Суть регресії Кокса: модель ризиків

Стаття написана Павлом Чайкою, головним редактором журналу «Пізнавайка». З 2013 року з моменту заснування журналу Павло Чайка присвятив себе популяризації науки в Україні та світі. Основна мета як журналу, так і цієї статті – пояснити складні наукові теми простою та доступною мовою.

регресія Кокса

У житті і бізнесі виникає маса ситуацій, в яких вкрай важливо адекватно оцінити ризики того чи іншого рішення. Чим далі горизонт планування – тим більше факторів впливає на результат справи. Модель пропорційних ризиків, запропонована в 1972 році, якраз покликана допомогти оцінити ймовірність настання тієї чи іншої події. По імені розробника метод отримав назву регресія Кокса.

Уточнимо, що регресія в якості методу використовується для моделювання взаємин між різними змінними і з’ясування, як така взаємодія впливає на кінцевий результат. Також уточнимо, що ризики в даній моделі безпосередньо залежать від фактора часу. Для прикладу, візьмемо дослідження впливу оброблених продуктів на ризик розвитку діабету 2 типу. Саме регресія Кокса була взята за основу при вивченні впливу продуктів на здоров’я людини.

Суть регресії Кокса

В основі регресії Кокса лежать 3 (три) базових допущення, на яких будується моделювання ситуації. Це дуже важливий момент.

Базові припущення:
1. Всі використовувані змінні є незалежними.
2. Всі використовувані змінні мають лінійний вплив на оцінювані ризики.
3. Ризики є пропорційними для будь-яких 2-х об’єктів в будь-який часовий відрізок.

З урахуванням даних припущень формула оцінки ризиків має наступний вигляд:

h(t) = h0(t)*exp(β1*х1 + β2*х2 …+ βр*хр)

У цій формулі наявні такі величини:

  • h0(t)- базовий ризик.
  • β1,…, βp – коефіцієнти.
  • х1, х2,…, хр – незалежні змінні (т.зв. предиктори).

Коефіцієнти β1,…, βp описують ступінь впливу кожної змінної на ймовірність настання події. Так, при збільшенні змінної хр на 1 ризик збільшується в exp (βр) раз. Це за умови, що значення інших предикторів не змінювалося.

В цілому, метод Кокса має багато спільного з логістичною регресією: в тому і іншому випадку регресія будується за допомогою почергового включення і виключення предикторів в створювану модель. Тому модель нерідко представляють таким чином:

h[(t),(х1, х2, …, хр)] = h0(t)*exp(β1*х1 +…+ βр*хр)

Далі можна лінеаризувати модель, поділивши частини формули на h0 (t) і взявши натуральний логарифм від обох частин:

log{h[(t),(х…)]/h0(t)} = β1*х1 +…+ βр*хр

Основна перевага регресії Кокса для оцінки ризиків полягає в тому, що для моделювання ситуації за даним методом потрібна менша кількість спостережень, ніж для багатьох інших методів. При цьому дана модель має високу точність оцінки пропорційних ризиків.

Leave a Reply

Your email address will not be published. Required fields are marked *