Суть регрессии Кокса: модель рисков

Статья написана Павлом Чайкой, главным редактором журнала «Познавайка». С 2013 года, с момента основания журнала Павел Чайка посвятил себя популяризации науки в Украине и мире. Основная цель, как журнала, так и этой статьи – объяснить сложные научные темы простым и доступным языком

регрессия Кокса

В жизни и бизнесе возникает масса ситуаций, в которых крайне важно адекватно оценить риски того или иного решения. Чем дальше горизонт планирования – тем больше факторов влияет на исход дела. Модель пропорциональных рисков, предложенная в 1972 году, как раз призвана помочь оценить вероятность наступления того или иного события. По имени разработчика метод получил название регрессия Кокса.

Уточним, что регрессия в качестве метода используется для моделирования взаимоотношений между различными переменными и выяснения, как такое взаимодействие влияет на конечный результат. Также уточним, что риски в данной модели напрямую зависят от фактора времени. Для примера, возьмем исследование влияния обработанных продуктов на риск развитие диабета 2 типа. Именно регрессия Кокса была взята за основу при изучении влияния продуктов на здоровье человека. Это исследование можно прочесть в этой статье.

Суть регрессии Кокса

В основе регрессии Кокса лежат 3 (три) базовых допущения, на которых строится моделирование ситуации. Это очень важный момент.

Базовые предположения:
1. Все используемые переменные являются независимыми.
2. Все используемые переменные оказывают линейное влияние на оцениваемые риски.
3. Риски являются пропорциональными для любых 2-х объектов в любой временной отрезок.

С учётом данных допущений формула оценки рисков имеет следующий вид:
h(t) = h0(t)*exp(β1*х1 + β2*х2 …+ βр*хр)
В этой формуле наличествуют следующие величины:

  • h0(t) – базовый риск.
  • β1, …, βp – коэффициенты.
  • х1, х2, …, хp – независимые переменные (т. н. предикторы).

Коэффициенты β1, …, βp описывают степень влияния каждой переменной на вероятность наступления события. Так, при увеличении переменой хр на 1 риск увеличивается в exp (βр) раз. Это при условии, что значение прочих предикторов не менялось.

В целом, метод Кокса имеет много общего с логистической регрессией: в том и другом случае регрессия строится с помощью поочередного включения и исключения предикторов в создаваемую модель. Поэтому модель нередко представляют таким образом:

h[(t),(х1, х2, …, хр)] = h0(t)*exp(β1*х1 +…+ βр*хр)

Далее можно линеаризовать модель, поделив части формулы на h0(t) и взяв натуральный логарифм от обеих частей:

log{h[(t),(х…)]/h0(t)} = β1*х1 +…+ βр*хр

Основное преимущество регрессии Кокса для оценки рисков состоит в том, что для моделирования ситуации по данному методу требуется меньшее количество наблюдений, чем для многих других методов. При этом данная модель обладает высокой точностью оценки пропорциональных рисков.

Автор: Павел Чайка, главный редактор журнала Познавайка

При написании статьи старался сделать ее максимально интересной, полезной и качественной. Буду благодарен за любую обратную связь и конструктивную критику в виде комментариев к статье. Также Ваше пожелание/вопрос/предложение можете написать на мою почту pavelchaika1983@gmail.com или в Фейсбук, с уважением автор.

2 комментария

  • Добрый день. Подскажите, пожалуйста, по статистическим методам. У меня есть группа больных (n=229) с терминальной стадией заболевания, которые прошли успешное лечение по устранению причины этого заболевания (избавились от вируса). После этого, я наблюдаю больных каждые 3-6 месяцев с целью выявления неблагоприятных исходов. Мне необходимо определить какие параметры (факторы) до лечения позволят спрогнозировать развитие неблагоприятного исхода, несмотря на успешную противовирусную терапию. Какой метод точнее: логистическая регрессия или анализ пропорциональных рисков Кокса (последний чаще встречается в работах с аналогичным дизайном исследования)?

  • Екатерина сложно выбрать тот или иной метод, каждый из них имеет свои плюсы и минусы. Попробуйте оба, а потом можно будет сравнить их эффективность.