Методы анализа связей между переменными. Связи между качественными переменными

Из кн.: Плавинский С.Л. Биостатистика.Планирование, обработка и представление результатов биомедицинских исследований при помощи системы SAS. СПб: Издательский дом СПб МАПО.- 2005

Очень часто исследователя интересует не столько вопрос о том, различаются ли средние в двух группах, сколько о том, существует ли связь между двумя или более переменными. На самом деле иногда эти вопросы аналогичны. Например, проблему увеличения смертности среди курильщиков мы можем сформулировать как проблему разности смертности в группах курящих и не курящих (проблема сравнения групп) или как проблему взаимосвязи между курением и смертностью. Однако те статистические показатели, которые мы будем использовать для описания двух моделей будут различными. В принципе, возможны два основных индикатора степени связи между показателями - относительный риск (и отношение шансов) и коэффициент корреляции. Первый тип показателей показывает как меняется риск при переходе из одной дискретной группы в другую, тогда как второй пытается тветить на вопрос, существует ли упорядоченность во взаимоотношениях переменных на всем диапазоне значений. Обычно относительный риск и отношения шансов используются при описании взаимоотношений друг с другом качественных переменных (измеренных на номинальной шкале), в то время как коэффициент корреляции используется для анализа связей в который участвует, как минимум, одна количественная или полуколичественная переменная.

Для начала рассмотрим относительный риск и отношение шансов. Относительный риск определяется как отношение вероятностей наступления событий в одной группе к аналогичной вероятности в другой. Понятно, что если данное отношение больше единицы, это означает, что вероятность события (например, смерти) выше в одной группе, нежели в другой, иными словами, мы имеем дело с фактором риска. Если же величина меньше единицы, то мы имеем дело с протективным фактором (например, если группы определялись применением метода лечения). Понятно, что для адекватного расчета необходимо также знать, как рассчитывались вероятности наступления события в одной и другой группе. Это зависит от дизайна исследования - если две группы были сформированы в один день (например, после проведения скрининга), а затем за ними наблюдали один и тот же промежуток времени, нам достаточно посчитать процент тех у кого данное событие наступила в одно и другой группах и оценить отношение этих двух групп. Например, если в одной группе из 100 человек умерло 5, а в другой из 300 - 3, то процент в первом случае будет 5%, во втором - 1%, а относительный риск - 5. Однако ситуация осложняется, если мы отбирали пациентов в группу лечения на протяжении определенного периода времени, а закончили исследование одновременно. Тогда один человек у нас находился под наблюдением 10 лет, а другой - только год. Если теперь поделить количество случаев на количество обследованных величина может оказаться бессмысленной, поскольку средний срок наблюдения в той и другой группах может быть разным. Решить эту проблему можно, считая частоту наступления события не на количество людей, а на количество единиц времени наблюдения, которые "вложил" каждый человек, вошедший в исследование. Например, если один человек находился под наблюдением 5 лет, другой два года, а третий умер, через год после начала исследования, всего в исследовании было 8 человеко-лет наблюдения. Смертность составит 1/8 или 13 на 100 человеко-лет наблюдения. Рассчитав показатели смертности в группах таким образом можно взять их отношение, которое и будет являться относительным риском. Технически данный показатель отличается от "обычного" относительного риска (обозначаемого RR - Relative Risk) и носит английское название Relative Risk Ratio (сокращенно RRR), однако можно показать, что два показателя равны при одинаковом сроке наблюдения в двух группах и на русский язык они обычно переводятся одинаково.

У показателей относительного риска есть несколько проблем - во-первых они не могут быть измерены при любом типе дизайна исследования, а во вторых, математические манипуляции с ними осложнены. Первая проблема связана с тем фактом, что при использовании дизайна по типу случай-контроль, когда соотношение больных и здоровых подбирается произвольно, процент больных оказывается величиной также определяемой произвольно и поэтому относительный риск теряет смысл.

Таблица 4.1 Четырехпольная таблица

 

Больные

Здоровые

РФ+

a

b

РФ-

c

d

Действительно, поскольку риск заболевания в группе, подвергшейся воздействию фактора риска составляет a/(a+b), то произвольное изменение соотношений a и b приведет к произвольным изменениям показателя риска. Конечно, можно оценить соотношение a/(a+c), но его трактовка будет иной (вероятность того, что у больного присутствует фактор риска - диагностическая чувствительность фактора риска), а отношение двух подобных показателей не будет равно отношению рисков.

Однако можно рассуждать и не в терминах риска, а в терминах шансов - количества раз, когда человек выиграет (останется здоровым) к числу раз, когда он проиграет (заболеет). Тогда шансы заболеть в группе, подвергшейся воздействию фактора риска составят a/b, а в группе без этих факторов - c/d. Теперь мы можем посмотреть, во сколько раз шансы заболеть в группе риска выше, чем шансы заболеть в группе без факторов риска. Это отношение, равное (a/b)/(c/d)=(a*d)/(b*c) и называется отношением шансов (английское обозначения odds ratio, сокращенно, OR ). Отношение шансов удобно по следующей причине: вернемся назад к дизайну по типу случай-контроль. Мы фиксируем количество лиц в контрольной группе и в группе больных. Поэтому имеет смысл рассчитывать шансы только отдельно в группе больных и здоровых. Иными словами, оценим вначале шансы того, что у больного пациента встретится риск фактор (a/c), а затем, что риск фактор встретится у здорового (b/d). Отношение шансов равно (a/c)/(b/d)=(a*d)/(b*c). Иными словами, какой бы дизайн мы не выбрали - когортный или случай-контроль - отношение шансов будет определяться одинаково. Однако на этом, достоинства отношения шансов не заканчиваются. Посмотрим, что произойдет, если мы организуем когортное исследование, направленное на изучение редко возникающего заболевания, например такого, что встречается с частотой 1 на 1000 (на самом деле, это относительно часто встречающееся заболевание, если вы поинтересуетесь мнением не статистика, а эпидемиолога). Далее предположим, что некий фактор риска увеличивает вероятность развития заболевания в три раза. Тогда можно записать, что c=1 d=999 a=3 b=997. Относительный риск равен 3 ([3/1000]/[1/1000]). Отношение шансов равно (3/997)/(1/999)=3.01. Видно, что различия между значением отношения шансов и относительным риском малы. Отсюда формулируется важное правило - на основании отношения шансов мы можем оценить относительный риск, если частота заболевания в исходной популяции мала.

Кроме того, у относительного риска имеется еще одна небольшая проблема, которая отсутствует у отношения шансов. Предположим, в вышеописанном примере вы захотите оценить отношение вероятностей не заболеть. Это отношение будет равно (997/1000)/(999/1000)=1.00. Так, что-то странное - риск заболеть в три раза выше, а вероятность остаться здоровым одинаковая! На самом деле, вывод абсолютно правильный, хоть и нарушает интуитивные представления о соотношении здоровья и болезни - вероятность заболеть в первой группе 0.3%, а во второй - 0.1%. В три раза выше. А вот вероятность не заболеть составляет 99.7% в первой группе и 99.'% во второй. Иными словами почти все пациенты останутся здоровыми в обеих группах. Поэтому отношение вероятностей и оказывается равным почти единице. Однако работать с показателями, которые зависят от того, с какой "стороны" мы смотрим на данные достаточно сложно. Посмотрим же, чему рано отношение шансов остаться здоровым: (997/3)/(999/1)=0.33 или 1/3. Иными словами отношение шансов для ненаступления события является величиной обратной к отношению шансов наступления события. Это свойство очень удобно при формировании математических моделей.

Надо заметить, что, на самом деле, нас мало интересует значение отношения шансов или относительного риска само по себе. Мы его получили в нашей выборки и больше ни у кого такой выборки не будет. Читателя любой научной статьи интересуют параметры популяции, из которой была сделана данная выборка. Поэтому мы должны оценить возможный диапазон значений, в котором может находиться популяционное, а не выборочное значение отношения шансов или относительного риска. Такой диапазон, как мы помним, называется доверительным интервалом. Поэтому, строго говоря, нас интересует не абсолютное значение отношения шансов, а его доверительный интервал. В случае нормального распределения доверительный интервал рассчитать было просто. А вот если речь заходила о процентах - уже сложнее (см. выше при обсуждении теста знаков). Еще сложнее оценить напрямую доверительный интервал, если речь идет об отношении вероятностей (или шансов). Проблема заключается в том, что распределение возможных значений никак нельзя считать даже отдаленно похожим на нормальное - оно не будет даже симметричным. Действительно, если некое вещество оказывает негативное воздействие на состояние человека, значение отношения шансов, например, может варьировать в очень широких пределах - от 1 до бесконечно большой величины. В то же время, если вещество оказывает положительное действие, то значения отношения шансов располагаются в узком диапазоне - от 1 до 0. Для того, чтобы сделать распределение симметричным мы можем взять логарифм отношения шансов. Тогда в случае негативного действия логарифм отношения шансов будет меняться от 0 до бесконечно большого положительного числа; а в случае позитивного значения - от 0 до бесконечно большого отрицательного числа. Woolfe показал, что дисперсия логарифма отношения шансов оценивается достаточно легко - она равна сумме значений, обратных частотам в четырехпольной таблице. Иными словами, дисперсия логарифма отношения шансов V равна V=1/a+1/b+1/c+1/d. Поскольку 95% значений заключено в диапазон среднее плюс-минус 2 стандартных отклонения, а стандартное отклонение равно квадратному корню из дисперсии, мы можем рассчитать доверительный интервал логарифма отношения шансов. Так, в описанном выше примере дисперсия равна 1/3+1/997+1/1+1/999=1.34. Квадратный корень из этого значения составляет 1.16. Натуральный логарифм отношения шансов (3) равен 1.10. Нижняя граница доверительного интервала логарифма отношения шансов равна 1.10-2*1.16=-1.22. Верхняя граница равна 1.10+2*1.16=3.42. Поскольку доверительный интервал включает нулевое значение, мы не можем сказать, в популяции действительно ли повышен риск в первой группе или нет. Возведя число е в степень, соответствующую нижней и верхней границам (взяв антилогарифм от границ), мы получим доверительный интервал отношения шансов. Функция возведения числа е в произвольную степень присутствует во всех научных и инженерных калькуляторах (иногда в виде клавиши ех, иногда в виде клавиши ехр(х), а иногда при нажатии клавиши обратной функции (inv или 2nd) и клавиши натурального логарифма). Также она есть в MS Excel и большинстве других математических и статистических программ. Границы доверительного интервала в нашем примере будут равны 0.30 и 30.57. Надо заметить, что ширина доверительного интервала является показателем качества исследования - чем он шире, тем хуже исследование. В данном случае мы имеем именно такую ситуацию - результаты анализа не позволяют сказать, оказывает ли фактор выраженное протективное действие (OR может быть даже 0.30), или крайне негативное (OR=30.6). В популяции шансы негативного исхода могут быть как в 3 раза ниже, так и в 30 раз выше. Иными словами, данное исследование ничего не добавило к нашему пониманию проблемы - до начала исследования мы знали, что возможен и такой, и такой вариант, и после мы знаем не больше. А все так хорошо начиналось! Отношение шансов было равно 3! Конечно, в реальности, после исследования мы знаем о действии фактора немного больше - доверительный интервал смещен в сторону больших значений, поэтому если мы получим результаты нескольких подобных исследований и объединим их, то сможем придти к более определенным результатам, однако это тема другой главы (мета-анализ и байесовский подход). Работать с доверительным интервалом довольно легко, хотя и требуется - как и везде в статистике - толика здравого смысла. Надо вначале (до сбора материала) определить те значения OR, которые мы будем рассматривать как клинически эффективные. Здесь и необходим здравый смысл. Если шансы выжить увеличиваются на 0.1%, то это, наверное, малоэффективное лечение. Обычно в качестве границы клинической эффективности принимается значение отношения шансов в 1.2 или, соответственно, 0.8. Затем мы должны посмотреть, включает ли доверительный интервал это значение. Если он находится по одну сторону от него (например, 1.3-1.9) мы заключаем, что фактор действительно значим и мы можем доверять полученным данным. Если он не пересекает границу отсутствия эффекта (1.0), но пересекает линию клинической значимости (например, 0.6-0.95), то мы можем сказать, что фактор действительно оказывает некоторое воздействие, но насколько оно значимо, нам сказать трудно. Наконец, возможна ситуация, когда весь доверительный интервал расположен вне интервала клинических значимостей (например, 0.9-1.1). В этой ситуации мы можем утверждать, что фактор не оказывает и не может оказывать никакого клинически значимого действия. Все остальные случаи мы можем рассматривать как недостаточно адекватно организованные исследования.