Статистические вопросы оценки программ профилактики ВИЧ

Ron Brookmeyer

Quantitative Evaluation of HIV Prevention Programs/ Edited by Edward H. Kaplan and Ron Brookmeyer, Yale University Press, New Haven and London, 2002, pp 55-78

В течение последних двух десятилетий мы накопили значительные знания по поводу патогенеза инфекции вируса иммунодефицита человека (ВИЧ) и лечению лиц, зараженных ВИЧ. Однако, остается значительная неопределенность в вопросе о типе и характеристиках эффективных программ по профилактике инфекции. На самом деле, новые случаи инфекции ВИЧ продолжают возникать с пугающей быстротой, особенно в развивающихся странах. Более того, до сих пор еще не завершено ни одного исследования третьей стадии, по оценке эффективности вакцин. Данная глава представляет некоторые статистические вопросы, которые возникают при количественной оценке программ профилактики ВИЧ. Задачей является осветить статистические вопросы дизайна и анализа исследований по профилактике ВИЧ.

ВИЧ профилактика относится к широкому спектру профилактических программ, включая вакцинацию, программы обмена шприцов, консультирование и тестирование, программы скринирования запасов крови, программы борьбы с заболеваниями, передающимися половым путем, терапевтические вмешательства, которые снижают частоту передачи инфекции от матери к ребенку и различные поведенческие программы. Большая часть того, что мы знаем по профилактике ВИЧ, была получена в обсервационных исследованиях, в резкой противоположности к изучению анализа методов изучения СПИДа и ВИЧ, знания о которых пришли из рандомизированных, контролируемых исследований. Хотя обсервационные исследования и являются ключевой фигурой в оценке эффективности профилактики ВИЧ, имеется несколько важных примеров использования рандомизированных, контролируемых исследований, включая исследования, которые оценивают воздействие программ по борьбе с заболеваниями, передающимися половым путем и профилактических методик, снижающих частоту передачи инфекции от матери к ребенку. Целью данной главы, является осветить некоторые статистические вопросы дизайна и анализа профилактических исследований. В этой главе обсуждены сильные и слабые стороны различных дизайнов и источников данных для получения надежных выводов об эффективности профилактики, и приведены примеры из других областей общественного здоровья. В следующем разделе мы будем обсуждать несколько типов дизайнов, включая рандомизированные исследования, естественный эксперимент и обсервационные наблюдения. Затем мы обсудим использование данных регистрации ВИЧ/СПИДа для получения выводов о профилактике ВИЧ. Финальный раздел освещает некоторые статистические и аналитические вопросы оценки профилактических программ борьбы с вирусом иммунодефицита человека.

Дизайны исследований.

Рандомизированные испытания профилактики ВИЧ.

Имеется несколько важных примеров использования рандомизированных исследований для профилактики ВИЧ. Например, 076 протокол группы клинических испытаний по СПИДу (ACTG), оценивал эффективность AZT для снижения вероятности передачи от матери к ребенку (1). Это исследование включало матерей, которые были индивидуально рандомизированы на получение либо плацебо, либо AZT с 36-ой недели беременности. Это важное исследование продемонстрировало, что частота перинатального заражения может быть снижена практически на две трети, с 25% до 8%.

В другом исследовании в Танзании, рандомизированными оказались общины, которые получали либо специальную программу по лечению заболеваний, передающихся половым путем (ЗППП), либо контрольную программу. Гипотеза этого исследовании состояла в том, что ЗППП являются кофактором для передачи и приобретения ВИЧ инфекции и таким образом, снижение распространенности ЗППП, может снизить частоту новых случаев ВИЧ. В аналогичном исследовании в Уганде, несколько общин были рандомизированы для того, чтобы получить массовое лечение с целью снижения распространенности ЗППП. Как в Танзании, так и в Уганде, единицей рандомизации была община. В противоположность этому, единицей рандомизации группы клинических испытаний по СПИДу в протоколе 076, были индивидуумы (беременные женщины).

Имеется несколько основных причин, почему для оценки эффективности профилактических программ, направленных против ВИЧ, более предпочтительными исследованиями являются рандомизированные исследования, по сравнению с обсервационными (4,5). Во первых, и наверное, это является наиболее важным, рандомизация избегает "самоотбора". "Самоотбором" называется возможность ошибочных выводов, так называемое смещение результатов, которое возникает, если индивидуумы селективно выбирают одно вмешательство или другое. Те индивидуумы, которые выбирают определенное лечение могут иметь различный риск ВИЧ инфекции, не сравнимый с теми, которые имеются у индивидуумов, выбравшими другое лечение. Во вторых, рандомизация избегает "отбора исследователем" в рамках которого, исследователь систематически помещает определенные типы индивидуумов в одну или другую группу лечения. В третьих, рандомизация помогает достигнуть баланса между группами вмешательства и контроля, в соответствии с факторами риска ВИЧ инфекции, которые либо очень сложно измерить, либо те, которые являются неизвестными. Например, предположим, что некоторые генетические или пищевые факторы защищают человека от приобретения ВИЧ инфекции, но точно неизвестно какие это факторы, или эти факторы крайне сложно измерить. Рандомизация в большом исследовании приводит к тому, что генетические и пищевые факторы, с высокой вероятностью, будут примерно сбалансированы в группах вмешательства.

Насколько важным является иметь рандомизированные группы сравнения в исследованиях по профилактике заболеваний? Эти вопросы были впервые подняты Карлом Пирсоном (6 ) во время обсуждения профилактики тифа. В обсуждении необходимости контрольной группы для профилактики тифа в 30-е годы, Пирсон сказал: "контрольные пациенты не могут рассматриваться, как истинный контроль до тех пор, пока не продемонстрировано, что те люди, которые являются наиболее тревожными и особо относятся к своему здоровью, те люди, которые являются наиболее аккуратными и, соответственно, у них имеется крайне низкий риск, не являются теми людьми, которые получат вакцинацию и таким образом могут возникнуть случайные корреляции между заболеванием и отсутствием вакцинации"(7).

Однако, майор Гринвуд принял другую позицию и спорил, что возражения Пирсона " было бы смертельным.... если бы доказательство, что волонтеры, которые получают иммунизацию, являются более аккуратными, чем не вакцинированные лица, либо по своей личной гигиене, например. Если бы тиф передавался через воду и аккуратные индивидуумы кипятили бы свою питьевую воду, но если тиф передается через пищу, на которой посидели мухи или какими-либо другими переносчиками, никакие индивидуальные действия не смогли бы воздействовать на данный результат. Возражения Карла Пирсона для меня кажутся менее важными, чем они представляются при первом прочтении"(7).

Конечно СПИД не является тифом, можно достаточно долго спорить, что в исследовании, которое включает добровольную вакцинацию, те, кто захочет быть провакцинированным может изменить свое поведение, которое поместит их в группу более высокого (или возможно низкого) риска ВИЧ инфекции, чем те люди, которые не захотят, чтобы их вакцинировали. В таких ситуациях принято полагаться на статистическую корректировку в анализе, для того, чтобы отрегулировать дисбаланс между группами лечения. В идеале следовало бы добиться того, чтобы вероятности подвергнуться воздействию вируса ВИЧ были бы одинаковыми в обеих группах, группе лечения и группе контроля. К сожалению, эти вероятности обычно не известны и рандомизация позволяет удостовериться в том, что средняя вероятность воздействия ВИЧ для каждого индивидуума, примерно одинаковая в обеих группах.

В отсутствии рандомизации мы должны полагаться на суррогатные переменные, такие как, сообщаемые участниками, частоту поведения высокого риска (например, некоторые типы сексуальных практик или совместное использование игл, среди наркоманов). Мы используем эти данные, для того, чтобы определить, имеют ли лица в двух группах воздействия, одинаковую вероятность встречи с ВИЧ вирусом. Однако, эти переменные являются всего лишь суррогатными для воздействия ВИЧ и часто они базируются на самоотчетах, и таким образом измеряются с достаточно большим уровнем ошибки. Более того, даже если количество поведений, по данным самоотчетов, является абсолютно точным, они все равно могут не быть хорошим предиктором вероятности столкновения с ВИЧ вирусом. Например, если у человека имеется большое количество сексуальных контактов, но все эти контакты с неинфицированным партнером, тогда индивидуум вообще не будет встречаться с ВИЧ вирусом. Рандомизация избегает этих проблем, поскольку в большом исследовании она позволяет удостовериться в том, что вероятности воздействия ВИЧ на пациентов, были примерно одинаковыми во всех группах вмешательства. Рандомизированные исследования, таким образом, наилучшим образом защищают от систематической ошибки.

Опасность самоотбора может быть легко проиллюстрирована исследованием по борьбе с ишемической болезнью сердца (8). В этом исследовании 1103 пациента были рандомизированы в одну группу лечения, группу получавшую клофибрат, и 2789 были рандомизированы в группу плацебо. Пятилетняя смертность в группе клофибрата и плацебо составили 20% и 21%, соответственно, и статистически не различались между двумя группами (Р >0,10). Сравнение двух групп ( лечение клофибратом, против плацебо), базирующееся на начальных данных по рандомизации, обычно называется методом анализа по рандомизации или "intent to treat analysis". Таким образом, анализ по группам рандомизации, не выявил никакого эффекта от лечения. Однако, когда две группы были разбиты не тех, кто следовал рекомендациям врачей ( тех, кто принимал, по крайней мере, 80% лекарственных средств, назначенных медиками) и тех, кто не следовал рекомендациям (те, кто не принимал, по крайней мере 80% лекарственных средств), то были получены удивительные результаты.( Таблица 3.1). Пятилетняя смертность среди тех, кто следовал и не следовал рекомендациям, среди лиц исходно рандомизированных в группу клофибрата, составили 15% и 25%, соответственно( P<0,01). Наивная интерпретация этих результатов заключается в том, что имеется значительный эффект клофибрата по снижению смертности, поскольку те пациенты, следовавшие рекомендациям, которые принимали клофибрат, имеют значительно более низкую смертность, чем те пациенты, которые не принимали лекарственное средство (не следовавшие рекомендациям). Однако, когда группа плацебо также была разбита на две части, пятилетняя смертность, среди тех, кто следовал рекомендациям и не следовал рекомендациям, т.е. принимали или не принимали таблетки, содержавшие плацебо, составила 15% и 28%, соответственно (P<0,01). Таким образом кажущиеся различия между следовавшими рекомендациям и не следовавшими рекомендациям, среди тех, кто был рандомизирован на клофибрат, были абсолютно аналогичны тем, кто был рандомизирован в плацебо. И это совершенно четко демонстрирует, что индивидуумы, которые сами вызываются и выполняют рекомендации, отличаются от тех людей, которые не выполняют рекомендации, в данном случае по риску смерти. Были сделаны попытки объяснить эффект, выявленный среди тех, кто следовал рекомендациям, идентификацией других переменных, которые были бы связаны, как с подчинением рекомендациям врача, так и со смертностью. Однако такие переменные не были найдены. Это исследование демонстрирует опасность прихода к причинным выводам по поводу эффективности лечения в исследованиях, где пациенты самостоятельно отбираются в группы лечения. К счастью это исследование являлось рандомизированным и сравнение частоты смертности между двумя группами лечения, с использованием анализа по рандомизации, оставило очень мало сомнений в том, что клинически значимый эффект отсутствовал.

Таблица 3.1 Иллюстрация эффекта самоотбора

Лечение

5-летняя смертность (%)

Клофибрат (все)

20%

Выполнявшие назначения

15%

Не выполнявшие назначения

25%

Плацебо (все)

21%

Выполнявшие назначения

15%

Не выполнявшие назначения

28%

Однако, исследования с рандомизацией также не совершенны. Например, может иметься различная частота выхода пациентов из исследования, даже если исследование, само по себе, было рандомизированным. Для того, чтобы проиллюстрировать эту идею, предположим, что рандомизированное исследование по профилактике, было организовано с целью оценить эффективность программы по консультированию, против контрольной программы, для снижения поведения высокого риска. Если программа консультирования требует значительно большего времени и сил, для того, чтобы участники принимали в ней участие, крайне вероятно, что те индивидуумы, которые более мотивированы, чаще будут возвращаться на повторные собеседования, чем те индивидуумы, которые менее мотивированы и для них более высока вероятность того, что они выйдут из исследования. Если более мотивированные участники также являются участниками с более низким (или более высоким) риском ВИЧ инфекции, тогда может показаться, что программа консультирования более эффективна, чем контрольная программа, поскольку " человека-года наблюдения" состоят, в основном из мотивированных участников. Две рандомизированные группы с течением времени будут становиться все более и более несбалансированными (по отношению к риску ВИЧ). Таким образом, рандомизация защищает против систематической ошибки путем того, что она обеспечивает сбалансированность групп в начале исследования, сбалансированность в отношении ключевых факторов риска. Однако, рандомизация не обязательно обеспечивает, того, что группы лечения обязательно останутся сбалансированными после начала исследования.

Другая сложность в рандомизированных исследованиях возникает, когда в качестве единицы рандомизации, используется община. В таких исследованиях община рандомизируется к одному или другому типу воздействия. Однако, между рандомизированными единицами могут возникать эффекты загрязнения или эффекты переноса. Например, одна из общин может быть рандомизирована к профилактическому вмешательству (А), а вторая, близко географически расположенная община, к рандомизированному вмешательству (В). При этом жители двух общин могут путешествовать между ними и смешиваться друг с другом. Наблюдения из этих двух общин теперь не являются статистически независимыми. Можно ожидать, что эффект этой статистической зависимости между общинами, будет приводить к усилению оцениваемой эффективности вмешательства. Более того, даже две географически близких общины, которые рандомизированы к одному и тому же вмешательству, могут наткнуться на серьезные осложнения, поскольку, если их жители взаимодействуют друг с другом, то будет иметься отсутствие статистической независимости между единицами рандомизации (т.е. общинами). Например, в Танзанийском исследовании в регионе Мванца, были рандомизированы пять пар общин. Каждая община имела пару, географически расположенную в том же регионе. Одним из подходов, который был предложен для борбы с эффектом загрязнения или смешивания между рандомизированными единицами, был - рандомизировать большой кластер общин, которые были достаточно близки географически, а не рандомизировать индивидуальные общины. Допущение, на котором основывается этот подход, заключается в том, что индивидуумы внутри такого большого кластера, будут смешиваться или взаимодействовать только с индивидуумами того же самого кластера общин. Этот подход был принят в общинных исследованиях по интенсивному лечению заболеваний, передающихся половым путем, которое было организовано в районе Ракаи в Уганде (3). Однако, имеется также крайне важные недостатки, которые происходят от факта рандомизации кластера общин, а не индивидуальной общины. Проблема заключается в том, что если несколько общин группируются в один кластер и если рандомизируется этот кластер, а не община целиком, то рандомизация осуществляется с меньшим количеством единиц. В основном, статистическая сила исследования для обнаружения размеров эффекта снижается, по мере снижения количества независимых единиц рандомизации (размер выборки). Действительно, в крайнем случае, когда имеются только два кластера общин, одно единственное случайное событие в одном кластере, такое как эпидемия сифилиса, или наводнение , или строительство дороги, может полностью переделать результаты, которые получаются от воздействия терапии.

Естественные эксперименты.

К сожалению, мы не всегда имеем возможность провести рандомизированный эксперимент. Иногда мы достаточно везучи и у нас получается естественный эксперимент. В естественных экспериментах отнесение единицы к группе воздействия или к контрольной группе не базируется на формальном алгоритме рандомизации, но по относительно счастливому стечению обстоятельств, факторы, которые относят в одну или другую группу, не связаны с результатом и поэтому вероятность систематической ошибки отбора кажется крайне мало вероятной (6).

Одним из самых известных примеров использования естественного эксперимента в общественном здравоохранении - является исследование причины возникновения холеры в середине девятнадцатого века. Закон по защите воды был принят в Лондоне в 1852 году и он требовал, чтобы как источник питьевой воды, использовались только незараженные части реки Темзы (10). К сожалению, только одна компания, обеспечивающая водоснабжение, Lambeth Waterworks Company последовала требованиям закона. Lambeth ранее поставляла одну из наиболее загрязненных видов воды, но теперь она обеспечивала одной из наиболее чистых. Кроме различий в качестве воды, никаких других различий между потребителями воды от различных водопроводных компаний не было. На самом деле компания Lambeth напрямую, улица за улицей, дом за домом, конкурировала с другими водопроводными компаниями (10). В результате появился естественный эксперимент. Таблица 3.2 сравнивает частоту смертей в зависимости от водопроводной компании до того и после того, как Lambeth изменила источник воды. До изменения смертность среди потребителей компании Lambeth была одинаковой с потребителями услуг других компаний, но после изменения, частота в тех районах, которые обеспечивались Lambeth составляла менее одной четвертой от частоты потребителей воды других компаний. Это было мощное доказательство того, что холера передается загрязненной водой. Очевидно, что невозможно было бы сделать формальное рандомизированное испытание, в котором люди были бы рандомизированы на получение чистой или загрязненной воды.

Таблица 3.2 Смертность от холеры в Лондоне на 1000 человеко-лет в XIX веке

 

Водопроводная компания

 

Lambeth

Southwark & Vauxhall

До закона 1852

12,5

11,8

После принятия закона 1852

3,7

13,0

Пример естественного эксперимента в области ВИЧ инфекции относится к оригинальным исследованиям по поводу этиологии ВИЧ инфекции у больных гемофилией. Проблема, с которой сталкивались исследователи, заключалась в том, что при изучении причины СПИДа, отсутствовала полностью удовлетворительная животная модель ВИЧ, для того, чтобы выполнять необходимые эксперименты и доказать причинно-следственные связи. На протяжении многих лет имелось настойчивое меньшинство ученых, которые задавали вопрос, является ли ВИЧ причиной СПИДа. И они предполагали, что это был случай вмешательства третьей переменной, когда на самом деле причиной СПИДа являлся стиль жизни, такой, как использование наркотиков. Затем был опубликован анализ, который изучил полную популяцию, более 6000 больных гемофилией в Великобритании, и это исследование базировалось на естественном эксперименте (11). Использование наркотиков среди больных гемофилией практически равняется нулю, поэтому вопрос о том, что воздействие ВИЧ будет замутняться воздействием наркотиков, в этой группе не стояло. Таблица 3.3 демонстрирует смертность среди не инфицированных и инфицированных ВИЧ, больных гемофилией после 1985 года, когда тестирование на ВИЧ стало доступным. И при этом эти данные страфицированы по тяжести гемофилии. Смертность после 1985 года среди инфицированных в 10 раз выше, чем среди не инфицированных, больных гемофилией. Это можно рассматривать как естественный эксперимент, поскольку случайная подвыборка больных гемофилией была инфицирована потому, что они, по несчастью, получили загрязненные продукты крови. Явно, что выполнение формального рандомизированного исследования в данной ситуации было бы неэтичным. Возникновение таких естественных экспериментов для большинства исследователей давало дополнительные доказательства, того, что ВИЧ инфекция приводит к СПИДу (11).

Таблица 3.3 Смертность на 1000 человеко-лет наблюдения среди ВИЧ-инфицированных и не инфицированных больных гемофилией в Великобритании

 

Тяжелая гемофилия

Гемофилия умеренной степени тяжести

 

Не инфицированы

Инфицированы

Не инфицированы

Инфицированы

1985-1992

8,1

(5,4-10,9)

49,1

(43,7-54,4)

3,5

(2,3-4,6)

45,2

(33,7-56,7)

1977-1984

7,9

(6,4-9,4)

3,7

(3,0-4,5)

Критерии для "естественного" эксперимента заключаются в том, что вероятность принадлежать к группе воздействия или контроля не зависит от тех переменных, которые связаны с результатом, таким как смертность или ВИЧ инфекция. В примерах с холерой и гемофилией, обсуждавшихся выше, высоко вероятно, что этот критерий удовлетворялся. Однако, существуют другие примеры в профилактике ВИЧ, где удовлетворение этих ключевых условий эксперимента не обязательно выполнялось. Например, в исследовании обучения по поводу СПИДа, предположим, что некоторые утренние курсы в колледжах получают один тип вмешательства, а некоторые вечерние курсы в колледжах получают другой тип вмешательства (4). Если студенты, которые занимаются в утренних классах, систематически по риску ВИЧ отличаются от студентов, которые занимаются на вечерних курсах, тогда критерии естественного эксперимента не будут удовлетворены. Другой пример относится к оценке программы обмена шприцов в городе Балтиморе (12). Программа обмена шприцов в Балтиморе была проведена для того, чтобы обеспечить чистыми иглами жителей центра Балтимора. Можно было бы сравнить частоту новых случаев ВИЧ в центре города Балтимора с частотой в окружающих районах графства Балтимор. Является ли это естественным экспериментом? Для того, чтобы утвердительно ответить на этот вопрос необходимо предположить, что жители центра города, сравнимы с жителями графства по отношению к риску ВИЧ, что является достаточно сомнительным допущением, поскольку частота новых случаев ВИЧ была значительно выше в центре Балтимора, даже до начала программы обмена шприцов в 1994 году. В качестве альтернативы можно было бы сравнить изменения в частоте новых случаев ВИЧ до и после начала программы обмена шприцов (1994) в городе Балтиморе и соответствующие изменения в графстве Балтимор. Однако, даже это сравнение, изменение частоты новых случаев, может быть подвергнуто сомнению по следующей причине. Изменения в частоте новых случаев ВИЧ в общине, зависит от распространенности ВИЧ инфекции или другими словами, стадии эпидемии в соответствии с простой математической моделью роста эпидемии (13). Например, одна из общин может находиться в ранней фазе экспоненциального роста, в то время как другая будет находиться в стадии насыщения. Если эпидемия в графстве Балтимор находилась на другой стадии зрелости, нежели эпидемия в городе Балтимор, тогда мы будем наблюдать различные изменения в частоте новых случаев, даже в отсутствии какого-то ни было профилактического вмешательства.

Обсервационные исследования.

В отсутствии рандомизированных контролируемых испытаний или естественного эксперимента, приходится полагаться на обсервационные наблюдения для оценки программ профилактики ВИЧ. Два основных дизайна исследований для обсервационных исследований - это когортные исследования и исследования по типу случай-контроль. Ключевым вопросом, который необходимо оценить в обсервационных исследованиях, когортных или по типу случай-контроль, является вопрос о том, что люди, которые выбрали участие в профилактической программе (леченные) в чем- то систематически отличны от тех индивидуумов, которые решили не принимать участия в программе (контроль) и насколько эти различия связаны с риском развития ВИЧ инфекции. Если подобные различия имеются, тогда можно выполнить статистическую коррекцию, используя стратифицированный или регрессионный анализ для того, чтобы оценить эффект переменных, которые, как известно связаны с риском ВИЧ, но это можно сделать только в том случае, если эти показатели были измерены у всех индивидуумов. Для тех показателей, которые не известны исследователям, никакой удовлетворительной корректировки быть не может.

Один из примеров использования исследования по типу случай-контроль в изучении ВИЧ включает гипотезу о том, что амилнитриты, одно из веществ, которое использовали гомосексуалисты, связано с развитием СПИДа. Исследование по типу случай-контроль, выполненное в начале 80-х годов, подобрало пары случаев со СПИДом и контролем и обнаружило положительную связь мужду использованием амилнитрита и СПИДом. Не откорректированное отношение шансов для СПИДа, связанное с использованием амилнитрита было 8.6, что предполагало значимый эффект амилнитритов. Множественный логистический регрессионный анализ, который включал контроль количества сексуальных партнеров, потенциальную переменную, которая могла повлиять на взаимосвязь между амилнитритом и СПИДом, также предполагал, что эта связь достаточно сильна, с откорректированным отношением шансов 12,3. Эти результаты были получены в 1982 году, до того, как был открыт вирус ВИЧ. Однако, авторы этого исследования аккуратно предупреждали, что использование "амилнитрита может являться суррогатной переменной, другой причинной переменной, такой как воздействие сексуально передающегося онкогенного вируса" (14). Действительно последующие крупные исследования продемонстрировали, что после корректировки на наличие более детальной информации по сексуальному поведению, амилнитриты уже не были связаны со значимым увеличением риска, предполагая, что оригинальная взаимосвязь между СПИДом и амилнитритом, являлась артефактом, который появлялся от мультиколлинеарности между некоторыми сексуальными практиками и использованием данных химических веществ. Мультиколлинеарность делает интерпретацию сложной и, для того, чтобы подтвердить такую взаимосвязь, крайне важным является, установление биологического механизма . Однако, такие механизмы иногда предлагаются слишком быстро, после того, как была найдена некая взаимосвязь, и поэтому необходимо подумать над тему того, насколько биологически разумным является предложенный механизм (15). Например, в 1982 году New England Journal of Medicine опубликовал статью, которая предполагала биохимический механизм, объяснявший взаимосвязь между амилнитритом и возникновением СПИДа (16). Однако, после того как в 1983 году был изолирован ВИЧ вирус, гипотеза о причинной роли амилнитрита исчезла.

Второй пример использования обсервационных исследований для оценки профилактических программ по борьбе с ВИЧ, включает программы обмена шприцов. Простой, однако наивной, оценкой программ обмена игл, было бы сравнение частоты ВИЧ среди тех, кто добровольно участвовал в программу, в сравнении с подходящим контролем. Ключевым вопросом здесь является идентификация подходящей контрольной группы. В идеале контроль должен состоять из индивидуумов со сравнимым риском ВИЧ инфекции, по сравнению с теми, кто принимает участие в программе обмена шприцов. К сожалению, индивидуумы, которые добровольно присоединяются к программе обмена шприцов, не отобранная случайно подгруппа из популяции, а люди, которые пришли в результате самоотбора, и их риск ВИЧ инфекции может значительно отличаться от тех, кто не принял участия в программе. Как тогда можно было бы выбрать сравнимую группу контроля? Совершенно ясно, что контрольная группа будет ограничена индивидуумами, которые в настоящий момент используют внутривенные наркотики, но даже так, те кто участвуют в программах обмена шприцов, могут совместно использовать иглы более часто (или менее часто), чем те, кто выбирает не участие в программе.

Исследования в Нью-Йорке и Монреале попытались сравнить частоту новых случаев ВИЧ среди внутривенных наркоманов, которые присоединились и не присоединились к программе обмена шприцов в этих городах (17,18). Поскольку участники программ могли систематически отличаться от не-участников, стало крайне важным откорректировать вмешивающиеся переменные, такие как частота введения наркотиков или возраст. Таблица 3.4 показывает откорректированные значения относительного риска для заражения ВИЧ, при участии в программе обмена шприцами в Монреале и Нью-Йорке. В этих двух городах результаты оказались абсолютно противоположными. Исследование в Монреале показало более высокий риск ВИЧ инфекции среди тех, кто постоянно пользовался услугами программы обмена шприцов, относительный риск 10,2. В то время как в Нью-Йорке был продемонстрирован значимый протективный эффект программ снижения вреда (относительный риск 0,3). Авторы обоих исследований аккуратно предупреждают, что обсервационные исследования и статистическая корректировка возможных мешающих переменных не гарантирует от удаления систематических ошибок (17-19). Бруно и его коллеги отмечают, " возможно, что несмотря на большое количество данных, которые мы использовали в попытке идентифицировать мешающие переменные, некоторые из них остались неучтенными" (17). Дес Джарлаис и его коллеги комментируют, что " ни одно из исследований, которое было опубликовано, не являлось рандомизированным клиническим испытанием, поэтому мы не можем установить наличия причинно-следственных связей .... Мы не контролировали факты, которые привели наших участников к программе обмены шприцов (потенциальная ошибка самоотбора)" (18). В попытке объяснить различные результаты, полученные в Монреале и Нью-Йорке, Лурье писал, что "наиболее вероятное объяснение заключается в том, что силы отбора привлекали внутривенных наркоманов с наиболее рискованным поведением в Монреале. Основная программа по обмену шприцов в Монреале была открыта с 9 вечера до 4 утра ....... Программа обмена шприцов, по всей вероятности, непропорционально часто использовалась теми наркоманами, которые оказывались на улице в ранние утренние часы и у кого имелись большие проблемы с добыванием шприцов в аптеках, поэтому неудивительно, что такие пациенты находятся в группе более высокого развития риска ВИЧ. "(20). Объясняет это или нет различные результаты в Монреале и Нью-Йорке, понятно не до конца. Может быть имелись также систематические ошибки отбора в исследовании в Нью-Йорке, которые также необходимо было бы рассмотреть? Необходимо быть аккуратным, когда мы смотрим на ошибки отбора, как в тех исследованиях, которые дают результаты, не совпадающие с предыдущими идеями, так и в тех исследованиях, которые дают результаты, совпадающие с предыдущими идеями. В любом случае расходящиеся результаты, базирующиеся на обсервационных данных из двух исследований, до сих пор не получили объяснения.

Таблица 3.4

Откорректированные отношения риска заболеваемости ВИЧ-инфекцией среди участников программы обмена шприцов в Монреале и Нью-Йорке

 

Отношения риска

95% доверительный интервал

Монреаль

   

Неучастники

1,0

-

Участники, < 50% времени

0,9

0,3-2,7

Участники, > 50% времени

2,6

0,1-6,7

Постоянные участники

10,2

0,1-31,5

Нью-Йорк

   

Неучастники

1,0

-

Постоянные участники

0,3

0,1-0,7

Альтернативой простому эмпирическому анализу когортных исследований, является использование моделей, таких как циркуляционная теория, которая объясняет эффекты обмена шприцов с точки зрения ВИЧ инфекции (21-23). Такой подход может оказаться важным инструментом, генерирующим идеи и помогающим объяснить иногда конфликтующие результаты, которые получаются в результате простого эмпирического анализа обсервационных когортных исследований.

Тенденции в данных регистрации.

Тенденции данных регистрации ВИЧ или СПИДа также могут использоваться для оценки профилактических мероприятий, направленных против возникновения СПИДа. Данные регистрации могут включать в себя количество случаев СПИДа, которое было зарегистрировано в общине на протяжении определенного периода времени, или же исследования, которые проводятся в общинах по определению распространенности ВИЧ инфекции. Основная надежда заключается в том, что эффекты профилактических программ будут отражены в снижении количества заболеваний, и это снижение может быть отмечено в собираемых регистрационных данных. Сила данного подхода заключается в том, что оценка производится по количеству заболевших в данной общине, а не только среди участников исследования. Продемонстрировать, что вмешательство является эффективным в определенных контролируемых условиях, или среди участников исследования, отличается от того, что мы можем продемонстрировать тот факт, что профилактическая программа, примененная на уровне общины или страны, оказывает эффективное воздействие на общественное здравоохранение, снижая количество заболевших. Например, образовательная или консультационная программа может быть эффективна, когда она внедряется в контролируемых условиях или в небольших объемах, когда же в противоположность, она внедряется в больших объемах, она может быть значительно менее эффективной. Имеются, однако, важные недостатки и ограничения при использовании данных наблюдения, при оценке профилактики ВИЧ. Основным недостатком является отсутствие адекватного контроля или сравнительных данных по регистрации. В идеале нам бы хотелось измерить то количество случаев, которое имелось бы, при отсутствии проведения профилактической программы. Если количество случаев начинает снижаться после того, как началась профилактическая программа, достаточно опасно делать заключение, что это снижение причинно-связано с профилактической программой, поскольку снижение могло возникнуть и в отсутствии профилактической программы. Дополнительной проблемой является то, что данные регистрации, в основном, опираются на новые случаи СПИДа, регистрация которых достаточно хорошо налажена в большинстве развитых стран. Однако, количество новых случаев СПИДа, возникают значительно позже по времени, чем новые случаи инфекции ВИЧ. Снижение количества вновь возникающих случаев ВИЧ, которое может являться результатом эффективных программ общественного здоровья, не будет отражаться на количестве случаев СПИДа на протяжении многих лет, поскольку существует длительный и вариабельный инкубационный период. Тем не менее, были предприняты попытки оценить новые случаи ВИЧ инфекции от тенденции случаев СПИДа, используя метод обратных расчетов (24-26). Случаи СПИДа и распространенность ВИЧ связаны друг с другом следующим соотношением:

где A (t) - это кумулятивное количество случаев СПИДа, диагностированное до наступления календарного времени t, g(s)- это скорость инфицирования в календарное время s ( то есть количество новых случаев инфицирования в единицу времени s и F(t|s) - это распределение периодов инкубации для индивидуума, инфицированного в календарное время s. Распределение инкубационных периодов - это вероятность того, что инкубационный период будет короче времени t. Основная идея заключается в том, чтобы использовать тенденции в данных по новым случаям СПИДа A(t) (количество случаев СПИДа на протяжении времени), для того, чтобы выяснить что-то по поводу изменений новых случаев ВИЧ g (s) (количество новых инфекций на протяжении времени).

Мы приведем два примера использования обратных расчетов для получения информации по поводу профилактики СПИДа. Гейл, Розенберг и Гедерт использовали метод обратных расчетов для того, чтобы оценить эффект лечения, такого как лечение AZT, на удлинение инкубационного периода и отсрочку прогрессирования ВИЧ инфекции в СПИД у инфицированных индивидуумов (27). Хотя клинические исследования ранее демонстрировали, что AZT и другие методы лечения, являются терапевтически эффективными, не было популяционных исследований, которые бы продемонстрировали, что такое лечение, на самом деле, имеет хоть какое-то воздействие на большие группы, инфицированных ВИЧ, людей (28). Гейл, Розенберг и Гедерт использовали метод обратных расчетов для того, чтобы проанализировать новые случаи СПИДа в Сан-Франциско, Лос-Анжелесе и Нью-Йорке (27). Их расчеты вначале базировались на стабильном или стационарном распределении времени инкубации ( то есть, что она не удлинилась). И эти расчеты показали, что количество наблюдаемых случаев СПИДа должно быть большим, чем было реально обнаружено после июля 1987 года. Метод обратных расчетов предполагал, что наблюдается неожиданное снижение роста новых случаев СПИДа. Однако, Гейл и коллеги продемонстрировали, что не стационарный инкубационный период, с удлинением инкубационного периода после 1987 года, может объяснить тенденцию к снижению, вновь диагностируемых случаев СПИДа (27). Однако, снижение частоты новых случаев ВИЧ не могло объяснить снижение количества случаев СПИДа. На самом деле, в качестве одной из частей анализа чувствительности, было показано, что даже, если количество новых случаев ВИЧ равнялось бы нулю и после 1983 года, снижение количества случаев СПИДа, не может быть объяснено ничем другим, кроме удлинения инкубационного периода. Это было одно из первых исследований, которое продемонстрировало, что лекарственные средства, используемые для лечения СПИДа, действительно имеют значительный эффект, с точки зрения общественного здоровья и они удлиняют инкубационный период. Однако, остается большое количество важных неопределенностей с методом обратного подсчета, которые включают изменения в определении того, что считается СПИДом, распределение инкубационных времен, параметризации кривой новых случаев ВИЧ, и недостаточно полная регистрация и отсрочки в регистрации новых случаев СПИДа (26).

Вторым примером использования обратных подсчетов и данных по регистрации, являются оценки по попытке снижения передачи инфекции от матери к ребенку. На рисунке 3.1 показано количество перинатальных случаев СПИДа в Соединенных Штатах, в зависимости от квартала, в котором диагноз был поставлен (29,30). Определяется значительное снижение новых случаев примерно с 1994 года. Хотя рисунок 3.1 и показывает значительное снижение перинатальных случаев СПИДа, он не объясняет, почему оно произошло. Является ли причиной удлинение инкубационного периода педиатрического СПИДа, или снижение распространенности ВИЧ среди женщин детородного возраста, или же снижением вероятности передачи от матери к ребенку? Протокол 076 группы по клиническим испытанием в области СПИДа, продемонстрировал, что AZT, назначенный беременным женщинам, может снизить вероятность передачи ВИЧ от матери к ребенку примерно на две трети (1) и, таким образом профилактическое использование AZT, является возможной гипотезой, объясняющей снижение количества педиатрических случаев СПИДа в Соединенных Штатах.

Байерс и соавторы использовали данные по регистрации (примерно такого же типа, как показано на рисунке 3.1) и метод обратных расчетов, для того, чтобы оценить количество детей, родившихся с ВИЧ инфекцией, на протяжении длительного периода времени (31). В дополнение к этому они оценили количество новых матерей с ВИЧ инфекцией в Соединенных Штатах, используя "Обзор женщин детородного возраста" . Базируясь на этом, они смогли посчитать вероятность передачи ВИЧ от матери к ребенку, путем деления количества детей, родившихся с ВИЧ инфекцией, на количество матерей, у которых имелась эта ВИЧ инфекция. Они обнаружили, что вероятность передачи в 1988 году была около 23%, а затем вероятность передачи постоянно снижалась, до примерно 17% в 1994 году. К какому выводу мы можем придти из этих анализов? Анализ предполагает, что снижение перинатального СПИДа, показанное на рисунке 3.1, отражает снижение вероятности передачи инфекции от матери к ребенку, что, в свою очередь, вероятнее всего, является результатом профилактического использования AZT, как было продемонстрировано протоколом 076 (1,30,31). Однако, дополнительные объяснения снижения вероятности передачи, такие, как изменения в практике грудного вскармливания, базируясь только на этих данных и на этих видах анализа, также не могут быть полностью исключены.

Рис. 3.1 Количество перинатальных случаев ВИЧ в США с 1985 года

В некоторых случаях наивная интерпретация данных по регистрации ВИЧ, может быть ошибочной, как было продемонстрировано Брукмайером и соавторами в их анализе тенденций новых случаев ВИЧ и распространенности этой инфекции среди пациентов, являющихся посетителями клиники венерических болезней в городе Пуна (Индия), с мая 1993 года по апрель 1995 года (32). Таблица 3.5 демонстрирует, что распространенность ВИЧ снижалась в течении этого временного периода, в то время, как количество новых случаев ВИЧ, было крайне высоким - более, чем 10% в год. Падающая или стабильная, распространенность ВИЧ не означает, что нет новых случаев ВИЧ. На самом деле, в устойчивом состоянии, когда потери от заболеваемости ВИЧ и смертности в популяции, равняются количеству новых случаев ВИЧ, распространенность ВИЧ будет оставаться постоянной, даже несмотря на высокую частоту новых случаев этого заболевания. Таким образом, не стоит наивно интерпретировать постоянную или снижающуюся распространенность ВИЧ, как доказательство того, что эпидемия находится под контролем или, что профилактические усилия, направленные против ВИЧ, являются успешными (32).

Таблица 3.5 Тенденции заболеваемости и распространенности ВИЧ-1 среди пациентов венерологической клиники в городе Пуна, Индия, май 1993-апрель 1995

 

Распространенность ВИЧ

 

Новые случаи ВИЧ

 

Протестировано

Положительны (%)

ЧЛН

Сероконверсия (n)

Заболеваемость (%/год)

Май 1993-октябрь 1993

1466

23,3

87,0

8

9,2

Ноябрь 1993- апрель 1994

806

20,0

195,6

29

14,8

Май 1994- октябрь 1994

1165

19,8

232,8

20

8,9

Ноябрь 1994-апрель 1995

911

18,0

207,6

19

9,2

Всего (май 1993-апрель 1994)

4348

20,6

722,9

76

10,5

Как обсуждалось выше, получение информации об эффективности профилактических программ по отношению к ВИЧ, посвященных снижению новых случаев ВИЧ, которая бы базировалась на данных регистрации случаев СПИДа и исследования распространенности ВИЧ, имеет важные ограничения и может приводить к серьезным проблемам в интерпретации. В противоположность этому, популяционные данные по новым случаям ВИЧ, могут дать неоценимую прямую информацию по поводу того, являются ли профилактические усилия эффективными, могут ли они снизить, вновь возникающие, случаи инфекции. К сожалению, данные по новым случаям ВИЧ крайне сложно получить. Одна из причин заключается в том, что новые случаи ВИЧ обычно оцениваются на основании проспективного когортного исследования, которое требует включения неинфицированных участников, которые затем мониторируются на возникновение ВИЧ инфекции. Те индивидуумы, которые участвуют в этом исследовании, могут отличаться по своему риску ВИЧ инфекции от тех индивидуумов, которые отказываются включаться в исследование. В дополнение, даже среди тех, кто включается в исследование, может отмечаться значительное количество вышедших из него и, поэтому процент отслеживания может быть достаточно низким. Более того, те индивидуумы, которые возвращаются на повторные визиты, могут отличаться от тех, кто не пришел. Мы называем этот феномен систематической ошибкой наблюдения. Разрабатываются новые методы, которые позволяют справиться с некоторыми ограничениями традиционных когортных исследований в области оценки новых случаев ВИЧ, за счет низкого числа возвращающихся для повторных визитов и систематической ошибки наблюдения, в особенности, оценки новых случаев ВИЧ, базирующихся на ранних маркерах ВИЧ инфекции. Были предложены такие оценки новых случаев ВИЧ, предполагается, что они будут требовать только одного кросс-секционного исследования (33,34) и для таких моделей были разработаны теоретические модели (35,36). Основная идея заключается в том, чтобы тестировать индивидуумов в популяции на наличие или отсутствие биологического маркера ранней инфекции для того, чтобы идентифицировать недавно инфицированных людей. Эта методология использует только одно кросс-секционное исследование или " моментальный снимок" и, поэтому оно не требует длительного наблюдения и, таким образом, в этих методах не встречается ошибка наблюдения и на них не влияет селективное выбывание лиц во время наблюдения. Одна из проблем, которые появились, когда были предприняты первые попытки использовать этот подход, заключается в том, что маркер недавней инфекции, такой как антиген р 24, был крайне коротким, и поэтому статистическая точность результирующих оценок была низкой. Саттен и соавторы обсуждают оценки такого "исследования моментального снимка ", базировавшегося на двойном тесте антител, потому что этот тест увеличивает продолжительность существования биологического маркера и, таким образом, представляет значительное продвижение вперед в использовании данной технологии.

Аналитические вопросы.

Оценка эффективности.

Статистический анализ исследования, которое посвящено профилактике ВИЧ, довольно часто включает тестирование определенной гипотезы и расчет соответствующей P-оценки. В то время, как ограничения P-оценки обсуждались большим количеством авторов в других ситуациях, имеет смысл снова подчеркнуть недостаток P-оценки, для оценки значимости профилактических программ борьбы с ВИЧ для общественного здоровья. Мы хотим знать не только то, что некая программа снизила частоту ВИЧ, но также мы хотим знать количественную оценку этого . Поэтому нам необходим показатель эффективности. Однако, существуют различные способы измерения эффективности. Один из наиболее популярных - это, так называемый, относительный риск ВИЧ инфекции. Различные производные относительного риска, такие как эффективность вакцинации также использовались. Отношение рисков или отношение новых случаев ВИЧ, измеряется как риск в единицу времени для неинфицированного человека, инфицироваться. Отношение риска является отношением новых случаев среди тех, кто был включен в программу по профилактике ВИЧ, деленный на риск развития новых случаев ВИЧ среди тех, кто не был включен в программу по профилактике ВИЧ. Например, в программе по обмену шприцами в Нью-Йорке было обнаружено, что отношение риска составляет 0,3 среди постоянных участников этой программы, по отношению к тем, кто не входил в программу. Предполагается, что программа обмена шприцами может потенциально снизить частоту новых случаев ВИЧ примерно на две трети. Однако, такой интерпретации необходимо избегать из-за возможности систематической ошибки отбора, как об этом описывалось ранее.

Если отбросить вопрос систематической ошибки отбора, оценка эффективности, базирующаяся на относительных рисках, также имеет свои ограничения. Относительные риски не говорят нам ничего об абсолютном количестве случаев инфекции, которую можно будет избежать, если мы будем использовать профилактические программы, направленные против ВИЧ. Например, если вмешательство направлено на один путь передачи ( например, совместное использование шприцов внутривенными потребителями наркотиков) и этот путь передачи составляет только небольшой компонент эпидемии в общине, такое вмешательство может быть относительно неэффективным в снижении большого количества новых случаев ВИЧ инфекции в общине, даже если относительный риск, базирующийся на исследованиях в общинах наркоманов, предполагает сильный эффект от подобной программы. В противоположность этому, вмешательство со значительно менее внушительным относительным риском, но обращенное на путь передачи, обеспечивающий наибольший компонент эпидемии в общине, оказывает значительно большее воздействие на общественное здоровье, в терминах случаев инфекции, которые удалось избежать. Более того, простой относительный риск не включает в себя как прямые, так и непрямые эффекты. Например, профилактика нового случая инфекции у мужчины, являющегося внутривенным наркоманом, может непрямым образом предотвратить инфекцию у женщины, сексуального партнера этого наркомана (заражение, которое происходит от полового пути передачи), а это в свою очередь может предотвратить инфекцию у ребенка, рожденного от этой женщины. Таким образом, предотвращение одного случая инфекции, может прервать каскад других инфицирований. В идеале нам бы хотелось знать общее количество инфекций, которое может быть предотвращено как напрямую, так и косвенно, от программы предотвращения ВИЧ. Лонжини, Халлоран и коллеги подчеркивают важность оценки как прямых, так и непрямых эффектов при оценке эффективности профилактики в общинах.

Эпидемия ВИЧ/СПИДа использует для своего распространения различные пути передачи. Это приводит к дополнительным сложностям в интерпретации относительного риска при применении его на популяции, в которой способы передачи имеют иной удельный вес, чем в той популяции, которая использовалась для расчета относительного риска. Например, рассмотрим оценку профилактического вмешательства, которое направлено на использование методов очистки игл хлором, которыми пользуются внутривенные наркоманы. Не инфицированный наркоман, может подвергнуться риску встречи с вирусом ВИЧ, либо в ходе сексуального контакта, либо в результате использования загрязненной иглы. Предположим, что частота новых случаев ВИЧ, которая возникает в результате сексуальных контактов равняется IS и частота ВИЧ инфекции от использования наркотиков равняется ID. Предположим далее, что эффект использования очистки игл на снижение заболеваемости, приводит к тому, что риск инфицирования снижается от ID до (R0 x ID), где R0 - это относительный риск, связанный с профилактической программой. Тогда общее количество случаев ВИЧ в отсутствие профилактической программы составляет I1,

I1= IS + ID

Общее количество случаев ВИЧ при внедрении профилактической программы очистки игл, составляет

I2 = IS + R0 x ID

Отношение новых случаев с профилактикой и без профилактики, составляет

R = R0 x PD + (1 - PD)

где PD = ID /(ID + IS) и представляет собой пропорцию случаев инфекции, которая вызвана внутривенным путем передачи среди наркоманов. Таким образом, простой когортный анализ, который делит количество новых случаев ВИЧ, среди тех, кто вошел в программу, по сравнению с тем, кто не вошел в профилактическую программу, будет оценивать эффект профилактической программы по величине R, а не по величине R0. Что является последствием этой ошибки? Если R0 < 1, тогда R0 <R < 1; иными словами , тогда R перемещается в сторону 1. Более того, по мере того, как PD приближается к 0, R приближается к 1. Значения R зависят от количества случаев инфекции, которые являются результатом передачи внутривенным путем, а именно PD. Две общины могут иметь абсолютно разные значения R, даже несмотря на то, что R0 будет являться одним и тем же, в двух общинах. Можно было бы наивно приписать наблюдаемые различия в R между двумя общинами, различиями в характеристиках программ, а не тому, что в этих двух общинах имеются различные значения PD. Основная идея заключается в том, что параметр относительного риска (R) из двух общин, не является напрямую сравнимым с результатами различий в эпидемии. В одной общине эпидемия может распространяться, в основном, путем сексуальной передачи, в то время как в другой общине, эпидемия может распространяться, в основном, внутривенным путем передачи среди внутиривенных наркоманов. Несмотря на это, профилактическая программа может быть абсолютно одинаково эффективна в двух общинах, по отношению к определенному пути передачи, на который направлена данная программа.

Один пример может прояснить взаимоотношения между R и R0. Предположим, что у нас есть община, где 50% всех инфекций являются следствием использования загрязненных игл наркоманами, а вторые 50% являются результатом сексуального пути передачи. Таким образом, PD = 0,5. Теперь предположим, что относительный риск, связанный с использованием очистки игл хлоркой, составляет R0 = 0,5, иными словами использование очистки игл снижает риск передачи на 50%. Отсюда следует, что R = 0,75. Если мы используем параметр R для того, чтобы описать эффективность программы очистки игл, мы можем установить, что эта программа снижает количество новых случаев ВИЧ на 25%. Если вместо этого, мы будем использовать параметр R0, мы можем сказать, что количество новых случаев ВИЧ снижается на 50%. Явно, что оба этих высказывания вместе не могут быть правильными. Значительно более правильным будет сказать, что программа очистки игл связана с 25% снижением общей заболеваемости ВИЧ инфекцией и 50% снижением ВИЧ инфекции, в результате совместного использования шприцов. Для того, чтобы избегать путаницы, параметр R можно называть общим относительным риском, связанным с профилактической программой, а R0 можно называть относительным риском, специфичным для данного типа передачи. Можно было бы ожидать, что общий относительный риск будет варьировать в разных общинах.

Единицы анализа.

При анализе профилактических программ, важным вопросом, является единица анализа. Иногда рандомизируются индивидуумы, а иногда рандомизируются общины или даже группы общин. Например, протокол 076, который был направлен на снижение перинатальной передачи инфекции, включал рандомизацию беременных женщин, в то время как исследования в Танзании и Уганде оценивали воздействие лечения заболеваний, передающихся половым путем, на частоту ВИЧ, базируясь на рандомизации общин или деревень (1-3).

Если единицей рандомизации является индивидуум, то можно выполнять стандартный анализ человеко-лет наблюдения, для того чтобы сравнивать заболеваемость в двух группах. Например, предположим, что количество новых случаев инфекции (сероконверсии) в группах 1 и 2 равняется Х1 и Х2, соответственно. Общее количество человеко-лет наблюдения в группе 1 и группе 2, составляет Т1 и Т2, соответственно. Тогда простой статистический анализ включает допущения о том, что Х1 имеет распределение Пуассона, со средним I1 x T1, где I1 - это истинная заболеваемость в группе 1 и Х2 имеет распределение Пуассона, со средним I2 x T2. Затем мы выполняем тестирование нулевой гипотезы о том, что I1 = I2, при этом мы используем общую заболваемость Х1 и Х2. р -оценки получаются путем отношения Х1 к биноминальному распределению с размером выборки (Х1 + Х2) и вероятностью "успеха" равной T1 /( T1 + T2) (39).

Если единицей рандомизации была община, анализ выполняется иначе. Например, исследование в Танзании включало 6 групп общин. Внутри каждой пары, одна община была рандомизирована так, чтобы стать контрольной групой, а вторая подвергалась воздействию. Это исследование включило свыше 4000 человек, как в группе вмешательства, так и в группе контроля. Однако, было бы неправильным выполнить наивный анализ человеко-лет наблюдения, как описано выше, с общим числом человеко-лет наблюдения для каждой из двух групп, включающей в целом 4000 человек. Это является ошибкой в связи с тем, что результаты для каждого индивидуума внутри общины, не являются независимыми. Индивидуумы, которые живут внутри одной и той же определенной географической общины, имеют общие характеристики. Например, в исследованиях в Уганде или Танзании строительство новых дорог, или дорог для большегрузных автомобилей, новых учреждений коммерческого секса в определенной общине, могло привести к увеличению риска инфицирования для всех индивидуумов, живущих в этой общине. Более того, эпидемия может возникнуть в одной общине и не возникнуть в другой, просто в результате случайных стечений обстоятельств. Таким образом, например, если эпидемия сифилиса возникает в одной из общин во время исследования, она может увеличить риск для всех индивидуумов, живущих в инфицированной общине. Более правильным анализом будет являться анализ на шести парах, либо при помощи парного t-теста, либо теста перестановок, либо теста знаков. Имеется значительнй объем литературы по анализу рандомизированных исследований, включающих общины. Например, Доннар и Клар изучали статистическую методологию кластерного дизайна с бинарными результатами (40-42). Гейл, Марк, Керрол, Грин и Пии сообщали о результатах детальной симуляции рандомизированных дизайнов (43). Брукмайер и Чен оценивали статистические методы когортного анализа общинных профилактических программ, с использованием человеко-лет наблюдения в том случае, когда рандомизированные общины являются маленькими (44).

Обсуждение.

Задачей этого раздела являлось провести обзор некоторых статистических вопросов, дизайна и анализа исследований по профилактике ВИЧ. Рандомизированные исследования предлагают наилучшую защиту против систематических ошибок. Однако, рандомизированные исследования также не совершенны. Более того, в некоторых условиях может быть не только не этично, но не возможно провести рандомизацию. В отсутствии формального рандомизированного исследования, естественный эксперимент может дать уникальные возможности для оценки результатов. Необходимо воспользоваться естественным экспериментом, если такая возможность появляется.

В отсутствии рандомизированного испытания или естественного эксперимента, для оценки эффективности профилактики ВИЧ, очень часто приходится полагаться на обсервационные исследования. Основная проблема, которая связана с обсервационными исследованиями - это самоотбор. Исследователи никогда не могут быть убеждены в том, что наблюдаемый эффект, который они считают результатом воздействия вмешательства, не является, на самом деле, различием между теми индивидами, которые добровольно присоединились и теми, кто решил не присоединяться к профилактической программе.

Данные по регистрации СПИДа и ВИЧ инфекции, также использовались для того, чтобы придти к каким-то выводам об эффективности профилактики ВИЧ. Сильная сторона этого подхода заключается в том, что он базируется на широко распространенных показателях заболеваемости, а не на результатах, среди участников контролируемых экспериментов. Однако, в большинстве случаев, использование данных регистрации, является достаточно грубым инструментом, для получения надежных выводов об эффективности профилактики ВИЧ.

Дизайн исследований должен внимательно проанализировать сильные и слабые стороны рандомизации на уровне общины или на уровне индивидуума. В любом случае, как при расчете размера выборки, так и при статистическом анализе, необходимо принимать во внимание единицу рандомизации и, в более общем случае, наличие корреляции между наблюдениями. Наконец, особое внимание следует уделить выбору и интерпретации суммарных статистических показателей эффективности программ профилактики ВИЧ. Необходимо четко сообщить, включают ли подобные показатели оценку прямых или непрямых эффектов и при каких условиях полученные результаты могут быть применимы в других общинах.

Литература.

1. Connor EM, Sperling RS, Gamer R, Kiselev P Scott G, O'Sullivan MJ, VanDyke R, Bey M, Shearer N, Jacobson RL, Jimenez E, O'Neill E, Bazin B, Del fraissy JF, Culnane M, Coombs R, Elkins M, Moye J, Stratcon R Bdsley J. Reduction of maternal-infant transmission of HIV type 1 with zidovudine treatment: Pediatric AIDS Clinical Trials Group Protocol 076 Study Group. N Engl J Med 1994; 331: 1173-1180.

2. Grosskunh H, Moshe F, Todd J, Mwijarubi E, Igokke A, Senkoro K, Mayand R Changalucha J, Nicholl A, Ila-Gina G, Newell J, Mugeye K, Mabey D, Hayes R. Impact of improved treatment of sexually transmitted diseases on HIV infection in rural Tanzania: A randomized control trial. Lancet 1995; 346: 530-536.

3. Gray RJ, Wawer MJ, Sewan Combo NK, et d. Issues in sampling and study design For a community-based trial of STD control for AIDS prevention, in Rabbi District, Uganda. International Society for STD Research, New Orleans, abstract 078, p. 61 (1995).

4. Coyle S, Borsch R, Turner C, editors. Evaluating AIDS Prevention Programs. Washington, DC: National Academy Press, 1991

5. Piantadosi S. Clinical Trials: A Methodological perspective. NewYork: JohnWiley, 1997.

6. Brookmeyer R. AIDS, epidemics and statistics. Biometrics, 1996; 52:781-796.

7. Greenwood, M. Epidemics and Crowd Diseases: tin introduction to the Study of Epidemics. New Macmillan, 1935.

8. Coronary Drug Project Research Group. Influence of adherence to treatment and response of cholesterol and mortality in the coronary drug project. N Engl J Med 1980; 303:1038-1041.

9. Rosenbaum P. Observational Studies. NewYork: Springer-Verlag, 1995.

10. Eyler JM. Victorian Social Medicine: The Ideas and Methods of William Farr. Baltimore, MD: Johns Hopkins University Press, 1979.

11. Darby SC, Ewart DWJ Giangrande PLF, et aI. Mortality before' and after HIV infection in the complete United Kingdom population of haemophiliacs. Nature 1995; 377:79- 82.

12. Vlahov D, Junge B, Brookmeyer R, et d. Reductions in high-risk drug use behaviors among participants ia the Baltimore Needle Exchange Program. J Acquir Immune Defic Syndr Hum Retrovirol 1997; 16:400-406.

13. May RM, Anderson RM. Transmission dynamics of HIV infection. Nature 1987; 326: 137 -142.

14. Marmor M, Friedman-Men A, Laubenstein L, et al. Risk factors for Kaposi's sarcoma in homosexual men. Lancet 1992; 1:1083-1086.

15. Vandenbroucke JR Pardoel V. An autopsy of epidemiological methods: The case of poppers in the early epidemic of the acquired immunodeficiency syndrome (AIDS). Am J Epidemiol 1989; 129:455-457.

16. Jorgenson KA, and Lawesson SO. Amyl nitrite and Kaposi's sarcoma in homosexual men. N Engl J Med 1982; 307:893-894.

17. Bruneau J, Lamothe F, Franco E, Lachance N, Desy M, Soto J, and Vinceletce J. High rates of HIV infection among injection drug users participating in needle exchange programs in Montreal: Results of a cohort sandy. Am J Epidemiol 1997; 146:994-1002.

18. Des Jarlais DC, Marmot M, Boone D, Titus S, Ciuhu S, Perle T, Benny J, Friedrnan S. HIV Incidence among injecting drug users in New York City Syringe-Exchange Programs. Lancet 1996; 348:987-991.

19. Bruneau J, Franco E, Lamothe F. Assessing harm reduction strategies: The dilemma of observational studies. Am J Epidemiol 1997; 146:1007-1010.

20. Lurie P. Invited commentary: Le mystere de Montreal. Am J Epidemiol 1997; 146: 1003-1006.

21. Kaplan EH, O'Keefe E. Let the needles do the talking. Evaluating the New Haven Needle Exchange Interfaces 1993; 23:7-26.

22. Kaplan EH, Heimer R. A circulation theory of needle exchange. AIDS 1994; 8:1083- 1086.

23. Kaplan EH. A method for evaluating needle exchange programs. Statistics in Medicine 1994; 13:2179-2187.

24. Brookmeyer R, Gail MH. Minimum size of the acquired immunodeficiency syndrome (AIDS) epidemic in the United States. Lancet 1986; 2:1320-1322.

25. Brookmeyer R. Reconstruction and future trends of the AIDS epidemic in the United States. Science1991; 253:37-42.

26. Brookineyer R, Gail MH AIDS Epidemiology: A Quantitative Approach. New York Oxford University Press, 1994.

27. Gail MH, Rosenberg PS, Goedert JJ. Therapy may explain recent deficits in AIDS incidence. J Acquir Immune Defic Syndr 1990; 3:296-306.

28. Gail MH. Use of observational data, including surveillance studies for evaluating AIDS therapies. Statistics in Medicine 1996; 15:2273-2288.

29. Centers for Disease Control. Найдено по адресу http://www.cdc.gov/hiv/graphics/pediatri.htm 27 июня 2000.

30. Stoto M, Almario D, McCormick M, editors. Reducing the Odds: Preventing Perinatal Transmission of HIV in the United States. Washington, DC: National Academy Press, 1999.

31. Byers RH, Caldwell MB, Davis S, Gwinn M, Lindegren M. Projections of AIDS and HIV incidence among children born infected with HIV. Statistics in Medicine 1998; 17:169- 181.

32. Brookmeyer R, Mehendale SM, Plez RK, Shepherd ME, Quinn T, Rodrigues JJ, Bollinger RC. Estimating the rate of occurrence of new HIV infections using serial prevalence surveys: The epidemic in India. AIDS 1996; 8:924-925

33. Brookmeyer R, Quinn T. Estimation of current HIV incidence rates from a cross-sectional survey using early diagnostic tests. Am J Epidemiol 1995; 141:167-172.

34. Brookmeyer R, Quinn T, Shepherd ht, et al. The AIDS epidemic in India: A new method for estimating current HIV incidence rates. Am J Epidemiol 1995; 142:709-713.

35. Brookmeyer R. Accounting for follow-up bias in estimation of HIV incidence rates. Journal of the Royal Statistical Society (A) 1997; 160: 127- 140

36. Kaplan E, Brookmeyer R. Snapshot estimators of recent HIV incidence rates. Operations Research 1999; 47:29-37.

37. Janssen RS, Sateen G, Stramer SL, et aI. New testing strategy to detect early HIV-l infection for use in incidence estimates and for clinical prevention purposes. JAMA 1998; 280:42-48.

38. Haloran ME, Haber M, Longini IM Jr, Struchiner CJ. Direct and indirect effects in vaccine efficacy and effectiveness. Am J Epidemiol 1991; 133(4):323-331.

39. Breslow NE, Day NE. Statistical Methods in Cancer Research, Vol. 2. Design and Analysis of Cohort Studies. Lyon, France: International Agency for Research on Cancer, 1987.

40. Donner A, Klar N. Cluster randomization trials in epidemiology: Theory and application. Journal of Statistical Planning and Inference 1994; 42:37- 56.

41. Donner A, Klar N. Methods for comparing event rates in intervention studies when the unit of allocation is a cluster. Am J Epidemiol 1994; 140:279 -289.

42. Donner A, Klar N. Statistical considerations in the design and analysis of community intervention trials. Journal of Cynical Epidemiology 1996; 49:435 -439.

43. Gail MH, Mark SD, Carroll RJ, Green SB, Pee D. On design considerations and randomization-based inference for community intervention trials. Statistics in Medicine 1996; 15:1069-1092.

44. Brookmeyer R, Chen YQ. Person-time analyst of paired community intervention trials when the number of communities is small. Statistics in Medicine 1998; 17:2121-2132.

45. Hayes R, Mosha F, Nicoll A, Grosskurth H, Jewell N, Todd J, Killewo J, Rugemalila J, Mabey D. A community trial of the impact of improved sexually transmitted disease treatment on the HIV epidemic in rural Tanzania: Design. AIDS 1995; 9:919-926.