Экологическая эпидемиология.

I. Hertz-Picciotto. Environmental Epidemiology

В кн.: Rothman K., Greenland S. Modern Epidemiology. 2nd ed., Lippincott Williams & Wilkins, Philadelphia, 1998 .- p. 555-583


Предмет экологической эпидемиологии.
Оценка воздействия.
Обзор типов исследования и аналитических инструментов экологической эпидемиологии.
Уроки истории.
Описательный анализ и использование данных по временным тенденциям и пространственному распределению.
Пуассонова регрессия.
Дополнительные вопросы анализа временных серий: влияние третьих переменных, авторегрессия и промежуточные переменные.
Специальные вопросы пространственного анализа: влияние третьих переменных и анализ кластеров.
Надзор.
Оценка риска.
Направления развития.


Предмет экологической эпидемиологии.

Одним из самых ранних опубликованных исследований в области экологической эпидемиологии была работа Бейкер (Baker, 1767) «Эндемичные колики в Девоншире». На протяжении половины столетия врачи обращали внимание на тот факт, что те, кто пьет темный сидр в Девоншире, часто серьезно заболевали с возникновением судорог, причем заболевание иногда заканчивалось смертью. Бейкер отметил, что любители сидра в других местах страны пили его в больших количествах без каких-либо последствий для себя. Поэтому он пришел к выводу, что «причину этой Колики не надо искать в чистом Сидре, а в некоем, либо сознательном, либо случайном изменении его состава». Изучение аппаратов, применявшихся в различных графствах, показало, что в прессах для изготовления сидра в Девоншире очень часто использовался свинец, который не применялся в других местах. Бейкер протестировал образцы сидра, полученные в Девоншире и в других графствах, смешивая их с серой. В образцах из Девоншира осаждался свинец, чего не было в других образцах. Эпидемиологический метод был простым: были обнаружены региональные различия в заболеваемости; были идентифицированы необходимые условия для возникновения заболевания (сидр), но его наличие было также отмечено в регионах с низкой заболеваемостью; были проанализированы условия воздействия для того, чтобы выявить подозрительную причину на основании симптомов, известных по клиническому наблюдению за работниками свинцовой промышленности, и было установлено, что они аналогичны симптомам, обнаруженным у любителей сидра из Девоншира. Ну и наконец, наличие вещества было экспериментально подтверждено в выборках из графств с высокой распространенностью заболевания, но это вещество не было обнаружено в графствах с низкой распространенностью заболевания. Современные исследования в области экологической эпидемиологии редко настолько успешны, поскольку меньше известно о различные реагентах, которые нас окружают, и частично в связи с тем, что отрицательные эффекты на здоровье менее выражены и могут иметь значительно больший индукционный период.

Для наших целей под внешней средой, которой занимается экологическая эпидемиология, мы понимаем факторы, являющиеся внешними и не являющиеся необходимыми для нормального функционирования человека, но изменяющие характеристики здоровья, факторы, которые могут вызывать заболевания. Поэтому окружающая среда включает физические, химические и биологические агенты, а также социальные, политические, культурные и инженерные или архитектурные факторы, воздействующие на контакт человека с подобными реагентами. Ранее экологическая эпидемиология фокусировалась в основном на биологических агентах и таких факторах, как система водозабора, канализация и гигиена питания. Появление санитарно-очищенной воды, строительство разветвленной канализационной системы, и принятие законов, регулирующих обработку пищи, являлось теми экологическими мероприятиями, которые в местах, где они внедрялись, значительно снижали, как заболеваемость, так и смертность. Во многих развивающихся странах необходимость для тех же самых мероприятий все еще остается важнейшей экологической задачей.

В последнее время внимание экологической эпидемиологии сместилось в основном к химическим и физическим агентам таким, как летучие органические соединения, металлы, пестициды и радиация. Источниками загрязнения могут быть индустриальные выбросы, автомобили, гормоны, которые добавляются в пищу животных, остатки пестицидов в пище и остатки этих веществ, достигающие резервуаров питьевой воды, химические выбросы во время производства или транспортировки, опасные отходы, радон из естественно возникающих геологических источников и минералы в грунтовых водах, как естественно появляющиеся в них (например, мышьяк), так и попавшие туда за счет активности человека (например, свинец или фтор), а также коммерческие продукты, контактирующие с кожей, такие как чистящие вещества, косметические средства и краски для волос. Экологическая эпидемиология также изучает характеристики заболеваний в популяциях, которые оказались в зоне действия таких катастроф как наводнение, землетрясение, воины и тому подобное.

Благодаря этому акценту на физических и химических агентах, имеются достаточно четкие связи между экологической эпидемиологией и эпидемиологией профессиональных заболеваний. Например, более высокая частота респираторных заболеваний среди шахтеров и других профессиональных групп, у которых воздух рабочих зон сильно  загрязнен пылью, дымом и гарью, привела к тому, что появились идеи о влиянии загрязнения воздуха на здоровье в городах. В то время как негативные эффекты наблюдались в группах с очень высоким воздействием, таким как обнаруживается на рабочем месте, возможность аналогичных эффектов с более низкой концентрацией в популяции, привела к обеспокоенности, как среди общественности, так и среди ученых, работающих в области здравоохранения. Все увеличивающиеся выбросы промышленных химических веществ в воздух, воду и в почву (United States Environmental Protection Agency,1991) все еще подчеркивают обеспокоенность этими проблемами.

Некоторые исследования в экологической эпидемиологии пытаются охарактеризовать эффект известных факторов на здоровье. Однако часто наблюдается изменение заболеваемости, для которой причинное объяснение отсутствует, и экологический эпидемиолог пытается обнаружить агент, ответственный за это заболевание. В любом случае определенность результатов четко связана с качеством оценки воздействия. В первом случае знание того, что существует некий агент, будет недостаточно до того момента, пока исследователь не сможет с минимальным уровнем ошибки идентифицировать индивидуумов - кто оказался подвергнутым воздействию, а кто – нет. Доказательства могут быть усилены, если мы будем разделять лиц, которые получили значительное и незначительное воздействие. В случае, когда агент неизвестен, можно обратить внимание на общую ситуацию (например, проживание рядом с источником промышленного загрязнения, дни с высоким загрязнением воздуха и т.д.), или же можно попытаться идентифицировать специфическое вещество, ответственное за повышение заболеваемости или смертности.

Хотя в некоторых случаях под словом окружающая среда мы понимаем все не генетические факторы, в данной главе мы пользуемся более часто используемым ограниченным определением, которое было приведено выше. В этом определении исключены, например, диетические предпочтения, несмотря не то, что они часто связаны с определенным регионом проживания, а также некоторые заболевания нехватки веществ, которые определены особенностями окружающей среды, такие как кретинизм, вызываемый отсутствием йода в диете (DeLong, 1993) или пеллагра у бедняков (Goldberger, 1914; Goldberger и соавторы,1920). Характеристики питания могут также оказывать воздействие на влияние других агентов: например, дефицит кальция увеличивает абсорбцию свинца из желудочно-кишечного тракта (Goyer,1995). Накапливаются доказательства тому, что антиоксидатны, часто встречающиеся во фруктах и овощах, защищают от развития рака и сердечно-сосудистых заболеваний (Weisburger,1991; Borek, 1995; Machlin,1995). Таким образом, эпидемиология питания при изучении взаимосвязи между внешней средой и заболеваниями, указывает на возможные вмешивающиеся переменные и модификаторы эффекта.

Воздействие факторов окружающей среды часто связано с социальными факторами, с местом, где человек живет, проводит свое свободное время или покупает продукты питания. Тот факт, что социальный, политический и экономический контексты являются важнейшими для большинства проблем в экологической эпидемиологии, пока еще признан не всеми. Как следствие, для учета социального класса в основном игнорируется неадекватность корректировки по уровню доходов и образовательному статусу. Хотя некоторые авторы, (например, Saracci,1998) включают социальный класс, как пример внешнего фактора «воздействия», для наших целей социальный класс, аналогично питанию, рассматривается как потенциальная третья переменная или модификатор эффекта.

Другой характеристикой воздействия факторов окружающей среды является то, что они в основном не добровольны. Например, шумовое загрязнение, производимое местным аэропортом, перхлорэтилен в грунтовых водах, попавший туда из расположенной поблизости химчистки, и т.п. Размеры подобного загрязнения могут находиться под контролем законодательства и оказываться под воздействием политических или экономических факторов. По этой причине, и в связи с тем, что могут иметься промышленные или коммерческие игроки, отвечающие за загрязнение, политические последствия многих экологических исследований (аналогично исследованиям в области профессиональных заболеваний) часто наступают достаточно быстро. Результаты могут использоваться как доказательства в судебных исках, или иногда, как основа для оценки риска и принятия решения о введение в действие регуляторных актов. Действительно, количественная оценка риска сама по себе является интерфейсом между наукой (как эпидемиологической, так и токсикологической), и политикой (Hertz-Picciotto, 1995 a, b). Учитывая те последствия, к которым часто приводят экологические эпидемиологические исследования, они должны базироваться на достаточно точных научных методах, поскольку работа затем должна выдержать серьезную научную и общественную критику.

Оценка воздействия.

Чаще всего именно качество оценки внешнего воздействия определяет достоверность экологического эпидемиологического исследования. Грубые бинарные переменные (например, да или нет; высокое или низкое) часто неадекватны, поскольку уверенность в воздействии может быть низкой и объединять большое количество различных уровней воздействия внутри потенциально не гомогенных групп риска. Упорядоченные категории предоставляют возможность оценки взаимоотношения между дозой и результатом. Тем не менее, оценка на непрерывной шкале воздействия в значимый период времени придает исследованию значительно большую чувствительность. Количественные показатели также позволяют исследователю оценить сопоставимость в разных исследованиях (Hertz-Picciotto и Neutra, 1994) и предоставляют основу для принятия решений в законодательной области.

Чрезвычайно полезным является разделение условий, которые подвергаются воздействию, на сложные смеси и одиночное воздействие. Условия, в которых возникает воздействие, обычно включают в себя определенную ситуацию и группу различных воздействий, которые могут меняться на протяжении времени, или от места к месту. Сгорание угля, например, приводит к появлению смеси, отличающейся от загрязнителей воздуха, которые возникают при сгорании автомобильного топлива. Загрязнители от автомобильного топлива варьируют в зависимости от типа топлива, температуры воздуха и солнечного света. Активное и пассивное потребление дыма различаются, как в результате различия в источнике табака, так и в результате различных добавок. Поэтому исследователь должен четко понимать насколько тестируемая им гипотеза определяет условия получения воздействия, что это - смесь, или одиночное воздействие и, соответственно, должен выбрать адекватный дизайн исследования и стратегию оценки воздействия. Общее заблуждение в подобных исследованиях заключается в том, что исследования, которые демонстрируют связи, но не идентифицируют определенного агента, отвечающего за эти взаимосвязи, хуже, чем те исследования, которые идентифицируют данный агент. Информация о влиянии группы воздействий или о воздействии в определенных условиях, может оказаться одинаково значимой, как и та информация, что указывает на определенный агент. Они также могут иметь большую предиктивную значимость и большую значимость с точки зрения общественного здоровья, поскольку профилактические вмешательства часто направлены на весь сценарий попадания человека под воздействие, а не на определенное вещество. Более того, в результате синергичного действия веществ сила воздействия смеси может оказаться больше, чем сила воздействия отдельных компонентов, входящих в смесь (Germolec и соавторы, 1989, Hertz-Picciotto и соавторы, 1992). Неспособность изолировать в окружающей среде индивидуальный агент, который отвечает за растущую заболеваемость, не должна использоваться для того, чтобы отсрочить решение о подобных вредоносных воздействиях.

Инструментами оценки воздействия являются: (1) интервью, опросники и структурированные дневники; (2) измерения во внешней среде (макро уровень) на основании существующих данных, либо при проведении эпидемиологического исследования (например, уровень побочных продуктов хлорирования воды, измеряемый в резервуарах водопроводной компании); (3) концентрации вещества в человеке, или на микро уровне (например, угарный газ в воздухе квартир, или тригалометаны в воде, собранной из-под крана); (4) индивидуальные дозы (например, использование индивидуального мониторирования воздуха или применения комбинации, состоящей из измерений датчика, стоящего на кране, с самоотчетами по потреблению воды и использованию воды для принятия ванны и душа); (5) измерение соединений в тканях человека (например, свинца в крови), или измерение концентрации метаболических продуктов (диметиларсената в моче после воздействия мышьяка); (6) маркеры физиологического эффекта (например, продуктов взаимодействия с белками, вызванные попаданием в организм бета-нафтиламинов из сигаретного дыма).

Все опросники и интервью полагаются на знания человека и его память, и поэтому они могут оказаться ошибочными. Личное или телефонное интервью могут приводить к тому, что многие факторы будут скрываться людьми и, кроме того, «желательность» того, или иного действия оказывает сильное воздействие на результаты опросов. Само заполняемые опросники избегают влияний интервьюера, но обычно у них наблюдается меньшая частота отклика, и они могут оказаться неподходящими для получения сложной информации, в то время как интервьюер может проверить, что респондент понимает вопрос и может обратить внимание на то, что какие-то показатели пропускаются (Armstrong и соавторы, 1992). Использование прокси-респондентов (лиц, которые должны оценить воздействие за кого-то другого) обычно приводит к еще большим ошибкам.

Необходимо иметь в виду различия между воздействием, которое измеряется во внешней среде и дозой, которая измеряется либо в тканях человека, либо в момент контакта индивидуума с окружающей средой (например, использование личного монитора или устройства для сбора образцов выдыхаемого воздуха). Различия между этими двумя показателями зависят от активности человека, его физиологических характеристик и вариабельности внешних воздействий самих по себе, как во времени, так и в пространстве. Измерения во внешних средах дают экологический показатель, и полезны в том случае, когда воздействие является широко распространенным в некоторых, но не во всех географических регионах, или не во все временные периоды, или более точно – когда групповые различия перевешивают межиндивидуальные различия. Примером подобной ситуации может являться некий регион, в котором содержание тригалометана в питьевой воде в десять раз выше, чем в других регионах. Межиндивидуальная вариабельность доз тигалометана, базирующаяся на потреблении воды, количества принятых душей и т.д., во многом перевешивается различиями между регионами, и таким образом, польза от сбора дополнительной информации о потреблении воды будет минимальной. Макро измерения также полезны, когда беспокойство направлено на общее, а не на индивидуальное воздействие, как возникает, например, при необходимости определения дозировок для законодательного регулирования. Прямые методы измерения во внешних средах должны быть проверены как при помощи жесткой системы контроля качества, так и с помощью логических связей между стратегией получения образцов и биодинамикой загрязнителя в окружающей среде (Seifert,1995).

Иногда для измерения воздействия в качестве суррогатного показателя используется продолжительность контакта (или потенциального контакта). При этом существует предположение о том, что продолжительность контакта коррелирует с кумулятивной действующей дозой. Если у различных индивидуумов воздействие сильно отличается, или оно значительно меняется на протяжении времени, подобное допущение является не реалистичным, и за счет этого истинные связи могут быть нарушены. В то время как характеристики деятельности могут позволить оценить индивидуальные различия, отсутствие данных об изменении действующей дозы со временем, очень трудно преодолеть. Когда имеются внешние показатели, они могут комбинироваться с продолжительностью и временем пребывания в загрязненном регионе, а также с информацией об активности (время, проведенное внутри дома или вне дома, количество потребленной воды и т.д.), в этой ситуации можно оценить количественную дозу воздействия для каждого индивидуума.

Тем не менее, эти оцененные индивидуальные показатели могут оказаться плохим суррогатом для индивидуально поглощенной дозы, в виду вариабельности, которая вносится различиями в частоте дыхания, возрасте, половой принадлежности, медицинском состоянии и т.д. Доза, действующая на ткани-мишени, зависит от фармакокинетики, иными словами, от распределения вещества в различных участках человеческого тела (почки, мозг, печень, кровоток и т.д.), скорости метаболизма и биохимических путей, которые могут приводить либо к формированию активного соединения, либо детоксифицировать его, кроме того, она зависит от времени хранения вещества и времени его выведения. Индивидуальные различия в фармакокинетике могут очень сильно воздействовать на различия в дозе в органах-мишенях. Например, медленные ацетиляторы будут иметь более высокую общую дозу, если исходное соединение являлось токсичным, в то время как быстрые ацетиляторы будут иметь большую дозу, если токсический агент является ни чем иным, как ацетилированным производным исходного соединения. Тканевые концентрации могут явиться лучшим показателем дозы, чем измерения во внешней среде и данных по активности, но в некоторых случаях они могут оказаться плохим индикатором долгосрочного воздействия. По поводу оценки преимуществ и недостатков различных методов изучения воздействия смотри работу Armstrong и соавторов (1992).

Когда сложно получить показатели для каждого конкретного человека, можно сконструировать суррогатный показатель, используя для этого дозиметрическое моделирование (Lebert, 1995). Измерение во внешней среде комбинируется с информацией о физико-химических свойствах изучаемого вещества, часто также с измерениями вещества в различных точках изучаемого места. В качестве примеров можно привести дисперсионные модели для загрязнителей воздуха, гидрорологическое моделирование воздействия веществ, растворенных в воде, и изоплетное моделирование заражения почвы. Эти модели предсказывают уровень воздействия в определенном регионе и могут улучшить точность моделей воздействия и ответа, используемых эпидемиологами. Тем не менее, поскольку модель - это простой набор структурированных допущений, дозиметрические модели, прежде чем они будут использованы для эпидемиологических исследований, должны быть проверены (Seifert,1995).

Еще одним концептуально важным вопросом является вопрос о том, как изучить биологически значимое количество. Было показано, что определенные типы рака связаны с электрическими и магнитными полями, оценка которых проводилась при изучении конфигурации сетей, при этом прямого измерения этих полей не проводилось. Однако при прямом измерении этих полей данные не нашли подтверждения. Это может быть связано с тем, что измерения не смогли оценить соответствующие воздействия во времени, или возможно, эти поля просто не являются вредоносными (Savitz, 1995). Обратите внимание, что если представленные связи не являются биологически значимыми, то тогда можно искусственно добиться усиления силы связи.

Время, когда необходимо проводить изучение воздействия, является специфичным для этиологической гипотезы и того заболевания, которое изучается. Ухудшение когнитивной функции у пожилых людей может быть связано с кумулятивной дозой свинца, которую лучше всего оценить по содержанию свинца в костях (период полураспада 10-15 лет), чем по содержанию свинца в крови (период полураспада 45 дней). В противоположность этому, при изучении эффекта воздействия свинца на плод, кумулятивное воздействие свинца на мать менее значимо, чем то количество свинца, которое попадает в кровеносную систему плода. Поэтому содержание свинца в крови матери во время беременности (откуда свинец может проникать в кровоток плода) является более разумным показателем, нежели содержание свинца в костях (в том случае, если при этом напрямую не измеряется, какое количество свинца постоянно высвобождается из этих костей). Воздействия или нахождение в загрязненных участках в определенные периоды в прошлом, являются более адекватными подходами для изучения заболевания с длительным латентным периодом, или для изучения заболевания, вызываемого длительно действующими хроническими воздействиями. В крупномасштабном изучении лейкемии, которое проводилось вокруг завода по переработке ядерного топлива в Селлафильде, в Западной Кумбрии в Англии, было отмечено повышенное количество случаев лейкемии среди детей, родившихся в деревне, но не среди недавно приехавших в этот регион. Это позволило предположить, что если воздействие и было ответственно за повышенное количество случаев лейкемии, то это воздействие начиналось до рождения (Gardner  и соавторы, 1987 a,b). Существуют некоторые данные, которые указывают на то, что пренатальные условия и условия в раннем детстве могут оказывать воздействие на здоровье взрослого человека (Barker, 1992), но эти данные необходимо подтвердить с использованием современных статистических методов для того, чтобы иметь возможность контролировать влияние третьих переменных.

К сожалению, реконструкция воздействия в прошлом очень часто связана с проблемами неадекватной информации, неполных измерений во внешних средах или не адекватности записи, которую в настоящий момент невозможно проверить. Для острых или умеренно краткосрочных эффектов (например, некоторые вредоносные воздействия на репродуктивную функцию) критический период может быть идентифицирован значительно легче. Исследования подобных результатов во многом выигрывают от сбора детальной информации по времени воздействия. 

Hertz-Picciotto и соавторы (1996) недавно продемонстрировали полезность ретроспективного сбора данных по воздействию, проведенных по месяцам беременности. Когда собирается информация о времени воздействия, но критический временной период не известен, может оказаться полезным анализ различных вариантов, в том случае, если имеется вариабельность воздействия между временными периодами и у различных людей. Если критический временной период известен, но обнаруживается взаимосвязь и в других временных периодах, тогда может оказаться, что (1) не совсем адекватно измерено время воздействия, (2) воздействие высоко коррелирует с временными периодами, или (3) имеются некоторые систематические ошибки, связанные с временными периодами.

Близкой темой является, так называемое, время удержания. Несмотря на то, что внешнее воздействие могло закончиться много лет тому назад вещества, имеющие длительные период полураспада, все еще могут присутствовать в окружающей среде. Трагический инцидент, известный как Юшо («масляное заболевание») в Японии и Ю-Ченг на Тайване, включали в себя потребление пищевого масла, загрязненного полихлоринированными бифинильными соединениями (Kuratsune и соавторы, 1972; Chen и соавторы, 1994). Дети, рожденные спустя годы у женщин, которые отравились этим маслом, страдали от тяжелых нарушений психомоторного развития вследствие пренатального воздействия вещества, сохранившегося в теле матери (Chen и соавторы, 1994). Пребывание хлоророрганических пестицидов в жировых тканях позволяет оценить воздействие в более ранние периоды, что является полезным при проведении исследований по типу случай-контроль.

Биологические маркеры такие, как изменения на клеточном, биохимическом или молекулярном уровне, могут также предоставить информацию о воздействии в прошлом. Они могут указывать на полученную дозу, или могут использоваться для того, чтобы оценить дозу в тканях-мишенях, являясь, таким образом, дополнением к данным, полученным при опросе пациентов. Временной период воздействия, который отражается этими биомаркерами, должен быть четко определен, в противном случае выводы могут оказаться ошибочными.

Важность оценки внешнего воздействия в экологической эпидемиологии не может быть переоценена. Не только достаточно большими часто являются наблюдающиеся ошибки, но также иногда исследователь не знает, что являлось воздействием, и каков был источник воздействия, как, например, в некоторых проектах по изучению свалок токсических отходов. Даже когда известно и воздействие, и источник, благодаря которому оно может проникать в организм, часто не оцениваются индивидуальные уровни воздействия, несмотря на их потенциально высокую вариабельность. Примером может являться изучение эффектов на репродуктивную систему, при кажущейся весьма хорошо организованной программе оценки воздействия малатиона, распылявшегося с воздуха в различных регионах Калифорнии (Thomas и соавторы,1992 b). Исследователи оценили воздействие на основании адреса проживания, коридоров пролетавших самолетов, которые проводили опрыскивание, и математической модели дисперсии. Однако исследователи не собрали индивидуальные данные по времени, которое люди проводили в месте своего проживания, а также находились ли они внутри дома или вне его в момент опрыскивания, что предоставило бы более четкую возможность для изучения прямого контакта человека с пестицидами. Не проводилось также никаких измерений на приусадебных участках. Не проводилась оценка биологических образцов для изучения абсорбированной дозы и т.д.

Ошибки при измерении воздействия могут приводить как к появлению систематической ошибки, так и появлению неточностей при оценке эффектов воздействия на здоровье. При использовании линейных моделей с нормально распределенной ошибкой и гомоскедастичностью, систематическая ошибка в коэффициентах регрессии может оцениваться как отношение дисперсии у каждого конкретного индивидуума, к дисперсии между индивидуумами. Например, если это отношение равно 1, то оцененный коэффициент составляет всего лишь половину своего истинного значения (Brunekreef и соавторы, 1987). В реальной ситуации отношение дисперсии может быть еще больше, что приводит к значительным отклонениям от истинных величин. Исследование профессиональных воздействий, которые используют должностную классификацию, очень часто имеют крайне высокую вариабельность внутри каждой категории (Rappaport и соавторы, 1993). Аналогичные проблемы преследуют и исследования окружающей среды. С другой стороны, повторные измерения могут позволить получить более точные оценки воздействия, в результате чего систематическая ошибка в оценке эффекта будет уменьшена (Brunekreef и соавторы, 1987; Liu и соавторы, 1978; Rappaport и соавторы, 1995). Обратите также внимание на то, что когда индивидуальная вариабельность является достаточно большой, макро и микро измерения воздействия могут оказаться более предпочтительными, по сравнению с индивидуальными измерениями или биологическими измерениями, поскольку они лучше оценивают среднее воздействие (Rappaport и соавторы, 1995).

Другой возможностью для улучшения оценки воздействия является интегрирование большого количества переменных в географических информационных системах (ГИС). ГИС – это компьютерная программа, которая предоставляет инструменты для введения баз данных статистического анализа, включая пространственные характеристики в рамках достаточно сложных моделей. Эти системы могут накладывать друг на друга топографические карты (включая распределение источников воды, тип почвы и т.д.), метеорологические, социо-демографические данные, данные по инфраструктуре системы здравоохранения и другие. Известные примеры применения подобных систем включают определение элементов ландшафта, которые объясняют повышенное количество переносчиков заболеваний, таких как комары Anopheles albimanus в Мексике (Beck и соавторы, 1994); изучение воздействий на популяции, проживающей в районе линии электропередачи (Wartenberg и соавторы, 1993); оценку плотности популяции по отношению к местам выбросов токсических химических веществ (Stjckwell и соавторы, 1993); и создание карт с обнаружением регионов, где у детей наблюдается высокая концентрация свинца в крови для того, чтобы организовывать скрининговые программы и программы по профилактике (Guthe и соавторы, 1992). При планировании исследования полезность существующих показателей и/или решение о том, какой количество и какой тип измерений необходимо делать, требует четкого понимания вариабельности показателей как у каждого индивидуума, так и между различными субъектами исследования. Проблемы различных подходов к оценке воздействия серьезно обсуждаются Hatch и Thomas (1993).

Обзор типов исследования и аналитических инструментов экологической эпидемиологии.

Экологическая эпидемиология использует все стандартные типы исследований таких, как когортные, одномоментные, исследования по типу случай-контроль, экологические и популяционные вмешательства. Например, первое исследование, указывающее не то, что хроническое воздействие низких концентраций свинца оказывает негативное воздействие на психическое развитие детей, включало в себя когортные исследования (de la Burde и Choate, 1972,1975) и исследования по типу случай-контроль (Youroukos и соавторы,1978). В классическом одномоментном исследовании Needleman с соавторами (1979) было описано кумулятивное воздействие свинца в детстве на основании содержания свинца в молочных зубах. После корректировки на большое количество возможных вмешивающихся факторов, рост дозы свинца, полученный в течение всей жизни, был связан с более низким коэффициентом интеллекта и проблемами с поведением. Дальнейшее одиннадцатилетнее проспективное наблюдение за когортами, идентифицированными в одномоментном исследовании, продемонстрировало, что воздействие свинца в раннем детском возрасте является предиктором неспособности закончить среднюю школу, а также более низких оценок по чтению, более ограниченного словарного запаса, худшей координации деятельности рук и глаз, а также худшего времени реакции на раздражители (Needleman и соавторы, 1990). Пример связи между воздействием свинца и развитием нервной системы демонстрирует то, как серии исследований различных типов в разных популяциях позволяют накопить серьезные объемы доказательств по потенциально причинно-следственным взаимоотношениям.

Популяционные профилактические исследования можно проанализировать на примере оценки полезных эффектов фторирования воды. Ast (1962) просуммировал результаты четырех подобных вмешательств, начатых в 1940-е годы. Сравнение данных, полученных в периоды до начала фторирования воды, с данными, полученными после этого вмешательства, показало, что количество кариозных, запломбированных или потерянных зубов на одного ребенка значительно уменьшилось: диапазон снижения в четырех регионах составлял от 48% до 70%.  Те же популяции, у которых в воде не хватало фтора, но они не фторировали свою водопроводную воду, продолжали страдать от высокой частоты кариеса. Эти исследования продемонстрировали, что добавление фтора в воду для профилактики кариеса оказывает такое же воздействие, как и естественно фторированная вода.

Проблемы, которые являются специфичными для экологической эпидемиологии, привели к появлению новых типов исследований, включая двух-стадийный рандомизированный набор (Weinberg и Wacholder,1990; Weinberg и Sandler, 1991). Двух-стадийные дизайны исследования (White, 1982 b; Walker, 1982 a) в целом полезны для (1) изучения редких воздействий, которые связаны с редкими заболеваниями (например, поздняя смерть плода и профессиональное воздействие в популяционной когорте), или (2) в тех ситуациях, когда одни случаи более информативны, чем другие, как возникает в большинстве ситуаций, когда известные факторы риска не очень интересуют исследователей. Примером подобного подхода является исследование по типу случай-контроль для изучения причин рака легких у некурящих людей. Значительным преимуществом двух-стадийного дизайна исследования является то, что не надо собирать информацию о ковариантах для всей изучаемой популяции, в результате чего стоимость сбора данных уменьшается. Если статус заболевания и некоторая информация о воздействии легко доступна, они могут быть использованы на первой стадии для того, чтобы определить вероятности рекрутирования в исследование до того, как будет произведен более интенсивный поиск данных.

Рандомизационные схемы были разработаны для того, чтобы понизить стоимость и улучшить статистическую эффективность при изучении связи радона и рака легких (Weinberg и Wacholder, 1990; Weinberg и Sandler, 1991). Поскольку большинство случаев рака легких могут быть связаны с курением, целью было обеспечить большее количество не курящих пациентов с раком легких и добиться вероятностного выравнивания групп случаев и контроля по статуту курения. Преимущества рандомизационного набора, по сравнению с обычным частотным набором включают: (1) до начала исследования не надо знать распределения факта, по которому проводится формирование пар в общей популяции,; (2) одновременно с появлением случаев рекрутируются и контроли (вместо того, чтобы дожидаться, пока будет набрана группа всех возможных случаев), и (3) может быть также изучен эффект «парообразования» или факторы скрининга первой стадии.

Экологические исследования весьма часто используются в эпидемиологии факторов окружающей среды, поскольку воздействие очень часто измеряется на групповом уровне, или в связи с тем, что ограниченные ресурсы для выполнения исследования не дают возможности для сбора индивидуальных данных. Обратите внимание на то, что если только одна переменная измеряется на групповом уровне обычного воздействия, то тогда анализ может рассматриваться, как уровень индивидуального анализа, при котором известна ошибка измерения для одной переменной. Менее известные факторы, которые характерны для экологического исследования в эпидемиологии окружающей среды, включают в себя следующее:

  1. Условия для возникновения влияния третьих факторов различаются при анализе индивидуальных исследований против групповых исследований и исследований экологического уровня, и при экологическом анализе некоторые типы третьих исследований не могут быть адекватно проконтролированы.
  2. Экологическое смещение может возникать, когда мы приходим к заключению о взаимосвязях на индивидуальном уровне, базируясь на анализе, выполненном на групповом уровне.
  3. Борьба против систематических ошибок в экологических исследованиях может быть усилена, когда (а) используются небольшие географические регионы (исключением является изучение заболеваний с длительными инкубационными периодами, когда миграция может оказаться серьезной проблемой), и (б) для анализа единица наблюдения стратифицируется в группы для того, чтобы добиться более гомогенного риска развития заболевания.

Несмотря на свои проблемы, экологические исследования могут оказаться полезными, когда (1) область исследования является новой, или исследование уперлось в какой-то тупик и его целью является достаточно дешево осуществить скрининг гипотез (в этой ситуации могут оказаться очень полезными временные тенденции, когорты по рождению и картографические исследования); (2) целью является определение эффективности программы политических действий или законодательных актов, которые осуществляются на экологическом уровне, такие, в которых воздействие является гомогенным у всех индивидуумов (однако для подобных исследований на индивидуальном уровне проблемой все еще может оказаться влияние третьих переменных); или (3) вариабельность у индивидуумов перевешивается различиями между группами (смотри ранее описанный пример по тригалометану в питьевой воде).

На экологических данных часто базируются три достаточно полезных типа исследования. К ним относятся: (1) изучение региональных различий путем картографического анализа; (2) изучение внутригрупповых изменений за счет анализа временных тенденций и временных серий; и (3) оценка различий во временных тенденциях в различных регионах, или изменения в пространственных характеристиках на протяжении длительного периода времени. В каждом из них описательный анализ затем может быть использован для того, чтобы создать модель, которая будет использовать региональные или временные атрибуты для предсказания уровня заболеваемости. Таким образом, наибольший интерес представляют инструменты, которые позволяют связать пространственную и временную вариабельность воздействия, с пространственной и временной вариабельностью в интересующих нас заболеваниях, или других состояниях здоровья. До недавнего времени эта связь определялась за счет простых таблиц и графиков, аналогично стратифицированному анализу, который используется в эпидемиологии в целом. Сейчас уже доступны статистические модели для относительных показателей, позволяющие контролировать множественные третьи переменные. Следующий раздел на примере исторических проблем в эпидемиологии, иллюстрирует некоторые из принципов, которые воздействуют на тип исследований и анализ временных и пространственных феноменов. Последующие разделы анализируют специальную технику, которая может использоваться в экологической эпидемиологии.

Уроки истории.

В своем начальном периоде экологическая эпидемиология интересовалась в основном биологическими агентами и факторами внешней среды, которые воздействуют на контакт человека с подобными агентами. Несмотря на свой нынешний акцент на химических и физических агентах, уроки от таких работ, как та, что была выполнена Сноу (Snow) в 1855 году не должны быть забыты. Данный раздел приводит несколько классических исследований, которые анализировали агенты, распространяющиеся через воздух и воду.

Пример заражения воды.

Классическая работа Джона Сноу (1855) о распространении холеры представила достаточно большой диапазон доказательств того, что фекальные массы инфицированных пациентов, которые потребляются в очень маленьких количествах, но несущие в себе «болезненный яд», являются основным способом передачи холеры, и что смешивание канализационных стоков и питьевой воды создает условия для широкомасштабной передачи. Методология, при помощи которой проводилось это исследование, двигалась от серии случаев, отслеживающих появление эпидемии в муниципалитете, до картографического анализа случаев и экологического сравнения различных районов Лондона во время вспышек холеры 1832, 1849 и 1853 годов, и, наконец, до естественного эксперимента (когортного исследования, в котором воздействие распределяется между когортами так, как будто бы оно находится под контролем только случайных факторов). Экологическое межобщинное сравнение регионов Лондона сопровождалось оценкой данных о стоимости недвижимости для того, чтобы продемонстрировать отсутствие связи между источником воды и богатством. Таким образом были представлены доказательства того, что данная взаимосвязь не являлась следствием этой потенциальной третьей переменной. Естественный эксперимент был случайным событием, но Сноу усилил результаты этого анализа, включив туда индивидуальное подтверждение воздействия. На самом деле, Сноу сам (и один его ассистент) посетили дома всех жертв холеры, и попросили выживших жителей сообщить им название их водопроводной компании. Большинство не могли вспомнить название компании, пока не находили счет. Как результат было признано, что самостоятельные отчеты являются не адекватными. Сноу поэтому требовал счет, или при невозможности этого сделать, старался получить бутылочку воды из-под крана. Затем выяснилось, что хотя он не мог искать сам микроорганизм (поскольку он еще не был открыт), были значительные различия в количестве поваренной соли, содержавшейся в этих двух типах воды. Добавление нитрата серебра позволяло разделять два источника воды, поскольку загрязненная вода начинала преципитацию только при количестве хлорида серебра в 40 раз большего (указывая на более высокий уровень поваренной соли в воде), чем более чистая вода, которая забиралась вне канализационных сбросов Лондона вверх по течению (Snow, 1855, стр. 78). Поэтому воздействие в доме каждого пациента определялось с очень высокой точностью. Знаменатели для количества подвергшихся воздействию и не подвергавшихся воздействию, были получены на основании отчетов водопроводных компаний, которые указывали на количество домов в каждом районе, снабжавшихся той или иной компанией.

Сноу оценил совпадения между различными источниками информации и то, насколько они совпадали с возможным путем распространения заразного начала. Он обратил внимание на то, что в том случае, если источники воды не были загрязнены, холера, встречалась в основном в перенаселенных районах, где жили бедняки и рабочий класс. В районах, расположенных поблизости от Broad Street, заболевание без разбора наносило удар, как по богатым, так и по бедным домам. Хотя для сегодняшних эпидемиологов сложно понять скептицизм, с которым была принята теория Сноу о пути передачи инфекции, ясность мышления Сноу и его крайняя аккуратность, когда он пытался совместить все аспекты эпидемии холеры в Лондоне и в других местах с не популярной на тот момент теорией, служат моделью для современной экологической эпидемиологии.

Примеры загрязнения воздуха.

Литература по эффектам на здоровье, вызываемыми загрязнением воздуха, может быть разделена на три периода. Эти три эры исследований демонстрируют взаимоотношение между целью исследования и дизайном исследования, а также между дизайном исследования и методом анализа.

Первое поколение исследований было заинтересовано в изучении эффектов на здоровье событий, которые приводили к крайне высокому уровню загрязнения воздуха. Эти события обычно вызывались метеорологическими инверсиями, такими как те, что произошли в долине реки Меузы в Бельгии в 1930 году (Firket, 1931), в городке Донора, штат Пенсильвания в октябре 1948 (Schrenk и соавторы, 1949) и в Лондоне зимой 1952 года. Во время Лондонского «тумана» концентрация дымов и диоксида серы были в 8-10 раз выше, чем в предыдущие три недели (Scott, 1953) и резко увеличилось количество смертей от сердечно-сосудистых заболеваний и заболеваний дыхательных путей (Logan, 1953), (таблица 28-1). Сильнее всего пострадали пожилые люди и новорожденные дети, что отразилось на росте общей смертности, аналогичной той, что возникла во время эпидемии холеры 1866 года. Заболеваемость имела одинаковые характеристики (Abercrombie, 1953) и соответственно точно также менялось количество заболеваний и смертей среди животных на фермах.

Первое поколение исследований заражения воздуха методологически были аналогичными исследованиям эпидемии инфекционных заболеваний, которые заполняли журналы по эпидемиологии и общественному здоровью в тот период времени: сравнение внутри общин с использованием дизайна исследования до-и-после, базируясь на витальной статистике, больничных данных, а также на опросах людей по поводу наличия симптомов. Заболеваемость или смертность во время периода времени, когда происходило увеличение концентрации веществ, сравнивалась с ситуацией в той же самой популяции во время более ранних периодов, когда не наблюдалось подобного загрязнения. Сравнение внутри общины является идеальным дизайном для изучения эффектов, имеющих крайне короткий латентный период - от нескольких недель, до нескольких месяцев, а также в тех случаях, когда миграция не является большой проблемой и имеется четкое разделение периодов: периода резкого роста концентрации загрязнителя и периода низкой концентрация загрязнителя.

Второе поколение исследований, выполненных в 1950-е и 1960-е годы, было направлено на изучение значительно менее выраженных уровней загрязнения, и очень часто базировалось на дизайнах исследований, сравнивающих общины с более высоким уровнем загрязнения, с общинами, в которых уровень загрязнения был ниже (Burn и Pemberton, 1962; Zeidberg и соавторы,1967; Lave и Seskin,1970), например, в исследовании в штате Нью-Йорк, где уровень загрязнителей был значительно ниже, чем даже исходный уровень до начала Лондонского смога (Lee и соавторы, 1972). Winkelstein и соавторы (1967) обнаружили, что области, характеризующиеся высокими концентрациями мелкодисперсных частиц в воздухе, по сравнению с низкой общей концентрацией, имеют повышенный уровень смертности. Аналогично более ранним эпизодам, при более резко выраженных эпизодах,  увеличивалась смертность от заболеваний легких, а наиболее уязвимыми были пожилые люди. Второе поколение исследований также расширило изучение тех результатов, которые включали ухудшение течения заболевания легких, не требовавших госпитализации (Carrow и соавторы,1969).

Наибольшая проблема, с которой сталкивались эти исследования, сравнивавшие между собой различные общины, заключалась в том, что имелась четкая корреляция между социально-экономическим уровнем и уровнем загрязнения воздуха. Хотя тенденции в изменении заболеваний с увеличением загрязнения воздуха по исходным данным очень часто менялись, если данные стратифицировались по социально-экономическому уровню, они не исчезали. Тем не менее, возможность остаточного влияния третьих переменных вследствие неадекватной характеристики социально-экономического статуса и других, не измененных факторов, оставалась в силе.

Несмотря на эти слабые стороны, исследования загрязнения воздуха второго поколения, продемонстрировав угрозу обычного загрязнения воздуха для здоровья популяции в целом, привели к развитию и принятию стандартов для воздуха, включая принятия «Акта о чистом воздухе» в 1970 году, который пытался защитить население от загрязнения воздуха (смотри Luneberg, 1995, для того, чтобы ознакомиться с юридическими вопросами охраны окружающей среды в Соединенных Штатах).

Таблица 28-1. Зарегистрированные смерти в административных границах Лондона по диагнозам, начиная с недели, заканчивавшейся 22 ноября до недели, заканчивавшейся 27 декабря 1952 года.

 

Количество смертей для недели, заканчивавшейся:

Среднее количество смертей в неделю для недель, заканчи-вавшихся 22 ноября, 29 ноября и 6 декабря

Проценты средних из первых трех недель для недели заканчивающейся

Причина

 22 ноября

 29 ноября

 6 декабря

13 декабря

 20 декабря

 27 декабря

 13 декабря

 20 декабря

27 декабря

Туберкулез легких

 18

19

14

77

37

21

17.0

453

218

123

Рак легких

 38

27

45

69

32

36

36.7

188

87

98

Сердечно-сосудистые заболевания

225

272

273

707

389

272

256.7

275

152

106

Гипертензия

 12

1719

47

36

21

16.0

294

225

131

 

Другие сердечно-сосудистые заболевания

 27

23

26

46

31

32

25.3

182

123

127

Грипп

 1

7

2

24

9

6

3.3

720

270

180

Пневмония

 31

28

45

168

125

91

34.7

486

363

264

Бронхит

 46

73

76

704

396

184

65.0

1.083

609

283

Другие заболевания легких

 10

8

9

52

21

13

9.0

578

233

144

Не отклассифици-рованные случаи

 19

26

25

79

35

37

23.3

339

150

159

Все другие случаи

 326

353

411

511

412

316

363.3

140

113

87

Все причины

753

853

945

2,484

1,523

1,029

850.3

292

179

121

Источник: Scott J.A. Fog and Deaths in London, December 1952. Public Health Reports 1953; 68(5)474-479

Третье поколение исследований было направлено на изучение даже еще более низких уровней загрязнения воздуха и еще менее заметных эффектов. Эти недавно выполненные исследования во многом полагались на временные серии внутри общины, которые изучали эффекты флюктуаций уровней загрязнителей на протяжении определенного периода времени в одном и том же регионе. Хотя сравнение между общинами могут быть полезными, когда сравнимость достаточно высока (например, Pope, 1991), сравнения внутри общины избегают проблем третьих переменных, которые отличаются у разных индивидуумов, но остаются постоянными на протяжении, интересующих нас периодов времени. Например, распространенность курения и распределение количества лиц разного социального класса, а также распределение жителей по возрасту, может различаться между общинами, но крайне мало вероятно, чтобы эти показатели резко изменились на протяжении короткого периода времени. И даже если они изменяются (например, для 3-х летнего исследования), мало вероятно, что эти изменения отражают краткосрочные изменения в уровне загрязнения воздуха, возникающие в период нескольких недель.

Современные исследования низкоуровенего загрязнения воздуха позволяют предположить, что существует достаточно четкая взаимосвязь загрязнения воздуха с увеличением таких исходов, как смерть и госпитализация, или симптомов, сообщаемых самим человеком, ухудшением течения бронхиальной астмы, а также они отражаются на прямых измерениях показателей функции легких у здоровых лиц (Schwartz и Dockery, 1992; Dockery и соавторы, 1993; Pope и соавторы, 1991). Хотя четкие механизмы и специфические воздействия, или комбинации этих воздействий еще только предстоит выявить, аналогичность результатов, получаемых при исследованиях, опирающихся на данные, собранные как внутри общин, так и при сравнении между общинами, усиливает доказательства причинно-следственных связей между загрязнением воздуха и возникновением различных заболеваний.

Описательный анализ и использование данных по временным тенденциям и пространственному распределению.

Картирование и анализы временных тенденций, описанные в исторических примерах в предыдущих разделах, сейчас будут обсуждены более детально.

Анализ, зависящий от временных изменений.

Имеются три основных типа изменений со временем частоты заболеваний: временное объединение, циклические процессы и логитюдные тенденции. Временное объединение обычно возникает, когда агент недавно привнесен в окружение человека, или когда поведение самого человека внезапно приводит к тому, что популяция сталкивается с воздействием или патогеном, с которым не сталкивалась раньше в таких больших количествах. В качестве примеров можно привести возникновение за короткий период времени нескольких случаев крайне редкого порока развития в одной из больниц в Австралии, что привело к тому, что талидомид был идентифицирован, как соединение, тератогенное для человека (Taussing, 1962). Вспышка, приведшая к тысячам случаев паралича в Мекнесе в Марокко, привела к идентификации партии оливково масла, загрязненного крезил фосфатами, использовавшимися в качестве смазочных масел (Smith и Spalding, 1959). И при обычных пищевых отравлениях, которые могут являться следствием неадекватной обработки пищи и привнести бактериальное загрязнение, например, такое как сальмонелла, возникают ситуации, при которых в определенный короткий период времени, большое количество людей, собираясь вместе, потребляют эту загрязненную пищу, или эта пища достаточно широко распространяется другим путем. К этой же группе относятся несчастные случаи, такие как кораблекрушения, авиакатастрофы и пожары, а также естественные катастрофы такие, как землетрясение, наводнение, и политические беспорядки, такие как войны и насильственное перемещение населения. Все они могут приводить к появлению временных кластеров повреждений и к смерти.

Циклическая характеристика возникает при большом количестве заболеваний. Циклические изменения не являются удивительными, учитывая хорошо известные циклы размеров и активность популяции переносчиков, изменение физического окружения, которое может воздействовать на патогенное начало, а также многие физиологические функции человека и его поведение. Хорошо известным примером этого являются времена года: смертность от сердечно- сосудистых заболеваний, от сосудистых поражений мозга и заболеваний легких увеличиваются зимой и снижаются летом (Anderson и Le Riche, 1970; Bull и Morton, 1975), однако в то же время, и крайне выраженные колебания жаркой погоды так же могут приводить к увеличению смертности от этих причин (Gover,1938). Обнаружение цикличности в заболеваемости предполагает, что действует цикличная причина, и она очень часто рассматривается как доказательство возможной инфекционной этиологии, хотя могут играть роль также другие причины: температура, уровень инсоляции, поведение и сезонные факторы со стороны окружающей среды, например использование определенных пестицидов.

Исследования более постепенных изменений (в противоположность группировке во времени) играли важную роль в эпидемиологии на протяжении всей истории ее развития. Нанесение на график эпидемических кривых на протяжении времени привело к пониманию вероятности наличия инкубационного периода и передачи коллективного иммунитета. Исследования заболеваемости и смертности, когда данные включают в себя большой срок наблюдения (например, годы или десятилетия), были использованы для того, чтобы сгенерировать гипотезы о причинных факторах развития различных заболеваний, таких как сердечно-сосудистые заболевания (Marmot, 1992), рак молочной железы (Tarone и Chu,1992; Swanson и соавторы,1993) и астма (Jackson и соавторы, 1988; Arrighi, 1995) – и это только отдельные примеры.

Рассуждения о причинах логитюдных тенденций могут оказаться достаточно спорными. Факторы, которые будут вмешиваться в наблюдаемые закономерности, включают в себя изменения точности и изменение самих диагностических процедур, изменения времени выживаемости в результате более эффективного лечения и при изучении смертности, а также обращение за медицинской помощью, если изучаются менее тяжелые заболевания (Devesa и соавторы, 1984; Gardner и Osmond, 1984). Тем не менее описание тенденций с точки зрения, как амплитуды заболеваемости, так и ее распределения в различных половых и возрастных группах, может оказаться полезным источником идей об этиологии заболевания. Когда видны половые различия, те факторы, по которым различаются мужчины и женщины (профессия, курение, потребления алкоголя и т.д.) с большей вероятностью играют роль, нежели источники, которые оказывают воздействие на всех людей без разбора (реагенты, находящиеся в пище или воде, автомобильные выбросы и т.д.). Тенденции в изменении заболеваемости и их вариабельности в различных подгруппах популяции, могут стимулировать формулировку новой научной гипотезы.

Поведенческие изменения и другие изменения воздействий, которые возникают у людей с течением времени, когда они оказывают воздействие на заболеваемость, приводят к периодическим эффектам. Изменения, возникающие в разных поколениях (люди, родившиеся позднее, ведут себя иначе) приводят к появлению эффектов когорты рождения. Поскольку возраст, период и когорты линейно зависят друг от друга, полная модель, включающая все три фактора, является невозможной, означая, что нет метода, при помощи которого мы смогли бы адекватно описать все три эффекта вместе, не делая никаких дополнительных допущений. Тем не менее, анализ когорт рождения особенно полезен, когда воздействие относительно краткосрочное или меняется на протяжении времени непостоянно (например, смотри Frost, 1939).

Создание картограмм.

Создание карт, на которые наносится заболеваемость, служило той же самой цели, что и анализ временных тенденций или когорт рождения. Еще в 1790-х годах карты случаев желтой лихорадки на Восточном побережье Соединенных Штатов сыграли важную роль в дебатах между сторонниками заразной и не заразной теорий возникновения этого заболевания (Howe, 1989). Карта Сноу, демонстрирующаяся в случае холеры вокруг колонки на Broad Street, продемонстрировала значимость этой причины (1855). Создание карт эндемических заболеваний было начато позднее. О истории картографии и ее использования при изучении эпидемий девятнадцатого и двадцатого столетий смотри в работах Howe (1989).

Имеются три важнейших характеристики карты, которые включают в себя: (1) как обозначаются места – это точечные показатели или регионы, (2) являются ли они регулярными или нерегулярными и (3) переменная, которая наносится на карту, является непрерывной или дискретной. Создание карт для непрерывных данных, таких как заболеваемость или средняя продолжительность жизни в штатах или графствах, включает в себя (1) разделение

географического региона на дискретные области (обычно используются административные единицы, в которых собираются данные), (2) расчет стандартизованных отношений или средних для каждого региона, (3) категоризация этих отношений или средних  и (4) установление связи, а для того чтобы представить эти упорядоченные категории  используется цвет или штриховка. Результатом является, так называемая, хлороплетная карта отношений или средних. Для отражения более высокой частоты показателя используется увеличивающаяся интенсивность цвета, или более темная штриховка, при этом следует помнить, что использование разнообразных цветов, или сильных и ярких цветов, снижает легкость анализа (Tufte,1990).

Необходимо принять адекватное решение по отношению к тому, каков будет метод стандартизации, количество категорий, где делать точки разделения, и несколько эти точки разделения должны варьировать в разных картах, если делается набор карт (Smans и Esteve,1992). Количество категорий должно быть выбрано таким образом, чтобы максимизировать информацию, которую получит читатель. Если формируется набор карт для одного и того же региона (например, карта для каждого вида рака в определенной стране), тогда большая вариабельность в заболеваемости предполагает использование различных точек разделения на разных картах, поскольку использование одних и тех же абсолютных точек разделения, может привести к крайние неинформативным картам, либо для более редких, либо для более часто встречающихся форм заболевания.

Приведенные выше рассуждения, хотя и являются важными, обычно перекрываются значительно более сложной проблемой: для редких заболеваний карты, базирующиеся на наблюдаемой частоте заболеваний, могут иметь одну серьезную ошибку. Поскольку в разных регионах размеры исходной популяции практически всегда различаются, многие регионы с высокой частотой заболевания будут иметь крайне небольшое количество случаев. Иными словами, чем меньше популяция, тем больше нестабильность заболеваемости и поэтому, тем выше вероятность крайне высокой заболеваемости. Графики исходных, или стандартизованных заболеваемостей, соответственно, могут привлекать внимание к повышенным, но не стабильным рискам в мало населенных регионах (связанной с этим проблемой, является нулевая заболеваемость в регионах с крайне различающимися размерами популяции). Обсуждение методов различия в регионах с нулевыми частотами заболевания смотри в работе Cressie (1991). Альтернативой для создания графика частот является график вероятностей,  иными словами, график Р - оценок, а не наблюдаемых частот. Однако этот подход обращает более пристальное внимание на большие регионы, где относительно небольшое увеличение относительного риска будет приводить к более значимым Р - оценкам. В результате внимание фокусируется на размерах популяции, а не на размерах риска.

С технической точки зрения наблюдаемая частота – это оценка по методу максимального правдоподобия истинной частоты в любом регионе, но набор наблюдаемых частот не обязательно является наилучшим набором оценок для подобных истинных частот заболеваемости (Efron и Morris, 1977). Для того чтобы представить себе эту проблему, вообразите двух-стадийный процесс, который приводит к появлению наблюдаемых частот (Devine и соавторы, 1994). Во-первых, истинная (но не измеренная) средняя частота qi для каждого региона возникает в результате распределения заболеваемостей на всей карте. Средняя этого распределения равняется истинной частоте для всей карты. Во-вторых, существуют наблюдаемые частоты для каждого региона, которые возникают от распределения, имеющего среднее qi - истинную частоту в этом регионе. Иными словами, для каждого региона мы наблюдаем одну частоту из распределения частот в этом регионе. Мы хотим построить карту с наилучшими оценками, специфичными для данного региона частотами qi . Проблема заключается в том, что необходимо уменьшить «шум», связанный с вариабельностью внутри региона таким образом, чтобы карта иллюстрировала вариабельность между регионами, соответствуя вариабельности истинных, специфичных для региона частот qi .

Одним из решений данной проблемы является объединение индивидуальных значений с последующим формированием из них групповых значений. Для каждой области на карте можно сделать взвешенное среднее наблюдаемых частот для карты в целом, и наблюдаемой частоты для определенного региона. Этот подход может рассматриваться как Байесовский метод, который комбинирует «исходную» информацию с эмпирическими данными для того, чтобы получить улучшенные апостериорные оценки. В приложении к построению карт, частота для карты в целом служит как исходная информация. Поскольку исходная частота также неизвестна и должна быть заменена оценкой априорной величины, соответствующий метод обозначается, как «эмпирический Байесовский». Для построения карт заболеваний вариабельность в размерах популяции может рассматриваться, как источник гетерогенности, а эмпирический Байесовский метод, как метод сглаживания различий. Tsutakawa и соавторы (1985); Elliott и соавторы (1992); и Devine и соавторы (1994) показывают как частоты заболеваний, стабилизированные при помощи эмпирической Байесовской техники, могут отфильтровать «шум» и привести к более четкому представлению географического распределения заболеваний.

Весовые коэффициенты, использованные для расчета взвешенных средних, варьируют в разных регионах. Частоты для регионов с небольшой популяцией в большей степени двигаются в сторону общего среднего для всей территории, чем для более густо населенных регионов, частоты которых, так или иначе, более стабильны (Tsutakawa и соавторы, 1985; Clayton и Kaldor, 1987). Таким образом, если частота в неком регионе не стабильна в результате высокой вариабельности внутри этого региона (небольшой размер популяции), вес, который дается местной частоте, будет близок к нулю. Значения, основанные на региональных характеристиках, могут дополнять информацию по средним, нанесенным на карту. Например, регион с высокой частотой, который находится близко к другим регионам с высокой частотой, может уменьшаться в меньшей степени по сравнению с тем, что происходило бы, если бы этот регион был бы окружен другими регионами с низкой или средней частотой (Clayton и Kaldor, 1987).

К сожалению, расчет оптимальных значений весов не очень легок и требует итеративных методик. Кроме того, карты эмпирических, стабилизированных по Байесу частот, не позволяют справиться со всеми артефактами, возникающими при построении картограмм (Moulton и соавторы, 1994). Тем не менее, графики стабилизированных частот являются более привлекательными, по сравнению с графиками исходных значений.

Иным подходом к нанесению частот на графике, является трансформация графиков таким образом, чтобы выровнять популяционную плотность (Schulman и соавторы, 1988). В нисходящем порядке, начиная с региона, требующего наибольшего увеличения размера, каждый регион расширяется вокруг своего географического цента таким образом, чтобы изменился размер, а не площадь оставшихся регионов. Данный подход позволяет справиться с проблемой неравных размеров популяции, но не с проблемой нестабильных оценок частот. Кроме того, он может еще привести к тому, что оригинальная схема будет изменена до неузнаваемости.

После того, как карта была создана, она может использоваться для того, чтобы стимулировать этиологические исследования. Графики графств Соединенных Штатов, опубликованные Национальным институтом рака (NCI) в 1970-е годы (Mason и соавторы, 1975, 1976), служили, как инструмент надзора, и представляли собой первый описательный шаг многостадийного процесса исследования, прошедшего через следующие стадии (Hoover и соавторы, 1975; Blot и Fraumeni, 1976, Blot и соавторы, 1979): графики заболеваемости были связаны с пространственной информацией о географическом распределении основных промышленных предприятий, а также количеством работников этих предприятий (Stone и соавторы, 1978). Затем частота заболеваемости в графствах была использована в регрессионном анализе с зависимой переменной, представлявшей собой распространенность определенных промышленных предприятий и поведенческих факторов (Blot и Fraumeni, 1976,1977). Эти экологические регрессионные модели использовались для корректировки на уровне графств таких характеристик, как средний уровень доходов, среднее образование, популяционная плотность и процент лиц, проживающих в городских районах. Для того чтобы исследовать гипотезы, генерированные таким образом, Национальные институты рака использовали вторую стадию исследования, состоявшую из анализа свидетельств о смерти, и далее третью стадию, состоявшую из исследований по типу случай-контроль, включавшую интервью с пациентами или их родственниками (Blot и Fraumeni, 1976; Blot и соавторы, 1979). Эта стратегия позволила идентифицировать высокую заболеваемость раком носоглотки в регионах с большой распространенностью мебельного производства (Brinton и соавторы, 1977), раком легких в графствах, где находилась перерабатывающая промышленность (Blot и Fraumeni, 1976), раком мочевого пузыря в регионах с химической индустрией (Hoover и соавторы, 1975) и раком ротовой полости в регионах, где часто нюхали табак (Blot и Fraumeni, 1977).

Стратификация по полу при географическом анализе служит той же цели, что и при анализе временных тенденций. Заболеваемость женщин во многих странах в меньшей степени является следствием воздействия профессиональных вредностей, особенно это было характерно для недавнего прошлого. Например, высокая частота рака ротовой полости на юго-востоке Соединенных Штатов, распространенная среди популяции обоего пола, была указанием на то, что производственные факторы вряд ли являются причиной увеличения частоты этого заболевания, приведя к гипотезе о том, что в данном случае основным фактором риска является вдыхание табака.

Даже для исследования факторов развития заболеваний не связанных с неким пространственным расположением, контроль пространственного распределения может оказаться важным, поскольку важные вмешивающиеся переменные, которые сложно измерить, или измерять не практично, могут иметь тенденцию группироваться в определенных регионах. Примеры включают в себя практики постановки диагноза врачами, или местные привычки, которые приводят к тому, что человек обращается (или не обращается) за медицинской помощью. Соответственно, многомерные методики, которые используются для пространственных данных, являются очень важными для контроля третьих переменных, зависящих от пространственного распределения. Cressie (1991) продемонстрировал возможность использования подобных методов для того, чтобы в анализируемых им данных, бороться с пространственными тенденциями.

Аналогии и различия между анализом временных тенденций и пространственных данных. 

Сравнение аналитических стратегий для пространственных и временных данных указывает как на аналогии, так и на различия между ними. Временные сравнения могут базироваться только на данных о насупивших событиях, если можно предположить, что не было важных временных изменений в исходных уровнях факторов риска и в размерах популяции. В противоположность этому, пространственные сравнения  практически всегда требуют данных, как по количеству случаев, так и по размерам исходной популяции, иными словами, данных о размерах, возрасте, распределении по полу и т.д.

Как для временных, так и для пространственных данных важным является то, с какой точностью они измеряются, или насколько они детализируются. Для временных данных, например, отслеживание эпидемии кори требует, чтобы оно делалось на протяжении дней или недель, в то время как тенденции в измерении смертности от сердечно-сосудистых заболеваний возникают на протяжении десятилетий (Uemura и Pisa,1988; Wilkinson,1989; Marmot, 1992), но существует и сезонная вариабельность (Anderson и Le Riche,1970). Очевидно, что как воздействие, так и заболевание являются важными при определении, какой должна быть временная шкала. Анализ временных тенденций, вне зависимости от шкалы, наиболее полезен тогда, когда интересующее нас воздействие является достаточно широко распространенным, поскольку тогда для того, чтобы получить частоты, зависящие от времени, можно анализировать суммарные данные. Стабильность взаимосвязи заболевания с факторами риска будет зависеть от размера популяции, исходной заболеваемости и размеров анализируемых периодов времени. Исследование более коротких временных периодов требует популяции больших размеров или более высокой заболеваемости.

Между тем для пространственных данных, проблема шкалы очень часто приводит к серьезным методологическим проблемам, в особенности, когда воздействия крайне локализованы, исследователь может быть заинтересован в небольших регионах, где частота заболевания будет не стабильной. Стабильность может быть достигнута, если эти локализованные воздействия наблюдаются на протяжении длительного периода времени, и данные по результатам также можно получить, поскольку они собирались на протяжении достаточно длительных периодов времени. К сожалению, документирование воздействия на людей в прошлом очень часто не полное и получить его достаточно сложно, поэтому сложно, соответственно, будет определить популяцию, находившуюся под воздействием, если даже это делается не на индивидуальном уровне. Данная ситуация возникает во многих общинах, расположенных неподалеку от места, где производятся или складируются потенциально опасные химические вещества. Вопросы, связанные с изучением небольших мобильных популяций в определенных географических регионах, анализируются в большом количестве литературных источников под названием «Анализ небольших регионов». Этот вид анализа активно развивался в последние годы (смотри, например, Diehr и соавторы,1990; Elliott и соавторы, 1992; McMahon и соавторы,1993).

Пуассонова регрессия.

При изучении частоты заболевания по отношению к различным географическим положениям или различным временным периодам, исследователь эпидемиолог может пожелать откорректировать на влияние многочисленных третьих переменных, а также может захотеть количественно смоделировать взаимоотношения между воздействием и результатом. Пуассонова регрессия предоставляет универсальный подход для моделирования частоты редких заболеваний (Pearce и соавторы,1988). Она может быть применена к данным, при которых основными факторами, определяющими единицу наблюдения, являются время и пространство. Если заболевание является более часто встречающимся, то тогда более адекватным будет применение биноминальной регрессии или анализа выживаемости.

При использовании Пуассоновой регрессии количество или частота заболеваний описываются в виде функции воздействия, пространственных переменных, временных переменных, демографических и других показателей. Этот метод очень часто используется, когда предикторные переменные являются категориальными (номинальными или ординальными), а внутри ячеек, полученных за счет перекрестного табулирования переменных предсказателей, подсчитываются события и в большинстве случаев необходимо также оценить количество человеко-лет наблюдений или ожидаемые частоты, связанные с каждой из ячеек. Данные, собранные в рамках временных серий или в различных географических регионах, могут быть организованы в ячейки, определенные такими показателями, как дни недели, года и т.д., либо графства, штаты, регионы мира и т.д., или же единицы, объединяющие в себя время и пространство, например, графства – года и т.д.

В случае типичной экпотенциальной (логлинейной) Пуасоновой регрессионной модели принимаются следующие допущения: (1) логарифм частоты заболеваний линейно зависит от изменений переменной воздействия; (2) изменения заболеваемости вследствие совместного действия различных факторов риска являются мультипликативными (эффекты умножаются); (3) для каждого уровня дополнительных переменных количество случаев имеет дисперсию, равную среднему и (4) наблюдения независимы. Методы для того, чтобы обнаруживать и каким-то образом корректировать нарушение допущений (1) и (2) аналогичны тем, что используются в других экспоненциальных моделях (например, логистическая модель пропорционального риска) (смотри Greenland, 1989b). Методы для того, чтобы выявить нарушения допущения (3), иными словами удостовериться, нет ли чрезмерной дисперсии (дисперсия слишком большая) или недостаточной дисперсии (дисперсия слишком мала), включают в себя графики остатков против среднего, построенные при различных уровнях предикторной переменной. Методы коррекции нарушений допущений Пуассоновой регрессии в деталях обсуждаются Вreslow (1984), а также McCullagh и Nelder (1989).

И наконец, допущение (4) может оказаться нарушенным поскольку пространственные наблюдения или наблюдения, связанные с временными тенденциями, могут оказаться независимыми. Во временных сериях количество случаев (смерти, госпитализации и т.д.), возникающие в определенный день i, могут коррелировать с количеством событий i – 1, i – 2 (и возможно, и в другие соседние дни) не вследствие действия включенных в исследование переменных, а по другим, неизвестным причинам. Понятно, что если холодная погода увеличивает смертность, тогда некоторая корреляция между близко расположенными днями является результатом аналогичной температуры в подобные дни. Если этот источник автокорреляции является единственным, то после корректировки температуры, корреляции между днями, расположенными близко друг к другу, больше не будет. Если же имеются другие источники подобной корреляции, кроме тех, которые контролируются в анализе, тогда необходимо использовать автокорреляционные и авторегрессионые модели (Diggle, 1990). Простая автокорреляционная модель смертности во временных сериях может включать, как объясняющую переменную, переменную результата (частоту случаев заболевания или смерти) в предшествующие несколько дней. Конечно, можно включить в модель также такие переменные, как загрязнение, предшествующее анализируемому периоду на протяжении нескольких дней, или метеорологические переменные, учитываемые за несколько предшествующих периодов, но они могут быть включены вне зависимости от того, используются ли автокорреляционные модели или нет.

Аналогичное отсутствие независимости может возникать и в пространственных данных. Частота заболеваний в определенном географическом регионе может быть связана с частотой в прилежащих регионах. Причинами может оказаться передача заболевания или фактора риска от человека к человеку, наличие одних и тех же переносчиков или источников воздействия, или же влияние диагностической практики врачей. Пространственная автокорреляционная модель заболеваемости в регионах на карте может включать в качестве одной из независимых переменных среднюю переменную результата (заболеваемость или смертность) во всех прилежащих регионах.

Дополнительные вопросы анализа временных серий: влияние третьих переменных, авторегрессия и промежуточные переменные.

Анализ временных серий обычно отслеживает определенную общину или регион на протяжении определенного периода времени. Хотя анализируемым результатом может быть среднее количественного показателя, измеренного у индивидуума, такие как функция внешнего дыхания, эти показатели могут быть также и бинарными (смерть, госпитализации, наличие симптома и т.д.). Обычно подобные данные хорошо подходят для Пуассоновой регрессии с временем, используемым в качестве единицы наблюдения. Если для анализа частот используется обычная линейная регрессионная модель, необходимо оценить допущение нормальности распределения и постоянство дисперсии во времени (гомоскедастичность).

Как отмечалось выше, при сравнении внутри общин, в противоположность пространственным сравнениям (между общинами) необходимость в знаменателе исчезает, если состав популяции и ее размеры не меняются на протяжении длительного периода времени. Отсутствие в необходимости иметь данные по знаменателю особенно благоприятно, когда изучаемый регион четко не определен. Например, если исследователь хочет оценить больничные данные в очень густо населенных регионах, притом, что не все больницы могут быть включены в исследование. Подсчет госпитализаций или количества пациентов, посещающих амбулаторные отделения стационаров, может быть сравнен в дни с высоким загрязнение и в дни с низким загрязнением. Таким образом, для того чтобы оценить непосредственный эффект от воздействия на общину в целом, сравнения, базирующееся на времени, и использующее одну популяцию, могут оказаться более удобными и предоставить более достоверные оценки, чем сравнение между общинами.

Хотя вмешивающиеся переменные на индивидуальном уровне не являются проблемой для анализа временных серий, воздействие других причин, таких как инфекционные возбудители, другие загрязнители воздуха, временные тенденции в смертности и метеорологические факторы, могут оказать серьезные влияния на результат. Температура или влажность может сильно коррелировать с загрязнением, а сезонные изменения смертности с ее зимними подъемами также хорошо описаны. Для того чтобы справиться с этими показателями, необходимо включать коварианты для температуры, и удалить осцилляции, связанные со временем. Все это необходимо делать одновременно (Box и Jenkins, 1976).

Кроме того, заболеваемость инфекционными заболеваниями также может флюктуировать одновременно с эпизодами высокого заражения воздуха. Модели могут включать индикаторные показатели, которые будут соответствовать дням эпидемии, или же анализ может быть ограничен временными периодами, когда отсутствует грипп или другие эпидемии. Кроме того, индивидуальные загрязнители воздуха (мелкодисперсная пыль, кислотные аэрозоли, озон и т.д.) также могут сильно коррелировать друг с другом. Корреляция не является проблемой, если исследователей интересует смесь загрязнителей, но если же целью является идентификация фактора, ответственного за негативный эффект на здоровье, то тогда могут возникнуть серьезные проблемы.

В теории с этими сложностями можно справиться, если изучать регионы или временные периоды, в которых коррреляция изучаемых загрязнителей с другими факторами (эпидемиями инфекционных заболеваний, метеорологическими переменными и другими загрязнителями) является низкой. Например, Schwartz (1994) провел мета-анализ связи смертности и общего количества мелкодисперсных частиц, при котором корреляция между концентрацией этих частиц и температурой варьировала от отрицательной до положительной. Аналогичным образом Borja-Aburto и соавторы (1997) сфокусировали свое внимание на городе Мехико, где уровень озона не так высоко коррелирует с диоксидом серы, температурой или концентрацией мелкодисперсной пыли, как это видно в большинстве городов Соединенных Штатов. Однако получить данные с низкой корреляцией среди всех загрязнителей достаточно тяжело.

Долгосрочные тенденции в смертности могут оказаться серьезной проблемой, если используется длительный период наблюдения. Корректировка подобных тенденций может быть достигнута, если включить простой количественный индикатор времени, индикаторные переменные для месяцев или лет, переменные сплин аппроксимации, или с помощью использования непараметрической регрессии. Подобная корректировка должна предприниматься с осторожностью. Если имелась долгосрочная тенденция в воздействии, таком как, например, уменьшение или увеличение уровня загрязнения, то тогда корректировка может привести к тому, что эффект загрязнения будет искусственно сдвинут к нулевой точке. Систематическое смещение может возникнуть, поскольку эффекты вследствие уменьшения загрязнения будут лишь частично связаны с временными периодами. С другой стороны, время может оказаться и истинно вмешивающейся переменной, в особенности в случае анализа длительных периодов. Чем более длительные периоды анализируются, тем большее значение приобретают вопросы миграции, изменяющейся диагностической практики, изменения в поведении и другие важные источники колебаний показателей в одну или другую сторону.

Авторегрессионые модели, иными словами модели, включающие результаты предыдущего временного периода в качестве предиктора исходов в последующие периоды, в настоящее время часто используются в исследованиях по изучению загрязнения воздуха. Тем не менее, логичность допущения о том, что колебания смертности во времени причинно связаны друг с другом вне зависимости от погоды, загрязненности и частоты инфекционных заболеваний, все еще остается под вопросом. Если корреляции в смертности по дням, расположенным в непосредственной близости друг от друга во времени, возникают вследствие того, что существует автокорреляция уровня загрязнения или изменения погодных условий, то тогда авторкорреляторные модели могут достаточно серьезно увеличить оценки дисперсии эффекта загрязнителей, поскольку в тех случаях, когда загрязнители измеряются с некоторой ошибкой, все это может привести к появлению систематических смещений.

Связанным с этими проблемами вопросом, являющимся одним из наиболее сложных в эпидемиологии, остается вопрос, что одни и те же переменные могут быть как причинным фактором, так и вмешивающейся переменной. Вот два примера. В первом, в изучении ежедневного уровня озона в связи с ухудшением течения бронхиальной астмы, уровень физической активности может быть связан с концентрацией озона и может уменьшать риск исходов, таким образом, являясь вмешивающейся переменной. Кроме того, он может оказаться промежуточной переменной, если человек ограничивает физическую активность в дни с высокой концентрацией озона в воздухе. Эпизоды бронхиальной астмы также могут приводить к тому, что человек будет ограничивать свою активность и соответственно, вероятность последующего ухудшения течения заболевания будет снижаться. Надо ли в этой ситуации при анализе взаимосвязи между уровнем озона и эпизодами бронхиальной астмы включать в модель коррекцию уровня физической активности?

Во втором примере при исследовании взаимосвязи между свинцом и ростом, предполагается, что высокий уровень свинца может приводить к уменьшению абсорбции кальция, но дефицит кальция увеличивает абсорбцию свинца. Кальций является необходимым для роста костей и может быть также маркером адекватности питания. Необходимо ли при изучении взаимосвязей свинца и роста включать концентрацию кальция, как третьей вмешивающейся переменной?

Ответ на эти вопросы заключается в том, что как включение этих третьих переменных в модель, так и их игнорирование, может привести к появлению ошибочных результатов (Robins, 1986, 1987, 1989). Рассмотрим взаимосвязь кальция, свинца и роста (рисунок 28-1).


Рис. 28.1 Иллюстрация проблемы влияния третьих (вмешивающихся) переменных, которые также находятся в причинной связи с воздействием. При изучении эффекта свинца на развитие организма ребенка, кальция явно является вмешивающейся переменной, поскольку он оказывает независимое от свинца действие на рост и негативно коррелирует с содержанием свинца в крови. Однако он может также являться промежуточной переменной, хотя свинец может оказывать воздействие на рост и при помощи иных механизмов (см. текст). Систематическая ошибка может возникать как в случае учета действия кальция, так и в случае, если его эффекты в исследовании не учитываются

Кальций явно является вмешивающейся переменной, поскольку он оказывает независимый эффект на рост и связан с уровнем свинца. Кроме того, он может быть промежуточной переменной: свинец может конкурировать с кальцием как за абсорбцию, так и за участки связывания на белках, что приводит к дефициту кальция. Этот дефицит может оказаться одним из механизмов, при помощи которых свинец оказывает воздействие на рост, хотя могут играть роль и другие механизмы такие, как нейроэндокринные расстройства. Контроль концентрации кальция может привести к недооценке эффекта свинца, поскольку эффекты опосредованные концентрацией кальция, будут целиком отнесены на роль кальция. Отказ от контроля за концентрацией кальция может привести к переоценке эффекта свинца, поскольку независимые эффекты дефицита кальция (не являющиеся следствием увеличенной концентрации свинца в крови) будут отнесены на счет свинца. Тем не менее, определение того, какие эффекты являются независимыми, а какие являются промежуточными, в эпидемиологическом исследовании обычно установить невозможно. Поскольку эти эффекты возникают на протяжении длительного периода времени, разделение подобных сценариев требует данных, которые собираются на протяжении длительного периода времени, как по концентрации кальция, так и по концентрации свинца, а также для этого требуются специальные методы анализа (смотри Arrighi и Hertz-Picciotto, 1994, 1996; Robins, 1989; Robins и соавторы, 1992 b). Для подобного анализа окажутся необходимыми тщательно разработанные лонгитюдные исследования экологической эпидемиологии с повторными измерениями, как воздействия, так и различных других переменных.

Специальные вопросы пространственного анализа: влияние третьих переменных и анализ кластеров.

Чисто описательные пространственные исследования включают характеристики только заболеваний или только воздействий. Чрезвычайно большой интерес представляют аналитические исследования, которые изучают, как пространственные характеристики распределения случаев заболевания связаны с пространственными случаями распределения воздействия, особенно после того, как были учтены третьи переменные. Данный раздел анализирует влияние третьих переменных при сравнении различные общин, пространственную вариабельность и три класса технических подходов для оценки анализа формирования кластеров вокруг источников выбросов, и проблемы, связанные с изучением предполагаемых кластеров.

Влияние третьих переменных при сравнении между общинами.

Довольно часто встречающимся типом исследования является исследование, которое сравнивает заболеваемость в общинах, имеющих высокий уровень воздействия для неблагоприятного фактора, с частотой заболеваемости в общинах с низким уровнем воздействия неблагоприятного фактора. Этот дизайн исследования является адекватным в случае, когда воздействие оказывает влияние целиком на всю общину, но не в том случае, когда единичный источник загрязнения воздействует на очень большой регион внутри данной общины. Хотя многие исследования по сравнению общин являются по своей природе экологическими, более оптимальным дизайном (который не окажется под воздействием экологических ошибок) включает в себя измерение дополнительной информации и результатов на уровне индивидуумов. Сравнение между общинами наиболее адекватно при оценке воздействия хронических постоянных факторов, для которых вариабельность в основном наблюдается между различными общинами, а не внутри одной общины. Основной проблемой в этой ситуации будет являться адекватный контроль третьих переменных.

Примером данного подхода является изучение Шести Городов (Ferris и соавторы, 1979), в котором были отобраны города с различным уровнем в воздухе сульфатов и мелкодисперсных частиц. У группы жителей городов были проанализированы исходные показатели функции внешнего дыхания, а также были проведены интервью, позволяющие изучить некоторые дополнительные факторы, влияющие на функцию внешнего дыхания и источники загрязнения, находящиеся в домах (Dockery и соавторы, 1993). Изучавшиеся загрязнители внутри городов  обычно распределены достаточно равномерно (имеется низкая межиндивидуальная вариабельность), и в значительной концентрации проникают внутрь домов, где жители Соединенных Штатов проводят большую часть своего времени. Когда доминирует межобщинная вариабельность, ошибки измерения, несмотря на экологическое воздействие, по всей вероятности, окажутся низкими. В этой ситуации остающимся первичным источником систематической ошибки будет отсутствие способности контролировать влияние социально-экономического статуса, который не описывается образованием и профессией.

Социальный класс достаточно четко связан с широким диапазоном заболеваний  (Townsend и соавторы, 1988; Krieger и Fee, 1994). Неадекватное измерение третьих переменных предполагает, что оценки взаимосвязей между основным воздействием и результатом являются ошибочными, даже когда анализ и пытается откорректировать вмешивающиеся переменные (Greenland, 1980; Savitz и Barton. 1989). Более того, даже тогда, когда ошибочная классификация является не дифференциальной, откорректированные показатели могут оказаться более ошибочными, чем исходные (Brenner, 1993). В связи с этим может потребоваться необходимость найти иной подход, нежели обычные суррогаты этой достаточно сложной, но важной детерминанты состояния здоровья, которая включает индивидуальные характеристики, характеристики семьи и окружения.

Ресурсы, которые имеются у индивидуума, играют большую роль в уязвимости организма, большую роль также играет факт, какой у этого человека имеется доступ к медицинской или профилактической помощи. Образование, доходы, занятость и профессия могут быть дополнены, например, такими показателями, как есть ли у человека банковский счет, продолжительностью времени работы на нынешней работе, временем, которое человек провел без работы (всего или за последние пять лет), а также типом медицинской страховки, имеющимся у этого индивидуума. Поскольку длительное безденежье оказывает очень большое воздействие, которое не ограничивается эффектом от бедности, то могут потребоваться данные по социально-экономическому статусу в прошлом (Miller и Korenman, 1994). Переменные, показывающие семейную ситуацию, могут включать в себя такие параметры, как количество совместно проживающих, наличие каких-то основных бытовых приборов и наличие автомобиля. Факторы, связанные с окружением, могут включать в себя процент безработных, проживающих в этом же регионе, плотность населения, средний доход, процент собственных домов, среднее количество лет образования и т.д. Было продемонстрировано, что характеристики окружения, в котором живет человек, предсказывают состояние здоровья человека даже после того, как принимается во внимание его индивидуальный образовательный уровень и брачный статус (Collins и соавторы, 1997). Недавние исследования продемонстрировали также четкую взаимосвязь между бедностью и местами расположения опасных отбросов (United States General Accounting Office, 1983; United Church of Christ Commissions on Racial Justice, 1987; United States Environmental Protection Agency, 1992).

Поскольку социально-экономический статус является настолько важным предиктором здоровья, то ни одно исследование окружающей среды не может его игнорировать. Для того чтобы при планировании исследования, сборе данных и анализе результатов адекватно контролировать вмешивающиеся переменные, исследователь должен обратить внимание на этот множественный феномен.

Типы анализа, применяющиеся для оценки характеристики распределения случаев заболевания.

Ранее мы уже обсудили технические проблемы создания карт заболеваемости и использование подобных карт. В данном разделе мы кратко обсудим более специализированные количественные методы.

Кластер случаев заболевания определяется как необычное увеличение случаев заболевания по отношению ко времени, пространству или обоим этим показателям. Для того чтобы понимать, что является необычным, вначале необходимо посмотреть за пределы данного периода времени, пространства или времени и пространства, которое нас интересует, для того чтобы выяснить, что является обычным. Эти «обычные» показатели заболеваемости соответствуют распределению случаев изучаемых заболеваний в том же месте в другие временные периоды, в одном или другом аналогичном расположении в те же самые временные периоды, или распределение случаев изучаемых заболеваний в больших регионах, тем тот, который нас интересует. Кроме того, для того чтобы выявить наличие пространственных кластеров, или кластеров на протяжении длительных периодов времени, необходимо знать распределение здоровых людей или той популяции, которая подвергается риску, на протяжении того же самого количества времени или при распределении его в пространстве. Определение знаменателей очень часто является сложной работой, поскольку регионы гомогенного воздействия могут не соответствовать регионам, для которых имеются популяционные данные или данные по состоянию здоровья (Hertz-Picciotto, 1996).

Исследование кластеров может ответить на следующие описательные вопросы: (1) Возникает ли заболевание в кластерах? (2) Где расположены участки с наибольшим количеством заболеваний? (3) Наблюдается ли ситуация, при которой количество случаев заболеваний в большей степени сконцентрировано в пространстве и времени, чем можно было бы ожидать в результате действия только случайных факторов? Или можно ответить на аналитические вопросы: (4) Какое воздействие в большей степени имеют эти случаи в популяции в целом? И (5) наблюдаются ли кластеры заболевания вокруг места источника воздействия? Анализ, отвечающий на вопрос (4) может являться продолжением анализа, отвечающего на вопрос (3). Однако если случаи не концентрируется в большем количестве, чем можно было бы ожидать в результате действия только случайных факторов, то искать общее воздействие, скорее всего, может оказаться бессмысленным. Исследования кластеров являются одним из разделов эпидемиологического надзора, который предоставляет информацию о том, что является «обычным», иными словами, предоставляет референтные данные, с которыми сравниваются данные, полученные в подозреваемых кластерах.

Некоторые методы полагаются только на данных, базирующихся на случаях заболевания, другие требуют либо определенную численность популяции, либо контрольную группу, которая случайным образом выбирается из популяции. С кратким резюме методов, используемых для изучения кластеров во времени, пространстве или времени и пространстве, можно познакомиться в публикации Центра по контролю за заболеваемостью (CDC,1990b). В общем, шкала, которая используется для измерения собираемых данных, очень часто является основным фактором, который определяет, какой тип анализа может использоваться и способность этого анализа выявлять значимые результаты.

Имеется три типа аналитических подходов к изучению географической вариабельности: подсчет ячеек, близости и метод дистанции или ближайшего соседа. Метод подсчета ячеек сравнивает наблюдаемое количество случаев в ячейках, обычно определяемых географическими регионами, с ожидаемым количеством случаев. Методы близости анализируют, высока ли вероятность того, что области более высокой частоты заболевания расположены рядом с другими регионами высокой частоты. Методы дистанции или ближайшего соседа сравнивают физические расстояния между случаями с ожидаемыми расстояниями.

Адекватный метод для определенной ситуации является следствием специфического исследовательского вопроса, который задается при планировании исследования. Для того чтобы изучить общее образование кластеров в большом регионе, наиболее адекватными являются методы близости, за исключением случаев крайне редких исходов. Кроме того, если данные уже агрегированы, методы близости могут оказаться единственно возможным подходом. Если районы являются маленькими и очень хорошо определенными, а нас интересует гетерогенность в различных регионах, т.е. идентификация регионов с высокими частотами, то тогда может оказаться адекватным метод подсчета ячеек. Эти методы, однако, не обязательно анализируют кластеры за пределами сформированных ячеек. Когда количество случаев или регион являются достаточно маленькими, то тогда единственно адекватной техникой может оказаться метод ближайшего соседа. Этот подход также имеет то преимущество, что он не базируется на искусственно сформированных границах. Следующие три подраздела кратко описывают концепции и некоторые методы анализа кластеров заболеваний.

Методы подсчета ячеек при оценке кластеров. 

Классический метод подсчета ячеек был разработан Knox (1964) для того, чтобы проанализировать взаимодействие между пространством и временем. Анализировались все возможные пары случаев на предмет временных и пространственных различий, которые их разделяют. Производилась произвольная дихотомизация по обеим шкалам (времени и пространства), а затем фокусировалось внимание на том, является ли количество пар, которые близки друг другу, как по времени, так и в пространстве больше, чем ожидаемая, базируясь на краевых частотах таблицы 2 х 2. (время на пространство). Knox подчеркивал необходимость проведения анализа с использованием стратификации по характеристикам случаев в качестве теста устойчивости результатов. Ederer и соавторы (1964) проанализировали взаимодействие между временем и пространством в городах аналогичного размера с помощью разделения пятилетних интервалов на годичные ячейки для того, чтобы оценить образование кластеров лейкемии во времени в каждом из городов. Были предложены различные варианты этих методов.

Подход Knox является адекватным для заразных заболеваний, но он обладает низкой мощностью для обнаружения рисков, которые не связаны с передачей заболевания от человека к человеку (Bithell и Stone, 1989). Аналогичный аргумент может быть использован и против метода Ederer. В целом, Whittemore и соавторы (1987) предполагают, что для хронических заболеваний формирование кластеров во времени является мало вероятным. На самом деле, когда индивидуальные периоды заболевания значительно варьируют у разных индивидуумов, или причинный агент постоянно присутствует на протяжении длительного периода времени, пространственные кластеры значительно более вероятны, чем кластеры во времени и пространстве.

Большинство методов подсчета ячеек для только пространственных кластеров включают деление карты на регионы. Границы могут быть произвольными, однако регионы по отношению к шкале, по которой анализируются кластеры случаев, могут оказаться либо слишком маленькими, либо слишком большими.

 Openshaw и соавторы (1987, 1988) предложили «машинно-географический анализ», который идентифицирует не только когда возникли кластеры заболеваний, но и где они возникли. На карту накладывается сетка, и вокруг каждой точки пересечения линий этой сетки рисуется круг. Внутри каждого круга подсчитывается количество случаев, и сравнивается с ожидаемым количеством случаев на основании данных по распределению популяции в данном регионе. Процесс повторяется для концентрических кругов с радиусами 1 км, 2 км и т.д., до 25 км. Для того чтобы изучить лейкемию в Англии, Openshaw создал 812993 кругов для Северной Англии и нарисовал на карте только те, для которых P<0.002, исключение составили содержащие только один случай. Предполагая наличие Пуассонового распределения, нарисованные кружочки на графике должны бы быть разбросаны случайным образом. Однако выяснилось, что кружочки концентрируются примерно в пяти регионах – два относительно больших кластера и три небольших. Преимуществом этого метода является то, что шкала для кластера не определяется априорно, и что анализ «не управляется» ожидаемым расположением кластеров, поскольку анализируются все точки на координатной сетке. Более того, этот метод с интенсивным использованием ЭВМ не только позволяет идентифицировать расположение кластеров, но и также предполагает и их размеры.

Методы близости.

Очень часто точное расположение случаев не известно, и в зависимости от того, насколько грубо были агрегированы данные, исследователь может быть вынужден принять геополитические границы. В таких ситуациях или в ситуациях, когда размеры кластеров не известны или они больше, чем размеры ячейки, то в этом случае оказываются адекватными методы близости. Эти техники изучают степень, с которой области с большим количеством случаев, чем ожидается, имеют тенденцию к образованию кластеров. Методы близости полагаются на инструменты, разработанные в географии и известные под названием пространственной автокорреляционной статистики, которая изменяет степень, с которой значение переменной в одном месте, зависит от значения этой же переменной в соседнем регионе. Методы близости обычно требуют данных по знаменателю, поскольку размеры популяции варьируют в разных регионах.

 Мoran (1948) описал базовую структуру для методов близости. Бинарная характеристика измеряется в каждом регионе и может включать в себя такие параметры как высокая и низкая частота заболевания. Количество пар в регионе с высокой частотой, которые имеют общую границу (являются близкими), сравнивается с ожидаемой, для того чтобы подсчитать статистику (Moran I), которая в определенных условиях подчиняется нормальному закону распределения. Хотя методика является достаточно элегантной, статистика Moran I (1) только описательная, (2) обычно не может использоваться в тех случаях, когда регионы имеют не регулярную форму или сильно варьируют в размерах популяции (Besag и Newell, 1991) и (3) полагается на очень упрощенный показатель близости, поскольку пары регионов, разделенные только одним небольшим регионом, объединяются с парами, которые расположены на противоположных концах карты. Показатели дистанции (смотри ниже) справляются с этим (3) ограничением. Кроме того, другие методы близости, лучше отражающие взаимодействия между популяциями двух регионов, могут оказаться более адекватными для идентификации общих причин среди случаев заболевания, таких как, количество крупных дорог, пересекающих границу региона, или количество жителей одного региона, переезжающих на работу в другой регион.

Аналитические методы, использующиеся концепцией близости, включают в себя моделирование распространенности заболевания и оценку воздействия переменных близости (как бы мы их не определили) на вероятность развития заболевания. Такие модели могут служить для разных целей, как было проиллюстрировано в работе Clayton и соавторов (1993). Авторы этой работы построили график заболеваемости раком губ в Шотландии. Интересовавшим их фактором воздействия являлся процент населения, занятый в сельском хозяйстве, рыболовстве и лесоводстве. Были построены модели, которые включали в себя (1) процент занятых в сельском хозяйстве, рыболовстве и лесоводстве и (2) переменную, обозначавшую кластеры, рассчитанную как средний логарифм заболеваемости раком губы в соседних регионах. Когда эта переменная была введена в модель, коэффициент для процента населения, занятого в сельском хозяйстве, рыболовстве и лесоводстве уменьшился примерно на 50%, подтверждая, что, как рак губы, так и занятость в сельском хозяйстве, рыболовстве и лесоводстве, географически связаны. Если бы авторы создали модель без учета процента работающих в сельском хозяйстве, рыболовстве и лесоводстве, то тогда можно было бы изучать коэффициент группировки с корректировкой и без корректировки, для того чтобы определить, какое количество из наблюдающейся группировки в регионах с высокой частотой рака губы, объясняется количеством населения, занятого в сельском хозяйстве, рыболовстве и лесоводстве.

 Методы дистанции и ближайшего соседа.

Анализ дистанции и ближайшего соседа (1) позволяет избежать требования создания произвольных границ региона, как это требуется для большинства методов подсчета ячеек и близости, (2) не требует предварительного указания насколько близко должны быть расположены друг к другу случаи, для того чтобы можно было определить их как кластеры, и (3) обычно не требует для себя данных по популяционной численности (знаменателя).

В1967 году Mantel была предложена регрессионная модель для взаимодействия между временем и пространством, базирующаяся на дистанции. Вместо того чтобы дихотомизировать дистанцию, как это делал Knox, Mantel использовал трансформацию, которая максимизирует воздействие вариабельности на небольшой дистанции. Например, жить на расстоянии 10 метров от другого случая может оказаться весьма отличным, по сравнению с тем значением, которое придается тому, чтобы жить на расстоянии в 500 метров, в то время как различия между 2 и 5 километрами уже не столь важны. Подобное трансформирование достигается использованием величины обратной абсолютной дистанции, которая принимает во внимание тот факт, что большая часть информации о формировании кластеров содержится на небольших расстояниях.

Показатель группировки, базирующийся на дистанции, был предложен Besag (1989) и Besag и Newell (1991) и он не требует ни популяционных данных, ни контрольных серий. Зоны создаются и упорядочиваются на основании их дистанции от индексного случая. Подсчитывается количество зон, которое требуется для того, чтобы накопилось заранее определенное количество (k) случаев и при этом процедура повторяется для каждого случая. Доказательство существования кластера принимается тогда, когда требуется только небольшое количество зон для того, чтобы накопить (k) случаев. С использованием этих методов появляются значительно более широкие возможности по выявлению кластеров в сельских регионах.

Метод ближайшего соседа использует дистанции следующим образом: если имеется группа расположений, то для каждого расположения ближайшим соседом является расположение, которое расположено к нему ближе всего. Свойства ближайшего соседа не является обратимыми, иными словами, если А является ближайшим соседом В, то В не обязательно является ближайшим соседом А (смотри рис. 28-2). Некоторые расположения служат, как ближайшие соседи целой группе других.


Рис. 28-2. Точка В является ближайшим соседом точек А и С, в то время, как точка С не является ближайшим соседом любой другой точки. Этот пример иллюстрирует тот факт, что свойство близости не является обратимым

Большинство авторов, хотя и не все (Lewis, 1980), считают, что анализ по методу ближайшего соседа включает в себя сравнение между случаями и контролями. При справедливости нулевой гипотезы отсутствия кластеров средняя дистанция между случаями и близость случаев друг к другу будут аналогичны среднему расстоянию между контролями и количеством соседей у контролей. Оценкой относительного кластерообразования является отношение d0/ d1 , где d0 – среднее расстояние от контроля до его ближайшего соседа, а d1 – это среднее расстояние от случая до его ближайшего соседа. Кроме предоставления показателя группирования (а не только тестирование его наличия), этот метод идентифицирует места, где наблюдается группирование (иными словами, такие случаи в наибольшей степени отвечают за формирование кластера). В данном случае соседи определяются, как другие случаи, а контрольные соседи определяются, как другие контроли.

Cuzick и Edwards (1990) предложили класс аналогичных методов, в котором случаи и контроли могут быть использованы в качестве ближайших соседей для членов любой группы. Таким образом, вместо того чтобы иметь одного единственного ближайшего соседа, эти методы используют (k) ближайших соседей для каждого расположения, такое, как например, пять ближайших соседей для каждого случая и для каждого контроля. Используя метод ближайшего соседа, Alexander и соавторы (1989) обнаружили доказательства формирования кластеров болезни Ходжкина на уровне британских избирательных участков, которое не было обнаружено на более крупном уровне графств или округов, и этот результат подчеркивает важность адекватного выбора шкалы. Авторы обратили внимание, что подобные кластеры могут быть наложены на равномерное распределение в популяции, подобный кластер может оказаться очень сложным для выявления, если большое количество случаев не связаны с определенным причинным агентом.

Анализ групп, возникающих вокруг точечных источников загрязнения.

Многие описательные методы могут быть легко адаптированы для изучения кластеров, возникающих вокруг точечных источников загрязнения. Когда, для сравнения характеристик ячеек с уровнем высокого заражения с ячейками с низким уровнем заражения, используются методы подсчета ячеек, то на самом деле применяется не что иное, как анализ географических корреляций.

Обычным подходом для изучения формирования кластеров вокруг известных точечных источников загрязнения является один из вариантов метода подсчета ячеек, включающий в себя создание границ вокруг источника, который в свою очередь включает популяцию, находящуюся под воздействием, расчет заболеваемости и сравнение со средними уровнями показателей в штате или в стране в целом. Однако с этим подходом возникают проблемы, включающие в себя: (1) сложности в определении размеров популяции в регионах, подвергшихся воздействию; (2) произвольность выбора границ (которые очень часто проводятся на основании имеющихся данных о размерах популяции), и сложность в определении того, насколько должен быть велик регион, который необходимо рассматривать; (3) размывание «реального эффекта», если используемый регион оказывается слишком большим; и (4) в случае выбора крайне маленького региона вероятность отбрасывания нулевой гипотезы крайне мала (в результате дискретной природы данных) (Bithell и Stone, 1989). Другой проблемой является отсутствие социо-демографических аналогов между популяцией, подвергшейся воздействию, и референтной популяцией.

Некоторые из этих проблем могут быть решены методами измерения дистанции, которые избегают искусственного определения пораженных регионов, и не требуют равного размера популяции. Метод Besag и Newell (1991) может быть адаптирован для аналитических исследований, при этом зоны классифицируются в зависимости от дистанции от источника воздействия (а не от индексного случая). Источник не обязательно должен быть точкой, например, это может быть река или побережье, и тогда дистанция может быть определена соответствующим образом. Аналогичным образом Bender и соавторы (1988) предлагают использовать количество как наблюдаемых, так и ожидаемых случаев в каждой зоне, а затем сортировать зоны по увеличению дистанции от источника до того момента, пока максимальный риск не будет достигнут. Тестовая статистика наиболее чувствительна к возникновению групп случаев, которые ближе всего расположены к месту выброса, но она резко теряет свою статистическую мощность, если риск при изменении расстояния от места выброса измеряется не монотонно.

Общие вопросы при исследовании кластеров.

Сообщение о возможных кластерах заболеваний довольно часто сообщаются местным властям, а также агентствам, работающим на уровне штата, и федеральным агентствам. Причем эти сообщения могут исходить как от простого гражданина, так и от врачей или других сотрудников системы здравоохранения. В 1990 году Центр по Контролю за Заболеваемостью (CDC, 1990b) выпустил целый набор руководств по изучению подобных кластеров. Эти руководства требуют интегрального подхода, который бы адекватно реагировал на обеспокоенность населения, и в то же время адекватно оценивал сообщения о кластерах, для того чтобы выяснить, насколько было бы полезно начинать полномасштабное исследование этиологии возникновения данного кластера. Большинство сообщений в отделы здравоохранения, которые указывают на возникновение кластеров случаев, не приводят к идентификации общего причинного воздействия для этих случаев. Для этого может существовать достаточно много причин. Во-первых, очень часто просто нет никакого увеличения количества случаев; во-вторых, обнаруженные случаи могут оказаться слишком разными для того, чтобы быть следствием одной и той же причины; в-третьих, если даже имеется повышенное количество случаев, их число может быть слишком маленьким для того, чтобы был проведен адекватный статистический анализ; в-четвертых, может и не оказаться общего воздействия, которое можно было бы подозревать в возникновении этой группы случаев, или же то воздействие, которое было предложено, не является реальной причиной.

Стадии, которые описываются CDC, включают в себя (1) первоначальный контакт и сообщение человеку, который привлек внимание к предполагаемому кластеру; (2) первоначальную оценку данных, включающих в себя (а) определение количества случаев, размеров популяции (если возможно), определение географического региона и временного периода, который следует изучить, (б) проверку случаев на биологическую адекватность возможности возникновения кластера и (в) оценка того факта, действительно ли имеется повышенное количество случаев и если имеется, то необходимо описание их эпидемиологических характеристик; (3) формальное изучение возможности проведения дополнительного исследования; и (4) если необходимо полномасштабное эпидемиологическое исследование. На каждой стадии процесс сбора информации может быть прекращен, если будет обнаружено, что дальнейшая оценка данных вряд ли имеет смысл.

Bender и соавторами (1988) подчеркивается важность третьего этапа исследования, посвященного необходимости проведения дальнейшей работы. В этом этапе исследования стадии изучения необходимости дальнейших исследований включают в себя оценку существующей заболеваемости и смертности; анализ литературы, посвященной биохимическим и токсикологическим свойствам предполагаемого агента; оценку возможности изучения воздействия агента на каждого индивидуума; оценку существующего желания к сотрудничеству со стороны индивидуумов, со стороны промышленных производств, со стороны сотрудников здравоохранения и других агентств; оценку разумности и стоимости различных дизайнов эпидемиологических исследований и установку критериев, которые помогли бы сбалансировать возможные сильные и слабые стороны подобного исследования. В ситуации, описанной Bender и соавторами (1988), где в общине, место проживания которой было загрязнено полициклическими ароматическими углеводами, было обнаружено повышенное количество случаев рака молочной железы, оценка адекватности дальнейших исследований позволила придти к выводу, что повышенное количество случаев было, по всей вероятности, связано с наличием большого количества жителей еврейской национальности, факт, который сам по себе является серьезным фактором риска рака молочной железы, поэтому в случае, если этиологическое исследование все-таки будет предпринято, сложность в оценке более раннего воздействия полициклических ароматических углеводов на каждого индивидуума, приведет к серьезной проблеме неадекватной классификации. Общине была предоставлена информация, которая проясняла, почему было проведено закрытие колодцев и очистка, однако эпидемиологические исследования не были рекомендованы: показатели качества воды, базировались на том, что оцененный уровень риска будет ниже, чем тот, который может быть эффективно выявлен при использовании эпидемиологических методов. Доверие жителей поддерживалось тем, что были возможности для постоянного общения с представителями системы здравоохранения, обнаружение высокой заболеваемости не было проигнорировано, и была четко продемонстрирована адекватность решения, почему организовывать этиологические исследования не имеет смысла.

В целом достаточно сложно придти к определенным выводам по отношению к формированию одного единственного кластера, вне зависимости от того, насколько обычным является этот кластер. Исследования кластеров наиболее плодотворны, когда (1) возникающее заболевание редкое и возникает в основном за счет действия одного единственного механизма и (2) заболеваемость резко увеличивается (Rothman, 1990).

Надзор.

Громадное количество и разнообразие химических веществ, которые были созданы за последние несколько десятилетий, вызывает большое беспокойство, как у жителей развитых стран, так и у жителей развивающихся стран. Для большинства химических соединений, не относящихся к лекарственным веществам или пищевым добавкам, тестирование ограничивается только проверкой наличия у них острой токсичности. Тестирование долгосрочных эффектов или хронических эффектов на здоровье делается крайне редко. В отсутствие адекватного тестирования до момента появления химикатов на рынке, систематическое мониторирование возможных негативных эффектов на здоровье, является как рациональным, так и адекватным. Эпиднадзор достаточно широко обсуждался в более ранних главах, однако надзор за состоянием окружающей среды требует дополнительных элементов (Hertz-Picciotto, 1996).

Идеальная надзорная система за экологически индуцированными заболеваниями имеет следующие элементы: (1) наличие высококачественных данных о заболеваемости и смертности с информацией о месте проживания человека; (2) постоянно обновляемые популяционные данные, предоставляющие возможность получить знаменатели для расчета заболеваемости, с корректировкой на возможную миграцию между двумя переписями населения; (3) широкий диапазон информационных источников по воздействиям, которые базируются на данных о выбросах, моделирование распространения частиц и мониторирование воды, воздуха и других средств, таких как почва и пища с адекватной методикой взятия образцов; (4) географическое коррелирование этих всех трех типов данных; (5) достаточно высокая степень разрешения, которая позволяет обнаружить эффекты воздействия в небольших общинах.

Подобная система надзора, хотя и достаточно дорогостоящая, оказывается благоприятной, поскольку она включает в себя информацию о долгосрочных тенденциях. Она включает в себя возможности по раннему предупреждению, или иными словами, способность обнаруживать необычно высокую частоту заболеваний, позволяет избежать тревоги среди общественности, а также дорогостоящих исследований в тех ситуациях, когда повышенного риска нет. Кроме того, она также имеет потенциал для увеличения доверия общественности в том факте, что правительство и сотрудники системы здравоохранения действительно хотят сохранить здоровье людей.

Интересная модель надзора реализуется в Великобритании. В ответ на сообщение в средствах массовой информации о повышенном количестве случаев лейкемии у детей вокруг завода по переработке ядерного топлива в Селлафильде, правительство создало комиссию, которая должна была изучить эту ситуацию (Elliott и соавторы, 1992). Отчет, подготовленный этой комиссией, призвал к созданию централизованной системы надзора для того, чтобы наблюдать за риском возникновения заболеваний в небольших регионах, расположенных вокруг крупных промышленных предприятий, которые могут выбрасывать канцерогенные или мутагенные вещества. В середине 1980-х годов было создано Подразделение по изучению статистики здоровья в небольших регионах, целью которого являлось: (1) реагировать на сообщения о возникновении кластеров заболеваний, особенно вокруг промышленных предприятий; (2) разработать систему надежного сбора информации о фоновом уровне заболеваемости в этих небольших регионах; (3) анализировать данные на предмет появления в них доказательств повышения заболеваемости и (4) разработать статистические методы анализа данных в небольших регионах.

Оценка риска.

Оценка риска – это взаимодействие между экологической эпидемиологией и политикой в области охраны окружающей среды, место взаимодействия между учеными и законодателями. Она включает в себя оценку риска в ситуациях, в которых риск не может быть измерен, или не может наблюдаться напрямую, т.е. в ситуациях, когда риски являются крайне небольшими, а популяция крайне маленькой, или воздействие не возникает в отрыве от других опасных воздействий, или воздействие может произойти, но пока еще не произошло, или предполагается достаточно латентный период с момента, когда произойдет подобное воздействие. Американская Национальная академия наук определяет оценку риска как «использование фактической базы для того, чтобы определить эффекты от воздействия опасных материалов и ситуаций на здоровье индивидуумов или популяции» (1983). Это определение, однако, полностью не отражает современное состояние вопроса: фактическая база обычно не адекватна для того, чтобы придти к определенным заключениям о рисках для здоровья в случаях, когда риски крайне малы, или воздействие крайне редко. Как результат, оценки риска обычно базируются на предположениях, которые описывают форму кривой доза-результат, а если количественные данные на людях не были получены, то дополнительные предположения, связанные с возможностью распространения токсических эффектов, наблюдаемых у животных, на людей. Эти допущения часто не могут быть протестированы напрямую, тем не менее, они необходимы для лиц, принимающих решения, и для общественности для того, чтобы иметь возможность оценить, каковы будут последствия для здоровья от определенных действий общественности (или от бездействия), и позволяют получить дополнительные данные со стороны системы здравоохранения при создании законов. К сожалению, если вопрос здоровья не поднимается напрямую, законодательный подход очень часто не сильно отличается от того, чтобы дождаться «выноса трупов».

Оценка риска имеет достаточно длительную историю неформального использования в качестве естественной части профилактической медицины. Обратите внимание на следующий пример:

«Мы обсудили возможные альтернативные действия для иммунизации против крови ВИЧ-инфицированных детей, в развивающихся странах…..

Мы стали наблюдать за гипотетической когортой одного миллиона детей в возрасте от 9 месяцев до 5 лет (или до смерти их от СПИДа), и изучили результаты альтернативных мероприятий. Мы предположили, что у всех уязвимых разовьется корь, и что в отсутствие скрининговой программы вакцинация составит около 50%. Поскольку исследования, анализирующего течение ВИЧ-инфекции у детей и иммунизацию против кори у ВИЧ-инфицированных детей, ранее не проводилось, для анализа использовались оценки, полученные при помощи метода Дельфи. Оценки для не инфицированных детей были получены из опубликованных исследований.

Наша модель позволяет предсказать, что принятие направления на тестирование ВИЧ и исключение из программы иммунизации детей с ВИЧ-инфекцией предотвратит три случая смерти от коревой вакцины у детей, инфицированных ВИЧ» (Onorato и соавторы, 1988).

В этом примере содержатся все формальные элементы оценки риска: все допущения четко описаны; оценки для некоторых параметров взяты из литературы; там, где данные отсутствуют, получены оценки от экспертов, ну и, наконец, риски представлены, как дополнительное количество случаев на миллион детей. В то время как оценки риска для экологических воздействия или профессиональных воздействий часто критикуются за отсутствие научной основы, приведенный выше пример демонстрирует, что создание гипотетического сценария и использование четко описанных допущений, в профилактическом здравоохранении является давно укрепившейся традицией.

Эпидемиологи могут предоставить информацию агентствам за счет формального процесса оценки риска, обращая особое внимание на использование данных, полученных на людях. Имеются следующие четыре шага при оценке риска (Национальный исследовательский совет, 1983):

  1. Идентификация вредного воздействия: имеются ли доказательства того, что агент может нанести вред здоровью людей, подвергающихся его воздействию?
  2. Оценка воздействия: кто находится под воздействием; за счет чего – воздуха, воды, пищи и т.д.; в какой дозе, и на протяжении какого периода времени?
  3. Зависимость между дозой и результатом: какова реакция на дозы, которые могут быть получены, и каков возможный результат при более низком воздействии?
  4. Характеристика риска: если имеется некая популяция и имеются данные по воздействию на нее, то учитывая экстраполированные взаимоотношения между дозой и результатом, каков будет эффект на здоровье?

Для более детального обсуждения методов и вопросов количественной оценки риска, можно посмотреть следующие публикации: публикации Агентства по охране окружающей среды США (1986); Thomas и соавторы (1992а); и Hertz-Picciotto, (1995а, 1995b).

Эпидемиологические данные могут служить в качестве основы для оценки взаимоотношения между дозой и результатом, если они демонстрируют наличие связи между воздействием и результатом и являются высококачественными (Hertz-Picciotto и Hu, 1994; Hertz-Picciotto, 1995b). С другой стороны, когда эпидемиологические исследования не подходят в качестве основы для экстраполяции (например, не наблюдается повышенного риска и данные по воздействию не очень хорошо оценены) обычно используются данные, полученные на животных. В данном случае эпидемиологические результаты могут оказаться ценными для того, чтобы проверить адекватность экстраполяции риска с животных, на людей ((Hertz-Picciotto и соавторы, 1987, 1988; Hertz-Picciotto и Hu, 1994; Hertz-Picciotto и Hu, 1995b).

Вследствие большого количества возможных допущений эпидемиологи часто не хотят вовлекаться в оценку риска, оставляя эту задачу тем людям, которые понимают эпидемиологию хуже. В результате появляется недостаточно адекватная оценка эпидемиологических доказательств, неадекватное использование данных, полученных на людях, и несправедливое отбрасывание других исследований.

Направления развития.

Некоторое время тому назад Saracci (1978) предложил стратегию развития экологической эпидемиологии, которая призывала (1) улучшить оценку воздействия (2) обратиться к проблеме совместных эффектов множественных воздействий и (3) интегрировать экспериментальные и эпидемиологические данные.  В области оценки воздействия был сделан достаточный прогресс и сейчас уже признано, что современная экологическая эпидемиология должна в этой области продвигаться вперед для того, чтобы получить новую информацию по данной проблеме. Больший объем работ необходим для того, чтобы интегрировать биологические данные с результатами оценки воздействия. Еще достаточно много необходимо сделать для того, чтобы оценить время воздействия, и как они связаны с индукцией и вопросами латентности.

По отношению ко второму предложению Saracci следует признать, что многие исследования должны включать оценку множественных воздействий и изучать возможные последствия взаимодействий. Препятствием для анализа множественных воздействий является практически полная невозможность разделения периодов индукции, взаимоотношений дозы и результата, и взаимодействия эффектов одного от другого (Thomas, 1981a, 1983; Greenland, 1993b). Эти множественные воздействия включают в себя не только традиционные химические и физические агенты, но также должны включать в себя социальные факторы, как потенциальные модификаторы эффекта. Социальный статус может влиять на силу контакта с факторами окружающей среды и их токсичность, либо противодействуя, либо способствуя негативным эффектам для здоровья. Он также может служить маркером таких факторов, как доступность медицинской помощи, качество медицинской помощи, доступность экономических и других ресурсов, а также являться маркером широкого спектра показателей, который может оказать воздействие на уязвимость к экологически индуцированным заболеваниям или на их тяжесть.

Экспериментальные исследования, не являющиеся клиническими испытаниями, для многих эпидемиологов кажутся далеким будущим, хотя имеется все увеличивающееся количество исследователей онкологов, которые регулярно анализируют вопросы молекулярной биологии заболеваний и/или изучают взаимодействие между генами и окружающей средой. Часто на границе этих областей и происходит основной прогресс науки. Для того чтобы добиться прогресса в соответствии с предложениями Saracci, будет требоваться более интенсивное сотрудничество с эпидемиологами, с одной стороны, а с другой стороны, с токсикологами, экологами, молекулярными биологами и генетиками.

Новым вопросом для экологических эпидемиологов является вариабельность уязвимости. Эта концепция не является новой. Она включена в элемент «организма хозяина» в старой парадигме эпидемиологии, которая разделяла причины заболевания на «окружение», «организм хозяина» и «агента». Однако она получает новые характеристики на фоне развития современной технологии, которая позволяет идентифицировать гены, участвующие в возникновении многих заболеваний, например, связанных с определенными метаболическими функциями (такие как, быстрые и медленные ацетиляторы), и с предрасположенностью к определенным заболеваниям, включая остеопороз и т.д. Изучение взаимодействий между генами и окружающей средой как способ идентификации уязвимых групп, может привести к появлению исследований с большей степенью специфичности и точности при оценке эффектов воздействия.

Saracci (1978) также указывал, что при оценке научных данных эпидемиологи должны быть ответственны не только за взаимодействие с другими специалистами, но и за взаимодействие с общественностью и политиками. Определение степени, с которой факторы окружающей среды отвечают за смерть, заболеваемость и инвалидизацию – это работа эпидемиолога. Наши данные могут помочь тем, кто находится за пределами эпидемиологии, отделить реальные и воображаемые опасности, а также отделить важные риски от неприметных рисков, а также могут привести к более рациональному распределению ресурсов для снижения заболеваемости от экологически детерминированных заболеваний. Эта глава начиналась описанием исследования Джоржа Бейкера, посвященному действию свинца в Девоншире.  В дальнейшем Бейкер (Baker, 1767) распространил свой доклад людям, жившим в Девоншире, и предоставил им «самое раннее понимание опасности, которая им угрожает, для того чтобы они могли предпринять адекватные шаги для охраны своего здоровья».