Эпидемиология для непосвященных.

Copyright BMJ Publishing Group 1997

 

5. Планирование и проведение исследования

Эпидемиологические исследования используют различные дизайны и широко варьируют в размерах. С одной стороны, можно организовать исследование по типу случай-контроль, которое будет включать менее 50 человек, в то время как с другой стороны, некоторые большие проспективные исследования, организованы так, что они наблюдают за многими тысячами людей в течение нескольких десятилетий. Основные типы дизайна исследований будут описаны в более поздних главах, а здесь мы попытаемся обсудить некоторые важные их характеристики, которые являются общими для планирования и выполнения исследований вне зависимости от типа дизайна исследования.

Начало планирования.

Для успеха в сборе данных необходима тщательная подготовка. Первый и часто наиболее сложный вопрос заключается в следующем: - "А зачем я вообще делаю это исследование?" Многие исследования начинаются с неопределенной надежды, что появится что-нибудь интересненькое, и они очень часто заканчиваются разочарованием. Общий интерес в начале исследования должен быть переведен в точно сформулированные и записанные цели этого исследования. Каждое исследование должно быть организовано таким образом, чтобы дать адекватный ответ на, по крайней мере, один определенный вопрос. Уже для начального планирования требуются некоторые идеи относительно заключительного анализа; и с самого начала может быть полезно сделать ключевые таблицы для заключительного отчета, и предусмотреть количество случаев, ожидаемых в ячейках этих таблиц.

Каждое исследование нуждается в первичной цели. Очень легко заявить "Поскольку мы имеем пациентов, давайте также измерять..."; но перегрузки, как исследователей, так и исследуемых, нужно избегать, если это будет угрожать первичной цели. Иногда вспомогательные цели могут быть разрешены на небольших подгруппах (каждый энный пациент, или пациент определенной возрастной группы) или путем приглашения некоторых пациентов для повторной экспертизы: когда начальный контакт был благоприятным и отклик достаточно хорош.

Необходимость чтения литературы.

Перед планированием исследования в деталях, достаточно разумным было бы выполнить библиотечный поиск, для того чтобы обнаружить публикации на данную тему. Иногда эта работа может дать ответ на поставленный вопрос без какой бы то ни было потребности в дальнейшем сборе данных; или она может обнаружить полезные источники опубликованной информации, типа отчетов из общих регистров, либо раковых регистров, которые могут сформировать основу для анализа, без необходимости проводить дорогостоящее и затратное по времени исследование. Даже, когда само исследование остается необходимым, опыт предыдущих исследований может помочь в выборе дизайна задуманного исследования, или указать на те ошибки и недостатки, которых надо избегать.

Выбор методов исследования.

Самая большая потребность при проведении эпидемиологического исследования состоит в том, чтобы обследовать репрезентативную выборку адекватного размера стандартизированным и достаточно достоверным способом. Это как раз и определяет выбор методов исследования и то, чем эти методы исследования будут отличаться от таковых в обычной клинической практике. Методы должны быть приемлемы, и ,по возможности, неинвазивными, в противном случае можно не достигнуть хорошего сотрудничества со стороны пациентов и группа, которая обследуется, становится не репрезентативной. Они должны быть относительно дешевыми и быстрыми, иначе не удастся обследовать, достаточного количества пациентов: когда объем ресурсов фиксирован, необходимость получения все более детальной информации находится в конфликте с потребностью обследовать все большее количество пациентов. Наиболее важным фактором правильно организованного исследования является то, что методы и персонал, которые проводят наблюдение должны быть четко стандартизированы; даже если это исключает дополнительный положительный эффект от клинической постановки диагноза.

Информация, реферируемая из существующих отчетов.

Иногда в существующих отчетах уже доступна адекватно стандартизированная информация. Например, в исследовании, которое направлено на изучение заболеваемости гипотиреозом после лечения тиреотоксикоза радиоактивным йодом, возможна идентифицикация пролеченных пациентов и получение информации, необходимой для того, чтобы наблюдать за ними (имя, дата рождения, пол, адрес, и т.д). Получить эту информацию можно из историй болезни, находящихся в архивах стационаров. В то время, как можно использовать таким образом, существующие истории болезни, требуемая информация обычно выписывается на специально разработанную форму, или даже вводится напрямую в портативный компьютер.

Структура формы для сбора информации или компьютерной программы для ввода данных должна принимать во внимание структуру материала источника. Необходимость неоднократно пролистывать назад и вперед историю болезни не только чрезвычайно утомительна и требует большого количества времени, но может также и увеличивать вероятность случайной ошибки. Каждая запись должна быть идентифицирована серийным номером, и должна включать достаточную информацию для того, чтобы обеспечить легкий доступ как к ней самой, так и к исходному материалу для проверки и для получения дополнительных данных, если они потребуются. Когда данные не вводятся напрямую в компьютер, более поздний перенос их в компьютер, может быть облегчен цифровым кодированием, и тогда квадратики для кодирования можно напечатать на правой стороне формы для сбора данных. Некоторые данные (например, даты рождения) могут легко быть написаны напрямую в квадратики для кодирования. Для других данных, например, образования, может потребоваться запись словами и последующая кодировка их в цифры. Время, потраченное на внесение записей, уменьшается, если не-цифровая информация, когда это возможно, обводится или подчеркивается, а не вписывается. Для того чтобы уменьшить случайные ошибки, любая переформулировка цифровых данных (например, расчет возраста в момент госпитализации исходя из даты рождения и даты госпитализации) должна быть выполнена компьютером после того, как все данные введены, а не как часть процесса копирования данных из истории болезни. При кодировании данных, необходимо принимать во внимание возможность пропуска или отсутствия информации.

Опросники.

Эпидемиологические данные очень часто получаются за счет использования опросников. Эти опросники могут быть как самозаполняемые (то есть заполняемые пациентом), а могут применяться и в рамках интервью. Самозаполняемые анкетные опросы легче стандартизировать, потому что возможность систематических различий в технике заполнения исключается. С другой стороны, они ограничены потребностью в отсутствии двойственного толкования всеми обследуемыми. Интервьюер может оказаться необходимым для сбора информации по сложным темам.

Создание хороших опросников требует навыка. Используемый язык должен быть ясен и прост. Два коротких вопроса, каждый из которых посвящен одной теме, значительно лучше, чем один, более длинный вопрос, который сразу же пытается выяснить информацию по двум темам. Вопрос, который успешно использовался в предыдущем исследовании, имеет очевидные преимущества. Последовательность вопросов должна принимать во внимание особенности человека, которому они адресованы - лучше начать с вопроса "Укажите, пожалуйста, Вашу дату рождения", чем сразу же задавать вопрос: "Вы когда-либо обращались к специалисту по поводу гонореи?" - то есть опросник должен быть разработан таким образом, чтобы облегчить его заполнение. Например, все вопросы, касающиеся одной фазы жизни человека, должны быть сгруппированы вместе. В качестве проверки надежности информации иногда полезно включать перекрывающиеся вопросы. При изучении факторов риска болей в пояснице, некоторые люди сообщали, что их работа требует, чтобы они проводили за рулем более четырех часов в день, но не отвечали положительно на вопрос о более, чем двухчасовом сидении в день где-либо. Это предполагает, что они должным образом не поняли вопрос. Чрезвычайно важным является вопрос о том использовать ли закрытые или открытые формы вопроса. Закрытые вопросы, имеют список, состоящий из всех возможных ответов (включая "не знаю"). На них отвечают с большей с готовностью и они легче классифицируются, но закрытые вопросы не всегда собирают детальную информацию, которая требуется. Когда используются интервьюеры, формулировка вопросов также должна быть стандартизирована настолько, насколько это совместимо с необходимостью получения полезной информации. Точно также, как и при получении выписки из существующих отчетов, формы, которые используются для записи ответов на вопросы, должны быть разработаны таким образом, чтобы их было легко заполнять; ответы на них должны быть достаточно точными с последующим легким кодированием и анализом.

Физикальное и клиническое обследование.

Методы физикального обследования должны быть разработаны таким образом, чтобы уменьшить вариабельность, как у самих пациентов, так и между различными врачам, участвующими в исследовании. Часто количественный показатель (например, частоту дыхания) легче стандартизировать, чем качественную оценку (имеется у ли кого-то тахипное, или нет). Стандартизация лабораторных тестов может быть улучшена четким описанием метода, того, как собираются образцы и как они хранятся, обеспечением достаточно жесткого контроля качества в момент проведения анализа.

Вне зависимости от того, какой метод сбора данных принят, перед осуществлением основного исследования обычно имеет смысл провести пилотажное исследование. Идентификация проблем на этой стадии может спасти от большого количества проблем позднее. В более крупных исследованиях дизайн опросников или форм для записи материалов, должны быть обсуждены со статистиком, который будет позже принимать участие в анализе.

Персонал и обучение.

В небольших исследованиях непосредственно сам врач может выполнить всю работу, но в больших исследованиях ему могут потребоваться помощники. Если эпидемиологическое обследование требует навыка и клинической оценки, оно, вероятно, было недостаточно стандартизировано: если оно адекватно стандартизировано, этой технике может быть научен любой разумный человек.

Рисунок демонстрирует, как два наблюдателя имели различную, и противоположную по характеру временную динамику в освоении навыка измерений толщины кожной складки во время ранних стадий исследования. Такие результаты обучения, которые встречаются довольно часто, должны быть завершены до начала основного исследования: новый персонал должен попрактиковаться в реальных условиях прежде, чем они начнут участвовать в самом исследовании.

Тенденция средних значений толщины кожной складки над трехглавой мышцей плеча, полученная двумя исследователями в одном и том же исследовании.

Несмотря на все предосторожности, различия между наблюдателями могут сохраняться. Поэтому наблюдатели должны принимать пациентов более или менее случайным образом: если, например, один человек обследовал большинство мужчин, а другой - большинство женщин, то различия между наблюдателями будут вмешиваться и маскировать истинные различия между полами. Для того, чтобы поддерживать контроль качества на протяжении всего исследования, необходимо вносить в формы для записи результатов идентификационный номер каждого наблюдателя (кто, какого пациента обследовал) и результаты, полученные разными специалистами, необходимо сравнивать.

Определение выборки

Размер выборки

Большинство исследований и клинических испытаний меньше, чем хотел бы исследователь, и поэтому отсутствие достаточного количества обследованных очень часто ограничивает желаемый анализ подгрупп. Это неизбежно. Чего можно избежать - это обнаружения на финальной стадии того, что количество обследованных не позволяет решить даже основные задачи исследования. Чтобы предотвратить это разочарование, необходимо сформулировать цель и задачи исследования в точных статистических терминах. Если цель состоит в том, чтобы оценить распространенность, то размер выборки будет зависеть от требуемой точности этой оценки. (В таблице 5.1 приведены некоторые примеры.) Ошибка выборки значительно больше для менее часто встречающихся состояний; то есть, чтобы достигнуть того же самого уровня достоверности результатов если распространенность низка, требуется выборка большего размера.

Таблица 5.1 95% доверительные интервалы и размеры выборки

Предполагаемая распространенность (%)

95 % Доверительный интервал

 

N=500

N=1000

2

1.0-3.7

1.2-3.1

10

7.5-13.0

8.2-12.0

20

16.6-23.8

17.6-22.6

Существуют также методы для расчетов размера выборки, требуемых для оценки с определенной степенью точности, среднего значения переменной, или для идентификации заданного различия в распространенности, или различий в средних значениях в двух популяциях. Эти методы могут быть найдены в учебниках или (лучше), для этого можно проконсультироваться со статистиком; но, в любом случае, исследователи должны сначала точно знать чего они хотят достигнуть.

Методы формирования выборки.

Когда выборка для исследования отбирается из большой популяции, статистические выводы будут более точными, если процесс выбора случаен, или эффективно случаен; то есть, если каждый индивидуум в изучаемой популяции имеет известную (обычно идентичную) ненулевую вероятность попасть в эту выборку. Чтобы добиться этого, необходимо иметь список всей изучаемой популяции. При изучении взрослых пациентов в больничном округе можно использовать избирательные списки. В профессиональных группах можно использовать платежную ведомость, а в школе имеются списки учеников. В общеврачебной практике - имеется регистр пациентов по полу и возрасту. Для того, чтобы сформировать простую случайную выборку, внесенные в список люди последовательно нумеруются. Числа для формирования выборки берутся из специальной таблицы, или, с помощью компьютера, генерируется список случайных чисел, на основании которого отбираются пациенты до тех пор, пока не будет отобрана группа определенного размера.

Может так случиться, что исследователь желает собрать выборку, в который определенные подгруппы (определенного возраста, например, или категории высокого риска) - присутствуют в относительно большем количестве. Для того, чтобы этого добиться, он может разделить популяцию на подгруппы (страты), а затем сформировать отдельную случайную выборку для каждой, корректируя различные размеры выборки в разных группах таким образом, чтобы удовлетворить требования исследования. Подобная методика называется стратифицированной случайной выборкой.

Популяция, которая исследуется, может быть достаточно большой и широко разбросанной - например, все общие практики в определенном городе - но для удобства, исследователь может концентрировать исследование только в нескольких географических областях. Этого можно добиться, составив случайную выборку практик, а затем, внутри каждой практики, создать случайную выборку индивидуумов. Такая двухстадийная выборочная методика работает очень хорошо, но при ней имеется некоторая потеря статистической эффективности, особенно, если на первой стадии отбирается только небольшое количество единиц.

Рекрутирование пациентов.

Большинство людей соглашается принимать участие в медицинских исследованиях при условии, что они доверяют исследователям, так же, как пациенты будут почти всегда будут помогать своим собственным докторам в их исследованиях. В популяционных исследованиях, однако, обычно не имеется никакого предыдущего контакта. Отобранным пациентам следует объяснить цели исследования, а также, почему именно их попросили принять участие в исследовании, что от них требуется, и что они могут получить из этого исследования, если они ожидают что-нибудь получить (например их обследуют, сообщат результаты исследования, или дадут какие-то рекомендации). Врачи общей практики, работающие в данном регионе, также должны знать что происходит. Время, которое отводится на предварительную связь с широкой общественностью - это всегда хорошо потраченное время.

Возможность обследования должна быть сделана настолько доступной, насколько это возможно. Если требуется, чтобы люди пришли в некий центр, лучше послать каждому письмо, в котором просить их придти в определенное время, чтобы исключить ожидание. Очень неплохо обеспечить людей транспортом. Часто различие между посредственным откликом и хорошим откликом является следствием того, что имеется тактичная настойчивость, включая повторные приглашения придти на обследование (возможно заказным письмом), телефонные звонки, идентификацию причин отказа от участия в исследовании (непосещаемости), и домашние визиты.

Частота отклика.

Уровень отклика, который является приемлемым, зависит и от изучаемого вопроса, и от популяции, относительно которой этот вопрос задается. Проблемы могут возникнуть в результате того, что люди, отказывающиеся от участия в исследовании, могут быть не типичными. Например, в исследовании факторов риска ишемической болезни сердца среди взрослых, которые зарегистрированы в группах врачей общей практики, лица, имеющие самый высокий риск, меньше всего хотели заполнять опросники или приходить для обследования. Если частота отклика составляла 85%, то распространенность высокого потребления алкоголя составившая 3% среди тех, кто принял участие в исследовании, могла бы оказаться весьма низкой, если бы большинство из тех, кто не принял участия в исследовании пили достаточно много. С другой стороны, обнаруженная 50% распространенность курения, не потребовала бы большого пересмотра, даже если все лица, отказавшиеся от участия в исследовании, курили.

Однако, наиболее важным является то, насколько нерепрезентативными являются лица, отказавшиеся от участия в исследовании, по отношению к основному вопросу, который изучает данное исследование. Не важно, являются ли они атипичными по всем остальным параметрам. В исследовании, которое оценивает взаимосвязь между концентрацией сывороточного иммуноглобулина E с легочной функцией, не будет играть большой роли, если лица, отказавшиеся от участия в исследовании, будут иметь необычно высокую частоту заболеваний легких, при условии, что они не являются нерепрезентативными в смысле связи функции внешнего дыхания с иммуноглобулином E.

Оценка возможного смещения, являющегося следствием неполного отклика - в конечном счете вопрос достаточно субъективный. Однако, в оценке могут помочь два подхода. Во-первых, может быть сформирована небольшая случайная выборка из тех пациентов, которые отказались принять участие в исследовании, а затем предпринять особенно энергичные усилия, чтобы обеспечить их участие, включая визиты домой. Тогда результаты, полученные в этой подвыборке, укажут на размер ошибки среди отказавшихся принять участие в исследовании в целом. Во-вторых, для всех людей, которые составляют изучаемую популяцию имеется некоторая информация. По этим данным возможно сравнить тех, кто принял участие в исследовании и тех, кто отказался от участия в исследовании по таким характеристикам как возраст, пол, и место жительства. Если обнаруживаются какие-то различия, они могут указать исследователю на возможные ошибки.

Кроме того, может оказаться полезным установить некоторые пределы неопределенности, являющиеся результатом того, что люди отказались от участия в исследовании, приняв крайние предположения относительно неучастников. Например, если цель исследования состоит в том, чтобы оценить распространенность заболевания, то следует оценить, какие бы были цифры распространенности, если бы все, отказавшиеся от участия в исследовании, были бы больными, или если бы ни один из них не был бы болен?

Анализ.

Небольшие исследования могут иногда анализироваться вручную с помощью калькулятора. В настоящее время, однако, анализ эпидемиологических данных почти всегда выполняется при помощи компьютера. В свете современных успехов технологии, практически любые, кроме самых больших наборов данных, могут быть удовлетворительно обработаны на персональном компьютере. Кроме того, теперь доступен широкий диапазон пакетов статистических программ, которые помогают провести эпидемиологический анализ.

Отправная точка для анализа на компьютере - это кодирование и ввод данных. Эти процедуры должны проверяться, обычно за счет того, что они выполняются два раза. Кроме того, как только данные были введены, должны быть проведены дополнительные проверки для того, чтобы гарантировать, что все коды являются достоверными (например, никто не должен иметь в качестве даты рождения 31 февраля) и исключены любые внутренние несовпадения (например, даты госпитализации, являющейся более ранней, чем дата рождения). Статистический анализ должен начаться только после того, как набор данных “вычищен” настолько, насколько это возможно.

При доступности существующих статистических пакетов программ, у ученого-медика возникает искушение начать анализ, который он не всегда полностью понимает - процесс, который может привести к использованию несоответствующих статистических методов. По этой причине предпочтительно при выполнении любых, кроме самых простых, исследований получить совет от статистика. Как и на более ранних стадиях обработки данных, все статистические вычисления должны быть проверенны.

 

Назад ------------ Далее