Таблица соответствий в PubMed

Следует отметить, что система PubMed содержит дополнительный компонент, который называется таблица соответствия MESH терминов (MESH Translation Table). Эта таблица содержит термины словаря MESH, которым сопоставлены синонимы. Благодаря этому словарю различные термины могут быть сопоставлены MESH термину, например "Витамин Н" (Vitamin H) сопоставляется MESH термину "Биотин" (Biotin), а "болезнь безумия коров" (mad cow disease) соответствует MESH термину "коровья спонгиоформная энцефалопатия" (Encephalopathy, Bovine Spongioform). Функция использования таблицы соответствия вызывается автоматически, если пользователь не внес указателя на поле, по которому следует искать термин.

В том случае, если поле не указывается явно, то PubMed осуществляется поиск в таблице соответствия MESH терминов. Если термин находится в таблице терминов, то формируется запрос, состоящий из MESH термина и оригинально введенного термина как текстового слова. Например, Vitamin H будет транслирован в запрос Biotin [MH] OR "vitamin h" [TW]

Если термин не обнаруживается в таблице соответствия MESH, он ищется в таблице соответствия названий журналов (Journal Translation Table). Таким образом, если в строку запроса введено название журнала в полной форме, например New England Journal of Medicine, то оно будет транслировано в запрос N Engl J Med [JOUR].

В случае отсутствия термина и в этом списке, система обращается к таблице фраз, которые составляются из терминов MESH, имен химических соединений, терминов Унифицированного медицинского языка (Unified Medical Language System) и т.д.

Если слово не находится в таблице фраз, и запрос состоит из слова с одной или двумя буквами после него, то оно анализируется на соответствие таблице авторов.

В случае отсутствия фразы во всех списках система пытается разбить ее на составные части (слова) и повторить поиск в описанных выше таблицах.

Методологические фильтры

Поиск информации в библиографических базах данных усложняется по мере увеличения базы данных. Это понятно, нам легко найти книгу, если она стоит на полке, где имеется еще десяток других книг.

Если же это не полка, а книжный шкаф, ситуация усложняется. Если мы заходим в книгохранилище, то здесь без некоей системы, быстро отправляющей к нужному стеллажу уже не обойтись. Проблема снимается при помощи каталогов, например тематических. Поступившая книга направляется в определенное место (например, в зависимости от года издания), а на нее создается тематическая карточка, где указывается шифр места хранения книги, ее библиографические данные, зачастую, набор ключевых слов, описывающих содержание книги. Поиск по теме облегчается. Если по какой-то теме накапливается слишком много публикаций, указываются подтемы, классификация становится более детальной и т.д. В результате может сформироваться иерархическое дерево тем, аналогичное контролируемому словарю MESH терминов.

Поэтому первым подходом к поиску является формирование наиболее точного запроса, уточнение темы до нахождение в дереве терминов именного того, который точнее описывает изучаемую проблему. Однако данный подход также имеет свои ограничения. Во-первых, термин находящийся даже в самом низу иерархии MESH может привести к обнаружению тысяч публикаций. Во-вторых, чем уже термин, тем выше вероятность того, что публикации, содержащие важную информацию, но немного отличающиеся по теме будут упущены. Кроме того, тема сама по себе не полностью определяет ценность найденной публикации. Если будет найдена статья, полностью соответствующая по теме искомым условиям, но ее содержание будет фальсифицировано или по иным причинам ее результатам нельзя будет верить ущерб может быть двойным - потерянное время и неадекватное решение. Поэтому желательно было бы найти публикации, удовлетворяющие сразу двум принципам, они соответствовали бы искомой теме и их результатам можно было бы доверять. В науке вопрос насколько можно доверять результатам определяется на основании двух правил - адекватности методологии исследования и воспроизводимости результатов. Грубо говоря, первое определяет насколько полученные в исследовании данные могут быть генерализованы и какова вероятность неучтенных внешних влияний в определении полученных результатов, тогда как второе правило проверяет, насколько в действительности результаты были генерализуемыми получили ли разные исследовательские группы сходные результаты. Понятно, что для ответа на второй вопрос требуется анализ нескольких оригинальных исследований, тогда как для первого - выполнение определенных условий при организации научного эксперимента.

Естественно, каждая научная специальность имеет свои требования к методологии, но, в основном, они сводятся к следующему - одинаковые объекты должны быть подвержены одинаковым воздействиям и их реакция будет сравниваться с реакцией другой группы также аналогичных объектов, но не подвергавшихся данному воздействию. В лабораторных условиях это относительно легко, особенно если речь идет об объектах, которые действительно могут быть одинаковыми (колония клеток кишечной палочки). Однако по мере усложнения биологического организма степень различий между индивидуумами резко возрастает. Тем не менее, одни индивидуумы похожи друг на друга в большей степени, чем другие. Поэтому наиболее сложной задачей является добиться такого разбиения на группы воздействия и контроля, чтобы одинаковые индивидуумы оказались в разных группах. Тут на помощь приходит методика рандомизации. В наиболее общем виде эта методика предполагает, что каждый входящий в исследование индивид имеет абсолютно одинаковые шансы попасть как в контрольную группу, так и в группу воздействия. Если существуют два одинаковых индивида, то вероятность для них двоих попасть в одну группу составляет одну четверть (1/2 * 1/2), т.е. в 75 случаях из 100 они окажутся в разных группах. В случае трех одинаковых пациентов шансы того, что хотя бы один из них окажется в другой группе уже составляет 7 к 1. Поэтому группы контроля и воздействия оказываются одинаковыми и такое исследование, называемое в клинике Рандомизированным клиническим испытанием, дает наиболее достоверную информацию.

Если авторы исследования не проводили рандомизацию, группы могут оказаться не сравнимыми. Представьте себе, что на одном предприятии меньше работы в понедельник и их чаще отпускают с работы в учреждения здравоохранения именно в этот день. При этом работники этого предприятия чаще подвергаются воздействию некоего неблагоприятного вещества. На другом предприятии, расположенном поблизости, нет особых вредностей, и работа распределена равномерно по всем пяти рабочим дням недели. Исследователи в клинике, расположенной посредине между этими двумя предприятиями начинают клиническое испытание и решают принимать добровольцев в исследование в понедельник и пятницу. Для облегчения работы в понедельник проводится прием в группу контроля, а в пятницу - в группу лечения. Пациенты не знают, в какую группу они попадут, но что произойдет? В пятницу, когда происходит набор в группу лечения, сотрудники первого предприятия приходить не будут, набор добровольцев немного затянется и к моменту завершения группа будет состоять из сотрудников только второго предприятия. В контроле будут и те и другие. Поскольку на втором предприятии больше вредностей и выше риск здоровью, состояние здоровья пациентов этой группы будет хуже. Соответственно, в группе контроля пациенты будут больше болеть, и группа лечения искусственно продемонстрирует завышенную эффективность лечения. Могут быть и другие причины появления искусственных различий при нарушении правила рандомизации - сознательный отбор более тяжелых пациентов в контрольную группу (слишком тяжелое состояние для оперативного лечения), отбор более тяжелых пациентов в группу лечения и т.д. В любом случае в нерандомизированном исследовании вероятность ошибки значительно выше, поэтому такие исследования имеют более низкую достоверность.

Иногда авторы исследования сами не могут разбить изучаемую группу на основную и контрольную не потому, что не хотят возиться с рандомизацией, а потому, что не могут сами воздействовать на пациентов. Представим себе исследование влияния вдыхания паров бензола на развитие апластической анемии. Понятно, что организация РКИ с сознательным подвержением смертельному риску большой группы людей приведет не к публикации, а на скамью подсудимых. Поэтому исследователям не остается ничего другого, как искать людей, которые сами подвергают себя риску и сравнивать их с другой группой людей - тех, кто такому риску не подвергается. В принципе этот дизайн исследования, называемый когортным ииследованием, похож на клиническое испытание, однако в группы контроля и воздействия люди назначают себя сами. Поэтому иногда эти исследования называют псевдо-экспериментальными (квази-эксперментальными). Данный дизайн является наиболее достоверным для исследования вредоносных влияний и считается недостаточно достоверным для исследований благотворных влияний.

В ряде случаев, особенно если некое осложнение наступает редко, описанный выше подход с использованием когортного исследования не очень удобен. Представьте чрезвычайно тяжелое осложнение (смертельное), которое развивается лишь у 1 из каждой тысячи принимающих данный препарат людей (и это, на самом деле, считается частым осложнением). Статистические расчеты показывают, что для того, чтобы в когортном исследовании это осложнение появилось в группе лечения с 95% вероятностью надо, чтобы эта группа включала не менее 3000 человек (общее правило - если осложнение встречается у 1 из N пациентов, надо наблюдать за утроенным количеством пациентов [3*N]). А если осложнение встречается реже? С другой стороны, препарат принимают сотни тысяч, миллионы людей. Исследование в Швеции показало, что в начале 90х потребление бензодиазепинов составляло примерно 62 дозы на 1000 населения в день. Для страны с населением около 9 млн это равноценно 558000 дозам в день. Соответствующие цифры в расчете на Россию (хотя потребление бензодиазепинов в то время было иным) могли бы составить 17,4 млн. доз в день. Поэтому препарат, который дает смертельные осложнения у 1 из 5000 пациентов, в стране, где его принимают 10 млн. человек, сможет убить 2000 человек. При этом ни один врач, назначающий данный препарат не будет видеть более одного случая (как у себя, так и у коллег) и соответственно, клинический "опыт" не сможет подсказать, что этот препарат вредоносен (ведь даже у участкового терапевта размер всего участка будет в семь с половиной раз меньше, чем необходимо для обнаружения побочного эффекта). Поэтому приходится прибегать к ухищрениям, чтобы обнаружить воздействие того или иного фактора.

Наиболее адекватным в данной ситуации будет подобрать группу людей, у которых было обнаружено состояние, которое могло быть вызвано изучаемым фактором (препаратом) и подобрать контрольную группу, у которых данного состояния нет. Затем посмотреть, сколько человек в первой группе действительно подвергалось воздействию фактора, и сколько лиц в группе контроля подверглось подобному воздействию. Если воздействие значительно чаще встречалось в группе лиц с патологией. Значит вероятность вредоносного воздействия достаточно высока. Например, была взята группа молодых женщин со светлоклеточной аденокарциномой влагалища (8 человек) и подобрана группа контроля из 32 женщин, родившихся в том же родильном доме, в тот же день, но не имевших данной патологии. Затем в обеих группах был задан вопрос о том, принимали ли матери девушек во время беременности диэтилстилбэстрол (ДЭС). В группе с аденокарциономой матери 7 из 8 девушек принимали ДЭС, в контроле ни одна не принимала ДЭС. Роль ДЭС в развитии аденокарциномы была доказана. Такой дизайн исследования называется дизайном по типу случай-контроль и он рассматривается как адекватный при изучении вредоносных влияний, которые оказывают свое воздействие достаточно редко.

Следует, однако, заметить, что не всегда дизайн исследования случай-контроль является адекватным только для вредоносных воздействий. Представим себе, что нам необходимо изучить качество нового диагностического исследования. Поскольку диагностический тест никак не влияет (в теории) на состояние здоровья пациента и экспериментатор не можем манипулировать результатами теста (они являются "свойством" пациента, как группа крови или потребление алкоголя), речь здесь может идти только о когортных исследования. Поэтому наиболее адекватным методом было бы взять группу пациентом, разбить ее на две части в зависимости от результатов теста, а затем наблюдать за ними. Но тут необходимо помнить, что воздействие на обе группы в когортном исследовании должно быть одинаковым. Поэтому можно либо оставить всех пациентов без лечения, либо давать препараты всем пациентам вне зависимости от результатов тестирования. И то, и другое, явно неприемлимо. Поэтому наиболее адекватным в данном случае будет являться дизайн исследования по типу случай-контроль.

Вместе с тем, даже для исследования по типу случай-контроль мы должны знать, какое состояние предположительно вызывается тем или иным агентом. Если это неизвестно, то анализ оказывается затрудненным. Поэтому в ряде случаев исследователь может заметить, что при назначении того или иного препарата у некоторых пациентов возникает, например, одышка. Сказать, что именно препарат вызывает одышку мы однозначно не можем, но такое подозрение появляется. Этот тип исследования называется "серия случаев" и рассматривается как самый низкий уровень в иерархии доказательств. Это, на самом деле, даже не доказательство, а подозрение.

Аналогичным образом рассматриваются так называемые "экологические исследования", в которых изучается связь между частотой двух событий на уровне популяции, а не индивидуума. Например, как меняется смертность от бронхиальной астмы у детей при изменении продаж аэрозолей изопротенерола? Эти исследования могут генерировать гипотезу о вредоносном действии того или иного вещества и, на самом деле, могут, изредка, ее и подтвердить - если после удаления соединения с рынка осложнения так же прекращаются. Однако здесь возможны совпадения (уязвимая группа погибла и это совпало с отменой препарата), поэтому однозначно причислять эти исследования к дающим доказательства нельзя

Ниже приведена небольшая таблица, которая суммирует подход к методологической оценке индивидуальных исследований. Для доказательства положительного эффекта требуются более достоверные данные, чем для доказательства вредного эффекта (primum non nocere). Ряд исследований, таких как серии случаев при изучении положительного эффекта и мнения экспертов можно рассматривать только как личную точку зрения авторов, достоверность которой ни в коем случае нельзя считать установленной и которую необходимо еще проверять

 

Благоприятный эффект

Вредный эффект

Диагностика

РКИ

Доказательства

   

КИ без рандомизации

Предположение

   

Когортные исследования

Предположение

Доказательства

 

Исследования случай-контроль

Предположение

Доказательства

Доказательства

Серии случаев

Точка зрения

Предположение

Точка зрения

Экологические исследования

Точка зрения

Предположение

Точка зрения

Мнения экспертов

Точка зрения

Точка зрения

Точка зрения

Вторым вопросом, который, как обсуждалось ранее, волнует врача, осуществляющего поиск работ в MEDLINE, является вопрос генерализуемости. Были ли подобные результаты получены разными группами авторов? Этот вопрос можно изучать самостоятельно, а можно посмотреть, не сделал ли кто-нибудь уже данную работу за нас.

Суммарная оценка ряда исследований называется обзором литературы. Обзоры литературы бывают разных видов, но в данном случае нас интересует лишь классификация их по методологии. Как отбирались источники для включения в обзор, и как оценивалось методологическое качество отдельных статей. Если условия поиска источников и особенности оценки их методологии были сформулированы до начала сбора материала, речь идет о "систематическом обзоре". Если жестких правил сбора и оценки материала для реферирования не было, речь идет об "описательном обзоре". Описательный обзор рассматривается как точка зрения автора, систематический обзор - как достоверный метод проверки обобщаемости результатов. Очень часто авторы такого обзора даже приводят суммарные оценки эффекта лечения или воздействия, тогда подобный обзор носит название мета-анализа.

Поэтому мы можем сформулировать следующую иерархию доказательств, указав в скобках соответствующий тип публикации в MEDLINE

Положительный эффект

  1. Достоверен И данные генерализуемы
  2. Достоверен
  3. Предполагаем
  4. Возможен

Вредный эффект

  1. Достоверен И данные генерализуемы
  2. Достоверен
  3. Предполагаем
  4. Возможен

Таким образом, для экономии времени, врач может указывать для запроса тему своего поиска в сочетании с методолгическими фильтрами, которые будут отбирать только исследования определенного уровня достоверности. Так, достоверные исследования положительного эффекта будут отбираться при помощи фильтра Randomized Controlled Trial [PT] OR Meta-Analysis [PT], достоверные исследования вредного эффекта при помощи фильтра Cohort Studies [MH] OR Meta-Analysis [PT]

Вместе с тем, врача, работающего с информацией интересует не только вопрос лечения или наступления побочных эффектов от терапии. Его интересует диагностика заболевания, его прогноз и факторы риска. Задачу поиска определенных типов исследований можно также решить при помощи методологических фильтров. Вначале врач должен решить, какой тип информации о данном заболевании он ищет - интересуют его вопросы этиологии(1), диагностики (2), прогноза (3) или лечения (4) заболевания. С последним пунктом мы уже немного разобрались, поэтому если врач ищет информацию о лечении, он может начать поиск с наиболее достоверных источников, а если их не найдется, расширить поиск использовав фильтр Clinical Trial [PT]. Вообще при обсуждении фильтров очень часто упоминается их чувствительность и специфичность, т.е. способность фильтра находить в MEDLINE интересующие исследования и не захватывать при этом большого количества ненужной информации. Если фильтр позволяет найти большее количество статей, имеющихся в MEDLINE по данной теме, то говорят о его высокой чувствительности. Если фильтр создает выборку, где содержится лишь небольшое количество не относящейся к делу информации, то говорят о его высокой специфичности. Если нам надо найти как можно больше публикаций и ничего не пропустить, мы будем использовать фильтры с высокой чувствительностью (оптимизированные по чувствительности), если же у нас мало времени и нам надо создать запрос, где бы большая часть статей относилась к теме, мы будем выбирать фильтры с высокой специфичностью (оптимизированные по специфичности). Простейшие фильтры перечислены ниже

Для исследований ЭТИОЛОГИИ: Risk [TW] (чувствительность=67%, специфичность=79%)

Для исследований ДИАГНОСТИКИ: Sensitivity and specificity [MH] (чувствительность и специфичность не определены)

Для исследований ПРОГНОЗА: Cohort Studies [MH] (чувствительность=60%, специфичность =80%)

Для исследований ЛЕЧЕНИЯ: Clinial Trial [PT] (чувствительность =93%, специфичность =92%)

Более сложные фильтры, разработанные Hayes и соавт., позволяют добиться значительно более высоких значений чувствительности и специфичности. В приведенной ниже таблице указан текст запроса ни использование фильтра на языке PubMed, и какой чувствительности и специфичности можно добиться, используя данный фильтр. Так, превый из представленных запросов позволяет добиться 99% чувствительности, но за счет большого количества не имеющих отношения к исследованиям лечения статьям. Второй фильтр даст почти исключительно нужные статьи, но ценой потери примерно половины всех интересующих нас публикаций (надо, правда, заметить, что высокая специфичность не всегда будет нас спасать от "мусора", а то, насколько часто встречается основной термин, по которому осуществляется поиск. Чем реже он встречается, тем больше, при прочих равных условиях, будет "мусора")

 

Таблица запросов клинически важной информации с использованием фильтров исследовательских методов

Категория

Отимизация по

Чувствительность/ Специфичность

Запрос на языке PubMed

Лечение

Чувствительности

99%/74%

"randomized controlled trial" [PT] OR "drug therapy" [SH] OR "therapeutic use" [SH:NOEXP] OR "random*" [WORD]

Специфичности

57%/97%

(double [WORD] AND blind* [WORD]) OR placebo [WORD]

Диагностика

Чувствительности

92%/73%

"sensitivity and specificity" [MH] OR "sensitivity" [WORD] OR "diagnosis" [SH] OR "diagnostic use" [SH] OR "specificity" [WORD]

Специфичности

55%/98%

"sensitivity and specificity" [MH] OR ( "predictive" [WORD] AND "value*" [WORD])

Этиология

Чувствительности

82%/70%

"cohort studies" [MH] OR "risk" [MH] OR ("odds" [WORD] AND "ratio*" [WORD]) OR ("relative" [WORD] AND "risk" [WORD]) OR "case" control*" [WORD] OR case-control studies [MH]

Специфичности

40%/98%

"case-control studies" [MH:NOEXP] OR "cohort studies" [MH:NOEXP]

Прогноз

Чувствительности

92%/73%

"incidence" [MH] OR "mortality" [MH] OR "follow-up studies" [MH] OR "mortality" [SH] OR prognos* [WORD] OR predict* [WORD] OR course [WORD]

Специфичности

49%/97%

prognosis [MH:NOEXP] OR "survival analysis" [MH:NOEXP]

Как же можно использовать эту таблицу? В наиболее общем виде запрос будет выглядеть так

(Описание темы MESH терминами) AND (Фильтр)

Так, если врач хочет найти статьи, посвященные прогнозу ишемической болезни сердца, он вначале выберет соответствующий данному заболеванию MESH термин, например Myocardial Ischemia. Вполне возможно, он захочет использовать несколько MESH терминов: Myocardial Ischemia [MH] OR Myocardial Infarction [MH]. Затем ему надо будет решить, какой тип поиска он хочет использовать - максимально возможное количество публикаций, но с риском получения большого количества ненужной информации или максимально адекватную выборку с риском потери статей. Предположим, что у врача не так много времени и ему надо создать наиболее компактную выборку. Тогда он берет фильтр, оптимизированный по специфичности и связывает его описанием задачи оператором AND

(Myocardial Ischemia [MH] OR Myocardial Infarction [MH])

AND

(prognosis [MH:NOEXP] OR "survival analysis" [MH:NOEXP])

Обратите внимание на то, что обе части запроса заключены в скобки. Если их не будет, последовательность выполнения операторов будет нарушена и запрос будет выполнен неверно.

Следует отметить, что Web-версия PubMed имеет специальную страницу с клиническими фильтрами, где пользователь может создать запрос не вспоминая структуру фильтра, а только указав, какой тип исследования он хочет найти и надо ему оптимизировать поиск по чувствительности или по специфичности.

Таким образом, фильтры являются мощным инструментом в использовании системы PubMed и они позволяют даже занятому клиницисту быстро и адекватно находить интересующую его информацию