Описание процедуры и результатов статистического анализа медицинских данных в научных публикациях.


В данной статье кратко рассмотрены наиболее важные аспекты, касающиеся описания статистического анализа в разделе “Материалы и методы” и представления данных в разделе “Результаты”. 

Описание статистического анализа в разделе “Материалы и методы”

Раздел “Материалы и методы” — традиционная часть как научных статей, так и диссертационных работ. Описание статистического анализа данных (если он вообще проводился) должно быть непременной частью этого раздела наравне с другими использованными авторами методами, такими как клинические, биохимические, иммунологические и т.д. При этом рекомендуется освещать следующие аспекты исследования.

Во-первых, необходимо описать задачи, которые ставились при анализе данных, например:

— описание изучаемых параметров в группах;
— парные групповые сравнения;
— исследование связей двух или нескольких параметров; анализ дожития.

В этом разделе статьи или диссертации не следует упоминать названия конкретных статистических методов, которые были использованы при обработке полученных данных, так как выбор того или иного метода зависит от результатов предыдущих этапов анализа данных. Конкретные статистические методы следует упоминать по ходу изложения результатов (в разделе “Результаты”).

Во-вторых, при анализе данных контролируемых испытаний медицинских вмешательств необходимо указать, проводился ли статистический анализ данных, полученных только тех больных, которые закончили лечение, или всех включенных в исследование. Если выбывшие из исследования составили более 20% от исходного числа участников испытания, то следует специально указать, не утрачена ли сопоставимость групп контроля и лечения в результате выбывания больных.

В-третьих, необходимо отметить, приводятся ли в тексте статьи или диссертации все сопоставления, которые выполнены в ходе анализа данных. Эта информация нужна читателю для того, чтобы он смог оценить существенность так называемой проблемы множественных сравнений 1.

В-четвертых, следует указать пакет программ и его производителя, использованные при анализе данных. Применение собственных разработок не рекомендуется. Это связано с тем, что при использовании разных алгоритмов в процессе программирования одних и тех же статистических методов возможны несколько различные результаты, коммерческие же пакеты программ надежны, и их качество общеизвестно. Среди доступных в России пакетов можно назвать следующие: Statistica (StatSoft, USA; существует также русифицированная версия производства StatSoft—Russia, 1999), BIOSTAT (S.A. Glantz, McGraw Hill; пер. на русск. яз.: М: Практика, 1998), англоязычные пакеты SPSS (SPSS Inc., USA), SAS (SAS Inst., USA), BMDP (BMDP Statistical Software, USA), STATGRAPHICS (Manugistic Inc., USA).

В случае если для анализа данных все же использовались оригинальные (не общеизвестные) программные средства, необходимо дать ссылки на источники литературы, в которой опубликованы подробные описания используемых математических методов и алгоритмов.

Представление данных в разделе “Результаты”

Представление и описание распределений качественных данных

Качественные данные (номинальные и порядковые) иногда называют также категориальными данными. Их принято обобщать путем подсчета количества наблюдений каждой категории (частоты) или вычисления доли наблюдений конкретной категории в исследуемой выборке (т.е. относительных величин в форме процентов или отношений). Если используются относительные величины, необходимо указывать также абсолютные значения числителей и знаменателей.

Распределения качественных данных необходимо описывать в тексте, а не представлять в виде диаграмм, даже если число категорий (частот) велико.

Если порядковые данные были получены путем разбивки на интервалы (градации) области значений непрерывных данных, необходимо указать границы и привести их обоснование. Вообще говоря, процедура разбивки на градации нежелательна, так как это ведет к потере информации. Эта процедура целесообразна только при использовании логических методов анализа данных, которые не входят в статистические пакеты программ.

Проценты удобно использовать для наглядности сопоставлений разных по объему групп. В случае представления данных в процентах необходимо указывать также исходные данные, на основании которых они вычислялись; например: “% (n/N)”, “% (n от N)” или “n от N (...%)”.

При итерационном пересчете процентов в подгруппе по отношению к группе (т.е. расчете процента от процента) данная процедура должна быть последовательно подробно описана.

Если объем выборки больше 100, рекомендуется указывать процент не более чем с одним десятичным знаком. Если объем выборки меньше 100, то проценты указываются только целыми числами. Если численность выборки меньше 20, то проценты вообще не рекомендуется использовать (так как при этом процент бывает значительно больше, чем само число; шутка: 33% крыс умерли, 33% выжили, а третья крыса убежала), в таких случаях приводятся только абсолютные числа количества наблюдений.

Представление и описание распределений количественных данных

Общее требование к представлению результатов исследований — указание количества наблюдений для каждой исследуемой переменной.

Распределения непрерывных количественных данных описываются с помощью центральной тенденции и дисперсии. Меры центральной тенденции: среднее (M), медиана (Me), мода (Mo) — показывают, в какой области значений параметра группируются данные. Меры дисперсии — среднеквадратическое отклонение (СКО, или standart deviation — SD”; s), размах, интерквартильный размах — показывают распределение данных по области значений.

Распределения, являющиеся приближенно нормальными (и только они), должны описываться средним и СКО (M±s). Напомним свойства нормального распределения: интервал с границами {M—s; M+s} включает 68% наблюдений, интервал с границами {M—1,96·s; M+1,96·s} — 95% наблюдений, интервал с границами {M—3·s; M+3·s} — 99% наблюдений данной выборки.

Для описания распределений, не являющихся нормальными (а это большинство распределений медико-биологических параметров), рекомендуется применять медиану и интерквартильный размах. Интерквартильный размах указывается в виде 25% и 75% процентилей, т.е. верхней границы 1-го и нижней границы 4-го квартилей. Однако допускается и указание других персентилей, например 10% и 90%. Пример описания: Ме (25%; 75%) = 60 (23; 78).

Для описания центральных тенденций и дисперсий как нормально, так и не нормально распределенных непрерывных количественных данных удобно их представлять в графическом виде и в таблицах. Однако следует помнить, что информация, представленная в таблицах, не должна дублироваться информацией, отраженной на графиках.

Приведем примеры способов графического представления распределений непрерывных признаков. На рис. 1 показана диаграмма размахов в виде линейного графика. Такой график удобен, так как весьма компактен и может быть подготовлен непосредст венно в текстовом редакторе. Нормальные распределения переменных (группа А) удобно представлять в виде отрезка между точками {M—s; M+s}. Распределения как нормальные, так и отличающиеся от нормальных (группа В), можно представлять в виде интервала между 25-м и 75-м процентилями, включающим 50% наблюдений.

На рис. 2 показан другой способ представления распределений непрерывных количественных данных — диаграмма диапазонов (“коробочный” график) — для нормально (группа А) и не нормально (группа В) распределенных данных. Такой график наглядно демонстрирует сразу несколько параметров распределения: центральные тенденции (среднее, медиана) и характеристики дисперсии наблюдений (минимум и максимум, 25-й и 75-й, а также 10-й и 90-й процентили, крайние точки данных).

Рис.1. Размахи абстрактных (изучаемых) признаков при нормальном распределении (группа А) и распределении, отличном от нормального (группа В).

По оси абсцисс — условные единицы измерения абстрактного (изучаемого) признака. Объяснение в тексте.

Рис. 2. Диапазоны (“коробочный” график) абстрактных (изучаемых) признаков при нормальном распределении (группа А) и распределении, отличном от нормального (группа В). Объяснение в тексте.

Широко распространен ошибочный подход, при котором для описания дисперсии непрерывных количественных данных используют стандартную ошибку среднего, обычно обозначаемую как “m”. Стандартная ошибка среднего (в отличие от СКО) является не характеристикой, описывающей распределение наблюдений исследуемой выборки по области значений, а лишь мерой точности оценки популяционного среднего, и, следовательно, не характеризует дисперсию в анализируемой выборке. Однако часто именно стандартную ошибку среднего “m” ошибочно приводят в качестве параметра описатель ной статистики, пытаясь продемонстрировать тем самым малую вариабельность своих данных, так как всегда (по определению ) m<s.

Другим частым поводом для использования “m” вместо “s” является то, что исследователи сталкиваются с ситуацией, когда s превышает среднее значение М, и соответственно запись “M±s” в большинстве случаев (когда переменная принимает только положительные значения) оказывается бессмысленной. Не зная, как описывать распределения, отличные от нормального, авторы приводят запись “M±m”, так как всегда m<s, и это позволяет избежать заведомо некорректной ситуации.

Если авторам все же необходимо привести именно точность оценки среднего, то рекомендуется приводить ее в виде 95% доверительного интервала (ДИ). В случае нормального распределения границами такого ДИ являются (M — 1,96 m; M + 1,96 m).

Если число наблюдений в исследовании не превышает 20, то такую совокупность наблюдений условно принято считать малой выборкой. Для описания наблюдений малой выборки не следует пользоваться методами описательной статистики, так как этот аппарат может неадекватно отражать распределения в малых выборках. Например, может не хватать данных, чтобы установить соответствие распределения нормальному, хотя среднее значение и СКО могут быть рассчитаны даже из двух наблюдений. В случае малых выборок результаты наблюдения рекомендуется приводить в виде таблицы первичных данных. Проценты при описании малых выборок, как уже упоминалось выше, вообще не должны использоваться.

Некоторые частные аспекты представления данных исследования

Точность количественных данных

Обычно после вычислений возникает бoльшее число значащих цифр, чем это было в исходных данных. В этом случае числовые данные необходимо округлять. В средних значениях принято приводить не более чем на один десятичный знак больше, чем в исходных данных, а в СКО — не больше чем на два десятичных знака больше, чем в данных. Например, если артериальное давление измерялось с точностью до разряда единиц, то не следует описывать распределение в виде 145,36 ± 27,489 мм рт. ст.

Кроме того, следует учитывать, что читатель обычно хорошо воспринимает числа, содержащие не более трех значащих цифр. Если приводятся дробные числа, не рекомендуется указывать более трех десятичных знаков.

Количественные данные парных наблюдений

Парные наблюдения — это наблюдения, полученные от одного участника исследования (до и после лечения, справа — слева и т.п.) или от разных участников, подобранных в пары по определенным характеристикам. Парные данные могут быть представлены на графиках (например, зависимость значений параметра от времени) или в таблицах.

Зачастую средние значения в группах таких парных наблюдений не различаются. Поэтому в случае исследования динамических изменений количественных данных возникает необходимость оценить их по отношению к исходному уровню. При этом рекомендуется использовать следующую формулу:

[(А1—А0)/А 0] ґ 100%,

где А0 — исходное значение параметра, А1 — последующее его значение.

Если результат представляет собой отрицательное число, то знак минуса опускают и говорят об уменьшении значений параметра, если результат является положительным числом, то говорят об увеличении значения параметра. В таблице можно привести значения со знаками минус или плюс.

Различия или изменения в парах наблюдений должны быть также представлены и описаны. Например, распределение разностей может быть описано с помощью среднего и СКО.

Трансформирование количественных данных

Иногда количественные данные трансформируют путем логарифмирования, извлечения квадратного корня, обратного преобразования и т.д. В результате такой трансформации распределение данных может превратиться из исходно не нормального в нормальное, что дает основание для использования параметрических статистических методов, применимых только к нормально распределенным данным. Однако следует помнить, что при трансформировании данных трансформируются и единицы их измерения, теряя при этом физический смысл, а результаты анализа трансформированных данных бывает трудно интерпретировать.

1Проблема множественных сравнений заключается в следующем: чем больше статистических сопоставлений проводится на одних и тех же данных, тем больше вероятность, что значение p может быть ошибочно принято за отражающее истинную биологическую закономерность. Если в качестве границы статистической значимости принято значение p=0,05, то каждое двадцатое значение р (согласно теории вероятности) неверно отражает истину. Для того чтобы избегать таких ошибок в случае большого числа сопоставлений, необходимо устанавливать более жесткий уровень статистической значимости результатов, например 0,01.