Stata. Таблицы для эпидемиологов

Stata располагает рядом команд, которые предназначены для анализа четырехпольных таблиц, включая таблицы формируемые в ходе стратифицированного анализа. Эти команды имеют общее название эпидемиологических или epitab. Расчет соответствующих статистических показателей и подавление ненужной информации в распечатках организовано таким же образом, каким эпидемиологи концептуализируют, обрабатывают, свои данные.

Команда Stata ir (incidents ratio) использует для расчета отношений заболеваемостей (включая по отношению к человеко-годам наблюдения), при этом оцениваются как сами показатели, так и их доверительные интервалы, а также аттрибутивная (относимая) доля для популяции в целом и лиц, подвергшихся негативному воздействию.

Команда Stata cs (cohort studies) используется для когортных исследований с одинаковым временем наблюдения для каждого участника. В подобной ситуации под риском понимается количество пациентов, у которых развивается изучаемое заболевание. Команда рассчитывает показатели риска и доверительные интервалы для различия рисков, отношения рисков и (при желании) отношения шансов, наряду с аттрибутивной долей для популяции в целом и лиц, подвергшихся негативному воздействию.

Команда Stata сс (case-control) используется для исследований по типу случай-контроль и одномоментных исследований. Оцениваются значения и доверительные интервалы отношений шансов наряду с аттрибутивной долей для популяции в целом и лиц, подвергшихся негативному воздействию.

Команда mcc (matched case-control) используется для парных исследований по типу случай-контроль. Оценивается критерий хи2 по McNemar, значения и доверительные интервалы для различий отношений и относительных различий пропорций в группе воздействия, а также отношение шансов.

Все эти команды существуют в двух вариантах: обычном и т.н. "немедленной" форме. При использовании команды в обычном виде система сама суммирует наблюдения, содержащиеся в базе данных. В "немедленной" форме все данные вводятся в командной строке.

Например, Boice и Monson (1977, данные приведены также в Rothman и Greenland, 1998, 238) приводят сведения о частоте возникновения новых случаев рака молочной железы у женщин с туберкулезом, которых повторно облучали флюорографии и тех, кого не облучали таким образом (оценивалось также количество человеко-лет наблюдения в каждой группе):

 

Флюорография

 

Подвергались

Нет

Количество случаев рака молочной железы

41

15

Человеко-лет наблюдения

28010

19017

Используя "немедленную" форму команды ir, команду iri (ir immediate), мы можем внести все данные из таблицы в систему в командной строке:

. iri 41 15 28010 19017

                 |   Exposed   Unexposed  |     Total
-----------------+------------------------+----------
           Cases |        41          15  |        56
     Person-time |     28010       19017  |     47027
-----------------+------------------------+----------
                 |                        |
  Incidence Rate |  .0014638    .0007888  |  .0011908
                 |                        |
                 |      Point estimate    |  [95% Conf. Interval]
                 |------------------------+----------------------
 Inc. rate diff. |          .000675       |  .0000749    .0012751	 
 Inc. rate ratio |         1.855759       |  1.005722     3.609    (exact)    
 Attr. frac. ex. |         .4611368       |   .005689    .7229472	(exact)
 Attr. frac. pop |          .337618       |
                 +-----------------------------------------------
                   (midp)   Pr(k>=41) =                    0.0177	(exact)
                   (midp) 2*Pr(k>=41) =                    0.0355	(exact)

Основная команда ir может работать как с исходными данными, так и с суммарными данными, а также позволяет анализировать стратифицированные данные. Rothman и Greenland (1998, 259) приводят данные из работы Doll и Hill (1966), посвященные смертности от ишемической болезни сердца в зависимости от курения у британских врачей-мужчин.

 

Курильщики

Некурящие

Возраст

Умерло

ЧЛН

Умерло

ЧЛН

35-44

32

52,407

2

18,790

45-54

104

43,248

12

10,673

55-64

206

28,612

28

5,710

65-74

186

12,663

28

2,585

75-84

102

5,317

31

1,462

Мы вводим эти данные в Stata:

. list, separate(0)

	     +-----------------------------------+
	     |    age   smokes   deaths   pyears |
	     |-----------------------------------|
	  1. |  35-44        1       32   52,407 |
	  2. |  35-44        0        2   18,790 |
	  3. |  45-54        1      104   43,248 |
	  4. |  45-54        0       12   10,673 |
	  5. |  55-64        1      206   28,612 |
	  6. |  55-64        0       28    5,710 |
	  7. |  65-74        1      186   12,663 |
	  8. |  65-74        0       28    2,585 |
	  9. |  75-84        1      102    5,317 |
	 10. |  75-84        0       31    1,462 |
	     +-----------------------------------+

Теперь можно оценить суммарную оценку смертности по Mantel-Haenszel и 90% доверительный интервал используя следующую команду:

. ir deaths smokes pyears, by(age) level(90)

	             age |      IRR      [90% Conf. Interval]    M-H Weight
	-----------------+-------------------------------------------------
	           35-44 |   5.736638     1.704242   33.62016      1.472169  (exact)
	           45-54 |   2.138812     1.274529   3.813215      9.624747  (exact)
	           55-64 |    1.46824     1.044925   2.110463      23.34176  (exact)
	           65-74 |    1.35606     .9625995   1.953472      23.25315  (exact)
	           75-84 |   .9047304     .6375086   1.305422      24.31435  (exact)
	-----------------+-------------------------------------------------
	           Crude |   1.719823     1.437554   2.068803                (exact)
	    M-H combined |   1.424682     1.194375   1.699399
	-------------------------------------------------------------------
	 Test of homogeneity (M-H)    chi2(4) =     10.41  Pr>chi2 = 0.0340

Rothman и Greenland (1998, 264) приводят стандартизованные показатели смертности и 90% доверительные интервалы используя в качестве весовых коэффициентов для каждой возрастной группы численность популяции курильщиков, что приводит к расчету стандартизованного показателя смертности (SMR). Эта оценка может быть воспроизведена использованием ключевого слова by(age), которое указывает на то, что таблица стратифицированная, а также указанием ключевого слова istandard (internal standard) для того, чтобы указать, что мы хотим использовать внутренний стандарт.

. ir deaths smokes pyears, by(age) level(90) istandard

	             age |      IRR      [90% Conf. Interval]        Weight
	-----------------+-------------------------------------------------
	           35-44 |   5.736638     1.704242   33.62016         52407  (exact)
	           45-54 |   2.138812     1.274529   3.813215         43248  (exact)
	           55-64 |    1.46824     1.044925   2.110463         28612  (exact)
	           65-74 |    1.35606     .9625995   1.953472         12663  (exact)
	           75-84 |   .9047304     .6375086   1.305422          5317  (exact)
	-----------------+-------------------------------------------------
	           Crude |   1.719823     1.437554   2.068803                (exact)
	 I. Standardized |   1.417609     1.186541   1.693676

Если бы мы хотели использовать внешнюю стандартизацию (весовые коэффициенты были бы выбраны в соответствии с численностью группы некурящих), мы бы заменили в вышеописанной команде ключевое слово istandard на estandard (external standard).

Литература

Boice, J. D., R. R. Monson. 1977.
Breast cancer in women after repeated fluoroscopic examinations of the chest. Journal of the National Cancer Institute 59: 823-832.
Doll, R., A. B. Hill. 1966.
Mortality of British doctors in relation to smoking: observations on coronary thrombosis. In Epidemiological Approaches to the Study of Cancer and Other Chronic Diseases, ed. W. Haenszel. National Cancer Institute Monograph 19: 205-268.
Rothman, K. J.,S. Greenland. 1998.
Modern Epidemiology. 2d ed. Philadelphia: Lippincott–Raven.