Описание и анализ

Команда summarize

Команда summarize дает краткую информацию о переменных. Она полезна для начального скрининга данных, особенно полезным является столбец, помеченный Obs (Наблюдение), который показывает количество наблюдений с не пустыми значениями, а также столбцы, помеченные Min (минимальное значение) и Max (максимальное значение).

 summarize

.

 Variable |  Obs Mean Std. Dev. Min Max

---------+-----------------------------------------------------

 id | 37 19  10.82436 1 37 

 type | 37 1.891892  .9656254 1 4 

 price | 35  46.58 16.3041 11.95 78.95 

 rating | 35 2.514286 .9194445 1 4  

Для того чтобы получить детальную информацию о распределении отдельных переменных, можно воспользоваться опцией detail:

 summarize price , detail

Обратите внимание на очень приятную модификацию summvl, которая также может демонстрировать и метки переменных: findit summvl.

 summvl

.

 Variable Obs  Mean Std.Dev Min Max Label

-------------------------------------------------------------------------

id 37 19 10.8244  1 37 identification number

type 37 1.89189  .965625 1 4 type of wine

price 35 46.58  16.3041 11.95 78.95 price per 75 cl bottle

rating 35 2.51429  .919444 1 4 quality rating

Команда list

Перечисление случаев может оказаться полезным для того, чтобы просмотреть данные, проверить результаты расчетов и найти ошибки. Следующая команда создает список значений переменных - от переменной sex до переменной age для первых 10 наблюдений. Демонстрируются коды, а не метки переменных:

 list sex-age in 1/10 , nolabel

 Возможности Stata по созданию списков не очень удобны, если вы хотите перечислить сразу большое количество переменных. Найдите и установите полезную альтернативу slist, делается это при помощи команды: findit slist.