СТАТИСТИЧЕСКИЕ ПРОГРАММЫ "УКАЖИ И ЩЕЛКНИ" - КУЗНИЦА ДЬЯВОЛА?

Открытое письмо преподавателям статистики.

Геральд Джонс

Появление статистических программ, которые используют метод "укажи и щелкни" революционизировало как использование, так и обучение статистики, точно также, как компьютеры сами по себе революционизировали теорию и развитие статистики всего лишь одно поколение тому назад. Вместе с этим прогрессом появились и некоторые особые проблемы в том, как понимается статистика теми, кто сегодня ей обучается.

Данное письмо является призывом ко всем нам и, по всей вероятности, предупреждением о том, чтобы мы не принимали программы, которые имеют интерфейс "укажи и щелкни" такими, какими они кажутся. Нет никаких сомнений в том, что интерфейс "укажи и щелкни" может быть очень удобной вещью и даже имеются некоторые статистические программы, которые кажутся невозможными без него. Например, программа EQS, предназначенная для структурного моделирования, предоставляет возможность построить модель анализа путей в форме интерактивной картины на экране, что является великолепным улучшением по сравнению с попытками сделать то же самое при помощи написания программы, но для более обычных статистических методов могут иметься и некоторые проблемы.

В этом коротком письме я хотел бы обсудить как преподавание, так и исследовательское использование статистики и я хотел бы отделить собственно анализ, от считывания и манипулирования данными в статистических программах.

Вначале небольшой урок истории: вначале был карандаш и бумага и Пирсон и Шеффе использовали эти инструменты для того, чтобы внести свой вклад в статистику и обучать своих студентов. Затем появились компьютеры и стало возможным целое новое поколение статистических методов. Программы были конечно необходимы и они базировались на различных логических концепциях, но после того, как они появлялись они устраняли необходимость для статистика (и студента) выполнять собственно расчеты вне зависимости от того, насколько сложными или простыми они были. Это было одновременно и благословение и проклятие. Хотя это было все еще очень полезным для того, чтобы писать адекватную программу без ошибок и понимать статистические концепции, на которых она основывалась. И теперь появилась "укажи и щелкни". Если у кого-то имеются достаточно простые или специально подготовленные данные для ввода, они могут получить прекрасный и достаточно сложный результат не зная ничего более того, как щелкать мышью. Во многих случаях благословение практически нулевое, а проклятие может быть очень значительным.

Общий результат этого прогресса заключается в том, что мы все вместе во имя удобства отказались от понимания . Вместо того, чтобы тратить три часа на расчеты вручную, мы можем написать:

PROC REG; MODEL GRE=SAT;
или
REGRESSION/ VARIABLES=GRE SAT / DEPENDENT = GRE

а затем компьютер за несколько секунд просчитает пять тысяч наблюдений. На этом фоне интерфейс "укажи и щелкни" предоставляет нам список переменных, из которых мы будем выбирать данные, окна, в которых нам необходимо поставить галочки и все это не будет требовать практически никакого понимания почему или как делается тот или иной выбор и, соответственно, все это приводит к все меньшему и меньшему пониманию того, что же на самом деле означают полученные результаты.

Обучение молодых специалистов статистике всегда было достаточно большой проблемой и большой необходимостью. Как мы уже видели, история двигалась от ручных расчетов через программирование и прибыла к методике "укажи и щелкни". А теперь давайте рассмотрим, что произойдет с будущим статистиком, если мы перевернем данную последовательность. Для большинства первый опыт начнется с интерфейса "укажи и щелкни", поскольку, как указывают многие прекрасные преподаватели, это самый быстрый способ быстро перейти к концепциям в учебной комнате. Позднее в исследовательской карьере наступает время, когда им приходится использовать техники программирования и те, кто начнет заниматься уже действительно наукой должны понимать статистику с расчетной точки зрения. Педагогически начинать с программного обеспечения "укажи и щелкни" является адекватным подходом только для тех студентов, для которых все знакомство со статистикой ограничится вводным курсом. Для тех же, кто будет заниматься серьезной научной работой, это может иметь катастрофические последствия.

Кроме обучения, некоторое количество наших студентов, в которых мы особенно заинтересованы, будет заниматься серьезной исследовательской деятельностью. Зачастую во время обучения большинство студентов используют хорошие небольшие прямоугольные наборы данных с очень небольшим количеством (если они вообще имеются) отсутствующих значений и всеми переменными, которые необходимы для всех расчетов. Естественно, необходимо начинать с простых примеров (и мы начинаем с простых примеров) и в этих условиях все, что анализируется может быть легко сделано при помощи метода "укажи и щелкни", включая ввод данных, манипуляцию с данными, анализ и даже создание графиков. Данные в реальном мире, однако, не всегда настолько хороши. Комплексные данные, такие как данные опросов общественного мнения, или данные переписи населения и даже прямоугольные наборы данных, которые используют большое количество переменных с различными характеристиками, представляют собой невероятно сложную задачу по манипуляции для исследователя, который настаивает на использовании техники "укажи и щелкни". Многие в таких ситуациях начинают понимать, что по крайней мере для манипуляции данными, программный синтаксис предоставляет значительно более эффективный метод подготовки данных для анализа.

Вполне возможно, что сегодняшние студенты, изучающие статистику, могут почувствовать, что их обманули, когда позднее они поймут, что им все равно придется изучать техники программирования для того, чтобы манипулировать данными, существующими в реальном мире или даже для того, чтобы выполнять различные виды анализа. Вполне возможно также, что подобное понимание может отвратить заинтересованных студентов от карьеры исследователей или статистиков.

Наше предложение, которое может проистекать из описанного выше, достаточно простое: помнить про все три уровня статистических знаний - расчеты, программирование, обработка при помощи метода "укажи и щелкни" - во всех наших обсуждениях и при распространении статистической техники. Информировать студентов не только о прелестях, но также и об опасностях расчетов в реальном мире, и давать им возможности приобрести те навыки, которые им потребуются, прежде чем их гибкость будет утеряна вследствие подчинения ее удобству метода "укажи и щелкни".