Почему мы должны избегать метода "укажи и щелкни" в пакетах статистической обработки данных?

Кристофер Баум, Селюк Сирин.

Многие пакеты прикладных программ, обрабатывающие статистические данные, предоставляют один из двух альтернативных методов работы с ними: метод, который базируется на использовании командного языка и метод "укажи и щелкни". Пользователи могут выбирать любой из этих двух методов для того, чтобы манипулировать своими данными и анализировать их - в большинстве случаев они получат один и тот же результат. Многие пользователи считают командный язык слишком сложным и поэтому начинают работать при помощи метода "укажи и щелкни". Однако существуют очень важные этические и практические вопросы, которые необходимо иметь в виду прежде, чем начинать использовать при статистических расчетах метод "укажи и щелкни" .

Воспроизведение результатов исследования является желательным, а зачастую и необходимым аспектом любой науки. При эмпирических исследованиях имеется достаточно обоснованные ожидания того, что результаты эмпирической работы или эксперимента если они будут использовать те же самые данные, могут быть повторены другими исследователями.

Некоторые профессиональные журналы, например, не опубликуют эмпирические работы если исследователь не предоставит информацию, которая явится достаточной для другого исследователя, чтобы иметь возможность повторить полученные результаты. Поскольку хорошо известно, что во время проведения анализа данных исходные данные много раз трансформируются (например, некоторые случаи опускаются, поскольку они являются "выскакивающими", или некоторые переменные меняются по теоретическим причинам), исследователь должен иметь очень детальный отчет о каждом шаге, который был сделан при работе с данными. Этого очень сложно добиться, если Вы будете использовать метод "укажи и щелкни". Например, если в программе SPSS кто-то удаляет наблюдения или трансформирует переменную, затем сохраняет эти результаты, то в этой программе уже будет невозможно вернуться назад и переделать анализ, в том случае, если оригинальный набор данных не был сохранен в другом файле. Поэтому общие стандарты исследовательской этики требуют, чтобы исследователи записывали последовательность своих действий на каждом шагу анализа и хранили наборы данных и копии компьютерных программ (например, копию синтаксисной программы SPSS). Просто использование метода "укажи и щелкни" может привести к тому, что исследователь окажется в конфликте со этикой исследований.

Другие преимущества использования командного языка программы (например, метод использования синтаксиса в SPSS) заключается в следующем:

Эти аргументы против использования метода "укажи и щелкни" также могут быть применены в рамках работы с программами, которые имеют командный язык (например, Stata, SAS). Написание программы не равнозначно написанию одиночных команд и таким образом, выдача команд одна за другой является хорошей идеей только для оценочного анализа; для того, чтобы создать командную программу вначале необходимо разработать схему анализа данных, а она уже будет требовать для себя обдумывания того, как необходимо будет работать с данными.