Введение

Система SAS существует на рынке уже более 30 лет и за это время стала одним из наиболее популярных продуктов для сбора, анализа и представления данных, короче, статистики. Появилась система на больших ЭВМ и до конца 80х годов развивалась на этих машинах. Только 6 версия SAS была перенесена на персональные компьютеры, вначале работая под управлением операционной системы MS-DOS, а затем, более поздние версии, стали работатьи под управлением Windows. В настоящий момент выпущена уже 9 версия этой программы, однако, судя по публикациям, наиболее популярной остается версия 6.12, выпущенная около 10 лет назад для для операционной системы Windows. Надо отметить, что SAS и сейчас существует в версиях для персональных компьютеров и больших ЭВМ, работая под управлением различных операционных систем. Важнейшим при этом является тот факт, что большая часть возможностей SAS доступна на всех платформах и язык ее одинаков вне зависимости от особенностей операционной системы, в которой работает SAS (исключением является, пожалуй, только доступ к файлам).

Также важным является и то, что SAS полностью совместима сверху вниз, т.е. программы, написанные в 6 версии SAS будут также адекватно работать в 8 или 9 версии, как они работали в более ранних версиях.

Почему мы будем упоминать более старые версии, включая 6.04, если уже выпущены версия 8 и 9? Ответ на этот вопрос частично лежит в распространенности разных версий системы, частично в том, что SAS не выпустила версий для наладонных и карманных компьютеров. Вместе с тем, иногда возникает потребность провести анализ где-то в дороге, тащить с собой ноутбук не хочется. Все больше и больше людей заменяют сейчас для чтения и набора текстов ноутбуки на карманные и наладонные компьютеры. Хотя SAS не приходила, похоже, в голову идея выпустить версию, например, для Pocket PC, тем не менее заставить ее работать под управлением этой операционной системы можно. Трюк заключается в использовании программ-эмуляторов, которые создают на карманном или наладонном компьютере виртуальную MS-DOS систему (для Pocket PC это, напрмер PocketDOS, а для систем под управлением EPOC (Psion) - XTM. В результате становится возможным запускать любую программу для MS-DOS, включая старые версии SAS. Автору этих строк приходилось работать в SAS 6.04 на карманных (Psion 5mx и Psion 7) и наладонных (Compaq 3790) компьютерах. Естественно, что Windows-версии SAS в таких условиях работать не будут, да и вряд ли кто-нибудь хотел бы пытаться устанавливать 200 мегабайтного монстра на 64-мегабайтную машинку! Вместе с тем, старые версии SAS предоставляют иследователю большую часть инструментария, который необходим ему для работы.

Сама система состоит из ряда модулей, которые выполняют определенные задачи. Наиболее часто используемыми модулями являются BASE - базовый модуль, который обеспечивает взаимодействие с пользователем и без которого система не работает (обязательный компонент) и модуль STAT, включающий в себя различные статистические подпрограммы (программы простейшего анализа и описания данных включены в модуль BASE). Существует большое количество других модулей, включая OR (линейной программирование и поддержка принятия решений), IML (интерактивный матричный язык программирования, аналогичный языку MatLab), FSE (полноэкранное редактирование) и другие. После установки пользователь получает доступ ко всем модулям, на которые он приобрел лицензию и никоим образом УпереключатьсяФ между модулями ему не надо. Все модули используют одинаковый формат и структуру файлов данных, а также практически одинаковый синтаксис.

В последующем изложении будет предполагаться, что у пользователя на машине установлены, как минимум, модули BASE и STAT.

Остальные модули будут упоминаться по мере необходимости.

Программный язык SAS включает в себя два основных вида конструкций - шаг DATA (набор комманд манипуляции данными) и процедуры PROC, которые собственно и осуществляют обработку данных. Практически всегда нам необходимо вначале ввести данные в систему (шаг DATA) и лишь затем начинать их обработку, поэтому общая структура программы в SAS выглядит так:

DATA ...
...
RUN; 
PROC ...
...
RUN;

Обратите внимание на то, что все программные блоки завершаются командой RUN. Эта команда говорит SAS, что блок комманд (процедурных или обработки данных) закончен и система может приступать к их выполнению. Следует также обратить внимание на то, что каждая строка комманд заканчивается точкой с запятой. Слудет помнить, что забытая точка с запятой является самой распространенной ошибкой при вводе программ SAS.