Инструменты системы SAS для дизайна и анализа экспериментов.

SAS System Tools for Design and Analysis of Experiments

Donna O. Fulenwider, Randall D. Tobias, Robert N. Rodriguez

SAS Institute Inc., Cary, NC

Резюме.

Система SAS предоставляет большой набор инструментов для дизайна и анализа эксперимента. Такие процедуры как: FAKTES, OPTEX, GLM, RSREG и NLP предоставляют статистикам мощные алгоритмы для конструирования, анализа и оптимизации экспериментального дизайна. Новый интерфейс ADX предоставляет большие возможности для инженеров и исследователей, которые предпочитают интерфейс по типу «укажи и щелкни», чтобы использовать мощь программы SAS при создании стандартных экспериментальных дизайнов. В данной работе мы представляем, как, используя новый интерфейс ADX, можно создавать различные экспериментальные планы.

Экспериментальный дизайн.

Все увеличивающееся количество инженеров, исследователей и ученых используют заранее спланированные эксперименты для того, чтобы обнаруживать и анализировать причинно-следственные взаимоотношения между важными факторами. Экспериментальный дизайн – это систематический подход к применению статистических методов в процессе эксперимента. Базируясь на вопросах, на которые необходимо найти ответ, создается план для тестирования, или дизайн с определенным количеством факторов и определенным количеством уровней этих факторов. Эти факторные уровни систематически изменяются, причем изменяются они одновременно, в соответствии с дизайном для того, чтобы оценить их воздействие на процесс. Эти эффекты изучаются с использованием статистических моделей, и затем эти модели используются для того, чтобы определить:

Конечным результатом является максимальное количество результатов в минимальном количестве времени за известную стоимость.

Инструменты дизайна эксперимента.

Экспериментальный дизайн включает пять шагов, для которых необходима программная поддержка:

С учетом бюджетных ограничений для данного эксперимента существуют различные типы дизайна, но не все из них одинаково эффективны. Без особой потери информации количество экспериментов, которое требуется в рамках статистически оптимального дизайна, может быть уменьшено, по сравнению со стандартным подходом «один фактор в данный момент», что в свою очередь приводит к значительному увеличению количества и качества информации, которую можно использовать для моделирования. Однако конструирование оптимальных дизайнов экспериментов требует мощных алгоритмов.

Программа SAS предоставляет различные инструменты для дизайна и анализа экспериментальных данных. Процедуры FACTEX и OPTEX в модуле SAS/QS предоставляют мощный алгоритм для конструирования таких дизайнов как факториальные и оптимальные дизайны. Процедуры модуля SAS/STAT - GLM,MIXED и RSREG предоставляют инструменты для анализа результатов. Процедура RSREG предоставляет специализированные методы для подгонки квадратичных моделей, включая технику оптимизации отклика. Процедура NPL в модуле SAS/OR предоставляет нелинейные оптимизационные возможности для сложных поверхностей отклика. Эти процедуры все вместе представляют собой богатый набор инструментов экспериментального дизайна для программиста и статистика, которые могут быть легко интегрированы со всеми остальными элементами системы SAS.

Решения для создания экспериментального дизайна.

Начиная с версии 6.03 системы SAS, SAS-институт признал, что потребители хотели бы получить доступ к мощи инструментов экспериментального дизайна в рамках легко используемой, управляемой меню, системой. Для этого была создана система ADX для дизайна экспериментов, которая предоставляет доступ к инструментам SAS для  не программистов и статистиков, заинтересованных в различных методах дизайна экспериментов. За несколько последних лет группа, работающая над развитием ADX, создала абсолютно новый интерфейс для дизайна и анализа эксперимента. Prabhu, Rodrigues и Tobias (1996) предоставили первый взгляд на интерфейс ADX на двадцать второй конференции SUGI. Широкий анализ адекватности этого интерфейса и отклик потребителей предоставил полезную информацию, и в результате этих действий появилась экспериментальная версия нового интерфейса ADX.

Новый интерфейс ADX.

Недавно выпущенный в качестве экспериментального продукта для версии 6.12, и планируемый для постоянного включения в версию, интерфейс ADX является чрезвычайно интересным дополнением к модулю SAS/QS. Этот интерфейс был разработан в ответ на запросы потребителей для того, чтобы иметь следующие возможности:

·        Более интуитивный интерфейс.

·        Более легкий ввод данных.

·        Большая гибкость для подгонки моделей.

·        Интерактивная графика.

·        Распечатка результатов в формате HTML.

Интерфейс не предназначен для использования в качестве общего инструмента статистического анализа. Интерфейс ADX – это структура, которая предназначена для того, чтобы предоставить Вам мощные инструменты SAS, которые необходимы для создания экспериментального дизайна. Следующий пример предоставляет введение в новый интерфейс ADX для анализа двухфакторного дизайна.

Пример:

Данный пример был взят из автомобильной индустрии. Инженеры при производстве моторов хотят уменьшить выбросы в атмосферу от двигателя внутреннего сгорания, и в то же время сохранить, или даже улучшить, экономию горючего. Эксперимент включает пять факторов, которые воздействуют на измеряемый результат. Результаты измеряются в единицах экономии топлива (мили/галлон), в выбросах углеводородов (граммы/миллилитр) и выбросов оксидов азота (грамм/миллилитр).

Таблица 1. Имена и уровни факторов

Имя фактора

Минимальное значение

Максимальное

значение

Отношение воздуха к топливу

16

17

Рециркуляция топлива в двигателе (фунт/мин)

.18

.92

Вспышка (градусы btc)

20

40

Скорость оборотов (об/мин)

1000

1600

Вращающий момент двигателя (фунт-фут)

45

115

Вы можете вызвать экспериментальную версию интерфейса ADX, запустив команду xadx (в командной строке или на командной линии внутри системы SAS). После вызова интерфейса ADX, Вы попадаете на рабочий стол ADX, показанный на рисунке 1. Рабочий стол – это место, где:

·        Организуются и просматриваются дизайны.

·        Копируются, удаляются или экспортируются новые дизайны.

·        Создаются новые дизайны.


Рисунок 1. Рабочий стол ADX.


Для того чтобы сконструировать дизайн для нового эксперимента, выберите меню File. Появится всплывающее меню, показанное на рисунке 2, и при этом мы выбираем дизайн с двумя уровнями.

 

Рисунок 2. Создание нового дизайна.

Основное окно для создания и работы с дизайнами, показано на рисунке 3. Поскольку в настоящий момент мы создаем новый дизайн, то окно пустое. Кнопки с правой стороны окна представляют собой логические шаги в проведении анализа эксперимента от определения экспериментов (факторов, откликов и блоков), до создания отчета о проведенном эксперименте. Вначале большая часть кнопок серая и кнопки «проявляются» по мере того, как их использование становится обоснованным, в зависимости от стадии эксперимента.


Рисунок 3. Основное окно дизайна экспериментов. 


Факторы могут быть определены в окне ввода данных, или факторы могут быть получены из библиотеки факторов. Это свойство может минимизировать количество времени, которое требуется для определения фактора. Аналогичным образом существует и библиотека откликов для переменных, которые имеют различные отклики. Рисунок 4 показывает пример библиотеки факторов.


Рисунок 4. Библиотека факторов.


После того, как были определены факторы и отклики для данного эксперимента, следующим шагом является выбор дизайна. Окно выбора дизайна, показанное на рисунке 5, предоставляет список возможных дизайнов для того количества факторов, которое было выбрано для данного эксперимента: четвертая часть дизайна третьего разрешения, половинная часть дизайна пятого разрешения и полный факториальный дизайн. Если выбрано блокирование, то из данного списка доступно большее количество дизайнов. Для простоты в данном примере мы выбираем полный факториальный дизайн.


Рисунок 5. Список выбора дизайнов.


По мере выбора дизайна Вы можете просмотреть структуру и правила вмешивающихся переменных. Выберите дизайн из списка, а затем выберите кнопку «Показать дизайн» (Show Design) и Вы получите информацию, аналогичную, показанной на рисунке 6.

В данном эксперименте Вы считаете, что скорость будет вмешиваться во взаимодействия между отношением воздуха к топливу, рециркуляцией топлива в двигателе (EGR) и вспышки в двигателе (SPARC). Кроме того, еще один показатель TORQUE (вращающий момент двигателя) будет зависеть от двухфакторного взаимодействия EGR и SPARC.

После выхода из окна выбора дизайна таблица заполняется матрицей дизайна эксперимента. Матрица дизайна эксперимента может быть показана с кодированными и не кодированными уровнями. Обратите, пожалуйста, внимание на то, что кнопки «Отредактировать отклики» (Edit Responses), «Настроить»(Customize) , и «Просмотреть» (Explore) становятся активными.


Рисунок 6. Детали дизайна.


В данной точке Вы можете добавить центральные значения, повторные измерения, повторить дизайн или определить внешние массивы. Все это делается при помощи кнопки «Настроить» (Customize). Пример с двигателями не требует никакой настройки.

Ввод полученных результатов может быть осуществлен аналогично тому, как это делается в электронных таблицах за счет окна «Редактировать отклики» (Edit Responses). Интерфейс ADX позволяет достаточно легко вводить отклики разными способами: Вы можете экспортировать дизайн в другую электронную таблицу для ввода данных, или Вы можете вырезать и вставить дизайн из ADX в другую электронную таблицу, такую как Excel. После того, как результаты отклика внесены, в другой электронной таблице Вы можете вырезать и вклеить эти значения в окно «Редактирование откликов». Однако для того, чтобы обеспечить адекватный анализ и адекватный учет результатов, факторные переменные и переменные отклика должны быть определены внутри интерфейса ADX. Предположим, что все результаты внесены в окно «Дизайн» за счет редактирования в окне «Редактировать отклики». Окно «Дизайн» показывает три отклика добавленные к дизайну, и кнопки «Подогнать и оптимизировать» становятся активными (Рисунок 7).


Рисунок 7. Основное окно «Дизайн» после того, как были добавлены результирующие значения.


Интерфейс ADX для анализа Ваших данных предоставляет большое количество разных графиков. В этой точке эксперимента еще пока ни одна модель не была подогнана, поэтому Вы можете просто посмотреть на некие особенности Ваших данных и взаимоотношения, которые существуют в них. Нажатие на кнопку «Проанализировать» (Explore) приводит к появлению окна с закладками, которое позволяет Вам легко переключаться от одного графического изображения к другому. Доступны графики основных эффектов и взаимодействия, а также диаграммы рассеяния, кубические и факториальные графики. Пример с двигателями позволяет нам просмотреть график взаимодействия для того, чтобы проанализировать взаимоотношения между факторами для трех переменных отклика. Рисунок 8 показывает график взаимодействия для углеводородов.


Рисунок 8. График взаимодействия для углеводородов.


Раздел «Выбор свойств» (Properties selection) во всплывающем меню внутри любого графического региона или из меню Pmenu View предоставляет возможность менять цвета, шрифты, толщину линий и так далее, для каждого индивидуального графика или для всей графики, которая используется в интерфейсе ADX. Кроме того, из Pmenu View Вы можете любые графики включить в окончательный отчет (Рисунок 9). Для отчета в формате HTML графика будет продемонстрирована на интернет страницах. Для текстовых отчетов графики подготавливаются таким образом, чтобы их можно было включить в текстовый редактор. Каждый раз, когда Вы выбираете включение графика в отчет, интерфейс ADX сохраняет график в файле формате gif и сообщает о местоположении этого файла.


Рисунок 9. Меню View.


Еще одним графиком, который предоставляет информацию об отношениях между факторами для каждой переменной отклика – это так называемый график-куб. Рисунок 10 демонстрирует график-куб для выбросов углеводородов.


Рисунок 10. График-куб для углеводородов.


Значения выброса углеводородов, напечатанные в каждом углу этого куба – это средние значения для данной комбинации уровней факторов. Символы используются для того, чтобы отметить наибольшее и наименьшее средние значения углеводородов. В закладке графика-куба Вы можете выбрать отдельные графики-кубы для каждого уровня факторов (используя отбор переменных при помощи ключевого слова BY). Вы можете также выбрать несколько переменных отклика. Для того чтобы посмотреть все графики, можно будет воспользоваться полосой прокрутки.

Следующим этапом в эксперименте является подгонка модели для каждого индивидуального отклика. Автоматически производится проверка допущений прежде, чем Вы попадете в окно «Подгонка» (Fit). Используются специальные индикаторы для того, чтобы продемонстрировать Вам, что некоторые допущения, возможно, не были выполнены. Интерфейс также проверяет, не нужна ли трансформация переменной отклика. Кроме того, проверяется, распределены ли остаточные значения нормально, а также автоматически проводится анализ вылетающих наблюдений, и выявляются наиболее значимые наблюдения.

После того, как допущения были проверены, интерфейс ADX предоставляет возможность посмотреть и отобрать эффекты. По умолчанию - это таблица с оценками эффекта и р - значениями. Выделенные эффекты на рисунке 11 – это те эффекты, которые рекомендуются для включения в упрощенную модель, затем упрощенная модель используется для оптимизации. По умолчанию отбор эффектов может базироваться на различных критериях. Выбранные эффекты, например, базируются на значении по умолчанию a-уровня равному 0,05. таблицы являются интерактивными и позволяют Вам выбирать или отменять выбор эффектов, просто щелкая по соответствующей строке. Для данного эксперимента значимой оказалась только переменная SPEED, а взаимодействия переменные значимыми не были


Рисунок 11. Раздел: эффекты для углеводородов.


Другие интерактивные графики, которые могут быть выбраны для того, чтобы просмотреть упрощенные модели – это:

·        График нормального распределения.

·        Полунормальный график.

·        График лента.

·        График Парето

·        График Байеса

Кроме того, можно просмотреть таблицу дисперсионного анализа, как для полной модели, так и для предполагаемой упрощенной модели (рисунок 12, доступ к модели осуществляется путем выбора в меню «Модели» (Model) пункта «Дисперсионный анализ для выбранных эффектов» (ANOVA for selected effects…) – прим.перев.).


Рисунок 12. Таблица дисперсионного анализа для углеводородов.


После подгонки модели для всех трех переменных отклика Вы заинтересованы в том, чтобы найти оптимальную область для оперирования факторами, базируясь на предсказательной модели, и Вы можете это сделать в разделе оптимизации (кнопка Optimize) основного окна дизайна.

Окно оптимизация отклика появляется как окно, содержащее несколько закладок, у которых выделены профиль предсказанных значений и оптимизатор контура и графики (на самом деле вначале появляется окно выбора откликов, которые будут оптимизироваться, в нашем примере можно оптимизировать по одной переменной отклика, по двум или по всем трем; пока выделим только два отклика – прим.перев.). По умолчанию первыми на экране появляются графики профиля предсказаний значений (рисунок 13). Вертикальная ось на графике показывает предсказанные значения для всех выбранных откликов, горизонтальная ось предоставляет значение пяти факторов. Для помощи в графической оптимизации вы можете выбрать некую функцию желательности. Для большей информации по поводу использования функции желательности при оптимизации множественных откликов, обратитесь к Myers Montgomery (1995). 

Интерфейс ADX позволяет Вам взаимодействовать с графиками для того, чтобы определить индивидуальные значения вариабельности для каждого отклика. Для выброса углеводородов и окиси азота большие значения не желательны и мы бы хотели иметь желательность 0, в то время как низкие значения будут иметь желательность 1. С другой стороны, для EGR желательны высокие значения (1), а низкие значения нет (0), данная функция позволяет, кроме того, установить целевые значения и создать нелинейные взаимоотношения между желательными значениями. После того, как Вы установили значения желательности для каждого индивидуального отклика и графически оптимизировали общую желательность, обнаруживаются те значения факторов, которые приводят к появлению оптимальных предсказанных откликов (Рисунок 13).


Рисунок 13. Графики предсказания.


Вы можете выбрать для дальнейшей работы оптимизатор контура. Оптимизатор контура позволяет Вам:

·        Наложить отклики один на другой.

·        Наложить стандартную ошибку для одного единственного показателя.

·        Установить границы на переменной отклика.

·        Изменить вертикальные и горизонтальные факторы.

·        Установить фиксированные значения для тех факторов, которые не используются для создания графика.

При выборе закладки оптимизатора контура (Contour optimizer) Вы можете приложить также те настройки, которые Вы уже использовали в профиле предсказаний. Как показано на рисунке 14 графики на шаге оптимизации могут быть связаны путем переноса с одного графика на другой.


Рисунок 14. Перенос настроек при оптимизации.


Для данного эксперимента Вы заинтересованы в том, чтобы на контуры выброса углеводородов были бы наложены контуры потребления топлива с использованием стандартной ошибки выбросов оксида азота как фоновый фактор. Факторы, в которых Вы заинтересованы, чтобы они были нанесены на график – это скорость (SPEED) И TORQUE. Отбор разделов внутри всплывающего меню позволяет Вам переходить по контурам и помечать расположение контуров со значениями факторов в данном месте. Это высоко интерактивное свойство позволяет многим инженерам адекватно работать с процессом оптимизации. Рисунок 15 показывает контурный  график с подписями.


Рисунок 15. Контурный оптимизатор с подписями.


Организация и представление результатов являются ключевым фактором при дизайне эксперимента. Интерфейс ADX позволяет Вам сохранять экспериментальные заметки для того, чтобы аргументировать все течение эксперимента. Заметки могут быть внесены для каждого фактора, для каждой переменной отклика и для каждой блоковой переменной. Отчеты можно генерировать (после нажатия кнопки «Отчет» (Report) в главном окне) либо в текстовом формате, либо в формате HTML. Вы также можете настраивать вид отчета, выбирая специфическую информацию и отклики, которые должны быть в него включены (рисунок 16).


Рисунок 16. Генератор отчетов.


Кроме того, для формата HTML Вы можете просмотреть графику, которую Вы хотели бы поместить в данный отчет. Список графических файлов можно поучить внутри генератора отчета. Вы можете удалить некоторые графики из отчета или изменить метки для этого графика, которые будут использоваться при генерации отчета. Рисунок 17 демонстрирует пример работы с редактором графиков (вызывается нажатием кнопки «Графические файлы» (Graphics Files…) в окне генерации отчета).

После того, как Вы выбрали те элементы, которые будут использоваться в отчете, Вы можете нажать на кнопку «Генерировать отчет» (Generate Report), в результате вызывается браузер, который по умолчанию используется для демонстрации отчета в формате HTML. Пример подобного отчета показан на рисунке 18.


Рисунок 17. Редактор графиков.



Рисунок 18. Распечатка в формате HTML.

Выводы.

Все увеличивающееся количество инженеров, исследователей и ученых используют детально спланированные эксперименты для того, чтобы обнаруживать и изучать причинно-следственные взаимоотношения между важными факторами. Программная поддержка для успешных экспериментов необходима для того, чтобы:

·        Создать план исследования.

·        Проанализировать отклики.

·        Оптимизировать отклики в экспериментальном пространстве.

·        Организовывать и сохранять информацию в эксперименте по мере того, как он развивается.

·        Создать отчет о полученных результатах.

Интерфейс ADX предоставляет эту поддержку и представляет собой изолированную систему, которая позволяет использовать мощные инструменты SAS для инженеров, исследователей и ученых. Разработанный в ответ на запросы потребителей, этот интерфейс предоставляет руководство и аналитические инструменты, необходимые для проведения планируемых экспериментов. 

Литература

  1. Myers, Raymond H., and Douglas C. Montgomery (1995), Response Surface Methodology, New York: John Wiley & Sons.
  2. Prabhu, Sharad W., Robert N. Rodriguez, and Randall D. Tobias (1996), “The New ADX Interface for Design andAnalysis of Experiments,” Proceedings of the Twenty-Second Annual SAS Users Group International Conference, 22,1258-1270. I

SAS, SAS/OR, SAS/QC, and SAS/STAT are registered trademarks or trademarks of SAS Institute Inc. in the USA and other countries. â indicates USA registration.