Экспериментальная психология: конспект лекций. Основы планирования эксперимента Планы ex post facto

Планирование эксперимента – это область математической статистики, ставящая своей целью выбор количества и условий постановки экспериментов, необходимых и достаточных для решения задачи с требуемой точностью, разработку методов и приемов математической обработки результатов эксперимента и принятия на основе этого определенных решений.

Что дает планирование экспериментатору? Принципиально иное отношение к ошибке. Рандомизация. Последовательный эксперимент. Оптимальное использование пространства независимых переменных. Редукция информации. Этическая функция планирования эксперимента. Планирование эксперимента и логика вопросов.

Какова стратегия эксперимента? 1. Признание факта существования задачи и ее формулировка. 2. Выбор факторов и уровней. 3. Выбор переменной отклика. 4. Выбор плана эксперимента. 5. Проведение эксперимента. 6. Анализ данных. 7. Выводы и рекомендации.

Аналогия между вычислительным и лабораторным экспериментами. Лабораторный эксперимент Образец Вычислительный эксперимент Модель Прибор Измерение Программа для компьютера Тестирование программы Расчет Анализ данных Калибровка

ПЕРВИЧНАЯ СТАТИСТИЧЕСКАЯ ОБРАБОТКА ОПЫТНЫХ ДАННЫХ Средняя арифметическая Ma= y/m=(y 1+y 2+. . . +yi+. . . +ym)/m Средняя геометрическая Mg=(yi)1/m=(y 1 y 2. . . yi. . . ym)1/m Средняя квадратическая Ms=(yi 2/m)1/2=((y 12+y 22+. . . +yi 2+. . . +ym 2)/m)1/2 Средняя гармоническая Mgr=m(yi– 1)– 1 Мода Медиана Md=y(m+1)/2 Md=(ym/2+1)/2

Дисперсия воспроизводимости Sj 2= (yij-yсрj)2/(m-1)= =((y 1 j-yсрj)2+(y 2 j-yсрj)2+. . . +(ymj-yсрj)2)/(m-1) Среднее квадратическое отклонение Sj=(Sj 2)1/2=((Yij-Yсрj)2/(m-1))1/2 Коэффициент вариации V=Sj/Yсрj · 100% Размах R=Ymaxj – Yminj Доверительный интервал для среднего B = yсрj t Sj/((m)1/2)

Количество повторных измерений m=(V 2) (t 2)/(T 2) Коэффициент вариации (V, %), Показатель точности (относительная ошибка T, обычно 5%), Показатель достоверности (t – критерий Стьюдента). m=(V 2) (t 2) (1 1/(2 m 1)1/2)2/(T 2) Нижний и верхний пределы для дисперсии =m– 1; =95%; =5%

Исключение грубых промахов По критерию Романовского |ym+1 –yср| t" Sy По критерию Q Q=|ym-ym-1|/|ym-y 1| Проверка однородности дисперсий F=S 21/S 22 – критерий Фишера; G – критерий Кохрена B/C – критерий Бартлетта (по χ2)

Проверка различия средних значений большая выборка малая выборка Сравнение нескольких средних с использованием критерия Дункана Производится ранжирование средних. Вычисляется значение дисперсии воспроизводимости с числом степеней свободы =n (m– 1).

Вычисляется нормированная ошибка среднего S=(Sa 2/m)0. 5 Выписываются значения (n– 1) значимых рангов из таблицы Дункана при числе степеней свободы, уровне значимости и p=2, 3, …, n. Наименьшие значимые ранги (НЗР), вычисляются как произведение рангов на нормированную ошибку среднего S. Проверяются разности между средними, начиная с крайних; эта разность сравнивается с НЗР при p=n, затем находится разность максимального среднего и первого, которое превосходит минимальное, и сравнивается с НЗР при p=n– 1 и т. д.

ВЫБОР ПАРАМЕТРОВ ОПТИМИЗАЦИИ И ФАКТОРОВ Требования к отклику: 1. Отклик (параметр оптимизации) должен быть эффективным с точки зрения достижения цели. 2. Отклик должен быть универсальным, т. е. всесторонне отражать свойства процесса. 3. Отклик должен быть количественным и выражаться одним числом. 4. Отклик должен быть статистически эффективным, т. е. иметь небольшую дисперсию. 5. Желательно, чтобы параметр оптимизации имел физический смысл, был простым и легко вычисляемым.

Требования к факторам: 1. Факторы должны быть управляемыми, т. е. такими, чтобы внутри области определения фактору можно было бы придать любое значение. 2. Факторы должны быть совместимы. Это означает, что любая комбинация уровней внутри областей определения может быть реализована. Факторы несовместимы, если некоторые комбинации уровней приводят к остановке процесса (например, в результате взрыва и т. п.). 3. Точность установления уровней факторов должна быть выше точности фиксирования значений параметра оптимизации.

ВЫДЕЛЕНИЕ СУЩЕСТВЕННЫХ ПЕРЕМЕННЫХ НА ОСНОВЕ АПРИОРНОЙ ИНФОРМАЦИИ Коэффициент ранговой корреляции Спирмэна =cov(x, y)/((S 2 x S 2 y)0. 5)=1– 6 ((xi–yi)2)/(n 3 -n) Коэффициент корреляции рангов Кендалла

Квадрат Юдена 1 2 3 4 5 6 7 1 A B C D E F G 2 B C D E F G A 3 D E F G A B C 1 2 1 3 1 2 3 1 2 2 2 1 2 3 A B C D E F G Σ 5 6 9 3 7 8 4

ЭКСПЕРИМЕНТАЛЬНО-СТАТИСТИЧЕСКИЕ МЕТОДЫ ВЫДЕЛЕНИЕ СУЩЕСТВЕННЫХ ПЕРЕМЕННЫХ Полный факторный эксперимент Переход от натурального масштаба переменной к условному ПФЭ 22 х1 х2 (1), a, b, ab -1 +1 -1 yр=b 0+b 1 x 1+b 2 x 2+b 12 x 1 x 2

+1 -1 -1 +1 Z= +1 +1 4 0 0 0 +1 +1 -1 -1 -1 +1 0 4 0 0 Z’= Z’Z= +1 -1 -1 -1 +1 +1 0 0 4 0 +1 +1 +1 -1 -1 +1 0 0 0 4 b 0=(y 1+y 2+y 3+y 4)/4; b 2=(–y 1–y 2+y 3+y 4)/4; b 1=(–y 1+y 2–y 3+y 4)/4; b 12=(y 1–y 2–y 3+y 4)/4.

Организация эксперимента и проведение расчетов реализуются в следующей последовательности. 1. Выбор уровней варьирования факторов. 2. Построение плана эксперимента и матрицы планирования. 3. Проведение экспериментальных измерений. 4. Вычисление коэффициентов линейной модели. 5. Проверка значимости коэффициентов модели. 6. Проверка содержательности модели. 7. Проверка адекватности модели. 8. Проверка предсказательной способности в центре плана. 9. Анализ остатков. 10. Интерпретация (анализ) модели. 11. Принятие решений на основе полученной информации

Почему используется полный факторный эксперимент S 2 bi= S 2 восп / N +1 +1 4 0 0 -1 +1 0 4 0 -1 -1 +1 +1 0 0 4 +1 +1 4 0 0 -1 +1 0 0 0 2 0 0 0 +1 +1 0 0 2

ПФЭ 23 х1 -1 +1 План х2 -1 -1 +1 +1 х3 -1 -1 +1 +1 Обозначение (1) a b ab c ac bc abc

yр=b 0+b 1 x 1+b 2 x 2+b 3 x 3+b 12 x 1 x 2+b 13 x 1 x 3+b 23 x 2 x 3+b 123 x 1 x 2 x 3 +1 -1 -1 -1 +1 +1 +1 -1 -1 +1 -1 -1 +1 -1 Z 1 = +1 -1 +1 +1 +1 -1 Z 2 = +1 +1 +1 -1 -1 +1 +1 +1 -1 +1 +1 -1 -1 +1 +1 -1 -1 +1 +1 +1

b 0=(y 1+y 2+y 3+y 4+y 5+y 6+y 7+y 8)/8; b 1=(-y 1+y 2 -y 3+y 4 -y 5+y 6 -y 7+y 8)/8; yuср = yu/N; b 2=(-y 1 -y 2+y 3+y 4 -y 5 -y 6+y 7+y 8)/8; b 3=(-y 1 -y 2 -y 3 -y 4+y 5+y 6+y 7+y 8)/8; S 2 R 0= (yu-yuср)2/(N-1); b 12=(y 1 -y 2 -y 3+y 4+y 5 -y 6 -y 7+y 8)/8; b 13=(y 1 -y 2+y 3 -y 4 -y 5+y 6 -y 7+y 8)/8; S 2 R = (yu-yuрасч)2 / (N-p); b 23=(y 1+y 2 -y 3 -y 4 -y 5 -y 6+y 7+y 8)/8; b 123=(-y 1+y 2+y 3 -y 4+y 5 -y 6 -y 7+y 8)/8; Содержательность модели: F=S 2 R 0/S 2 R Адекватность модели: F=S 2 R/S 2 восп. Предсказательная способность модели: t=|b 0 -y 0 ср|/(S 2 восп/m)0. 5

Дробные реплики ДФЭ 2 3 -1 + + D=0 + + - + + + - D=256 + - - + + + Генерирующее соотношение x 1 x 2=x 3 Определяющий контраст I=x 1 x 2 x 3 Система смешивания b 1 1+ 23; b 2 2+ 13; b 3 3+ 12; b 0 0+ 123

ДФЭ 24– 1 Генерирующие соотношения x 4=x 1 x 2 и x 4=x 1 x 2 x 3 Планы 1) d, a, b, abd, cd, ac, bc, abcd; 2) (1), ad, bd, ab, cd, ac, bc, abcd Определяющие контрасты I=x 1 x 2 x 4 и I=x 1 x 2 x 3 x 4. Системы смешивания 1) b 1 1+ 24; b 2 2+ 14; b 3 3+ 1234; b 4 4+ 12 ; b 13 13+ 234; b 23 23+ 134; b 34 34+ 123; b 0 0+ 124. 2) b 1 1+ 234; b 2 2+ 134; b 3 3+ 124; b 4 4+ 123; b 12 12+ 34; b 13 13+ 24; b 14 14+ 23; b 0 0+ 1234

ДФЭ 27– 4 y=b 0+b 1 x 1+b 2 x 2+b 3 x 3+b 4 x 4+b 5 x 5+b 6 x 6+b 7 x 7 ГС: х4=х1·х2, х5=х1·х3, х6=х2·х3 и х7=х1·х2·х3 Обобщающий ОК включает контрасты, образованные из этих четырех ГС, а также произведений контрастов по два, по три и по четыре. I=х1·х2·х4=х1·х3·х5=х2·х3·х6=х1·х2·х3·х7=х2·х3·х4·х5= =х1·х3·х4·х6=х3·х4·х7=х1·х2·х5·х6=х2·х5·х7=х1·х6·х7= =х4·х5·х6=х1·х4·х5·х7=х2·х4·х6·х7=х3·х5·х6·х7= =х1·х2·х3·х4·х5·х6·х7. Пренебрегая эффектами взаимодействия, начиная с тройных, получим: b 0→β 0 (ниже тройных нет) b 1→β 1+β 24+β 35+β 67 b 2→β 2+β 14+β 36+β 57 b 3→β 3+β 15+β 26+β 47 b 4→β 4+β 12+β 37+β 56 b 5→β 5+β 13+β 27+β 46 b 6→β 6+β 23+β 17+β 45 b 7→β 7+β 34+β 25+β 16

Выбор факторов на основе отсеивающего эксперимента Планы Плакетта-Бермана n N Комбинации знаков 3 4 + - + 7 8 + + + - 11 12 + + - 15 16 + + - 19 20 + + - - - + + - - + - + - - + + - n – количество факторов; N – число экспериментов.

Планы случайного баланса № x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 Ранг 1 2 3 4 5 6 7 8 + + + + + + + + + - 8 3 6 7 4 5 2 1

Анализ диаграмм рассеяния x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 Md- 5. 0 4. 5 4. 0 3. 5 5. 5 6. 0 3. 0 4. 5 Md+ 4. 0 4. 1 3. 0 5. 5 2. 5 3. 5 4. 5 3. 0 B -1. 0 -0. 5 -1. 5 2. 0 3. 0 -2. 5 1. 5 -1. 5 n 2 - - - 3 - - |p| 2. 0 1. 5 6. 0 - - - 7. 5 - - 3 4

ДИСПЕРСИОННЫЙ АНАЛИЗ Однофакторный дисперсионный анализ Модель yij= + j+ ij, yij обозначает i-е наблюдение на j-м уровне фактора (i=1, 2, . . . , m; j=1, 2, …, n). Расчет y-yср=y-50. 1 yij i ↓ 2 6 5 12 9 10 14 11 0 5 6 3 j→ -5 -4 -5 -11 -7 4 -8 -11 -5 -7 -9

Вычисление сумм значений отклика по столбцам. T. 1=6+5+12+9+10=42; T. 2=14+11+0+5+6=36; T. 3=-5 -4 -5 -1 -7=-32; T. 4=-8 -11 -5 -7 -9=-40. T. . =42+36– 32– 40=6. Вычисление средних значений отклика для каждого уровня фактора. y 1 ср=42/5=8. 4; y 2 ср=36/5=7. 2; y 3 ср=-32/5=-6. 4; y 4 ср=-40/5=-8. 0. Вычисление сумм квадратов значений отклика yij по строкам и столбцам. SS 1=62+52+122+92+102=386; SS 2=142+112+02+52+62=378; SS 3=(-5)2+(-4)2+(-5)2+(-11)2+(-7)2 =236; SS 4=(-8)2+(-11)2+(-5)2+(-7)2+(-9)2 =340; SS=386+378+236+340=1340. SSобщ=1340 -62/(5× 4)=1338. 2.

Вычисление сумм квадратов, характеризующих влияние фактора и ошибки. SSисп=422/5+362/5+(-32)2/5+(-40)2/5 -62/20=1135. 0; SSош = 1338. 2– 1135. 0 = 203. 2. Вычисление средних квадратов (дисперсий). νобщ=5× 4– 1=19; νисп=4– 1=3; νош=4×(5 – 1) = 16. MSисп =1135/3=378. 3; MSош=203. 2/16=12. 7. Результаты однофакторного дисперсионного анализа Источник изменчивости Сумма квадратов SS Число степеней свободы ν Средний квадрат MS Критерий Фишера F Фактор 1135. 0 3 378. 3 29. 8 Ошибка 203. 2 16 12. 7 Итого 1138. 2 19

Двухфакторный дисперсионный анализ Модель yij= + j+βj+ ij Расчет yij – 13 мм Автомобиль Марка шины A B C D T. j I 4 1 -1 0 4 II 1 1 -1 -2 -1 III 0 0 -3 -2 -5 IV 0 -5 -4 -4 -13 Т i. 5 -3 -9 -8 -15=T. . 17 27 27 24 95=

Вычисление сумм квадратов SSобщ = 95 -(-15)2/16 = 80. 9; SSмар = ((5)2+(-3)2+(-9)2+ +(-8)2)/4 -(-15)2/16 = 30. 6; SSавт=((4)2+(-1)2+(-5)2+ +(-13)2)/4 -(-15)2/16 = 38. 6; SSост=80. 9 -30. 6 -38. 6=11. 7. Вычисление числа степеней свободы νобщ=n 1·n 2– 1; νмар=n 1 – 1; νавт=n 2 – 1; νост= νобщ–νмар–νавт. νобщ=4· 4– 1=15; νмар=4– 1=3; νавт=4– 1=3; νост=15– 3– 3=9.

Вычисление средних квадратов. МSмар=SSмар/νмар; МSавт=SSавт/νавт; MSост=SSост/νост. МSмар=30. 6/3=10. 2; МSавт=38. 6/3=12. 9; MSост=11. 7/9=1. 3. F=MSисп/MSост. Fмар=10. 2/1. 3=7. 85; Fавт=12. 9/1. 3=9. 92. Результаты двухфакторного дисперсионного анализа Источник изменчивости Сумма Число степеней квадратов SS свободы ν Средний квадрат MS Критерий Фишера F Марки шин 30. 6 3 10. 2 7. 85 Автомобили 38. 6 3 12. 9 9. 92 Остаток 11. 7 9 1. 3 ИТОГО 80. 9 15

Многофакторный дисперсионный анализ Модель yijk= + j+βj+ k + ijk A B C D Уровни х1: a 1; a 2; a 3; a 4; B D A C Уровни х2: b 1; b 2; b 3; b 4; C A D B D C B A Уровни х3: A; B; C; D; Этапы вычислений: 1. Подсчет итогов (сумм) и средних значений по строкам Ai, столбцам Bj и латинским буквам Ck. 2. Вычисление суммы квадратов результатов всех наблюдений: SS 1 = (Yijk)2. 3. Сумма квадратов итогов по строкам, деленная на число элементов в каждой строке: SS 2 = Ai 2 / n. 4. Сумма квадратов итогов по столбцам, деленная на число элементов в каждом столбце: SS 3 = Bj 2 / n. 5. Сумма квадратов итогов по латинским буквам, деленная на число элементов, соответствующих каждой букве: SS 4 = Ck 2 / n.

6. Корректирующий член, равный квадрату общего итога, деленному на общее число ячеек квадрата (на число опытов): SS 5 = Yijk / (n 2). 7. Сумма квадратов для строки: SSa=SS 2–SS 5. 8. Сумма квадратов для столбца: SSb=SS 3 -SS 5. 9. Сумма квадратов для латинской буквы: SSc=SS 4 -SS 5. 10. Общая сумма квадратов: SSобщ=SS 1 -SS 5. 11. Остаточная сумма квадратов: SSост=SSобщ-(SSa+SSb+SSc). Дисперсионный анализ латинского квадрата Источник изменч-ти Сумма квадратов SS Число степеней свободы Средний квадрат MS Критерий Фишера F Строки SSa=SS 2 -SS 5 a=n– 1 MSa=SSa/ a MSa / MSост Столбцы SSb=SS 3 -SS 5 b=n– 1 MSb=SSb/ b MSb / MSост Лат. буквы SSc=SS 4 -SS 5 c=n– 1 MSc=SSc/ c MSс / MSост Остаток SSост=SSобщ – ост=(n-1) (n-2) MSост=SSост/ ост – (SSa+SSb+SSc) Итого SSобщ=SS 1–SS 5 общ=n 2– 1

Греко-латинский квадрат Исследовано влияние рецептурных факторов на относительное удли-нение при разрыве композиций на основе поливинилхлорида (ПВХ). x 1 – партия полимера. Уровни фактора x 1: a 1, a 2, a 3, a 4. x 2 – содержание пластификатора. Уровни фактора x 2, масс. ч. : b 1 – 20, b 2 – 30, b 3 – 40, b 4 – 50. x 3 – тип стабилизатора. Уровни фактора x 3: A –соевое масло, B – стеарат кальция, C – стеарат бария и D – стеарат кадмия. x 4 – тип динамометра. Уровни фактора x 4: , β, и. A B C Dβ C D Aβ B Bβ A D C D Cβ B A

План и результаты эксперимента при изучении свойств ПВХ x 2 x 1 a 2 a 3 a 4 Aiср Ai 2 b 1 A (8. 2) B (10. 2) C (8. 3) Dβ (5. 9) 32. 6 8. 2 1063 b 2 C (15. 1) D (25. 8) Aβ (22. 3) B (21. 2) 84. 4 21. 1 7123 b 3 Bβ (48. 9) A (25. 7) D (49. 6) C (35. 2) 160. 4 39. 9 25408 b 4 D (74. 1) Cβ (69. 5) B (80. 9) A (57. 1) 281. 6 70. 4 79299 Bj 146. 3 131. 2 161. 1 120. 4 G= =558. 0 Bjср 36. 6 32. 8 40. 3 29. 9 Bj 2 21404 17213 25953 14256

A B C D C k 113. 3 161. 2 128. 1 155. 4 Ckср 28. 3 Ck 2 12837 25985 16410 24149 40. 3 β 32. 0 38. 9 Dl 129. 3 146. 6 150. 1 132. 0 Dlср 32. 3 D l 2 16718 21492 22530 17424 36. 7 37. 8 33. 0

Вычисление суммы квадратов результатов всех наблюдений. . . SS 1=8. 22+10. 22+8. 32+. . . +80. 92+57. 12 =28992. 54. Сумма квадратов итогов по строкам, деленная на число элементов в каждой строке. SS 2=(1063+7123+25408+79299) / 4 =28223. 25. Сумма квадратов итогов по столбцам, деленная на число элементов в каждом столбце. . SS 3=(21404+17213+25953+14256)/4=19706. 50. Сумма квадратов итогов по латинским буквам, деленная на число элементов, соответствующих каждой букве. SS 4=(12837+25985+16410+24149) / 4 =19845. 25. Сумма квадратов итогов по греческим буквам, деленная на число элементов, соответствующих каждой букве. SS 5=(16718+21492+22530+17424) / 4 =19541. 00.

Корректирующий член, равный квадрату общего итога, деленному на общее число ячеек квадрата (на число опытов). SS 6 = 558. 02/ 16 = 19460. 25. Сумма квадратов для строки. SSa=SS 2 -SS 6; SSa=28223. 25 -19460. 25=8763. 00. Сумма квадратов для столбца. SSb=SS 3 -SS 6; SSb=19706. 50 -19460. 25=246. 25. Сумма квадратов для латинской буквы. SSc=SS 4 -SS 6; SSc=19845. 25 -19460. 25=385. 00. Сумма квадратов для греческой буквы. SSd=SS 5 -SS 6; SSd=19541. 00 -19460. 25=80. 75. Общая сумма квадратов. SSобщ=SS 1 -SS 6; SSобщ=28992. 54 -19460. 25=9532. 27. Остаточная сумма квадратов. SSост=SSобщ-(SSa+SSb+SSc+SSd); SSост=9532. 27 -(8763. 00+246. 25+385. 00+80. 75)=57. 27.

Дисперсионный анализ греко-латинского квадрата 4 4. Источник изменчивости Сумма квадратов SS Число степеней свободы ν Средний квадрат MS Критерий Фишера F Строки, x 2 8763. 00 3 2921. 0 152. 9 Столбцы, x 1 246. 25 3 82. 1 4. 3 Лат. буквы, x 3 385. 00 3 128. 3 6. 7 Греч. буквы, x 4 80. 75 3 26. 9 1. 4 Ошибка 57. 27 3 19. 1 F(3; 3; 0. 05)=9. 28 и F(3; 3; 0. 1)=5. 39 Итого 9532. 27 15

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА В УСЛОВИЯХ ВРЕМЕННОГО ДРЕЙФА Влияние этого временнóго дрейфа на параметры математического описания процесса можно практически устранить, разбивая серию опытов на отдельные блоки так, чтобы эффект от временнóго дрейфа оказался смешанным с произведениями факторов, для которых коэффициенты регрессии достаточно малы. Допустим, необходимо устранить влияние временнóго дрейфа на параметры уравнения регрессии, получаемого в результате полного трехфакторного эксперимента. С этой целью разобьем эксперимент на два блока и введем новую независимую переменную хд, характеризующую дрейф. Положим хд=х1 х2 х3. В один из блоков отберем опыты, для которых хд=+1, а в другой блок – для которых хд=– 1. Формально это планирование можно рассматривать как эксперимент типа 24– 1 с генерирующим соотношением хд=х1 х2 х3.

Планирование в условиях временного дрейфа Блок х1 х2 х3 хд=х1 х2 х3 Отклик 1 – 1 +1 – 1 – 1 +1 +1 +1 +1 +1 – 1 – 1 2 y 1+βд y 2+βд y 3+βд y 4+βд y 5–βд y 6–βд y 7–βд y 8–βд

Если уравнение регрессии ищется в виде y=b 0+b 1 x 1+b 2 x 2+b 3 x 3+b 12 x 1 x 2+b 23 x 2 x 3+b 123 x 1 x 2 x 3, то коэффициенты регрессии будут являться следующими оценками: b 0→β 0; b 1→β 1; b 2→β 2; b 3→β 3; b 12→β 12; b 13→β 13; b 23→β 23; b 123→β 123+βд; Рассчитаем, например, коэффициенты b 1 и b 123: b 1=(–(y 1+βд)+(y 2+βд)–(y 3+βд)+(y 4+βд)–(y 5–βд)+(y 6– βд)–(y 7–βд)+(y 8–βд))/8= =(–y 1+y 2–y 3+y 4–y 5+y 6–y 7+y 8)/8; b 123=((y 1+βд)+(y 2+βд)+(y 3+βд)+(y 4+βд)–(y 5–βд)–(y 6– βд)–(y 7–βд)–(y 8–βд))/8= =(y 1+y 2+y 3+y 4–y 5–y 6–y 7–y 8)/8+βд. Следовательно, все коэффициенты регрессии, кроме b 123, не содержат погрешностей, обусловленных временным дрейфом.

Анализ временнóго дрейфа может быть осуществлен также с помощью магических квадратов. Пусть нужно поставить N независимых опытов. Числа от 1 до N – это некоторые параметры времени, такие как часы или дни. Высказывается предположение, что при постановке N опытов имеет место временнóй дрейф экспериментальных данных. Характер дрейфа линейный. Рассмотрим план, представляющий собой совмещение магического квадрата с полным факторным экспериментом 24.

Рассмотрим результаты определения зависимости твердости резин от температуры вулканизации (= 180 о. С и = 140 о. С), продолжительности процесса (= 17 мин и = 5 мин), дозировки ускорителя (= 1. 2 масс. ч. и = 0. 4 масс. ч.) и наполнителя (= 30 масс. ч. и = 10 масс. ч.). Реализован полный факторный эксперимент 24 Допустим, что ежедневно ставим один опыт, тогда все опыты будут поставлены за 16 дней. В течение этого времени имеет место линейный дрейф. Для защиты от этого дрейфа наложим ПФЭ 24 на 4 4 магический симметричный квадрат, элементами которого являются номера шестнадцати опытов. Такой план приемлем, если взаимодействия х1 х4 и х2 х3 незначимы.

Факторный эксперимент 24, совмещенный с 4 4 магическим квадратом x 1(+1) x 2(+1) x 4(+1) x 3(+1) x 1(– 1) x 2(+1) x 2(– 1) 16 72. 0 2 70. 0 3 73. 8 13 59. 8 x 4(– 1) 5 69. 8 11 57. 8 10 62. 7 8 54. 7 x 4(+1) x 3(– 1) 9 67. 5 7 59. 3 6 64. 4 12 52. 2 x 4(– 1) 4 62. 4 14 48. 3 15 52. 2 1 50. 2

« x 1=[-1; 1; -1; 1; -1; 1]; « x 2=[-1; -1; 1; 1; -1; 1; 1]; « x 3=[-1; -1; 1; 1; 1; 1]; « x 4=[-1; -1; 1; 1; 1]; « y=; « X=; « b=(inv(X"*X))*(X"*y) b=61. 0687 2. 3187 4. 5312 4. 0062 3. 8063 « Y=X*b; « max(abs(y-Y)) ans = 3. 7938 « [(y-Y). /y*100] ans = 7. 5573 « (64. 7 -61. 1)/15*2 ans=0. 4800 В последней формуле сопоставлены значения отклика до дрейфа и после него. Если бы не было дрейфа, значение отклика в нулевой точке было бы 64. 7 единиц, а в результате дрейфа (пребывание в агрессивной среде) понизилось на 3. 6 единиц.

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ Зависимость между двумя переменными величинами называется статистической, если каждому значению одной из них соответствует множество значений другой, но число этих значений не является постоянным, а сами значения не отражают определенной закономерности. Рассмотрим двумерные наблюдения, т. е. такие наблюдения, которые дают значения двух случайных величин х и у. Используем такую статистическую характеристику – ковариацию или второй смешанный центральный момент (иначе – корреляционный момент) величин х и у: Коэффициент корреляции

Справедливы следующие соотношения: y=a+bx; x=a +׳ b ׳ y Таким образом, мы получаем два уравнения регрессии, которые отвечают двум различным математическим формулировкам задачи: в первом случае минимальное значение имеет сумма квадратов отклонений, взятых параллельно оси ординат, во втором случае – сумма квадратов отклонений, взятых параллельно оси абсцисс.

При подсчете коэффициентов регрессии можно воспользоваться следующими соотношениями: β= +φ При rxy = 1, tgφ = 0, следовательно, в этом частном случае обе линии регрессии совпадают. Каждая из переменных становится линейной функцией другой переменной. При rxy = 0 мы получаем две взаимно перпендикулярные прямые, параллельные координатным осям и проходящие через точку с координатами В этом случае очевидно, что между переменными не может существовать линейной статистической связи.

y 1 – условное напряжение при удлинении 100%, МПа; y 2 – условное напряжение при удлинении 200%, МПа; y 3 – условное напряжение при удлинении 300%, МПа; y 4 – условная прочность при растяжении, МПа; y 5 – относительное удлинение при разрыве, %; y 6 – сопротивление разлиру, к. Н/м; y 7 – твердость по Шору А.

Представление о корреляциях с помощью модели косинуса Соотношение между вулканизационными характеристиками ν=877; r=0. 968; r=0. 935; r=0. 984; tgφ=– 0. 0281. tgφ=– 0. 0535 tgφ=– 0. 0155.

ОПТИМИЗАЦИЯ ОДНОМЕРНЫЙ ПОИСК Метод последовательной дихотомии предусматривает размещение на каждом этапе экспериментирования сразу двух новых точек, расположенных симметрично относительно середины интервала неопределенности на расстоянии друг от друга. Здесь – по возможности малая величина, ограниченная снизу разрешающей способностью доп в измерении величины x. Значение доп – это та минимальная разница между соседними наблюдениями x, которая может быть обнаружена инструментально с помощью тех измерительных средств, которые имеются в распоряжении экспериментатора.

Метод поиска Фибоначчи базируется на использовании чисел Фибоначчи Fk, определяемых рекуррентным соотношением вида: Fk=Fk-1+Fk-2, k>1, F 0=F 1=1. N 1 2 3 4 5 6 7 8 9 FN 1 2 3 5 8 13 21 34 55 Метод золотого сечения является частной разновидностью метода Фибоначчи и отличается от него лишь тем, что в методе золотого сечения нет необходимости в обязательном предварительном определении общего числа опытов N. Координаты x(1) (первой точки в этом методе) находятся по формуле: x(1) = xmin + q L,

МНОГОМЕРНЫЙ ПОИСК Многомерность делает унимодальность менее вероятной Нельзя найти меру эффективности поиска, которая не зависела бы некоторым образом от удачи экспериментатора. Восприятие размера в многомерных пространствах. Существует большое число разнообразных методов многомерного поиска. В дальнейшем будут рассмотрены лишь некоторые из них, получившие наибольшее распространение для целей экспериментальной оптимизации. Эти методы можно разделить на две большие группы: на градиентные и неградиентные методы поиска экстремума.

Метод покоординатного поиска, (метод Гаусса-Зайделя) Метод Гаусса-Зайделя весьма прост при практической реализации, достаточно помехоустойчив. Однако ясно, что траектория поиска вряд ли будет наикратчайшей. Кроме того метод Гаусса. Зайделя имеет тенденцию к ложной остановке процедуры, если в ходе движения поисковая точка окажется на узком «гребне» .

ПЛАНИРОВАНИЕ ЭКСТРЕМАЛЬНЫХ ЭКСПЕРИМЕНТОВ В ПРОМЫШЛЕННЫХ УСЛОВИЯХ 1. Промышленный эксперимент должен одновременно с нормальным функционированием объекта и производством товарной продукции обеспечить получение полезной информации для нахождения оптимальных условий управления объектом. 2. Чтобы извлечь такую информацию, можно реализовать целенаправленное «покачивание» объекта около так называемого «рабочего режима» , планируя пробные шаги варьирования по управляемым факторам и выделяя влияние изучаемых переменных на отклик в условиях шума с помощью регрессионного анализа. 3. В производственных условиях, по сравнению с лабораторными, имеет место большое количество неконтролируемых и неуправляемых факторов, влияющих на ход процесса. 4. Медленные (относительно частоты постановки опытов) случайные флуктуации одних неконтролируемых и неуправляемых факторов промышленного объекта вызывают нерегулярный временной дрейф поверхности целевого отклика по отношению к управляемым факторам, то есть нерегулярное изменение с течением времени всей поверхности, а значит, и координат точки ее экстремума в их пространстве. 5. В промышленных условиях для реализации адаптационной оптимизации нет специального штата высококвалифицированных исследователей, а есть у производственной установки обслуживающий персонал довольно низкой квалификации. Здесь нет и той насыщенности исследования измерительными, регистрирующими приборами и вычислительными устройствами, которая присуща лабораторному эксперименту. Поэтому планы и вычислительные алгоритмы обработки наблюдений промышленного эксперимента должны быть достаточно просты. 6. Адаптационная оптимизация производственных установок предполагает постоянное исследование и подстройку объекта, то есть неограниченное временем проведение промышленного эксперимента, а значит, и неограниченное число его опытов.

ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ Во многих ситуациях, которые могут встретиться в промышленности, в экономической деятельности требуется максимизировать или минимизировать некоторую количественную величину при определенных ограничениях. Например, бизнесмен хочет максимизировать свою прибыль, однако при этом он ограничен общим числом имеющихся у него машин, наличием людей, капиталом, который он может инвестировать, и рядом других экономических факторов. Пример. Имеется три вещества сложного состава В 1, В 2 и В 3 разной цены. Каждое из них содержит определенное количество необходимых ингредиентов И 1, И 2, И 3 и И 4 Известно, что в течение суток требуется И 1 – не менее 250, И 2 – не менее 60, И 3 – не менее 100 и И 4 – не менее 220. Требуется минимизировать затраты на приобретение этих веществ. Очевидно, что количество приобретаемых веществ не может быть отрицательным.

Содержание необходимых ингредиентов в веществах и цены этих веществ В 1 В 2 В 3 И 1 4 6 15 И 2 2 2 0 И 3 5 3 4 И 4 7 3 12 Цена 44 35 100

В состав MATLAB входит Tool. Box Optimization, предназначенный для решения такого рода задач. Используется функция linprog. Первым аргументом linprog всегда является вектор f (вектор коэффициентов), далее задается матрица A и вектор b. Решение. x 1, x 2 и x 3 – искомые количества веществ. Целевая функция: f. Tо x=44·x 1+35·x 2+100·x 3. При наличии ограничений в виде равенств дополнительными аргументами могут быть Aeq и beq, наконец, двусторонние ограничения являются шестым и седьмым аргументами linprog. Поскольку линейные ограничения содержат «меньше или равно» , а количество ингредиентов в продуктах не должно быть менее заданных величин, то следует изменить знаки обеих частей системы. Для решения задачи составляется файл-прграмма. При вызове linprog вместо неиспользуемых аргументов (нет ограничений в виде равенств и верхней границы для неизвестных) задаются пустые массивы, обозначаемые .

Решение. Матрица А и векторы b и lb: =linprog(f, A, b, , lb, ); p=1. 8118 e+003; р – общая стоимость продуктов. Интерпретация. Представляет интерес умножить A на х, определить рекомендуемое содержание ингредиентов и сравнить его с минимально допустимым. A*x= [-250; -60: -142. 14; -220]; Сравнивая эти числа с вектором b, можно констатировать завышенное содержание третьего ингредиента. Это объясняется тем, что не было введено ограничение на максимальное содержание.

КОНТРОЛЬНЫЕ НАБЛЮДЕНИЯ Одно из наиболее важных применений статистическая теория находит в методах статистического контроля, среди которых хорошо известным примером может служить контроль качества. Контроль качества находит наиболее широкое применение в промышленности. Методика контроля качества находит два основных применения. Первое применение она находит в управлении технологическими процессами, при котором какой-либо реальный процесс, например такой, как работа машины, измеряется с целью оценки хода работы в настоящее время и, как подразумевается, для получения отправных данных для работы в ближайшем будущем. Второе применение она находит в приемочном контроле, который оценивает ход работы в прошлом путем измерения качества произведенных товаров. Поэтому это второе применение имеет дело с конечной совокупностью вещей, которые уже были произведены, тогда как управление технологическим процессом нацелено на проверку самого хода фактического производства. Это позволяет руководству выявить недостатки в процессе почти одновременно с их появлением и тем самым предотвратить выпуск изделий, имеющих дефекты.

Метод контроля основывается на свойствах нормальной кривой. Около 99. 7% всех наблюдаемых значений, взятых из нормально распределенной совокупности, располагаются в пределах интервала трех стандартных отклонений в любую сторону от среднего значения, и поэтому только около трех из каждой тысячи показаний наблюдений располагается вне этих пределов. Исходя из этого, может быть составлена контрольная карта, которая показывает возможные значения на вертикальной оси и ряды последовательных целых чисел, представляющих последовательные наблюдения, расположенные вдоль горизонтальной оси. Горизонтальная линия проведена на высоте, соответствующей среднему значению; гори зонтальные линии проведены также на высо тах, представляющих контрольные пределы. Верхний контрольный предел установлен на высоте, соответствующей значению средней плюс три стандартных отклонения (С. о.); ни жний контрольный предел установлен на вы соте, соответствующей значению средней минус три стандартных отклонения, так что около 99. 7% всех показаний должны расположиться в этих пределах.

Контрольные карты можно использовать: 1. Как сигнал о том, что в процессе произошло некоторое изменение, так и в качестве оценки величины изменения, для которого требуется коррекция. 2. Исключительно как сигнал о том, что в процессе произошло некоторое изменение, чтобы оператор осознал, что процесс требует его внимания. 3. Для получения оценок числа случаев в прошлом, когда в процессе возникали изменения, и установления на их основе причин, вызывающих эти изменения. 4. Как меру качества продукции для классификации по периодам. В производстве чаще всего используются: 1) контрольные карты Шухарта (карты R и s – средних значений, размаха и стандартного отклонения); 2) карты скользящих геометрических средних (скользящего экспоненциально взвешенного среднего) и скользящих размахов; 3) карты накопленных сумм; 4) многомерные контрольные карты.

Контрольные карты и R для вулканизационных характеристик t 10, t 50 и t 90 Карта накопленных сумм

ОПИСАНИЕ ПОЧТИ СТАЦИОНАРНОЙ ОБЛАСТИ При изучении почти стационарной области возникает ряд новых сложных проблем. Если мы хотим описать эту часть поверхности отклика полиномом (многочленом) второго порядка, то переменные нужно варьировать уже на трех уровнях. Возникает сложная задача построения таких планов. Здесь, прежде всего, нужно выбрать какой-то достаточно разумный критерий оптимальности. Во всяком случае, с самого начала было ясно, что планы полного факторного эксперимента типа 3 n (n – количество факторов) здесь неприемлемы, так как они потребуют слишком большого числа опытов. Если три фактора – 33=27, четыре фактора – 34=81. В работе Бокса и Уилсона (1951) была выдвинута идея построения композиционных планов, ядром которых служат линейные ортогональные планы. Предполагается что, попав в почти стационарную область, исследователь сначала ставит опыты, используя линейные планы. Затем, убедившись в том, что гипотеза линейности здесь не проходит, он достраивает линейный план до плана второго порядка; отсюда и само название - композиционный план.

Рассмотрим такую ситуацию: имеется два фактора, и на первом этапе мы строим полный факторный эксперимент (ПФЭ) 22. На рисунке точки этого плана изображены зачерненными кружками. Далее ставится эксперимент в центре квадрата для проверки гипотезы адекватности. Затем реализуются «звездные» точки. Выбор плана – это всегда компромиссное решение, принимаемое в результате диалога. Раньше это был диалог со справочником-каталогом планов, сейчас – это диалог с компьютером.

Ортогональность плана. План называется ортогональным, если ковариационная матрица плана содержит все нулевые элементы, кроме элементов главной диагонали (диагональная матрица). Для ортогональных планов все оценки коэффициентов независимы: эллипсоид рассеяния ориентирован так, что направление его главных осей совпадает с направлением координатных осей в пространстве коэффициентов. Ротатабельность плана. Ротатабельные планы имеют ковариационную матрицу, инвариантную к вращению координат, позволяют получить одинаковую дисперсию предсказанных значений функции отклика во всех равноудаленных от центра эксперимента точках. Выполнение этого условия делает любое направление от центра эксперимента равнозначным в смысле точности оценки поверхности. Если информационные контуры плана представить как поверхности с равными значениями дисперсии оценки поверхности отклика, то для ротатабельного плана эти поверхности будут представлять собой сферы.

ПРИМЕНЕНИЕ СОВРЕМЕННЫХ ПРОГРАММНЫХ ПРОДУКТОВ ДЛЯ АНАЛИЗА ПОЧТИ СТАЦИОНАРНОЙ ОБЛАСТИ Экспериментальная сетка, сформированная ломаными линиями без аппроксимации уравнением Поверхность отклика, отвечающая наибольшему значению коэффициента детерминации

ПРИМЕНЕНИЕ СОВРЕМЕННЫХ ПРОГРАММНЫХ ПРОДУКТОВ ДЛЯ АНАЛИЗА ПОЧТИ СТАЦИОНАРНОЙ ОБЛАСТИ Поверхность отклика, отвечающая модели 310 по каталогу программы TC 3 D Поверхность отклика, отвечающая модели 301 по каталогу программы TC 3 D

ПОСТРОЕНИЕ ДИАГРАММ СОСТАВ-СВОЙСТВО Частным случаем решения задачи описания почти стационарной области является построение регрессионных моделей для систем, являющихся смесями двух и более различных компонентов. Переменные xi таких систем являются пропорциями (относительным содержанием) нескольких (например, трех) компонентов смеси и удовлетворяют условию xi = x 1 + x 2 + x 3 = 1 Геометрическое место точек, удовлетворяющих условию нормированности сумм переменных, представляет собой двумерный симплекс (треугольник). Каждой точке симплекса соответствует смесь определенного состава, и любой комбинации относительных содержаний трех компонентов соответствует определенная точка симплекса. В рассматриваемой нами ситуации вершины симплекса соответствуют 100%-му содержанию каждого компонента; стороны треугольника, лежащие напротив этих вершин, соответствуют нулевому содержанию данного компонента; относительное содержание каждого компонента откладывается вдоль соответствующей стороны треугольника состава. Состав может быть выражен в мольных, массовых и объемных долях или в процентах.

Опустив из каждой вершины треугольника высоту, разделив каждую из них на десять равных по величине отрезков и проведя через полученные деления прямые, параллельные сторонам треугольника, получим треугольную сетку.

Для решения задачи построения диаграммы «свойство-состав» на симплексе целесообразно рассматривать модель y=y(x 1, x 2, x 3) (y – отклик) в форме приведенного полинома. Такие приведенные полиномы для трехкомпонентных смесей показаны ниже. Модель второго порядка для трех переменных: y = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3 Неполная кубическая модель: y = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3 + 123 x 1 x 2 x 3 Модель третьего порядка: y = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3 + + 12(x 1 – x 2) + 13(x 1 – x 3) + 23(x 2 – x 3) + 123 x 1 x 2 x 3 Модель четвертого порядка: y = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3 + + 12(x 1 – x 2) + 13(x 1 – x 3) + 23(x 2 – x 3) + + 12 x 1 x 2(x 1 – x 2)2+ 13 x 1 x 3(x 1 – x 3)2+ 23 x 2 x 3(x 2 – x 3)2+ 1123 x 12 x 2 x 3+ 1223 x 1 x 22 x 3+ 1233 x 1 x 2 x 32 Полиномы такого вида получаются из обычных полиномов соответствующей степени введением соотношения xi = x 1 + x 2 + x 3 = 1

Так, например, полином второй степени, в общем случае имеющий вид y=b 0+b 1 x 1+b 2 x 2+b 3 x 3+b 12 x 1 x 2+b 13 x 1 x 3+b 23 x 2 x 3+b 11 x 12+b 22 x 22+b 33 x 32, в приведенной форме с учетом условия xi = x 1 + x 2 + x 3 = 1 приобретет форму y = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3 При переходе к приведенной форме постоянный член b 0 исключается из уравнения умножением обеих сторон xi = x 1 + x 2 + x 3 = 1 на b 0. b 0 x 1 + b 0 x 2 + b 0 x 3 = b 0 и подстановкой полученных результатов в уравнение y=(b 0+b 1)x 1+(b 0+b 2)x 2+(b 0+b 3)x 3+b 12 x 1 x 2+b 13 x 1 x 3+b 23 x 2 x 3+b 11 x 12+b 22 x 22+b 33 x 32 Исключения квадратичных членов можно достичь подстановкой в уравнение вместо величин x 12, x 22 и x 32 значений x 12=x 1–x 1 x 2–x 1 x 3, x 22=x 2–x 1 x 2–x 2 x 3, x 32=x 3–x 1 x 3–x 2 x 3, образованных путем умножения соотношения xi = x 1 + x 2 + x 3 = 1 соответственно на x 1, x 2 и x 3 y=(b 0+b 11)x 1+(b 0+b 22)x 2+(b 0+b 33)x 3+(b 12–b 11–b 22)x 1 x 2+ + (b 13–b 11–b 33)x 1 x 3 +(b 23–b 22–b 33)x 2 x 3 Введя обозначения 1=b 0+b 11; 2=b 0+b 22; 3=b 0+b 33; 12=b 12–b 11–b 22; 13= b 13–b 11–b 33; 23=b 23–b 22–b 33, получим приведенную форму y = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3

Для оценки коэффициентов приведенных полиномов были предложены симплекс-решетчатые планы. В таблице представлено расположение точек (матрица планирования) и обозначение откликов для случая модели второго порядка. Отклик Координаты точек Отклик Координаты точек x 1 x 2 x 3 y 1 1 0 0 y 12 1/2 0 y 2 0 1 0 y 13 1/2 0 1/2 y 3 0 0 1 y 23 0 1/2

Для построения модели второго порядка реализуются точки в вершинах треугольника и в серединах его сторон. Схема расположения экспериментальных точек в симлексных решетках {3, 2} {3, 3}* {3, 3} {3, 4} {4, 2} {q, n}-решетки, q – число компонентов смеси, n – степень полинома Формулы для вычисления параметров модели второго порядка 1=y 1; 2=y 2; 3=y 3; 12=4 y 12– 2 y 1– 2 y 2; 13=4 y 13– 2 y 1– 2 y 3; 23=4 y 23– 2 y 2– 2 y 3.

Пример. Результаты исследования прочности пористых резин на основе комбинации каучуков СКМС-30 РП и БС-45 К, содержа-щих три типа порообразователей х1 – N, N’-динитрозопентаметилен-тетрамин (ЧХЗ-18), х2 – азодикарбонамид (ЧХЗ-21), х3 – бикарбонат натрия. Координаты точек и результаты эксперимента Координаты точек x 1 x 2 x 3 1 0 0 0 1 0 0 σ, МПа Координаты точек σ, МПа x 1 x 2 x 3 5. 6 5. 9 ½ 1/2 0 4. 4 4. 7 0 3. 2 1/2 0 1/2 5. 1 5. 4 1 6. 0 6. 3 0 1/2 3. 8 4. 0

Вычисление коэффициентов приведенного полинома. σ = 1 x 1 + 2 x 2 + 3 x 3 + 12 x 1 x 2 + 13 x 1 x 3 + 23 x 2 x 3 , хi . 1= σ1; 2= σ2; 3= σ3; 12=4σ12– 2σ1– 2σ2; 13=4σ13– 2σ1– 2σ3; 23=4σ23– 2σ2– 2σ3. β 1=(5. 6+5. 9)/2=5. 75; β 2=(3. 0+3. 2)/2=3. 10; β 3=(6. 0+6. 3)/2=6. 15; β 12=4(4. 4+4. 7)/2 -2(5. 6+5. 9)/2 -2(3. 0+3. 2)/2=0. 50; β 13=4(5. 1+5. 4)/2 -2(5. 6+5. 9)/2 -2(6. 0+6. 3)/2=-2. 80; β 23=4(3. 8+4. 0)/2 -2(3. 0+3. 2)/2 -2(6. 0+6. 3)/2=-2. 90. Уравнение регрессии имеет вид: σ = 5. 75 x 1 + 3. 10 x 2 + 6. 15 x 3 + 0. 50 x 1 x 2 - 2. 80 x 1 x 3 - 2. 90 x 2 x 3. Проверка однородности дисперсий. Критерий Кохрена: G=S 2 max/ Σ S 2 j. Средние значения: 5. 75; 3. 10; 6. 15; 4. 55; 5. 25; 3. 90. Дисперсии: 0. 045; 0. 020; 0. 045; 0. 020. Условие однородности дисперсий: G

Расчет дисперсии воспроизводимости. N=6; S 2 E =(0. 045+0. 020+0. 045+0. 020)/6=0. 037. Значения отклика в проверочной точке 4. 1; 4. 3. σ0 ср=4. 20 МПа Проверка адекватности модели. =a 12+a 22+a 32+a 122+a 132+a 232; ai=xi(2 xi-1); aij=4 xixj. t= σ·(r/(S 2 E (1+))1/2, = p(r-1), y=|σрасч-σср| – модуль разности отклика, рассчитанного по уравнению, и среднего отклика, определенного экспериментально в проверочной точке по r повторным наблюдениям. a 1=a 2=a 3=1/3·(2· 1/3 -1)=-1/9; a 12=a 13=a 23=4· 1/3=4/9; =3(-1/9)2+3(4/9)2=0. 630. Значения прочности в центре плана: σ0 расч=5. 75/3+3. 10/3+6. 15/3+ 0. 50/9 -2. 80/9 -2. 90/9=4. 42 МПа. t=|4. 42 -4. 20|·(2/(0. 037(1+0. 630))1/2 =1. 27; =6(2 -1)=6; =5 %; t(6; 0. 05)=2. 45.

Условие адекватности: tрасч

Пример. Влияние состава полимерной матрицы на тепловой эффект вулканизации. Все рецептуры содержали 15 масс. % каучука СКМС 30 РП и 30 масс. % смеси полимеров: каучук СКД (х1), полистирол (х2) и каучук СКМС-30 РП (х3) в различных соотношениях. Все системы содержали порообразователи. Для построения диаграмм использована программа в системе MATLAB. Но в нее были внесены определенные коррективы, которые позволили реализовать процедуру в следующей последовательности. С использованием программы Table Curve 3 D формируется модель, включающая два фактора х1 и х2. Затем составляется столбец значений параметров полученной модели b. этот столбец вводится в командное окно MATLAB. Затем открывается программа-модуль для построения диаграмм. В эту программу заранее внесены возможные уравнения. Такой подход позволяет рассчитать несколько конкурирующих моделей и оценить их статистические характеристики. В рассматриваемом случае получены следующие модели: 310 z=a+bx+cy+dx^2+ey^2+fxy+gx^3+hy^3+ixy^2+jx^2 y; 1301 z=(a+cx+ey+gx^2+iy^2+kxy)/(1+bx+dy+fx^2+hy^2+jxy); 301 z=a+bx+cy+dx^2+ey^2+fxy; 65 z=a+bx+cx^2+dx^3+ex^4+fx^5+gy+hy^2+iy^3+jy^4+ky^5; 50 z=a+bx+cx^2+dx^3+ex^4+fy+gy^2+hy^3+iy^4+jy^5.

На рисунке слева сплошными линиями показаны изолинии, полученные с использованием модели третьего порядка (310), а пунктиром – модели второго порядка. Справа даны изолинии (сплошные) применительно к моделям 65 и 50. они практически совпадают. Пунктиром показаны изолинии для модели 1301 по каталогу TC 3 D.

Создание модели - акт необходимый при анализе и синтезе сложных систем, но далеко не конечный. Модель - не цель исследователя, а только инструмент для проведения исследований, инструмент эксперимента. В первых темах мы достаточно полно раскрыли афоризм: "Модель есть объект и средство эксперимента".

Эксперимент должен быть информативен, то есть давать всю нужную информацию, которой следует быть полной, точной, достоверной. Но она должна быть получена приемлемым способом. Это означает, что способ должен удовлетворять экономическим, временным и, возможно, другим ограничениям. Такое противоречие разрешается с помощью рационального (оптимального) планирования эксперимента.

Теория планирования эксперимента сложилась в шестидесятые годы двадцатого века благодаря работам выдающегося английского математика , биолога, статистика Рональда Айлмера Фишера (1890-1962 гг.). Одно из первых отечественных изданий: Федоров В. В. Теория оптимального эксперимента. 1971 г. Несколько позже сложилась теория и практика планирования имитационных экспериментов, элементы которых рассматриваются в настоящей теме.

4.1. Сущность и цели планирования эксперимента

Итак, как мы уже знаем, модель создается для проведения на ней экспериментов. Будем считать, что эксперимент состоит из наблюдений , а каждое наблюдение - из прогонов (реализаций ) модели .

Для организации экспериментов наиболее важно следующее.

Компьютерный эксперимент с имитационной моделью обладает преимуществами перед натурным экспериментом по всем этим позициям.

Что же такое компьютерный (машинный) эксперимент?

Компьютерный эксперимент представляет собой процесс использования модели с целью получения и анализа интересующей исследователя информации о свойствах моделируемой системы.

Эксперимент требует затрат труда и времени и, следовательно, финансовых затрат. Чем больше мы хотим получить информации от эксперимента, тем он дороже.

Средством достижения приемлемого компромисса между максимумом информации и минимумом затрат ресурсов является план эксперимента.

План эксперимента определяет:

  • объем вычислений на компьютере;
  • порядок проведения вычислений на компьютере;
  • способы накопления и статистической обработки результатов моделирования.

Планирование экспериментов имеет следующие цели:

  • сокращение общего времени моделирования при соблюдении требований к точности и достоверности результатов;
  • увеличение информативности каждого наблюдения;
  • создание структурной основы процесса исследования.

Таким образом, план эксперимента на компьютере представляет собой метод получения с помощью эксперимента необходимой информации.

Конечно, можно проводить исследования и по такому плану: исследовать модель во всех возможных режимах, при всех возможных сочетаниях внешних и внутренних параметров , повторять каждый эксперимент десятки тысяч раз - чем больше, тем точнее!

Очевидно, пользы от такой организации эксперимента мало, полученные данные трудно обозреть и проанализировать. Кроме того, большими будут затраты ресурсов, а они всегда ограничены.

Весь комплекс действий по планированию эксперимента разделяют на две самостоятельные функциональные части:

  • стратегическое планирование;
  • тактическое планирование.

Стратегическое планирование - разработка условий проведения эксперимента, определение режимов, обеспечивающих наибольшую информативность эксперимента.

Тактическое планирование обеспечивает достижение заданных точности и достоверности результатов.

4.2. Элементы стратегического планирования экспериментов

Формирование стратегического плана выполняется в так называемом факторном пространстве . Факторное пространство - это множество внешних и внутренних параметров , значения которых исследователь может контролировать в ходе подготовки и проведения эксперимента.

Объектами стратегического планирования являются:

  • выходные переменные (отклики, реакции, экзогенные переменные );
  • входные переменные (факторы, эндогенные переменные );
  • уровни факторов.

Математические методы планирования экспериментов основаны на так называемом кибернетическом представлении процесса проведения эксперимента (рис. 4.1).


Рис. 4.1.

- входные переменные, факторы;

- выходная переменная ( реакция , отклик);

Ошибка, помеха, вызываемая наличием случайных факторов;

Оператор, моделирующий действие реальной системы, определяющий зависимость выходной переменной от факторов

Иначе: - модель процесса, протекающего в системе.

Первой проблемой , решаемой при стратегическом планировании, является выбор отклика (реакции), то есть определение , какие величины нужно измерять во время эксперимента, чтобы получить искомые ответы. Естественно, выбор отклика зависит от цели исследования.

Например, при моделировании информационно-поисковой системы может интересовать исследователя время ответа системы на запрос . Но может интересовать такой показатель как максимальное число обслуженных запросов за интервал времени. А может, то и другое. Измеряемых откликов может быть много: В дальнейшем будем говорить об одном отклике

Второй проблемой стратегического планирования является выбор ( определение ) существенных факторов и их сочетаний, влияющих на работу моделируемого объекта. Факторами могут быть питающие напряжения, температура, влажность, ритмичность поставок комплектующих и многое другое. Обычно число факторов велико и чем меньше мы знакомы с моделируемой системой, тем большее, нам кажется, число их влияет на работу системы. В теории систем приводится так называемый принцип Парето:

  • 20% факторов определяют 80% свойств системы;
  • 80% факторов определяют 20% свойств системы. Следовательно, надо уметь выделять существенные факторы. А

это достигается достаточно глубоким изучением моделируемого объекта и протекающих в нем процессов.

Факторы могут быть количественными и (или) качественными.

Количественные факторы - это те, значения которых числа. Например, интенсивности входных потоков и потоков обслуживания, емкость буфера, число каналов в СМО, доля брака при изготовлении деталей и др.

Качественные факторы - дисциплины обслуживания ( LIFO , FIFO и др.) в СМО, "белая сборка ", "желтая сборка " радиоэлектронной аппаратуры, квалификация персонала и т. п.

Фактор должен быть управляемым. Управляемость фактора - это возможность установки и поддержания значения фактора постоянным или изменяющимся в соответствии с планом эксперимента. Возможны и неуправляемые факторы, например, влияние внешней среды.

К совокупности воздействующих факторов предъявляются два основных требования:

  • совместимость;
  • независимость.

Совместимость факторов означает, что все комбинации значений факторов осуществимы.

Независимость факторов определяет возможность установления значения фактора на любом уровне независимо от уровней других факторов.

В стратегических планах факторы обозначают латинской буквой , где индекс указывает номер (тип) фактора. Встречаются и такие обозначения факторов: и т. д.

Третьей проблемой стратегического планирования является выбор значений каждого фактора, называемых уровнями фактора .

Число уровней может быть два, три и более. Например, если в качестве одного из факторов выступает температура, то уровнями могут быть: 80 o С, 100 o С, 120 o С.

Для удобства и, следовательно, удешевления эксперимента число уровней следует выбирать поменьше, но достаточное для удовлетворения точности и достоверности эксперимента. Минимальное число уровней - два.

С точки зрения удобства планирования эксперимента целесообразно устанавливать одинаковое число уровней у всех факторов. Такое планирование называют симметричным .

Анализ данных эксперимента существенно упрощается, если назначить уровни факторов, равноотстоящие друг от друга. Такой план называется ортогональным . Ортогональность плана обычно достигают так: две крайние точки области изменения фактора выбирают как два уровня, а остальные уровни располагают так, чтобы они делили полученный отрезок на две части.

Например, диапазон питающего напряжения 30…50 В на пять уровней будет разбит так: 30 В, 35 В, 40 В, 45 В, 50 В.

Эксперимент, в котором реализуются все сочетания уровней всех факторов, называется полным факторным экспериментом (ПФЭ).

План ПФЭ предельно информативен, но он может потребовать неприемлемых затрат ресурсов.

Если отвлечься от компьютерной реализации плана эксперимента, то число измерений откликов (реакций) модели при ПФЭ равно:

где - число уровней -го фактора, ; - число факторов эксперимента.

Экспериментом в широком смысле мы называем эмпирическое исследование, организация и проведение которого осуществляется по заранее составленному плану. Отклонение от схемы исследования, предусмотренной планом, могут увести далеко в сторону от решения поставленной задачи.

Грамотно составленный план обеспечивает оптимальные значения показателей валидности, по которым оценивают «качество» проведенного исследования, прежде всего достоверность полученных результатов.

Поэтому, планированию эксперимента в психологии уделяется особое внимание. Планирование эксперимента можно разделить на два этапа - содержательный и формальный:

  • 1) исходя из решаемой проблемы определяется ряд теоретических и экспериментальных положений, которые образуют теоретическую основу исследования (теоретическое обеспечение);
  • 2) формируются теоретические и экспериментальные гипотезы исследования;
  • 3) выбирается необходимый метод эксперимента - полевой, «тренажер», лабораторный;
  • 4) решается вопрос выборки испытуемых;
  • а) состав выборки (гендерный, возрастной, социальный, профессиональный и т.д.);
  • б) объем выборки;
  • в) способ формирования (рандомизированный, попарный, необходимость контрольной группы и т.д.)
  • 2. Задачи формального планирования:
  • 1) достичь возможности сравнения результатов;
  • 2) добиться возможности обсуждения полученных данных;
  • 3) обеспечить экономическое проведение исследования.

Если это не учитывать, то в дальнейшем не возможно будет сравнивать полученные результаты и однозначно их интерпретировать. Эти требования вытекают из особенностей экспериментальных методов вообще и психологически в частности.

Главная цель формального планирования - исключить по возможности максимальное число причин искажения результатов и тем самым минимизировать область ошибок, связанных с данным исследованием.

Необходимым условием успешного формального планирования является предварительный анализ всех возможных факторов экспериментальной ситуации, который начинается еще на этапе содержательного планирования.

Основные вопросы, на которые отвечает экспериментальный план, следующие:

  • 1) Одна или несколько независимых переменных используются в эксперименте;
  • 2) Изменяется ли независимая переменная по величине или остается постоянной;
  • 3) Какие методы контроля требует и допускает экспериментальная ситуация (методы контроля - методы устранения, фиксации или контролирования состояния нерелевантных стимулов);

В методологии экспериментального исследования известны простые и комплексные планы. Все простые планы изучение влияния на процесс одной единственной переменной. Комплексные планы составляются для случая воздействия нескольких переменных.

В подготовке и в планировании эксперимента большую помощь могут оказать пилотажные (предварительные) исследования.

На многие вопросы организации эксперимента нельзя найти ответ ни в литературе, ни в собственном жизненном опыте, ни в соответствующей теории. Только непосредственное пилотажное исследование может показать, например, оптимальные диапазоны необходимых изменений стимулов, степень утомляемости испытуемого в подготовляемом эксперименте, наличие тех или иных нерелевантных стимулов и пр.

Кроме того, в пилотажных исследованиях проверяются составленные экспериментальные планы. Как правело, при этом обнаруживается много поводов для их коррекции.

Не стоит жалеть времени и усилий на составление, проверку и коррекцию экспериментальных планов, потому что в процессе непосредственного проведения эксперимента импровизированные отклонения от установленного плана не приветствуются. Иначе это будет уже совсем другое исследование.(6 стр. 80)

Статистический подход, рассмотренный в предыдущем разделе, можно использовать в любом случае, когда требуется выяснить, отличается ли реально или, во всяком случае, статистически значимо некоторая полученная в эксперименте величина - среднее значение, коэффициент корреляции и т. п. от ее теоретического значения. Нас, скажем, может интересовать, достаточно ли отличается от 0,5 наблюдаемая частота рекомбинаций между двумя генетическими локусами в потомстве от возвратного скрещивания для того, чтобы можно было заключить, что данные локусы лежат в одной и той же хромосоме. Или, например, требуется выяснить, значимо ли статистически наблюдаемое различие между числом образующихся мужских и женских гамет. Далее, может возникнуть необходимость в определении частоты случаев выздоровления после какого-то заболевания - либо при испытании того или иного препарата, либо при сравнении эффективности двух препаратов. Замечательная особенность такого статистического анализа состоит в том, что все виды неизбежной естественной изменчивости, составляющей как бы «фон», на котором проявляется изменчивость, связанная с исследуемым фактором, учитываются в комплексе путем использования соответствующего распределения вероятностей.

Если фоновая изменчивость очень велика, то для получения окончательных результатов может потребоваться очень большое число наблюдений, а когда она сравнительно мала, результат будет получен значительно быстрее.

Если какой-либо эффект вызывается очень большим числом различных факторов, то вполне возможно, что фоновая изменчивость будет весьма велика. В таких случаях целесообразно попытаться выделить некоторые из этих факторов, даже если их невозможно полностью контролировать или исключить. Часто оказывается возможным разбить общую изменчивость на отдельные компоненты, из которых один соответствует исследуемому фактору, несколько других - другим воздействиям, допускающим возможность раздельной оценки, и последний - остальным воздействиям, раздельная оценка которых невозможна. Поскольку влияние последней группы факторов, безусловно, будет слабее, чем влияние исследуемого фактора, то это обеспечивает более точную статистическую проверку. Искусство располагать наблюдения в определенном порядке или проводить специально спланированные проверки с целью полного использования возможностей этих методов и составляет содержание предмета «планирование эксперимента». Детальное изложение существующих методов планирования эксперимента можно найти в литературе (см., например, ). В настоящем разделе мы осветим лишь некоторые основные преимущества сознательного и продуманного планирования эксперимента.

Допустим, например, что требуется сравнить болеутоляющее действие двух различных лекарственных препаратов А и В. Пусть подобрано 16 больных и принято решение разделить их случайным образом (во избежание какой-либо сознательно или непроизвольно вносимой систематической ошибки) на две группы, по 8 больных в каждой. Одна группа получает препарат А, а другая - препарат В. Затем измеряют время, в течение которого каждый из больных испытывает облегчение, и сравнивают средние значения по обеим группам. Если среднее время для препарата А значимо превышает среднее время для препарата В, то можно сделать вывод, что первый препарат более эффективен. (В данном случае несущественно, какой статистический критерий используется. Поскольку рассматривается небольшое число объектов, это может быть один из критериев Стьюдента.) Известно, что больные по-разному реагируют на один и тот же лекарственный препарат, поэтому продолжительность периода облегчения обычно сильно варьирует, что значительно понижает точность сравнения этих двух препаратов.

Однако в данном эксперименте различия между больными не представляют для нас особого интереса, и этот источник погрешности можно исключить следующим образом. Вместо того чтобы делить больных на две группы, проверяют на каждом из них оба препарата, назначая их последовательно через достаточно большие промежутки времени (чтобы избежать взаимодействия) и в случайном порядке (или, возможно, в одном порядке для одной половины больных и в другом порядке для другой). Теперь для каждого больного определяют относительное преимущество препарата А перед препаратом В, для чего вычисляют суммарную продолжительность периода облегчения для каждого из них и находят разность этих двух величин. Таким образом получают 16 чисел, характеризующих относительное преимущество одного препарата перед другим, что позволяет проверить, значимо ли отличается от нуля их среднее значение. Положительная разность свидетельствует о статистически значимом преимуществе препарата А, отрицательная - об обратном соотношении. Рассматривая показатели относительного преимущества, мы исключаем влияние реакции отдельных больных и в общем случае добиваемся более эффективного сравнения этих двух лекарств.

Такая простая проверка методом попарного сравнения представляет собой простейший план эксперимента, имеющий целью извлечь максимальное количество информации из данного числа наблюдений. Заметим, что этот план имеет и свои дополнительные особенности, так как требует особого внимания к ряду практических вопросов, например к тому, чтобы препараты назначались в случайном порядке (во избежание нежелательной систематической ошибки) и через достаточно большие промежутки времени (для исключения эффектов взаимодействия); однако здесь мы не можем детально рассматривать эти вопросы.

Мы показали, каким образом при проверке методом попарного сравнения можно контролировать или исключать из рассмотрения какой-либо один важный и явный источник изменчивости. В более общем случае могут быть спланированы факторные эксперименты, с помощью которых можно определить вклад каждого из нескольких факторов в общую изменчивость. Некоторые из этих факторов могут представлять особый интерес, тогда как другие имеют второстепенное значение. Идея и практическое применение этого нового подхода, принадлежащего главным образом Р. Фишеру, получили широкое распространение после появления его книги «Планирование экспериментов», вышедшей первым изданием в 1935 г. Большинство фундаментальных работ в области планирования эксперимента было посвящено сельскохозяйственным приложениям.

Допустим, требуется сравнить среднюю урожайность нескольких сортов пшеницы при применении различных удобрений в различной концентрации, учитывая при этом колебания в плодородии почвы на достаточно больших участках земли, которые можно разбить на делянки подходящих размеров. Для начала можно попытаться составить план эксперимента, в котором будут рассматриваться все возможные комбинации значений, или уровней, различных факторов. Так, если имеются четыре сорта пшеницы и три различных вида удобрений, применяемых в трех различных концентрациях, то общее число комбинаций условий будет равно 36. Таким образом, исходное число делянок в одном блоке факторного эксперимента будет равно 36 - по одной делянке на каждую комбинацию условий. Вследствие возможного колебания в плодородии почвы от одного блока к другому может оказаться целесообразным иметь не менее двух полных блоков.

Применение факторного плана вместо классической схемы, согласно которой каждый раз изменяется только один фактор, имеет ряд серьезных и даже несколько неожиданных преимуществ. Прежде всего в этом случае становится значительно более полной картина влияния каждого фактора, поскольку оно изучается в самых различных условиях (вследствие одновременного изменения других факторов). Во-вторых, большое число комбинаций факторов, используемых в эксперименте, облегчает предсказание результатов, которые могут быть достигнуты при определенной комбинации условий. В-третьих, если эффекты, вызываемые каждым фактором, включаемым в эксперимент, статистически независимы, то о каждом факторе можно получить не меньше информации, чем если бы в процессе эксперимента изменялся только один этот фактор, а остальные оставались постоянными. В-четвертых, если (как это часто бывает) различные факторы не являются независимыми, а вызывают эффекты, которые в большей или меньшей степени коррелированы, то в этом случае только факторный эксперимент может дать информацию о характере этих взаимодействий. При наличии нескольких взаимосвязанных существенных факторов обойтись без постановки факторного эксперимента невозможно. Для ряда часто встречающихся специальных задач разработано большое число стандартных планов такого типа.

Согласно некоторым из этих простейших планов, эксперимент проводят на нескольких блоках и внутри каждого из них на отдельных делянках проверяют влияние всех уровней какого-то одного фактора. При правильном планировании получают рандомизированный блочный план. В сельскохозяйственных задачах блоками могут служить участки земли на различных полях, а уровнями одного фактора - ступенчатая последовательность концентраций удобрений или просто различные сорта пшеницы.

В лабораторном эксперименте, в котором, скажем, проверяется влияние различных рационов питания на крыс, рационы питания будут испытываемыми условиями, а крысы - отдельными экспериментальными единицами (соответствующими делянкам в сельскохозяйственном эксперименте). Если бы мы могли использовать в эксперименте животных отдельных пометов, подвергая каждому воздействию по одному животному из каждого помета, то каждый помет можно было бы рассматривать как отдельный блок.

В рассмотренной выше простой проверке методом попарного сравнения также можно было бы применить рандомизированный блочный план; тогда каждого больного можно было бы рассматривать как отдельный блок, а лекарственные препараты - как условия эксперимента.

Хотя иногда бывает трудно перенести планы экспериментов, разработанные для одной области, особенно для сельского хозяйства, в совершенно другую область, лежащая в их основе логическая схема часто оказывается весьма сходной. Поэтому целесообразно тщательно обдумать возможность того, чтобы при надлежащей интерпретации элементов какого-либо определенного плана эксперимента можно было обеспечить его успешное применение в задачах совершенно иного характера. Это иллюстрирует большие возможности математических методов планирования эксперимента. В основе планирования должна, разумеется, лежать некоторая исходная математическая модель. Опишем самую простую из них, которая в том или ином варианте используется наиболее широко. Пусть требуется исследовать влияние только двух факторов А и В. Допустим, что наблюдаемое на некоторой экспериментальной единице влияние уровня фактора А и уровня фактора В можно записать в виде

где - наблюдаемая величина, - общее среднее, - относительные вклады этих двух факторов при заданных уровнях каждого из них, - случайное изменение, налагаемое на основную линейную аддитивную схему. Кроме того, часто принимается, что все величины имеют одно и то же нормальное распределение и независимы друг от друга. Эти ограничения весьма серьезны, однако часто принятие их в качестве первого приближения вполне оправданно. Так, если влияние этих факторов мало, то заметную величину будут иметь только линейные члены и возможными членами второго порядка можно пренебречь. При независимости факторов формула (2.4) вполне удовлетворительна. Но если они взаимодействуют друг с другом, то следует включить в нее дополнительные члены с, учитывающие это взаимодействие.

Можно, однако, выполнить проверку значимости на основе формулы (2.4), чтобы убедиться, нужны ли члены, характеризующие взаимодействие. Кроме того, если случайные величины не распределены по нормальному закону, то можно использовать какую-либо функцию эмпирических результатов (например, квадратные корни или логарифмы), для которой сохраняется нормальный закон распределения.

На основе элементарной формулы (2.4) легко построить модели, учитывающие множество факторов, блоков, взаимодействий и других усложнений, вызываемых практической необходимостью в каждом данном эксперименте. Дело в том, что в очень многих случаях необходимые вычисления относительно просты и выполняются непосредственно. Обычно приходится производить повторяющиеся вычисления сумм и сумм квадратов данных, выбранных соответствующим образом. Результаты представляют в виде таблицы дисперсионного анализа, с помощью которой можно установить значимость всех различных факторов, влияющих на результаты эксперимента.

Одним из современных вариантов планирования экспериментов, который следует рассмотреть особо, является последовательностная схема эксперимента. В эксперименте стандартного типа необходимо заранее решить, сколько наблюдений нужно набрать. Если после анализа обнаружится, что число наблюдений слишком мало, то нужно попытаться продолжить эксперимент, однако может оказаться, что на данном этапе сделать это трудно или невозможно. Если же выяснится, что получено значительно больше наблюдений, чем необходимо для достижения требуемой точности, то будут потеряны время и деньги. В медицинских задачах это имеет особенно существенное значение. Ни один врач не заинтересован в том, чтобы эксперимент длился дольше, чем это строго необходимо, так как его цель - дать своим больным наилучший из существующих препаратов, как только он пройдет клинические испытания. Таким образом, в медицине выбор и планирование эксперимента теснейшим образом связаны с этическими соображениями. Последовательностная схема предусматривает проведение эксперимента отдельными сериями. Оценка результатов производится на каждом этапе, с тем чтобы немедленно можно было решить, применять препарат А, препарат В или же продолжать эксперимент, поскольку окончательного вывода сделать еще нельзя. При такой схеме эксперимента длительность его будет минимальна и он закончится значительно раньше, чем в любом другом случае. Кроме того, в медицине часто бывает очень трудно или даже вообще невозможно провести обычную экспериментальную проверку, так как после нескольких неудачных исходов, которые могут закончиться смертью больного, начинаются острые споры о том, следует ли продолжать эксперимент вообще.

Последовательностная схема означает, что заранее можно тщательно и спокойно рассмотреть различные линии поведения, обусловливаемые различными исходами эксперимента. При этом значительно легче выбрать наилучшие решения непосредственно в ходе эксперимента и совместить требования этики со статистической эффективностью. Более детально методы последовательностного анализа в медицине рассмотрены в книге Эрмитажа .

Недостаток места не позволяет продолжать здесь изложение теории планирования эксперимента, тем более что этому предмету посвящена уже огромная литература г. Наша основная цель состояла в том, чтобы показать, каким образом с помощью простой математической модели процесса, на который одновременно воздействуют несколько факторов (носящих, возможно, в значительной мере вероятностный характер), можно с достаточной точностью выяснить степень влияния каждого из этих факторов в отдельности. Это позволяет применять для проверки значимости влияния крайне изменчивых и одновременно действующих факторов простые статистические критерии, описанные в разд. 2.2. А именно такой подход и необходим для исследования всего огромного многообразия явлений, встречающихся в биологии и медицине.


Транскрипт

1 Министерство образования Российской Федерации ВОСТОЧНОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра Метрология, стандартизация и сертификация ОСНОВЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА Методическое пособие для студентов специальностей «Метрология и метрологическое обеспечение» и «Стандартизация и сертификация (по отраслям пищевой промышленности)» Составитель: Хамханов К.М. УланУдэ, 00г.

2 СОДЕРЖАНИЕ Введение... Основные определения.. Параметры оптимизации.... Требования к параметру оптимизации.. Задачи с несколькими выходными параметрами 3. Обобщенный параметр оптимизации. 3.. Простейшие способы построения обобщенного отклика. 3.. Шкала желательности 3.3. Обобщенная функция желательности.. 4. Факторы Характеристика факторов. 4.. Требования к факторам Выбор уровней варьирования факторов и нулевой точки. 5. Выбор моделей.. 6. Полный факторный эксперимент 6.. Полный факторный эксперимент типа k 6.. Свойства полного факторного эксперимента типа k Расчет коэффициентов регрессии. 7. Дробный факторный эксперимент Минимизация числа опытов Дробная реплика Выбор полуреплик. Генерирующие соотношения и определяющие контрасты 8. Ошибки измерений критериев оптимизации и факторов Рандомизация.. 9. Отсеивающие эксперименты 9.. Априорное ранжирование факторов (психологический эксперимент) 9.. Метод случайного баланса Неполноблочные планы (учет качественных факторов и экспертные оценки) 0. Пример планирования эксперимента Выбор факторов 0.. Проведение эксперимента 0.3. Полный факторный эксперимент 0.4. Поиск оптимума методом крутого восхождения 0.5. Описание области оптимума 0.6. Построение графических зависимостей Приложения.. 88

3 ВВЕДЕНИЕ Традиционные методы исследований связаны с экспериментами, которые требуют больших затрат, сил и средств, т.к. являются «пассивными» основаны на поочередном варьировании отдельных независимых переменных в условиях, когда остальные стремятся сохранить неизменными. Эксперименты, как правило, являются многофакторными и связаны с оптимизацией качества материалов, отысканием оптимальных условий проведения технологических процессов, разработкой наиболее рациональных конструкций оборудования и т.д. Системы, которые служат объектом таких исследований, очень часто являются такими сложными, что не поддаются теоретическому изучению в разумные сроки. Поэтому, несмотря на значительный объем выполненных научноисследовательских работ, изза отсутствия реальной возможности достаточно полно изучить значительное число объектов исследования, как следствие, многие решения принимаются на основании информации, имеющей случайный характер, и поэтому далеки от оптимальных. Исходя из выше изложенного возникает необходимость поиска пути, позволяющего вести исследовательскую работу ускоренными темпами и обеспечивающим принятие решений, близких к оптимальным. Этим путем и явились статистические методы планирования эксперимента, предложенные английским статистиком Рональдом Фишером (конец двадцатых годов). Он впервые показал целесообразность одновременного варьирования всеми факторами в противовес широко распространенному однофакторному эксперименту . В начале шестидесятых годов появилось новое направление в планировании эксперимента, связанное с оптимизацией процессов планирование экстремального эксперимента. Первая работа в этой области была опубликована в 95 г. Боксом и Уилсоном в Англии . Идея БоксаУилсона крайне проста. Экспериментатору предлагается ставить последовательные небольшие серии опытов, в каждой из которых одновременно варьируются по определенным правилам все факторы. Серии организуются таким образом, чтобы после математической обработки предыдущей можно было выбрать условия проведения (т.е. спланировать) следующую серию. Так последовательно, шаг за шагом, достигается область оптимума. Применение планирования эксперимента делает поведение экспериментатора целенаправленным и организованным, существенно способствует повышению производительности труда и надежности полученных результатов. Важным достоинством является его универсальность, пригодность в огромном большинстве областей исследований. В нашей стране планирование эксперимента развивается с 960 г. под руководством В.В.Налимова. Однако даже простая процедура планирования весьма коварна, что обусловлено рядом причин, таких как неверное применение методов планирования, выбор не самого оптимального пути исследования, недостаточность практического опыта, недостаточная математическая подготовленность экспериментатора и т.д. Цель данной работы ознакомление читателей с наиболее часто применяемыми и простыми методами планирования эксперимента, выработка навыков практического применения. Более подробно рассмотрена задача оптимизации процессов.

4 . ОСНОВНЫЕ ОПРЕДЕЛЕНИЯ Планирование эксперимента, как и всякий раздел науки, имеет свою терминологию. Для удобства понимания рассмотрим наиболее общие термины. Эксперимент целенаправленное воздействие на объект исследования с целью получения достоверной информации. Большинство научных исследований связано с экспериментом. Он проводится на производстве, в лабораториях, на опытных полях и участках, в клиниках и т.д. Эксперимент может быть физическим, психологическим или модельным. Он может непосредственно проводиться на объекте или на его модели. Модель обычно отличается от объекта масштабом, а иногда природой. Главное требование к модели достаточно точное описание объекта. В последнее время наряду с физическими моделями все большее распространение получают абстрактные математические модели. К слову, планирование эксперимента напрямую связано с разработкой и исследованием математической модели объекта исследования. Планирование эксперимента это процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью. Здесь существенно следующее: стремление к минимизации общего числа опытов; одновременное варьирование всеми переменными, определяющими процесс, по специальным правилам алгоритмам; использование математического аппарата, формализующего многие действия экспериментатора; выбор четкой стратегии, позволяющей принимать обоснованные решения после каждой серии экспериментов. Задачи, для решения которых может использоваться планирование эксперимента, чрезвычайно разнообразны. К ним относятся: поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей, выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений, исследование диаграмм состав свойство и т.д. Поиск оптимальных условий является одной из наиболее распространенных научнотехнических задач. Они возникают в тот момент, когда установлена возможность проведения процесса и необходимо найти наилучшие (оптимальные) условия его реализации. Такие задачи называются задачами оптимизации. Процесс их решения называется процессом оптимизации или просто оптимизацией. Выбор оптимального состава многокомпонентных смесей и сплавов, повышение производительности действующих установок, повышение качества продукции, снижение затрат на ее получение вот примеры задач оптимизации. Далее следует понятие объект исследования. Для его описания удобно пользоваться представлением о кибернетической системе, которая схематически изображена на рис... Иногда такую схему называют «черным ящиком». Стрелки справа изображают численные характеристики целей исследования. Мы их обозначаем буквой игрек (у) и называем параметрами оптимизации. В литературе встречаются другие названия: критерий оптимизации, целевая функция, выход «черного ящика» и т.д. Для проведения эксперимента необходимо иметь возможность воздействовать на наведение «черного ящика». Все способы такого воздействия мы обозначаем буквой икс (х) и называем факторами. Их называют также входами «черного ящика». 88

5 х y х y х k Рис... При решении задачи будем использовать математические модели исследования. Под математической моделью мы понимаем уравнение, связывающее параметр оптимизации с факторами. Это уравнение в общем виде можно записать так: у = ϕ(х, х,..., х), k где символ ϕ (), как обычно в математике, заменяет слова: «функция от». Такая функция называется функцией отклика. Каждый фактор может принимать в опыте одно из нескольких значений. Эти значения называются уровнями. Для облегчения построения «черного ящика» и эксперимента фактор должен иметь определенное число дискретных уровней. Фиксированный набор уровней факторов определяет одно из возможных состояний «черного ящика». Одновременно это есть условие проведения одного из возможных опытов. Если перебрать все возможные наборы состояний, то получается множество различных состояний «черного ящика». Одновременно это будет число возможных различных опытов. Число возможных опытов определяют по выражению = где число опытов; р число уровней; k число факторов. Реальные объекты обычно обладают огромной сложностью. Так, на первый взгляд, простая система с пятью факторами на пяти уровнях имеет 35 состояний, а для десяти факторов на четырех уровнях их уже свыше миллиона. В этих случаях выполнение всех опытов практически невозможно. Возникает вопрос: сколько и каких опытов нужно включить в эксперимент, чтобы решить поставленную задачу? Здесьто и применяется планирование эксперимента. Выполнение исследований посредством планирования эксперимента требует выполнение некоторых требований. Основными из них являются условия воспроизводимости результатов эксперимента и управляемость эксперимента. Если повторить некоторые опыты через неравные промежутки времени и сравнить результаты, в нашем случае значения параметра оптимизации, то разброс их значений характеризует воспроизводимость результатов. Если он не превышает некоторой заданной величины, то объект удовлетворяет требованию воспроизводимости результатов. Здесь мы будем рассматривать только такие объекты, где это условие выполняется. Планирование эксперимента предполагает активное вмешательство в процесс и возможность выбора в каждом опыте тех уровней факторов, которые представляют интерес. Поэтому такой эксперимент называют активным. Объект, на котором возможен активный эксперимент, называется управляемым. На практике нет абсолютно управляемых объектов, т.к. на них действуют как p k, y m

6 управляемые, так и неуправляемые факторы. Неуправляемые факторы влияют на воспроизводимость эксперимента и является причиной ее нарушения. В этих случаях приходится переходить к другим методам исследования. 88. ПАРАМЕТРЫ ОПТИМИЗАЦИИ Выбор параметров оптимизации (критериев оптимизации) является одним из главных этапов работы на стадии предварительного изучения объекта исследования, т.к. правильная постановка задачи зависит от правильности выбора параметра оптимизации, являющегося функцией цели. Под параметром оптимизации понимают характеристику цели, заданную количественно. Параметр оптимизации является реакцией (откликом) на воздействие факторов, которые определяют поведение выбранной системы. Реальные объекты или процессы, как правило, очень сложны. Они часто требуют одновременного учета нескольких, иногда очень многих, параметров. Каждый объект может характеризоваться всей совокупностью параметров, или любым подмножеством этой совокупности, или одним единственным параметром оптимизации. В последнем случае прочие характеристики процесса уже не выступают в качестве параметра оптимизации, а служат ограничениями. Другой путь построение обобщенного параметра оптимизации как некоторой функции от множества исходных... ТРЕБОВАНИЯ К ПАРАМЕТРУ ОПТИМИЗАЦИИ Параметр оптимизации это признак, по которому оптимизируется процесс. Он должен быть количественным, задаваться числом. Множество значений, которые может принимать параметр оптимизации, называется областью его определения. Области определения могут быть непрерывными и дискретными, ограниченными и неограниченными. Например, выход реакции это параметр оптимизации с непрерывной ограниченной областью определения. Он может изменяться в интервале от 0 до 00%. Число бракованных изделий, число зерен на шлифе сплава, число кровяных телец в пробе крови вот примеры параметров с дискретной областью определения, ограниченной снизу. Количественная оценка параметра оптимизации на практике не всегда возможна. В таких случаях пользуются приемом, называемым ранжированием. При этом параметрам оптимизации присваиваются оценки ранги по заранее выбранной шкале: двухбалльной, пятибалльной и т.д. Ранговый параметр имеет дискретную ограниченную область определения. В простейшем случае область содержит два значения (да, нет; хорошо, плохо). Это может соответствовать, например, годной продукции и браку. Итак, первое требование: параметр оптимизации должен быть количественным. Второе требование: параметр оптимизации должен выражаться одним числом. Иногда это получается естественно, как регистрация показания прибора. Например, скорость движения машины определяется числом на спидометре. Часто приходится проводить некоторые вычисления. Так бывает при расчете выхода реакции. В химии часто требуется получать продукт с заданным отношением компонентов, например, А:В=3:. Один из возможных вариантов решения подобных задач состоит в том, чтобы выразить отношение одним числом (,5) и в качестве параметра оптимизации пользоваться значением отклонений (или квадратов отклонений) от этого числа. Третье требование, связанное с количественной природой параметра оптимизации однозначность в статистическом смысле. Заданному набору значений факторов должно соответствовать одно значение параметра оптимизации, при этом обратное неверно: одному и тому же значению параметра могут соответствовать разные наборы значений факторов. Четвертым, наиболее важным требованием, требованием к параметрам оптимизации является его возможность действительно эффективной оценки функционирования системы. Представление об объекте не остается постоянным в ходе исследования. Оно

7 меняется по мере накопления информации и в зависимости от достигнутых результатов. Это приводит к последовательному подходу при выборе параметра оптимизации. Так, например, на первых стадиях исследования технологических процессов в качестве параметра оптимизации часто используется выход продукта. Однако в дальнейшем, когда возможность повышения выхода исчерпан, начинают интересоваться такими параметрами, как себестоимость, чистота продукта и т.д. Оценка эффективности функционирования системы может осуществляться как для всей системы в целом, так и оценкой эффективности ряда подсистем, составляющих данную систему. Но при этом необходимо учитывать возможность того, что оптимальность каждой из подсистем по своему параметру оптимизации «не исключает возможность гибели системы в целом». Это означает, что попытка добиться оптимума с учетом некоторого локального или промежуточного параметра оптимизации может оказаться неэффективной или даже привести к браку. Пятое требование к параметру оптимизации требование универсальности или полноты. Под универсальностью параметра оптимизации понимают его способность всесторонне охарактеризовать объект. В частности, технологические параметры недостаточно универсальны: они не учитывают экономику. Универсальностью обладают, например, обобщенные параметры оптимизации, которые строятся как функции от нескольких частных параметров. Шестое требование: желательно, чтобы параметр оптимизации имел физический смысл, был простым и легко вычисляем. Требование физического смысла связано с последующей интерпретацией результатов эксперимента. Не представляет труда объяснить, что значит максимум извлечения, максимум содержания ценного компонента. Эти и подобные им технологические параметры оптимизации имеют ясный физический смысл, но иногда для них может не выполняться, например, требование статистической эффективности. Тогда рекомендуется переходить к преобразованию параметра оптимизации. Преобразование, например типа аrcsn у, может сделать параметр оптимизации статистически эффективными (например, дисперсии становятся однородными), но остается неясным: что же значит достигнуть экстремума этой величины? Второе требование, т.е. простота и легко вычисляемость, также весьма существенны. Для процессов разделения термодинамические параметры оптимизации более универсальны. Однако на практике ими пользуются мало: их расчет довольно труден. Из приведенных двух требований первое является более существенным, потому что часто удается найти идеальную характеристику системы и сравнить ее с реальной характеристикой... ЗАДАЧИ С НЕСКОЛЬКИМИ ВЫХОДНЫМИ ПАРАМЕТРАМИ Задачи с одним выходным параметром имеют очевидные преимущества. Но на практике чаще всего приходится учитывать несколько выходных параметров. Иногда их число довольно велико. Так, например, при производстве резиновых и пластмассовых изделий приходится учитывать физикомеханические, технологические, экономические, художественноэстетические и другие параметры. Математические модели можно построить для каждого из параметров, но одновременно оптимизировать несколько функций невозможно. Обычно оптимизируется одна функция, наиболее важная с точки зрения исследования, при ограничениях, налагаемых другими функциями. Поэтому из многих выходных параметров выбирается один в качестве параметра оптимизации, а остальные служат ограничениями. Всегда полезно исследовать возможность уменьшения числа выходных параметров. Для этого можно воспользоваться корреляционным анализом.

8 При этом между всевозможными парами параметров необходимо вычислить коэффициент парной корреляции, который является общепринятой в математической статистике характеристикой связи между двумя случайными величинами. Если обозначить один параметр через у, а другой через у, и число опытов, в которых они будут измеряться, через так, что u=, где u текущий номер опыта, то коэффициент парной корреляции r вычисляется по формуле 88 Здесь r y y y = u= (у y)(y y) u (у y) (y y) u u= u= u u u = и y = u= y средние арифметические соответственно для у и у. Значения коэффициента парной корреляции могут лежать в пределах от до. Если с ростом значения одного параметра возрастает значение другого, у коэффициента будет знак плюс, а если уменьшается, то минус. Чем ближе найденное значение r y y к единице, тем сильнее значение одного параметра зависит от того, какое значение принимает другой, т.е. между такими параметрами существует линейная связь, и при изучении процесса можно рассматривать только один из них. Необходимо помнить, что коэффициент парной корреляции как мера тесноты связи имеет четкий математический смысл только при линейной зависимости между параметрами и в случае их нормального распределения. Для проверки значимости коэффициента парной корреляции нужно сравнить его значение с табличным (критическим) значением r, которое приведено в прил. 6. Для пользования этой таблицей нужно знать число степеней свободы f = и выбрать определенный уровень значимости, например, равный 0,05. Такое значение уровня значимости соответствует вероятности верного ответа при проверке гипотезы p = a = 0,05 = 0,95, или 95%. Это значит, что в среднем только в 5% случаев возможна ошибка при проверке гипотезы. Если экспериментально найденное значение r больше или равно критическому, то гипотеза о корреляционной линейной связи подтверждается, а если меньше, то нет оснований считать, что имеется тесная линейная связь между параметрами. При высокой значимости коэффициента корреляции любой из двух анализируемых параметров можно исключить из рассмотрения как не содержащий дополнительной информации об объекте исследования. Исключить можно тот параметр, который труднее измерить, или тот, физический смысл которого менее ясен. u= y 3. ОБОБЩЕННЫЙ ПАРАМЕТР ОПТИМИЗАЦИИ Путь к единому параметру оптимизации часто лежит через обобщение. Уже указывалось, что из многих откликов, определяющих объект, трудно выбрать один, самый важный. Если же это возможно, то попадают в ситуацию, описанную в предыдущей главе. В этой главе рассматриваются более сложные ситуации, где необходимо множество откликов обобщать в единый количественный признак. С таким обобщением связан ряд трудностей. Каждый отклик имеет свой физический смысл и свою размерность. Чтобы объединить различные отклики, прежде всего приходится ввести для каждого из них некоторую безразмерную шкалу. Шкала должна быть однотипной для всех объединяемых откликов u.

9 это делает их сравнимыми. Выбор шкалы не простая задача, зависящая от априорной информации об откликах, а также от той точности, с которой определяется обобщенный признак. После построения для каждого отклика безразмерной шкалы, возникает следующая трудность выбор правила комбинирования исходных частных откликов в обобщенный показатель. Единого правила не существует. Здесь можно идти различными путями, и выбор пути неформализован. Рассмотрим несколько способов построения обобщенного показателя. 3.. ПРОСТЕЙШИЕ СПОСОБЫ ПОСТРОЕНИЯ ОБОБЩЕННОГО ОТКЛИКА Пусть исследуемый объект характеризуют n частных откликов у u (u,..., n) = и каждый из этих откликов измеряется в опытах. Тогда у u это значение uго отклика в ом опыте (=,...,). Каждый из откликов у u имеет свой физический смысл и, чаще всего, разную размерность. Введем простейшее преобразование: набор данных для каждого поставим в соответствие с самым простым стандартным аналогом шкалой, на которой имеется только два значения: 0 брак, неудовлетворительное качество, годный продукт, удовлетворительное качество. Стандартизовав таким образом шкалу частных откликов приступаем ко второму этапу их обобщению. В ситуации, когда каждый преобразованный частный отклик принимает только два значения 0 и, желательно чтобы и обобщенный отклик принимал одно из этих двух возможных значений, причем так, чтобы значение имело место, если все частные отклики в этом опыте приняли значение. А если хотя бы один из откликов обратился в 0, то и обобщенный отклик будет нулем. При таких рассуждениях для построения обобщенного отклика удобно воспользоваться формулой где Y обобщенный отклик в Iом опыте; n u= Y = n n y u u= y y,..., y,. произведение частных откликов n Корень введен для того, чтобы связать эту формулу с другой, более сложной, которая будет рассмотрена далее. В данном случае ничего не изменится, если написать n Y = y u. Недостаток этого подхода его грубость и жесткость. Рассмотрим другой способ получения обобщенного отклика, который может применяться в тех случаях, когда для каждого из частных откликов известен «идеал», к которому нужно стремиться. Существует много способов введения метрики, задающей «близость к идеалу». Здесь понятие «ввести метрику» значит указать правило определения расстояния между любыми парами объектов из интересующего нас множества. u= Дополним предыдущее обозначение еще одним:, у uо у u наилучшее («идеальное») значение uго отклика. Тогда уu у uо можно рассматривать как некоторую меру близости к идеалу. Однако использовать разность при построении обобщенного отклика невозможно по двум причинам. Она имеет размерность соответствующего отклика, а у каждого из откликов может быть своя размерность, что препятствует их объединению. Отрицательный или

10 положительный знак разности также создает неудобство. Чтобы перейти к безразмерным значениям, достаточно разность поделить на желаемое значение: 88 у u у у Если в некотором опыте все частные отклики совпадут с идеалом, то Y станет равным нулю. Это и есть то значение, к которому нужно стремиться. Чем ближе нулю, тем лучше. Здесь необходимо условиться о том, что считать нижней границей, если верхняя равна нулю. Среди недостатков такой оценки выделяется нивелировка частных откликов. Все они входят в обобщенный отклик на равных правах. На практике же различные показатели бывают далеко неравноправны. Устранить этот недостаток можно введением некоторого веса а u причем u u= a = и > 0 a. u Y uо у uо u a u u= уuо = Чтобы проранжировать отклики по степени важности и найти соответствующие веса, можно воспользоваться экспертными оценками. Мы рассмотрели простейшие способы построения обобщенного показателя. Для перехода и более сложным способам нужно научиться фиксировать более тонкие различия на шкале преобразования откликов. Здесь в основном приходится опираться на опыт экспериментатора. Но, чтобы этот опыт разумно употребить в рамках формальных процедур, его тоже нужно формализовать. Наиболее естественный путь такой формализации введение системы предпочтений экспериментатора на множестве значений каждого частного отклика, получение стандартной шкалы и затем обобщение результатов. Пользуясь системой предпочтений можно получить более содержательную шкалу вместо шкалы классификации с двумя классами. Пример построения такой шкалы рассмотрен в следующем подразделе.. у uо 3.. ШКАЛА ЖЕЛАТЕЛЬНОСТИ Одним из наиболее удобных способов построения обобщенного отклика является обобщенная функция желательности Харрингтона. В основе построения этой обобщенной функции лежит идея преобразования натуральных значений частных откликов в безразмерную шкалу желательности или предпочтительности. Шкала желательности относится к психофизическим шкалам. Ее назначение установление соответствия между физическими и психологическими параметрами. Здесь под физическими параметрами понимаются всевозможные отклики, характеризующие функционирование исследуемого объекта. Среди них могут быть эстетические и даже статистические параметры, а под психологическими параметрами понимаются чисто субъективные оценки экспериментатора желательности того или иного значения отклика. Чтобы получить шкалу желательности, удобно пользоваться готовыми таблицами соответствии между отношениями предпочтения в эмпирической и числовой системах (табл. 3..). Таблица 3. Стандартные отметки на шкале желательности Желательность Отметки на шкале желательности Очень хорошо,000,80,

11 Хорошо 0,800,63 Удовлетворительно 0,630,37 Плохо 0,370,0 Очень плохо 0,00,00 В табл. 3.. представлены числа, соответствующие некоторым точкам кривой (рис. 3.), e y которая задается уравнением d = e или d = exp[ exp(y)], где ехр принятое обозначение экспоненты. d Функция желательности 0, Рис. 3.. На оси ординат нанесены значения желательности, изменяющиеся от 0 до. По оси абсцисс указаны значения отклика, записанные в условном масштабе. За начало отсчета 0 по этой оси выбрано значение, соответствующее желательности 0,37. Выбор именно этой точки связано с тем, что она является точкой перегиба кривой, что в свою очередь создает определенные удобства при вычислениях. Кривую желательности обычно используют как номограмму. Пример. Пусть среди откликов будет выход реакции у, естественные границы которого заключены между 0% и 00%. Предположим, что 00% соответствует на шкале желательности единице, а 0% нулю, тогда на оси абсцисс получаем две точки: 0 и 00 (рис. 3.). Выбор других точек зависит от ряда обстоятельства, таких, как сложившаяся в начальный момент ситуация, требования к результату, возможности экспериментатора. В данном случае область хороших результатов (0,80 0,63 по шкале желательности) заключены в границы 5055%. 50% дает нижнюю границу. Пример. Другая картина получается, когда речь идет о синтезе нового вещества, которого до сих пор не удавалось получать в количествах, достаточных для идентификации. При выходе менее % нет способа идентифицировать продукт. Любой выход выше 0% превосходен (рис.3.). Здесь выход продукции обозначен через у. В наших примерах рассмотрены одинаковые отклики выхода реакции с границами измерения от 0% до 00%. Однако, это не всегда бывает так. Стоит включить такие отклики, как качество материала, и границы станут неопределенными. В этих случаях устанавливаются границы допустимых значений для частных откликов, причем ограничения могут быть односторонними в виде y y у y. Здесь надо иметь ввиду то, что у у,% у,% у u mn и двусторонними в виде mn u max ymn соответствует отметке на шкале желательности

12 d u = 0,37, а значение max исследователя. y устанавливается на основании опыта и ситуации 3.3. ОБОБЩЕННАЯ ФУНКЦИЯ ЖЕЛАТЕЛЬНОСТИ После выбора шкалы желательности и преобразования частных откликов в частные функции желательности приступают к построению обобщенной функции желательности. Обобщают по формуле n D = n d u u= где D обобщенная желательность; d u частные желательности. Способ задания обобщенной функции желательности таков, что если хотя бы одна желательность d u = 0, то обобщенная функция будет равна нулю. С другой стороны D= только тогда, когда d u =. Обобщенная функция весьма чувствительна к малым значениям частных желательностей. Пример: при установлении пригодности материала с данным набором свойств для использования его в заданных условиях если хотя бы один частный отклик не удовлетворяет требованиям, то материал считается непригодным. Например, если при определенных температурах материал становится хрупким и разрушается, то как бы ни были хороши другие свойства, этот материал не может быть применим по назначению. Способ задания базовых отметок шкалы желательности, представленный в табл.3., один и тот же как и для частных, так и для обобщенных желательностей. Обобщенная функция желательности является некоторым абстрактным построением, но она обладает такими важными свойствами, как адекватность, статистическая чувствительность, эффективность, причем эти свойства не ниже, чем таковые для любого технологического показателя, им соответствующего. Обобщенная функция желательности является количественным, однозначным, единым и универсальным показателем качества исследуемого объекта и обладая такими свойствами, как адекватность, эффективность, статистическая чувствительность, и поэтому может использоваться в качестве критерия оптимизации. 4. ФАКТОРЫ После выбора объекта исследования и параметра оптимизации нужно рассмотреть все факторы, которые могут влиять на процесс. Если какойлибо существенный фактор окажется неучтенным и принимал произвольные значения, не контролируемые экспериментатором, то это значительно увеличит ошибку опыта. При поддержании этого фактора на определенном уровне может быть получено ложное представление об оптимуме, т.к. нет гарантии, что полученный уровень является оптимальным. С другой стороны большое число факторов увеличивает число опытов и размерность факторного пространства. В разделе указано, что число опытов равно p k, где р число уровней, а k число факторов. Встает вопрос о сокращении числа опытов. Рекомендации о решении этой проблемы приведены в разделе 7. Итак, выбор факторов является весьма существенным, т.к. от этого зависит успех оптимизации. 4.. ХАРАКТЕРИСТИКА ФАКТОРОВ, 88

13 Фактором называется измеряемая переменная величина, принимающая в некоторый момент времени определенное значение и влияющая на объект исследования. Факторы должны иметь область определения, внутри которой задаются его конкретные значения. Область определения может быть непрерывной или дискретной. При планировании эксперимента значения факторов принимаются дискретными, что связано с уровнями факторов. В практических задачах области определения факторов имеют ограничения, которые носят либо принципиальный, либо технический характер. Факторы разделяются на количественные и качественные. К количественным относятся те факторы, которые можно измерять, взвешивать и т.д. Качественные факторы это различные вещества, технологические способы, приборы, исполнители и т.п. Хотя к качественным факторам не соответствует числовая шкала, но при планировании эксперимента к ним применяют условную порядковую шкалу в соответствии с уровнями, т.е. производится кодирование. Порядок уровней здесь произволен, но после кодирования он фиксируется. 4.. ТРЕБОВАНИЯ К ФАКТОРАМ Факторы должны быть управляемыми, это значит, что выбранное нужное значение фактора можно поддерживать постоянным в течение всего опыта. Планировать эксперимент можно только в том случае, если уровни факторов подчиняются воле экспериментатора. Например, экспериментальная установка смонтирована на открытой площадке. Здесь температурой воздуха мы не можем управлять, ее можно только контролировать, и потому при выполнении опытов температуру, как фактор, мы не можем учитывать. Чтобы точно определить фактор, нужно указать последовательность действий (операций), с помощью которых устанавливаются его конкретные значения. Такое определение называется операциональным. Так, если фактором является давление в некотором аппарате, то совершенно необходимо указать, в какой точке и с помощью какого прибора оно измеряется и как оно устанавливается. Введение операционального определения обеспечивает однозначное понимание фактора. Точность замеров факторов должна быть возможно более высокой. Степень точности определяется диапазоном изменения факторов. В длительных процессах, измеряемых многими часами, минуты можно не учитывать, а в быстрых процессах приходится учитывать доли секунды. Исследование существенно усложняется, если фактор измеряется с большой ошибкой или значения факторов трудно поддерживать на выбранном уровне (уровень фактора «плывет»), то приходится применять специальные методы исследования, например, конфлюэнтный анализ . Факторы должны быть однозначны. Трудно управлять фактором, который является функцией других факторов. Но в планировании могут участвовать другие факторы, такие, как соотношения между компонентами, их логарифмы и т.п. Необходимость введения сложных факторов возникает при желании представить динамические особенности объекта в статической форме. Например, требуется найти оптимальный режим подъема температуры в реакторе. Если относительно температуры известно, что она должна нарастать линейно, то в качестве фактора вместо функции (в данном случае линейной) можно использовать тангенс угла наклона, т.е. градиент. При планировании эксперимента одновременно изменяют несколько факторов, поэтому необходимо знать требования к совокупности факторов. Прежде всего выдвигается требование совместимости. Совместимость факторов означает, что все их комбинации осуществимы и безопасны.

14 Несовместимость факторов наблюдается на границах областей их определения. Избавиться от нее можно сокращением областей. Положение усложняется, если несовместимость проявляется внутри областей определения. Одно из возможных решений разбиение на подобласти и решение двух отдельных задач. При планировании эксперимента важна независимость факторов, т.е. возможность установления фактора на любом уровне вне зависимости от уровней других факторов. Если это условие невыполнимо, то невозможно планировать эксперимент ВЫБОР УРОВНЕЙ ВАРЬИРОВАНИЯ ФАКТОРОВ И ОСНОВНОГО УРОВНЯ Фактор считается заданным, если указаны его название и область определения. В выбранной области определения он может иметь несколько значений, которые соответствуют числу его различных состояний. Выбранные для эксперимента количественные или качественные состояния фактора носят название уровней фактора. В планировании эксперимента значения факторов, соответствующие определенным уровням их варьирования, выражают в кодированных величинах. Под интервалом варьирования фактора подразумевается разность между двумя его значениями, принятая за единицу при кодировании. При выборе области определения факторов особое внимание уделяют на выбор нулевой точки, или нулевого (основного) уровня. Выбор нулевой точки эквивалентен определению исходного состояния объекта исследования. Оптимизация связана с улучшением состояния объекта по сравнению с состоянием в нулевой точке. Поэтому желательно, чтобы данная точка была в области оптимума или как можно ближе к ней, тогда ускоряется поиск оптимальных решений. Если проведению эксперимента предшествовали другие исследования по рассматриваемому вопросу, то за нулевую принимается такая точка, которой соответствует наилучшее значение параметра оптимизации, установленного в результате формализации априорной информации. В этом случае нулевыми уровнями факторов являются те значения последних, сочетания которых соответствуют координатам нулевой точки. Часто при постановке задачи область определения факторов бывает заданной, являясь локализованной областью факторного пространства. Тогда центр этой области принимается за нулевую точку. Предположим, в некоторой задаче фактор (температура) мог изменяться от 40 до 80 о С. Естественно, за нулевой уровень было принято среднее значение фактора, соответствующее 60 о С. После установления нулевой точки выбирают интервалы варьирования факторов. Это связано с определением таких значений факторов, которые в кодированных величинах соответствуют и. Интервалы варьирования выбирают с учетом того, что значения факторов, соответствующие уровням и, должны быть достаточно отличимы от значения, соответствующему нулевому уровню. Поэтому во всех случаях величина интервала варьирования должна быть больше удвоенной квадратичной ошибки фиксирования данного фактора. С другой стороны, чрезмерное увеличение величины интервалов варьирования нежелательно, т.к. это может привести к снижению эффективности поиска оптимума. А очень малый интервал варьирования уменьшает область эксперимента, что замедляет поиск оптимума. При выборе интервала варьирования целесообразно учитывать, если это возможно, число уровней варьирования факторов в области эксперимента. От числа уровней зависят объем эксперимента и эффективность оптимизации. В общем виде зависимость числа опытов от числа уровней факторов имеет вид где число опытов; р число уровней факторов; k число факторов. k = p,

15 Минимальное число уровней, обычно применяемое на первой стадии работы, равно. Это верхний и нижний уровни, обозначаемые в кодированных координатах через и. Варьирование факторов на двух уровнях используется в отсеивающих экспериментах, на стадии движения в область оптимума и при описании объекта исследования линейными моделями. Но такое число уровней недостаточно для построения моделей второго порядка (ведь фактор принимает только два значения, а через две точки можно провести множество линий различной кривизны). С увеличением числа уровней повышается чувствительность эксперимента, но одновременно возрастает число опытов. При построении моделей второго порядка необходимы 3, 4 или 5 уровней, причем здесь наличие нечетных уровней указывает на проведение опытов в нулевых (основных) уровнях. В каждом отдельном случае число уровней выбирают с учетом условий задачи и предполагаемых методов планирования эксперимента. Здесь необходимо учитывать наличие качественных и дискретных факторов. В экспериментах, связанных с построением линейных моделей, наличие этих факторов, как правило, не вызывают дополнительных трудностей. При планировании второго порядка качественные факторы не применимы, т.к. они не имеют ясного физического смысла для нулевого уровня. Для дискретных факторов часто применяют преобразование измерительных шкал, чтобы обеспечить фиксацию значений факторов на всех уровнях. 5. ВЫБОР МОДЕЛЕЙ Как уже указывалось в разделе, под моделью понимается функция отклика вида у = f (х, х,..., х k). Выбрать модель значит выбрать вид этой функции, записать ее уравнение. Тогда останется спланировать и провести эксперимент для оценки численных значений констант (коэффициентов) этого уравнения. Наглядное, удобное воспринимаемое представление о функции отклика дает ее геометрический аналог поверхность отклика. В случае многих факторов геометрическая наглядность теряется, т.к. переходит в абстрактное многомерное пространство, где у большинства исследователей нет навыка ориентирования. Приходится переходить на язык алгебры. Потому рассмотрим простые примеры случаи с двумя факторами. Пространство, в котором строится поверхность отклика, называется факторным пространством. Оно задается координатными осями, по которым откладываются значения факторов и параметра оптимизации (рис. 5.). У Х Х Рис. 5.. Для двух факторов можно не переходить к трехмерному пространству, а ограничиться плоскостью. Для этого достаточно произвести сечения поверхности плоскостями, параллельными плоскости х ох (рис. 5.) и полученные в сечениях линии спроектировать на эту плоскость. Здесь каждая линия соответствует постоянному значению параметра

16 оптимизации. Такая линия называется линией равного отклика. Х Х 88 Рис. 5.. Получив некоторое представление о модели, рассмотрим требования к ним. Главное требование к модели это способность предсказывать направление дальнейших опытов, причем предсказывать с требуемой точностью. Это значит, что предсказанное с помощью модели значение отклика не отличается от фактического больше, чем на некоторую заранее заданную величину. Модель, отвечающая этому требованию, называется адекватной. Проверка выполнимости этого требования называется проверкой адекватности модели и она выполняется при помощи специальных статистических методов, которые будут рассмотрены позже. Следующим требованием является простота модели. Но простота вещь относительная, ее сначала надо сформулировать. При планировании эксперимента принимается, что простыми являются алгебраические полиномы. Наиболее часто применяются приведенные ниже полиномы. Полином первой степени: у = в о k в x Полином второй степени: у = в о k k k в j x x в x вj x x j Полиномы третьей степени: у = в k о k k в x вj x x j вj x x j вjj x x j k в x 3. j k k в x Здесь в этих уравнениях: у значения критерия; в линейные коэффициенты; в j коэффициенты двойного взаимодействия; х кодированные значения факторов. Эксперименты при планировании эксперимента нужны для определения численных значений коэффициентов. Чем больше коэффициентов, тем больше нужно опытов. А мы стремимся сократить их число. Следовательно, нужно найти такой полином, который содержит как можно меньше коэффициентов, но удовлетворяет требованиям, предъявляемым к модели. Полиномы первой степени имеют наименьшее число коэффициентов, кроме этого они.

17 позволяют предсказывать направление наискорейшего улучшения параметра оптимизации. Но полиномы первой степени не эффективны в области близкой к оптимуму. Поэтому при планировании эксперимента на первой стадии исследовании используют полиномы первой степени, и когда они станут неэффективными, переходят к полиномам более высоких степеней. 6. ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ Работу по планированию эксперимента начинают со сбора априорной информации. Анализ этой информации позволяет получить представление о параметре оптимизации, о факторах, о наилучших условиях ведения исследования, о характере поверхности отклика и т.д. Априорную информацию можно получить из литературных источников, из опроса специалистов, путем выполнения однофакторных экспериментов. Последние, к сожалению, не всегда возможно осуществить, т.к. возможность их осуществления ограничена стоимостью опытов, их длительностью. На основе анализа априорной информации делается выбор экспериментальной области факторного пространства, который заключается в выборе основного (нулевого) уровня и интервалов варьирования факторов. Основной уровень является исходной точкой для построения плана эксперимента, а интервалы варьирования определяют расстояния по осям координат от верхнего и нижнего уровней до основного уровня. При планировании эксперимента значения факторов кодируются путем линейного преобразования координат факторного пространства с переносом начала координат в нулевую точку и выбором масштабов по осям в единицах интервалов варьирования факторов. Используют здесь соотношение x c c ε o =, где х кодированное значение фактора (безразмерная величина); c натуральные значения фактора (соответственно текущее значение и на c o нулевом уровне); ε натуральное значение интервала варьирования факторов (С). Получаются значения факторов, равные (верхний уровень) и (нижний уровень). Расположение экспериментальных точек в факторном пространстве для полного факторного эксперимента при k= и k=3 показана на рис. 6.. Как видим, точки плана задаются координатами вершин квадрата, а точки плана 3 координатами вершин куба. По аналогичному принципу располагаются экспериментальные точки при k>3. С Х С Х C С С а) k= в) k=3

18 Рис ПОЛНЫЙ ФАКТОРНЫЙ ЭКСПЕРИМЕНТ ТИПА k Первый этап планирования эксперимента для получения линейной модели основан на варьировании на двух уровнях . В этом случае, при известном числе факторов, можно найти число опытов, необходимое для реализации всех возможных сочетаний уровней факторов. Формула для расчета числа опытов приводилась в разделе и в этом случае выглядит = k. Эксперимент, в котором реализуются все возможные сочетания уровней факторов, называется полным факторным экспериментом (ПФЭ). Если число уровней факторов равно двум, то имеем ПФЭ типа k. Условия эксперимента удобно записывать в виде таблицы, которую называют матрицей планирования эксперимента. Матрица планирования эксперимента Таблица 6. Номер опыта х х у 3 4 у у у 3 у 4 Матрица планирования для двух факторов приведена на табл. 6.. При заполнении матрицы планирования значения уровней факторов, в целях упрощения, обозначают соответствующими знаками, а цифру опускают. С учетом взаимодействия факторов х и х таблицу 6. можно переписать следующим образом: Матрица планирования Таблица 6. Номер опыта 3 4 х х х х у у у у 3 у 4 Каждый столбец в матрице планирования называют векторстолбцом, а каждую строку векторстрокой. Таким образом, в табл. 6.. мы имеем два векторастолбца независимых переменных и один векторстолбец параметра оптимизации. То, что записано в алгебраической форме, можно изобразить графически. В области определения факторов находится точка, соответствующая основному уровню, и проводят через нее новые оси координат, параллельные осям натуральных значений факторов. Далее выбирают масштабы по новым осям так, чтобы интервал варьирования для каждого фактора равнялся единице. Тогда условия проведения опытов будут соответствовать вершинам квадрата, при k=, и вершинам куба, при k=3. Центрами этих фигур является основной уровень, а каждая сторона равна двум интервалам (рис. 6.). Номера вершин квадрата и куба соответствуют номерам опытов в матрице планирования. Площадь, ограниченная этими фигурами, называется областью эксперимента. По аналогичному принципу располагаются экспериментальные точки при k>3. 88

19 Расположение точек в факторном пространстве для ПФЭ при k= и k=3 С Х С Х C C С С а) k= в) k=3 Рис. 6.. Если для двух факторов все возможные комбинации уровней легко найти перебором, то с ростом числа факторов возникает необходимость в некотором приеме построения матриц. Обычно используются три приема, основанные на переходе от матриц меньшей размерности к матрицам большей размерности. Рассмотрим первый прием. При добавлении нового фактора каждая комбинация уровней исходного фактора встречается дважды, в сочетании с верхним и нижним уровнями нового фактора. Отсюда естественно появляется прием: записать исходный план для одного уровня нового фактора, а затем повторить его для другого уровня. Этот прием можно применить для матриц любой размерности. Во втором приеме вводится правило перемножения столбцов матрицы. При построчном перемножении уровней исходной матрицы получаем дополнительный столбец произведения х х, далее повторим исходный план, а у столбца произведений знаки поменяем на обратный. Этот прием применим для построения матриц любой размерности, однако он сложнее, чем первый. Третий прием основан на чередовании знаков. В первом столбце знаки меняются поочередно, во втором столбце они чередуются через два раза, в третьем через четыре, в четвертом через восемь и т.д. по степеням двойки. Пример построения матриц планирования р 3 см. табл. 6.. Таблица 6.3 Матрица планирования эксперимента 3 Номер опыта 3 4 х х х 3 у у у у 3 у 4

20 у 5 у 6 у 7 у СВОЙСТВА ПОЛНОГО ФАКТОРНОГО ЭКСПЕРИМЕНТА ТИПА k Полный факторный эксперимент относится к числу планов, которые являются наиболее эффективными при построении линейных моделей. Эффективность, иначе оптимальность, полного факторного эксперимента достигается за счет ниже перечисленных его свойств. Два свойства следуют непосредственно из построения матрицы. Первое из них симметричность относительно центра эксперимента формулируется следующим образом: алгебраическая сумма элементов векторастолбца каждого фактора равна нулю, или j= x j = 0, где =, k номер фактора, число опытов. Второе свойство так называемое условие нормировки формулируется следующим образом: сумма квадратов элементов каждого столбца равна числу опытов, или j= Это следствие того, что значения факторов в матрице задаются и. Мы рассмотрели свойства отдельных столбцов матрицы планирования. Рассмотрим свойства совокупности столбцов. Сумма почленных произведений любых двух векторстолбцов матрицы равна нулю, или х j uj = 0 j= x j = x при u, а также, u = 0,..., k. Это важное свойство называется ортогональностью матрицы планирования. Последнее, четвертое свойство называется ротатабельностью, т.е. точки в матрице планирования подбираются так, что точность предсказаний значений параметра оптимизации одинакова на равных расстояниях от центра эксперимента и не зависит от направления. Выполнение этих условий обеспечивает минимальную дисперсию коэффициентов регрессии, но и равенство дисперсии. Это облегчает статистический анализ результатов эксперимента РАСЧЕТ КОЭФФИЦИЕНТОВ РЕГРЕССИИ Построив матрицу планирования осуществляют эксперимент. Получив экспериментальные данные рассчитывают значения коэффициентов регрессии. Значение свободного члена (в о) берут как среднее арифметическое всех значений параметра оптимизации в матрице: где в о у u. =, u y значения параметра оптимизации в uм опыте; число опытов в матрице.

21 Линейные коэффициенты регрессии рассчитывают по формуле в x y u u = = xu где хu кодированное значение фактора х в uм опыте. Коэффициенты регрессии, характеризующие парное взаимодействие факторов, находят по формуле в x x y u ju u j = = xu Рассмотрим пример расчета коэффициентов регрессии для планирования, матрица планирования которой приведена в табл. 6. y y y3 y4 в o = ; 4 y y y3 y4 в = ; 4 y y y3 y4 в = ; 4 y y y3 y4 в =. 4 Рассмотрим уравнение регрессии для k=3. y = в0 вх вх в3х3 вхх в3хх3 в 3 х х3 в3 хх х3, где в0 свободный член; в, в в линейные коэффициенты;, 3, в3, в3 в коэффициенты двойного взаимодействия; в 3 коэффициент тройного взаимодействия. Полное число всех возможных коэффициентов регрессии, включая в 0, линейные коэффициенты и коэффициенты взаимодействий всех порядков, равно числу опытов полного факторного эксперимента. Чтобы найти число взаимодействий некоторого порядка, можно воспользоваться формулой числа сочетаний С m k x x k! m!(k m)! u u =, где k число факторов; m число элементов во взаимодействии. Так, для плана 4 число парных взаимодействий равно шести 4! С 4 = = 6.!! Отсюда видно, что с ростом числа факторов число возможных взаимодействий быстро y x u ju, y u.


УДК 58.5: 58.48 В.С. Хорошилов СГГА, Новосибирск ОПТИМИЗАЦИЯ ВЫБОРА МЕТОДОВ И СРЕДСТВ ГЕОДЕЗИЧЕСКОГО ОБЕСПЕЧЕНИЯ МОНТАЖА ТЕХНОЛОГИЧЕСКОГО ОБОРУДОВАНИЯ Постановка задачи. Геодезическое обеспечение монтажа

Лекция В зависимости от способа сбора экспериментальной информации различают: 1. пассивный эксперимент; 2. активный эксперимент. Суть: исследователь собирает некоторый объем экспериментальной информации:

73 5 ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА ПРИ ПОИСКЕ ОПТИМАЛЬНЫХ УСЛОВИЙ 5.1 Основные понятия и определения Эксперимент занимает центральное место в науке. А применение математических методов планирования эксперимента

Тест по дисциплине «Основы теории эксперимента» 1. Как называется процедура выбора числа и условий проведения опытов, необходимых и достаточных для решения поставленной задачи с требуемой точностью? 1)

ВВОДНАЯ ЛЕКЦИЯ по дисциплине «Планирование и организация эксперимента» 1 Значимость проведения исследований; 2 Сбор данных и оформление результатов эксперимента; 3 Выбор объекта исследований. 1 Значимость

Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный технический университет

Определение значимости факторов и их взаимодействия в многофакторном эксперименте Р. Алалами, С.С. Торбунов После изучения объекта исследования и его физической сущности возникает ряд представлений о действии

Министерство образования Российской Федерации ВОСТОЧНО-СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ Методические указания к практическим занятиям по дисциплине «Планирование эксперимента» для

Голубев ВО Литвинова ТЕ Реализация алгоритма построения статистической модели объекта по методу Брандона Постановка задачи Статистические модели создают на основании имеющихся экспериментальных данных

Федеральное агентство по образованию Рубцовский индустриальный институт ГОУ ВПО «Алтайский государственный технический университет им. И.И. Ползунова» Н.А. Чернецкая ПЛАНИРОВАНИЕ И МАТЕМАТИЧЕСКАЯ ОБРАБОТКА

Федеральное агентство воздушного транспорта Федеральное государственное образовательное учреждение высшего профессионального образования МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ГРАЖДАНСКОЙ АВИАЦИИ

ЭКСПЕРИМЕНТ: ПЛАНИРОВАНИЕ И МАТЕМАТИЧЕСКАЯ ОБРАБОТКА РЕЗУЛЬТАТОВ НАБЛЮДЕНИЙ Некоторые методы планирования экспериментов в приложении к горному производству Если информации о рассматриваемом процессе недостаточно

ОДНОФАКТОРНЫЙ РЕГРЕССИОННЫЙ АНАЛИЗ Цель работы проведение однофакторного регрессионного анализа на основе полиномиальных моделей первого, второго и третьего порядка. Теоретические основы. Под регрессионным

Лекция 0.3. Коэффициент корреляции В эконометрическом исследовании вопрос о наличии или отсутствии зависимости между анализируемыми переменными решается с помощью методов корреляционного анализа. Только

МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «ЮгоЗападный государственный университет» Кафедра «Управление качеством, метрологии и сертификации»

7. КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ Линейная регрессия Метод наименьших квадратов () Линейная корреляция () () 1 Практическое занятие 7 КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ Для решения практических

ГЛАВА ДВУХМЕРНЫЙ КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ Методы двухмерного корреляционно-регрессионного анализа позволяют определить тесноту и вид зависимостей между парами стереометрических показателей одного

РЕГРЕССИОННЫЙ АНАЛИЗ Пусть у нас есть серии значений двух параметров. Подразумевается, что у одного и того же объекта измерены два параметра. Нам надо выяснить есть ли значимая связь между этими параметрами.

Министерство образования и науки Российской Федерации Федеральное агентство по образованию Саратовский государственный технический университет МАТЕМАТИЧЕСКИЕ МЕТОДЫ ПЛАНИРОВАНИЯ ЭКСПЕРИМЕНТА ПРИ ВЫПОЛНЕНИИ

Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего образования «Владимирский государственный университет имени Александра Григорьевича

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ СПЕЦИАЛИЗИРОВАННЫЙ УЧЕБНО-НАУЧНЫЙ ЦЕНТР Математика 0 класс ПРЕДЕЛЫ ПОСЛЕДОВАТЕЛЬНОСТЕЙ Новосибирск Интуитивно

Построение полного факторного эксперимента(пфэ) Уравнение (2.2) называется уравнением регрессии, а коэффициенты b 0, b ja, b jl, b jj - коэффициентами регрессии . При первоначальном исследовании объекта

ЛАБОРАТОРНАЯ РАБОТА «ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА» Большое планирование экспериментальных задач в химии и химической технологии формулируются как экстремальные; к ним относятся определение оптимальных условий

Кафедра математики и информатики ТЕОРИЯ ВЕРОЯТНОСТЕЙ И МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Учебно-методический комплекс для студентов ВПО, обучающихся с применением дистанционных технологий Модуль 3 МАТЕМАТИЧЕСКАЯ

Исследование операций Определение Операция - мероприятие, направленное на достижение некоторой цели, допускающее несколько возможностей и их управление Определение Исследование операций совокупность математических

1 АГ Дьячков, «Задания по математической статистике» Задание 6 6 Линейный регрессионный анализ 61 Построение регрессионной прямой Пусть экспериментатор, задавая значения неслучайной переменной t, в результате

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ

Лекция Большинство исследований проводимых в химической технологии сводятся к решению оптимальных задач. Существует два подхода к решению оптимальных задач: 1. Для решения оптимальных задач необходимо

Регрессионный анализ регрессионный анализ -введение коэффициент корреляции степень связи в вариации двух переменных величин (мера тесноты этой связи) метод регрессии позволяет судить как количественно

Глава 8 Функции и графики Переменные и зависимости между ними. Две величины и называются прямо пропорциональными, если их отношение постоянно, т. е. если =, где постоянное число, не меняющееся с изменением

ИЗУЧЕНИЕ СТАТИСТИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ РАДИОАКТИВНОГО РАСПАДА Лабораторная работа 8 Цель работы: 1. Подтверждение случайного, статистического характера процессов радиоактивного распада ядер.. Ознакомление

1 - Тема 1 Элементы теории погрешностей 11 Источники и классификация погрешностей Численное решение любой задачи, как правило, осуществляется приближенно, те с некоторой точностью Это может быть обусловлено

МИНИСТЕРСТВО СЕЛЬСКОГО ХОЗЯЙСТВА РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное образовательное учреждение высшего образования КУБАНСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ Математическое моделирование

Тема 2.3. Построение линейно-регрессионной модели экономического процесса Пусть имеются две измеренные случайные величины (СВ) X и Y. В результате проведения n измерений получено n независимых пар. Перед

1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ НЕФТИ И ГАЗА (НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ) имени И.М. Губкина Кафедра «Стандартизации, сертификации

ПРИМЕНЕНИЕ МЕТОДОВ ПЛАНИРОВАНИЯ И ПРОВЕДЕНИЯ ЭКСПЕРИМЕНТОВ ДЛЯ ОПТИМИЗАЦИИ КАЧЕСТВА МАШИННОГО ОБУЧЕНИЯ ПУТЕМ ВЫБОРА ПАРАМЕТРОВ М.В. Водолазкая, О.Л. Моросин, к.т.н. ФБГОУ ВПО «НИУ «МЭИ», Москва Работа

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА 2 СЕМЕСТР ЛЕКЦИЯ 4 ОБОБЩЁННЫЕ КООРДИНАТЫ И СИЛЫ УРАВНЕНИЯ РАВНОВЕСИЯ СИСТЕМЫ В ОБОБЩЁННЫХ КООРДИНАТАХ ВИРТУАЛЬНЫЙ ДИФФЕРЕНЦИАЛ ПОТЕНЦИАЛЬНЫЕ СИЛЫ Лектор: Батяев Евгений Александрович

ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА Статистические методы планирования эксперимента Проблемы построения эксперимента [Часть II, стр. 7-76] Отбор информации не объективен! 1. Результаты наблюдений - это лишь ограниченная

Оптимизация свойств изделий автомобилестроения средствами САПР Щербаков А.Н., Константинов А.Д. Пензенский государственный университет Выбор параметров и характеристик систем, обеспечивающих их функционирование

Министерство образования и науки Российской Федерации ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ САРАТОВСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

Министерство образования и науки Российской Федерации Федеральное агентство по образованию Саратовский государственный технический университет Балаковский институт техники, технологии и управления ПРИМЕНЕНИЕ

1 АГ Дьячков, «Задания по математической статистике» Задание 3 3 Доверительные интервалы 31 Доверительные интервалы параметров нормальной выборки 311 Математическая модель Нормальная выборка x = (x 1,

МАТЕМАТИЧЕСКИЕ МЕТОДЫ В ЗЕМЛЕУСТРОЙСТВЕ Карпиченко Александр Александрович доцент кафедры почвоведения и земельных информационных систем Литература elib.bsu.by Математические методы в землеустройстве [Электронный

Лекция ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СИСТЕМЫ ДВУХ СЛУЧАЙНЫХ ВЕЛИЧИН -МЕРНЫЙ СЛУЧАЙНЫЙ ВЕКТОР ЦЕЛЬ ЛЕКЦИИ: определить числовые характеристики системы двух случайных величин: начальные и центральные моменты ковариацию

3.. ПОСТРОЕНИЕ ОДНОФАКТОРНЫХ МОДЕЛЕЙ ПРОГНОЗИРОВАНИЯ Пусть в ходе корреляционного анализа прогнозисту удалось определить степень взаимосвязи между двумя случайными факторами и и определить направление

Построение ММ статики технологических объектов При исследовании статики технологических объектов наиболее часто встречаются объекты со следующими типами структурных схем (рис: О с одной входной х и одной

Тема. Функция. Способы задания. Неявная функция. Обратная функция. Классификация функций Элементы теории множеств. Основные понятия Одним из основных понятий современной математики является понятие множества.

Лекция.33. Статистические испытания. Доверительный интервал. Доверительная вероятность. Выборки. Гистограмма и эмпирическая 6.7. Статистические испытания Рассмотрим следующую общую задачу. Имеется случайная

Тема 10. Ряды динамики и их применение в анализе социально-экономических явлений. Изменение социально-экономических явлений во времени изучается статистикой методом построения и анализа динамических рядов.

МВДубатовская Теория вероятностей и математическая статистика Лекция 4 Регрессионный анализ Функциональная статистическая и корреляционная зависимости Во многих прикладных (в том числе экономических) задачах

Раздел 2 Теория пределов Тема Числовые последовательности Определение числовой последовательности 2 Ограниченные и неограниченные последовательности 3 Монотонные последовательности 4 Бесконечно малые и

Квантили Выборочная квантиль x p порядка p (0 < p < 1) определяется как элемент вариационного ряда выборки x (1), x () с номером [p]+1, где [a] целая часть числа а В статистической практике используется

И. В. Яковлев Материалы по математике MathUs.ru Квадратные уравнения и неравенства с параметрами. Данная статья посвящена вопросам расположения корней квадратного трёхчлена в зависимости от параметра.

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ» Кафедра «Математика и теоретическая механика» Методические рекомендации

Основные понятия кинематики (Лекция 1 в 2015-2016 учебном году) Материальная точка. Система отсчета. Перемещение. Длина пути Кинематика это часть механики, которая изучает движения тел без исследования

Лекция 5 ЭКОНОМЕТРИКА 5 Проверка качества уравнения регрессии Предпосылки метода наименьших квадратов Рассмотрим модель парной линейной регрессии X 5 Пусть на основе выборки из n наблюдений оценивается

Тема Теория пределов Как мы понимаем слово «предел»? В повседневной жизни мы часто употребляем термин «предел», не углубляясь в его сущность В нашем представлении чаще всего предел отождествляется с понятием

Лекция 10. Методы измерения тесноты парной корреляционной связи. Часть 1 Признаки могут быть представлены в количественных, порядковых и номинальных шкалах. В зависимости от того, по какой шкале представлены

НЕОБХОДИМЫЕ СВЕДЕНИЯ ПО МАТЕМАТИЧЕСКОЙ ОБРАБОТКЕ РЕЗУЛЬТАТОВ ИЗМЕРЕНИЙ В лабораторном практикуме вы постоянно будете иметь дело с измерениями физических величин. Необходимо уметь правильно обрабатывать

Контрольная работа выполнена на сайте www.maburo.ru Вариант 4 Задание. Прогнозирование экономических процессов. В таблице приведены данные продаж продовольственных товаров в магазине. Разработать модель

Министерство образования Российской федерации Государственное образовательное учреждение высшего профессионального образования «Хабаровский государственный технический университет» АПРИОРНОЕ РАНЖИРОВАНИЕ

6.2.4. ПОСТРОЕНИЕ ИНТЕРПРЕТИРУЕМЫХ РЕГРЕССИОННЫХ МОДЕЛЕЙ ТЕХНОЛОГИЧЕСКИХ ОБЪЕКТОВ С тех пор как за теорию относительности принялись математики, я ее уже сам больше не понимаю. (А. Эйнштей) Всякую интерпретацию



Похожие статьи