Учебное пособие: Дисперсионный анализ при помощи системы MINITAB для WINDOWS
«Входной интервал» -
вводится ссылка на диапазон, содержащий анализируемые данные. Ссылка должна
состоять не менее чем из двух смежных диапазонов данных, данные в которых
расположены по строкам или столбцам.
«Группирование» -
установите переключатель в положение. По столбцам или По строкам в зависимости
от расположения данных во входном диапазоне.
«Метки в первой
строке/Метки в первом столбце» - если первая строка исходного диапазона
содержит названия столбцов, установите переключатель в положение Метки в первой
строке. Если названия строк находятся в первом столбце входного диапазона,
установите переключатель в положение Метки в первом столбце. Если входной
диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут
созданы автоматически.
«Альфа» - введите уровень
значимости, необходимый для оценки критических параметров F-статистики. Уровень
альфа связан с вероятностью возникновения ошибки типа I (опровержение верной
гипотезы).
«Выходной диапазон» -
введите ссылку на левую верхнюю ячейку выходного диапазона. Размеры выходной
области будут рассчитаны автоматически, и соответствующее сообщение появится на
экране в том случае, если выходной диапазон занимает место существующих данных
или его размеры превышают размеры листа.
«Новый лист» - установите
переключатель, чтобы открыть новый лист в книге и вставить результаты анализа,
начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в
поле, расположенном напротив соответствующего положения переключателя.
«Новая книга» -
установите переключатель, чтобы открыть новую книгу и вставить результаты
анализа в ячейку A1 на первом листе в этой книге.
Пример
заполнения окна «Однофакторный дисперсионный анализ» представлен на рисунке 2.
Рисунок 2 – Пример
заполнения окна «Однофакторный дисперсионный анализ»
Результаты расчетов
однофакторного дисперсионного анализа представлены на рисунке 3.
Однофакторный дисперсионный
анализ
ИТОГИ
Группы
Счет
Сумма
Среднее
Дисперсия
Столбец 1
13
164,2
12,63077
2,34064103
Столбец 2
13
151,3
11,63846
2,33923077
Дисперсионный анализ
Источник вариации
SS
df
MS
F
P-Значение
F критическое
Между группами
6,400385
1
6,400385
2,73528203
0,111176312
4,259675279
Внутри групп
56,15846
24
2,339936
Итого
62,55885
25
Рисунок 3 – Результаты
расчетов по однофакторному дисперсионному анализу
Интерпретация
результатов:
«Группы» - данные по
выработке в первую и вторую смены.
«Счет» - количество
наблюдений в каждой из групп.
«Сумма» - сумма элементов
каждой из групп.
«Среднее» - средняя
выработка в каждой из групп.
«Дисперсия» -
рассчитывается дисперсия по каждой из групп;
SS - сумма квадратов;
df - число степеней свободы;
MS – средний квадрат;
F – расчетное значение отношения
Фишера;
P - уровень значимости для
вычисленного F;
F критическое – табличное значение
отношения Фишера.
Результаты расчетов
аналогичны результатам, полученным при расчетах вручную.
Двухфакторный
дисперсионный анализ в MSExel
Используя данный
предыдущего примера, предположим, что у нас есть данные о поле работников. Для
проведения двухфакторного дисперсионного анализа в MS Exel необходимо представить данные в виде перекрестной
классификации:
1
2
муж
12,1
9,9
11,1
11,4
12,6
13,4
12,9
10,4
11,6
12,9
13,1
12,6
12,6
13,9
жен
12,4
13,4
11,6
12,4
17,3
9,9
12,9
10,2
11,6
11,2
12,4
9,7
13,1
12,6
В меню «Сервис» выбрать
команду «Анализ данных» и команду «Двухфакторный дисперсионный анализ с
повторениями».
Далее необходимо
заполнить окно «Двухфакторный дисперсионный анализ с повторениями»:
«Входной интервал» -
вводится ссылка на диапазон, содержащий анализируемые данные.Необходимо
отметить не только сами числа, но и заголовок таблицы.
«Число строк для выборки»
- необходимо ввести количество повторений в одной ячейке. (Для нашего примера -
7)
«Альфа» - введите уровень
значимости, необходимый для оценки критических параметров F-статистики. Уровень
альфа связан с вероятностью возникновения ошибки типа I (опровержение верной
гипотезы).
«Выходной диапазон» -
введите ссылку на левую верхнюю ячейку выходного диапазона. Размеры выходной
области будут рассчитаны автоматически, и соответствующее сообщение появится на
экране в том случае, если выходной диапазон занимает место существующих данных
или его размеры превышают размеры листа.
«Новый лист» - установите
переключатель, чтобы открыть новый лист в книге и вставить результаты анализа,
начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в
поле, расположенном напротив соответствующего положения переключателя.
«Новая книга» -
установите переключатель, чтобы открыть новую книгу и вставить результаты
анализа в ячейку A1 на первом листе в этой книге.
Пример заполнения окна
«Однофакторный дисперсионный анализ» представлен на рисунке 2.
Рисунок 2 – Пример
заполнения окна «Двухфакторный дисперсионный анализ»
Результаты расчетов двухфакторного
дисперсионного анализа представлены на рисунке 3.
Дисперсионный анализ
Источник вариации
SS
df
MS
F
P-Значение
F критическое
Выборка
0,001429
1
0,001429
0,000643
0,979986
4,259677
Столбцы
6,412857
1
6,412857
2,884498
0,102366
4,259677
Взаимодействие
3,862857
1
3,862857
1,73751
0,199898
4,259677
Внутри
53,35714
24
2,223214
Итого
63,63429
27
Рисунок 3 – Результаты
расчетов по однофакторному дисперсионному анализу
Интерпретация
результатов:
SS - сумма квадратов;
df - число степеней свободы;
MS – средний квадрат;
F – расчетное значение отношения
Фишера;
P - уровень значимости для
вычисленного F;
F критическое – табличное значение
отношения Фишера.
4.
Задание по
выполнению лабораторной работы
4.1.
Однофакторный
дисперсионный анализ
Вы собираетесь открывать
магазин одежды. Произведенный опрос среди предполагаемых покупателей позволил
получить вам примерный уровень доходов респондентов в месяц, которые
предпочитают одежду тех или иных торговых марок. Необходимо проверить, есть ли
существенное различие в уровне доходов и маркой одежды, которую предпочитают
покупатели. Выясните, какие торговые марки можно отнести к одной группе (по
величине объема продаж) и предположите, как их можно сегментировать.
В табл.6 приведены
варианты заданий.
Таблица 6.
Торговые марки
M1
M2
M3
M4
M5
M6
M7
M8
M9
M10
M11
M12
555
1810
1749
2711
994
3687
566
4691
1679
861
1446
3543
426
1122
1746
2514
1085
2489
883
4130
2838
1074
1010
4828
349
2220
1509
2177
1215
2717
844
5328
3615
920
1414
5027
506
720
1949
2754
1024
4055
917
3268
2098
1192
1528
2937
550
2347
1673
2482
931
2485
850
3821
2602
970
1572
3067
443
1841
1275
2219
1242
2322
768
4132
2304
963
1538
4301
626
2250
1651
3065
948
3548
907
6429
2529
1417
1697
-393
582
2293
1745
2411
1041
3139
983
5833
2531
535
1223
1687
463
2550
862
2169
948
2258
855
3356
2784
1101
1072
3623
306
2977
831
2338
976
3327
794
2694
3646
1031
1725
3187
566
1542
1533
2415
998
2994
815
5074
4089
1011
1807
3353
569
3322
1432
2255
724
3783
760
3363
2603
1044
1512
4048
463
1441
1465
2527
952
3996
830
4852
2861
724
1623
3776
304
1952
1934
2446
998
3199
900
3316
2784
1327
1155
5251
528
1813
1813
2806
1115
4875
832
1985
2569
1199
1200
2009
496
617
1744
2618
834
2230
711
4547
3584
1206
1302
3480
648
2615
1151
2430
1034
3101
797
3293
2153
601
1304
4627
457
1777
876
2748
1018
4146
936
3922
3421
871
1687
2355
690
1420
1382
3110
1000
733
809
3086
4068
901
1428
2329
548
1843
1555
2996
834
3227
729
2447
3080
898
1433
3920
491
2574
940
2707
1165
2734
926
3524
2831
789
1440
1922
Вариант
Торговые марки
1
M1
M2
M3
M4
M5
M6
2
M2
M3
M4
M5
M6
M7
3
M3
M4
M5
M6
M7
M8
4
M4
M5
M6
M7
M8
M9
5
M5
M6
M7
M8
M9
M10
6
M1
M3
M4
M5
M9
M10
7
M1
M4
M5
M6
M9
M10
8
M1
M5
M6
M7
M9
M10
9
M1
M6
M7
M8
M9
M10
10
M1
M3
M5
M7
M9
M11
11
M2
M4
M5
M6
М11
М12
12
M2
M5
M6
M7
М11
М12
13
M2
M6
M7
M8
M10
M12
14
M2
M4
M6
M8
M10
M12
15
M2
M5
M7
M8
М11
М12
4.2 Двухфакторный
дисперсионный анализ
В таблице приведены данные опроса 32 человек.
Опрашиваемые были выбраны случайным образом из групп людей, которые
формировались так, чтобы результаты опроса были сбалансированы по всем уровням
факторов.
Таблица 7
Результаты опроса
Образование
Сфера деятельн.
Пол
Положение
Доход
Расход
X1
X2
X3
X4
Y1
Y2
Экономич.
Финансы
Муж.
Руковод.
852
650
Экономич.
Финансы
Жен.
Руковод.
750
700
Экономич.
Производ.
Муж.
Руковод.
210
140
Экономич.
Производ.
Жен.
Руковод.
180
160
Экономич.
Сельск,х.
Муж.
Работник
120
80
Экономич.
Сельск,х.
Жен.
Работник
130
120
Экономич.
Образов.
Муж.
Работник
210
180
Экономич.
Образов.
Жен.
Работник
190
170
Технич.
Финансы
Муж.
Работник
320
240
Технич.
Финансы
Жен.
Работник
240
220
Технич.
Производ.
Муж.
Работник
230
180
Технич.
Производ.
Жен.
Работник
140
130
Технич.
Сельск,х.
Муж.
Руковод.
350
300
Технич.
Сельск,х.
Жен.
Руковод.
360
320
Технич.
Образов.
Муж.
Руковод.
310
250
Технич.
Образов.
Жен.
Руковод.
310
300
Медицин,
Финансы
Муж.
Руковод.
540
450
Медицин,
Финансы
Жен.
Руковод.
450
420
Медицин,
Производ.
Муж.
Руковод.
310
210
Медицин,
Производ.
Жен.
Руковод.
405
380
Медицин,
Сельск,х.
Муж.
Работник
110
100
Медицин,
Сельск,х.
Жен.
Работник
120
110
Медицин,
Образов.
Муж.
Работник
210
180
Медицин,
Образов.
Жен.
Работник
180
170
Гуманит.
Финансы
Муж.
Работник
230
160
Гуманит.
Финансы
Жен.
Работник
240
220
Гуманит.
Производ.
Муж.
Работник
120
110
Гуманит.
Производ.
Жен.
Работник
125
120
Гуманит.
Сельск,х.
Муж.
Руковод.
280
180
Гуманит.
Сельск,х.
Жен.
Руковод.
300
280
Гуманит.
Образов.
Муж.
Руковод.
240
230
Гуманит.
Образов.
Жен.
Руковод.
230
200
Требуется методом двухфакторного дисперсионного
анализа оценить степень влияния изучаемых факторов на результирующий
экономический показатель. Первоначально оценить модель без
взаимодействия факторов, затем с взаимодействием. Сравнить результаты.
Сделать выводы. Варианты заданий приведены в табл.8.
Таблица 8
Варианты заданий
Вариант
Первый фактор
Второй фактор
Отклик
Вариант
Первый фактор
Второй фактор
Отклик
1
X1
X2
Y1
7
X1
X2
Y2
2
X1
X3
Y1
8
X1
X3
Y2
3
X1
X4
Y1
9
X1
X4
Y2
4
X2
X3
Y1
10
X2
X3
Y2
5
X2
X4
Y1
11
X2
X4
Y2
6
X3
X4
Y1
12
X3
X4
Y2
5.
Порядок
выполнения работы
1.
В соответствии с
вариантом задания выполнить однофакторный дисперсионный анализ, сделать выводы,
написать отчет.
2.
В соответствии с
вариантом задания выполнить двухфакторный дисперсионный анализ, сделать выводы,
написать отчет.
Контрольные вопросы
1.
Сформулируйте
основную идею дисперсионного анализа, для решения каких задач он наиболее
эффективен ?
2.
Что показывает F отношение Фишера?
3.
Каковы основные
теоретические предпосылки дисперсионный анализ?
4.
Произведите
разложение общей суммы квадратов отклонений на составляющие в однофакторном
дисперсионном анализе.
5.
Как получить
оценки дисперсий из сумм квадратов отклонений? Как получаются необходимые
числа степеней свободы?
6.
Приведите свой
пример двухфакторного дисперсионного анализа.
7.
На какие суммы
разлагается общая сумма квадратов отклонений в двухфакторном дисперсионном
анализе?