Блочный рандомизированный эксперимент


Скачать 410.57 Kb.
НазваниеБлочный рандомизированный эксперимент
страница1/4
ТипДокументы
filling-form.ru > бланк резюме > Документы
  1   2   3   4
Блочный рандомизированный эксперимент

Ранее был рассмотрен F-критерий однофакторного дисперсионного анализа для оценки разностей между математическими ожиданиями с групп. Этот критерий применяется в ситуациях, когда n однородных элементов (так называемых экспериментальных объектов) случайным образом распределяются по с уровням исследуемого фактора (так называемые группы условий факторного эксперимента. Такие эксперименты называются полностью рандомизированными.1

Кроме того, в разделе 9.2 описан ^-критерий для оценки разностей между математическими ожиданиями, который используется в ситуациях, связанных с повторяющимися измерениями или согласованными выборками. Этот критерий позволяет оценить различия между условиями проведения двух экспериментов. Предположим, что мы исследуем несколько групп условий или уровней исследуемого фактора. В таких ситуациях совокупности неоднородных объектов или индивидуумов, подлежащих сравнению (или повторным измерениям), называются блоками (blocks). Допустим, мы получили числовые результаты измерений для каждой группы условий и комбинаций блоков.

Эксперименты, в которых используются блоки, называются блочными рандомизированными экспериментами (randomized block designs). Хотя в таких схемах используются как условия, так и блоки, основное внимание уделяется оценке разностей между с разными группами условий. Целью объединения условий в блоки является максимально возможное исключение изменчивости экспериментальной ошибки с тем, чтобы разности между с групп условий проявились как можно отчетливее. Блочные рандомизированные эксперименты часто оказываются более эффективными, чем полностью рандомизированные эксперименты и, следовательно, позволяют получать более точные результаты [1,4, 7 и 8].

Для сравнения полностью рандомизированных и блочных рандомизированных экспе-риментов вернемся к сценарию, посвященному компании Perfect Parachute Company. Предположим, что в полностью рандомизированном эксперименте используются 12 наблюдений — по одному виду ткани на каждую из 12 смен. Любая изменчивость результатов испытаний становится частью экспериментальной ошибки, и, следовательно, различия между четырьмя поставщиками труднее уловить. Для того чтобы уменьшить экспериментальную ошибку, разработаем блочный рандомизированный эксперимент, в котором исследуются три смены, в течение каждой из которых ткутся четыре парашюта (один парашют — из волокон, полученных от первого поставщика, второй — из волокон, полученных от второго поставщика, и т.д.). Три смены рассматриваются как блоки, а условием факторного эксперимента является поставщик. Преимущество блочного рандомизированного эксперимента заключается в том, что из экспериментальной ошибки исключается изменчивость между тремя сменами. Следовательно, этот эксперимент часто обеспечивает более точные оценки различий между четырьмя поставщиками.

Критерии для оценки эффектов условий факторного эксперимента и блоков

Напомним, что в полностью рандомизированном эксперименте полная вариация (SST) подразделяется на межгрупповую (SSA) и внутригрупповую (SSW). Внутригрупповая вариация считается экспериментальной ошибкой, а межгрупповая вариация возникает вследствие различий между условиями факторного эксперимента.

Для того чтобы отделить эффект блокировки от экспериментальной ошибки блочно-

го рандомизированного эксперимента, необходимо подразделить внутригрупповую ва-

риацию на межблочную вариацию (SSBL) и случайную ошибку (SSE). Следова-

тельно, как показано на рис. 10.18, в блочном рандомизированном эксперименте

полная вариация результатов измерений представляет собой сумму межгрупповой

вариации (SSA), межблочной вариации (SSBL) и случайной ошибки (SSE).

Разделение полной вариации SST = SSA + SSBL + SSE

Случайная вариация (SSE) d.f. = (г- 1)(с- 1)

Рис. 10.18. Разделение полной вариации в блочном рандомизированном эксперименте

Для того чтобы разработать процедуру дисперсионного анализа для блочного рандо-мизированного эксперимента, введем следующие обозначения:

г — количество блоков,

с — количество групп или уровней фактора, п — общее количество наблюдений (п = гс), Хц — величина в i-м блоке и /-группе, Х1ш — среднее всех величин из i-ro блока,

Х^ — среднее всех величин из у-й группы,

с г

^^ГХу —общая сумма.

7=1 1=1

Полная вариация, называемая также полной суммой квадратов (SST), представляет собой вариацию между всеми наблюдениями. Величина SST равна сумме квадратов

разностей между каждым отдельным наблюдением и общим средним X , вычисленным по всем п наблюдениям.

ПОЛНАЯ ВАРИАЦИЯ

7=1 ,=1 (10.18)

где А" = —УУ J( — общее среднее значение.

Межгрупповая вариация, называемая также межгрупповой суммой квадратов (SSA), равна сумме квадратов разностей между выборочным средним каждой группы X t и общим средним значением X , деленным на количество блоков г.

МЕЖГРУППОВАЯ ВАРИАЦИЯ

SSA = r^X t-xJ, (10.19)

где X ( = -^Хп — среднее значение по у'-й группе.

Межблоковая вариация, называемая также межгрупповой суммой квадратов (SSBL), равна сумме квадратов разностей между средними значениями по каждому

блоку X, и общим средним значением X , деленному на количество групп с.

МЕЖБЛОКОВАЯ ВАРИАЦИЯ

SSBL = c^Xt -!)", (10.20)

где X, — среднее значение по i-му блоку.

Чисто случайная вариация или ошибка, также называемая суммой квадратов ошибок (SSE), равна сумме квадратов разностей между всеми наблюдениями после определенного воздействия и средними по блокам и группам.

СЛУЧАЙНАЯ ОШИБКА

sse=xzK - - + Щ- <10-21)

Поскольку фактор имеет с уровней, существует с-1 степеней свободы, связанных с межгрупповой суммой квадратов (SSA). Аналогично, поскольку существует г блоков, существует г-1 степеней свободы, связанных с межблоковой суммой квадратов (SSBL). Более того, общая сумма квадратов (SST) имеет п-1 степеней свободы, поскольку каждое наблюдение Хч сравнивается с общим средним X , вычисленным по всем п наблюдениям. Поскольку количество степеней свободы каждого источника вариации складывается с количеством степеней свободы полной вариации, количество степеней свободы суммы квадратов ошибок (SSE) получается путем вычитания и алгебраических манипуляций. Это количество степеней свободы равно (г-1)(с-1).

Если каждую компоненту суммы квадратов поделить на соответствующее количество степеней свободы, мы получим три вида дисперсии (MSA, MSBL и MSE), необходимых для формулы (10.22, а-в).

ВЫЧИСЛЕНИЕ СРЕДНЕКВАДРАТИЧЕСКИХ ЗНАЧЕНИИ

сел

№А = — , (10.22, а)

с-1

MSBL = ^^, (10.22,6)

г-1

MSE = 7—lb ГГ- (10.22, в)

Если выполняются предположения, принятые в дисперсионном анализе, можно применить .F-критерий (10.23), позволяющий проверить нулевую и альтернативную гипотезы о разностях между математическими ожиданиями с генеральных совокупностей.

if0: ц, = ц2 = ... = uf (условия не имеют эффекта), if,: не все ц, равны между собой, j = 1, 2, с.

РАНДОМИЗИРОВАННАЯ БЛОЧНАЯ F-СТАТИСТИКА ДЛЯ РАЗНОСТЕЙ МЕЖДУ С МАТЕМАТИЧЕСКИМИ ОЖИДАНИЯМИ

F=*™ (10.23)

MSE

^-статистика имеет ^-распределение, в котором числитель MSA имеет с-1 степеней свободы, а знаменатель MSE имеет (г-1)(с-1) степеней свободы. При заданном уровне значимости а нулевая гипотеза отклоняется, если вычисленная ^-статистика больше верхнего критического значения Fu, присущего ^-распределению с с-1 и (г-1)(с-1) степенями свободы в числителе и знаменателе (см. табл. Д.5). Итак, решающее правило принимает следующий вид.

Нулевая гипотеза if0 отклоняется, если F > Fv; в противном случае гипотеза Н0 не отклоняется.

Для того чтобы выяснить, дает ли какие-либо преимущества блочный рандомизированный эксперимент, некоторые статистики предлагают применять F-критерий для проверки блоковых эффектов. Нулевая гипотеза заключается в отсутствии блоковых эффектов

ff0: цх = u2 = ... = и,, (блоковые эффекты не наблюдаются), if,: не все ц, равны между собой,j = 1, 2, г.

F-СТАТИСТИКА ДЛЯ БЛОКОВЫХ ЭФФЕКТОВ

р _ MSBL ~ MSE

(10.24)

При заданном уровне значимости а нулевая гипотеза отклоняется, если вычисленная ^-статистика больше верхнего критического значения Fv, присущего F-pacnpeделению с с-1 и (г-1)(с-1) степенями свободы в числителе и знаменателе (см. табл. Д.5). Итак, решающее правило принимает следующий вид.

Нулевая гипотеза Н0 отклоняется, если F > Fv; в противном случае гипотеза ЬГ0 не отклоняется.

Некоторые статистики полагают, что этот критерий излишен, поскольку единственной целью блоков является создание более эффективного способа проверки наличия эффектов путем уменьшения экспериментальной ошибки.

В разделе 10.1 результаты дисперсионного анализа представлены в виде сводной таблицы ANOVA.

Таблица 10.8. Сводная таблица дисперсионного анализа для блочного рандомизированного эксперимента

Вид величины Количество Суммы Дисперсии F-статистика

степеней свободы квадратов

Межгрупповая с-1 SSA MSA=SSA/(c-l) F-MSA/MSW

Межблоковая г-1 SSBL MSBL=SSBL/(r-l) F=MSBL / MSE

Ошибка (r-2)(c-l) SSE MSE=SSE/(r-l)(c-l)

Полная rc-1 SST

Проиллюстрируем блочный рандомизированный эксперимент следующим примером. Предположим, что сеть ресторанов быстрого питания, имеющая четыре подразделения в определенном географическом регионе, желает оценить качество обслуживания в этих ресторанах. Для этой цели директор нанял шесть экспертов, имеющих разный опыт. Чтобы уменьшить эффект вариации между экспертами, был разработан блочный рандомизированный эксперимент, в которых блоками считались эксперты. В свою очередь, четыре ресторана образовали группы условий факторного эксперимента.

Шесть экспертов в случайном порядке инспектировали каждый из четырех ресторанов. Для оценки использовалась шкала баллов от 0 (низшая оценка) до 100 (высшая оценка). Результаты приведены в табл. 10.9.

Таблица 10.9. Рейтинги четырех ресторанов быстрого питания

Рестораны

Эксперты А Б В Г Всего Средние

1 70 61 82 74 287 71,75

2 77 75 88 76 316 79,00

3 76 67 90 80 313 78,25

4 80 63 96 76 315 78,75

5 84 66 92 84 326 81,50

6 78 68 98 86 330 82,50

Всего 465 400 546 476 1 887

Средние 77,50 66,67 91,00 79,33 78,625

Кроме того, как следует из табл. 10.9,

г = 6, с = 4, п = гс = 24

и

f = 1УУ У =1Ж = 78>625. rcjlTt 24

Результаты анализа результатов, полученных в рамках блочного рандомизированного эксперимента, приведены на рис. 10.19.



А .1.. а.

ИТОГИ

Счет Сумма Среднее Дисперсия

I Двухфакторный дисперсионный анализ без повторений

311

4 iЭксперт 1

5 ^Эксперт 2

6 'Эксперт 3

7 :Эксперт4

8 j Эксперт 5

9 :Эксперт 6 10]

II ;Ресторан А

12 Ресторан В

13 Ресторан С 14IРесторан D

сионныи анализ

15': »6!

17 ;Диспер

18 I

19]Строки

20 ■ Столбцы

21 i Погрешность

22'

23 jИтого

Источник вариации

SS

283,375 1787,458333 224,7916667

2295,625

MS

Р-значение F крит

5 56,675 3,781835032 0,020455782 2,901295204

3 595,8194444 39,75810936 2.23345Е-07 3,28738281 15 14,98611111

Рис. 10.19. Результаты инспекции сети ресторанов быстрого питания, полученные с помощью программы Microsoft Excel

Если установить уровень значимости критерия для проверки гипотезы о существовании различий между подразделениями сети ресторанов равным 0,05, решающее правило примет следующий вид: нулевая гипотеза Н0 (р, = р2 = р3 = р4) отклоняется, если F > 3,29. Число 3,29 представляет собой верхнее критическое значение F-распределения, имеющего три степени свободы в числителе и 15 степеней свободы в знаменателе (см. рис. 10.20). Поскольку F = 39,758 >FV = 3,29 (т.е. р = 0,000 < 0,05), мы можем отклонить гипотезу Н0 и утверждать, что средние рейтинги ресторанов статистически значимо различаются между собой. Чрезвычайно малое значение р означает, что, если бы средние рейтинги четырех подразделений были одинаковыми, вероятность обнаружить разности между их выборочными средними, была бы крайне малой. Итак, нулевая гипотеза практически невероятна. Следовательно, альтернативную гипотезу можно считать корректной.

Рис. 10.20. Области отклонения и принятия гипотез при изучении сети ресторанов быстрого питания при уровне значимости, равном 0,05, стремя и 15 степенями свободы

Рис. 10.21. Области отклонения и принятия гипотез при изучении сети ресторанов быстрого питания при уровне значимости, равном 0,05, с пятью и 15 степенями свободы

Для проверки эффективности блокировки, можно проверить разность между экспертами. При 5% -м уровне значимости решающее правило можно сформулировать следующим образом: нулевая гипотеза if0(p1 = р2 = ... = р6) отклоняется, если вычисленная

статистика F>2,90. Число 2,90 представляет собой верхнее критическое значение ^-распределения, имеющего пять степеней свободы в числителе и 15 степеней свободы в знаменателе (см. рис. 10.21). Поскольку F = 3,782 > Fv = 2,90 (т.е. р = 0,02 < 0,05), мы может отклонить гипотезу Н0 и утверждать, что средние рейтинги ресторанов статистически значимо различаются между собой. Итак, применение блоков уменьшает экспериментальную ошибку.

Процедуры Excel: дисперсионный анализ с помощью рандомизированного эксперимента

Чтобы выполнить однофакторный дисперсионный анализ, следует применить процедуру I

Анализ данных...^Двухфакторный дисперсионный анализ без повторений. В надстройке PHStat2 j

эта процедура не предусмотрена. Кроме того, вследствие сложности вычислений шаблон рабочего I

листа для этого критерия довольно трудно реализовать вручную. 1

Например, чтобы осуществить дисперсионный анализ данных, приведенных в табл. 10.9, используя блочный рандомизированный эксперимент, необходимо открыть рабочий лист Рейтинги в рабочей книге Chapter 10.xls и выполнить такие действия.

Двухфакторный дисперсионный анализ без повторений |Х[

Входные данные Входной интервал:

0 Метки Альфа: :о,05 \

Параметры вывода О Выходной интервал: (*} Новый рабочий лист: О Новая рабочая книга

Выбрать команду Сервисе Анализ данных...

\ Отмена j Справка

В диалоговом окне Анализ данных выбрать пункт Двухфакторный дисперсионный анализ без повторений в списке Инструменты анализа. Щелкнуть на кнопке ОК.

В диалоговом окне Двухфакторный дисперсионный анализ без повторений

(см. иллюстрацию) сделать следующее.

3.1. Ввести в окне редактирования Входной интервал переменной 1

3.2. 3.3. 3.4.

3.5.

диапазон А1:Е7.

Установить флажок Метки.

Ввести в окне редактирования Альфа число 0, 05.

Установить переключатель Параметры вывода в положение Новый рабочий лист и ввести название нового листа.

Щелкнуть на кнопке ОК.

Рабочий лист, созданный с помощью этой процедуры, не является динамически обновляемым. Следовательно, если данные изменятся, все описанные выше действия необходимо повторить.

Для выполнения этой процедуры необходимо, чтобы данные для каждой группы располагались в разных столбцах. Такие данные называются разгруппированными. Для того чтобы обработать сгруппированные данные, следует выполнить процедуру, описанную в разделе ЕН.9.2.

Кроме обычных ограничений, принятых в однофакторном дисперсионном анализе, необходимо также предположить, что между условиями факторного эксперимента и блоками нет взаимодействия. Иначе говоря, необходимо, чтобы все различия между условиями эксперимента (ресторанами) были согласованы со всеми блоками (отмечались всеми экспертами). Понятие взаимодействия (interaction) обсуждается в разделе 10.2.
  1   2   3   4

Похожие:

Блочный рандомизированный эксперимент iconО проведении эксперимента по маркировке товаров контрольными
Провести на территории Российской Федерации эксперимент по маркировке товаров контрольными (идентификационными) знаками по товарной...

Блочный рандомизированный эксперимент iconПриоритеты мировой науки: эксперимент и научная дискуссия Материалы...
«Приоритеты мировой науки: эксперимент и научная дискуссия»: Материалы I международной научной конференции 30-31 мая 2013 года, г....

Блочный рандомизированный эксперимент iconУмк “ The world of English 5-11” Эксперимент с Единым государственным...
Эксперимент с Единым государственным экзаменом перешел в новую фазу – фазу «поэтапного внедрения» по всей стране. Планируется, что...

Блочный рандомизированный эксперимент iconО. Е. Пахалин о проведении эксперимента по совершению таможенными...
Аможенной процедуры таможенного транзита, в таможенных органах Российской Федерации проводится эксперимент по совершению таможенными...

Блочный рандомизированный эксперимент iconРекомендации к выполнению лабораторных работ 1
Вы должны подготовиться так, чтобы выполнять эксперимент, руководствуясь только своими записями и не обращаясь в лаборатории к данному...

Блочный рандомизированный эксперимент iconАдвокатура и адвокатская деятельность
Оказание юридической помощи гражданам РФ бесплатно. Гарантии предоставления юридической помощи малоимущим. Эксперимент по созданию...

Блочный рандомизированный эксперимент iconАдвокатура и адвокатская деятельность
Оказание юридической помощи гражданам РФ бесплатно. Гарантии предоставления юридической помощи малоимущим. Эксперимент по созданию...

Блочный рандомизированный эксперимент iconАналитические материалы гиа-9
Егэ). Обучающиеся же, освоившие образовательные программы основного общего образования, проходят государственную (итоговую) аттестацию...

Блочный рандомизированный эксперимент iconЗадача Струпа
За полвека до появления задачи Струпа. Разветвленное дерево современных исследований во многих направлениях психологии, опирающееся...

Блочный рандомизированный эксперимент icon«Технология психолого-педагогического сопровождения учащихся с проявлением...
Начиная с этого времени, в исследованиях человеческой психики прочно обосновался эксперимент, что и итоге и способствовало превращению...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск