друзей, чел.Время решения контрольной, час.1159454309524203,5332658,521606164011532252,6236376,231615661011124282,87594106,84162483309724193,37516412,051625442010560233,0004927,56164582909816202,82814610,071665148010990263,2557897,281696261012024192,7261054,291707084012248302,429130103,510170723309224202,3612039,5111717356011016282,3428687,8121716445010248212,6722948,0131727335010832262,3567576,0141746831010048212,5592244,8151768138010464202,1733218,6161768434010448192,09521510,0171787666012890272,3429684,5181819045010648262,01170912,5191836854010532232,69159610,5201929575011760272,0219846,5Тема 3. Выборочное наблюдение Методические указания по теме Задача 1. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц:
Доход, у.е.до 300300-500500-700700-1000более 1000Число рабочих82844173С вероятностью 0,950 определить:
1) среднемесячный размер дохода работников данного предприятия;
2) долю рабочих предприятия, имеющих месячный доход более 700 у.е.;
3) необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.;
4) необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.
Решение. Выборочный метод (выборка) используется, когда применение сплошного наблюдения физически невозможно из-за огромного массива данных или экономической нецелесообразности. Учитывая, что на основе выборочного обследования нельзя точно оценить изучаемый параметр (например, среднее значение – или долю какого-то признака – р) генеральной совокупности, необходимо найти пределы, в которых он находится. Для этого необходимо определить изучаемый параметр по данным выборки (выборочную среднюю – и/или выборочную долю – w) и его дисперсию (Дв). Для этого построим вспомогательную таблицу 0.
Таблица 0. Вспомогательные расчеты для решения задачи
XifiХИXИfi(ХИ -)2(ХИ -)2fi до 300820016001376411101128300 - 500284001120029241818748500 - 700446002640084137004700 - 10001785014450778411323297более 10003115034503352411005723Итого100 57100 4285900По формуле (2) получим средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу ( ) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: Дв = 4285900/100 = 42859.
Затем необходимо определить предельную ошибку выборки по формуле (2)1:
= t, (2)
где t – коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки; – средняя ошибка выборки, определяемая для повторной выборки по формуле ( ), а для бесповторной – по формуле ( ):
= , ( ) = , ( )
где n – численность выборки; N – численность генеральной совокупности.
В нашей задаче выборка бесповторная, значит, применяя формулу ( ), получим среднюю ошибку выборки при определении среднего возраста в генеральной совокупности: = = 19,640 (у.е.).
Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в генеральной совокупности необходимо определить дисперсию этой доли. Дисперсия доли альтернативного признака w (признак, который может принимать только два взаимоисключающих значения – например, больше или меньше определенного значения) определяется по формуле (2):
. (2)
В нашей задаче долю альтернативного признака (рабочие с доходами более 700 у.е.) найдем как отношение числа таких рабочих к общему числу рабочих в выборке: w = 20/100 = 0,2 или 20%. Теперь определим дисперсию этой доли по формуле (2): =0,2*(1-0,2) = 0,16. Теперь можно рассчитать среднюю ошибку выборки по формуле ( ): = = 0,038 или 3,8%.
Значения вероятности и коэффициента доверия t имеются в математических таблицах нормального закона распределения вероятностей (если в выборке более 30 единиц), из которых в статистике широко применяются сочетания, приведенные в таблице 0:
Таблица 0. Значения интеграла вероятностей Лапласа
0,6830,8660,9500,9540,9880,997t11,51,9622,53В нашей задаче = 0,950, значит t = 1,96 (то есть предельная ошибка выборки в 1,96 раза больше средней). Предельная ошибка выборки по формуле (2) будет равна: = 1,96*19,64 = 38,494 (у.е.) при определении среднего дохода; = 1,96*0,038 = 0,075 или 7,5% при определении доли рабочих с доходами более 700 у.е.
После расчета предельной ошибки находят доверительный интервал обобщающей характеристики генеральной совокупности по формуле (2) – для средней величины и по формуле (2) – для доли альтернативного признака:
(-) (+) (2) (w-) p (w +) (2)
В нашей задаче по формуле (2): 571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е.
Аналогично определяем доверительный интервал для доли по формуле (2): 0,2-0,075 p0,2+0,075 или 0,125 p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%.
При разработке программы выборочного наблюдения очень часто задается конкретное значение предельной ошибки () и уровень вероятности (). Неизвестной остается минимальная численность выборки (n), обеспечивающая заданную точность. Ее можно получить, если подставить формулу ( ) или ( ) в формулу (2) и выразить из них n. В результате получатся формулы для вычисления необходимой численности повторной (2) и бесповторной (2) выборок.
nповт = ; (2) nб/повт = . (2)
В нашей задаче выборка бесповторная, значит, воспользуемся формулой (2), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (Дв = 42859) и доли рабочих с доходами более 700 у.е. (Дв = 0,16):
nб/повт = = 62 (чел.), nб/повт= = 197 (чел.).
Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.
Контрольные задания по теме Для изучения вкладов населения в коммерческом банке города была проведена 5%-я случайная выборка лицевых счетов, в результате которой получено следующее распределение клиентов по размеру вкладов:
Размер вклада, у.е.Число вкладчиков, чел.Вариант12345678910до 50001080100506030902070405 000 – 15 000406015030401107565908015 000 – 30 0002535709012090130140609530 000 – 50 00030454058030607520115свыше 50 000151030255015255105С вероятностью 0,954 определить:
1) средний размер вклада во всем банке;
2) долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;
3) необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;
4) необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.
|