Информатизация системы образования


НазваниеИнформатизация системы образования
страница14/21
ТипУчебник
filling-form.ru > Бланки > Учебник
1   ...   10   11   12   13   14   15   16   17   ...   21

Случайная выборка



«Нельзя объять необъятное», - говаривал Козьма Прутков, не подозревая, что это один из главных принципов статистических исследований. Невозможно узнать мнение каждого телезрителя о новой телепрограмме, установить возраст каждого жителя планеты или определить срок службы каждой электролампочки. Но, оказывается, для получения вполне достоверных статистических выводов это и не обязательно: достаточно выбрать не очень большое количество телезрителей, жителей планеты или лампочек и подвергнуть изучению только эту часть – так называемую, случайную выборку. Во многих ситуациях этого бывает достаточно, чтобы сделать выводы обо всей совокупности в целом.

4.1. Генеральная совокупность и случайная выборка



Выборочный метод. Генеральная совокупность. Случайная выборка

Пример 1. Случайная выборка в социологическом опросе

Пример 2. Случайная выборка в серии экспериментов

Репрезентативность выборки. Повышение репрезентативности

Пример 3. Как составляют выборку?

Пример 4. Снова о количестве детей

От выборки к статистическому ряду. Типы статистических данных

Пример 5. Статистика хоккейного чемпионата

Пример 6. Уровень загрязнения

Пример 7. Группа крови

Ранжирование и вариационный ряд

Пример 8. Ранжирование в MS Excel




НЕОБХОДИМЫЕ СВЕДЕНИЯ








Выборочный метод

Основным методом всех статистических исследований является выборочный метод. Суть его состоит в том, что в реальном исследовании мы наблюдаем не всю совокупность явлений или объектов, которые хотели бы изучить, а лишь какую-то их часть.

Например, при определении рейтинга телевизионной передачи практически невозможно выяснить мнение всех телезрителей, поэтому проводят выборочное обследование лишь малой их части. Или другой пример: для выяснения, какая сумма чисел выпадает на кубиках чаще всего, мы не можем продолжать наш опыт бесконечно долго. Однако с большой уверенностью можно ответить на этот вопрос уже после нескольких сотен опытов1.

Генеральная совокупность

Вся совокупность явлений или объектов, подлежащих статистическому исследованию, называется генеральной совокупностью. Элементами генеральной совокупности могут быть неодушевленные предметы, живые люди, природные явления, физические эксперименты и т.д. В каждом конкретном исследовании генеральная совокупность зависит от тех целей, которые ставятся перед исследованием.

Если мы хотим определить уровень жизни пенсионеров, то именно они составляют генеральную совокупность, а если уровень жизни в стране вообще, то это все ее население.

Случайная выборка

Во всех приведенных выше примерах практически невозможно подвергнуть обследованию все интересующие нас объекты – это или слишком дорого (в примерах с рейтингом передачи и уровнем жизни), или вообще невозможно (в примере с кубиками). Поэтому из всей генеральной совокупности для обследования выбирают небольшое (по сравнению с генеральной совокупностью) конечное множество элементов, которые составляют случайную выборку. Эти элементы изучают, выявляют различные характеристики и закономерности, а затем переносят полученные результаты на всю генеральную совокупность. Количество элементов в выборке называют ее объемом.









Пример 1.

Случайная выборка в социологическом опросе

На Web-сайте kapital.perm.ru опубликовано интересное исследование, посвященное популярной сегодня профессии бухгалтера. Наряду с прочими вопросами, авторов исследования интересовал вопрос: не мешает ли эта профессия семейной жизни? Для ответа на него была сделана случайная выборка из 100 женщин-бухгалтеров, которым был задан вопрос – сколько у них детей? Статистика получилась такой: у 39% детей нет вообще, 41% имеет одного ребенка, 17% - двоих, и лишь 3% - троих и более детей.

Судя по целям исследования, генеральной совокупностью здесь считалась совокупность всех женщин России, занятых в этой профессии.

? Как вы думаете, можно ли обобщить полученные результаты на всех женщин России (не только бухгалтеров)? На всех женщин Земли?









Пример 2.

Случайная выборка в серии экспериментов

На ³ приведены примеры случайных выборок, «извлеченных» из бесконечной серии экспериментов с двумя реальными кубиками: в первой из них всего 6 экспериментов, во второй 100, в третьей – 1000. Все три выборки были проведены для того, чтобы выяснить, какая сумма очков выпадает на кубиках чаще? Для первой выборки это оказались суммы 4 и 6, для второй выборки – суммы 5, 7 и 9, а для третьей – сумма 7.

Вы можете легко получить аналогичную выборку с помощью ВЛ «Классическая вероятность», поставив в ней соответствующую серию опытов.

? Вспомните, какая сумма очков на двух кубиках наиболее вероятна?







Репрезентативность выборки


Суть выборочного метода, о котором шла речь выше, состоит в том, чтобы обобщить результаты, полученные в выборке, на всю генеральную совокупность. К сожалению, такое обобщение далеко не всегда возможно. Если выборка действительно отражает закономерности, присущие всей генеральной совокупности, то она называется репрезентативной (от английского represent – отражать, представлять).

Повышение репрезентативности

Один из путей повышения репрезентативности – увеличение объема выборки. В примере с кубиками только в третьей выборке, содержащей 1000 опытов, удалось получить результаты, которые действительно можно распространить на всю генеральную совокупность (т.е. сказать, что самое вероятное значение суммы равно 7). Попытка сделать то же самое для первой и второй выборок, содержащих соответственно 6 и 100 опытов, приведет к ошибкам.

Но на практике увеличение объема выборки далеко не всегда возможно. Кроме того, очень непросто осуществить сам случайный выбор.

Вернемся к примеру 1 с опросом женщин-бухгалтеров. Идеальной схемой такого опроса была бы следующая: получить список всех женщин России, занятых в этой профессии, ввести его в компьютер, а затем с помощью специального датчика случайных чисел произвести этот случайный выбор. Такое решение было бы идеальным – но, оно неосуществимо на практике. Во-первых, мы никогда не сможем получить такого списка (разве что при проведении всеобщей переписи населения); во-вторых, если для анкетирования какого-то из респондентов, выбранного компьютером, придется ехать за полярный круг или подниматься высоко в горы, наше исследование окажется слишком дорогим. Поэтому приходится изобретать более практичные механизмы получения репрезентативных выборок - например, следить за тем, чтобы при выборе респондентов для проведения опроса были пропорционально представлены все слои и группы населения.









Пример 3.

Как составляют выборку?

Мы уже неоднократно приводили таблицы с результатами опросов, проводимых Фондом «Общественное мнение». Интересно посмотреть, какова структура случайных выборок, полученных в этих опросах. На ³ вы найдете таблицу, в которой показана структура выборок в трех различных опросах, проведенных ФОМ: «О ценах на хлеб», «Французы и россияне», «Отношение к моде». Как видите, темы опросов очень разные, проводились они в разное время в разных регионах, с участием разных респондентов, а вот структура всех трех выборок очень похожа: в каждой приблизительно поровну мужчин и женщин, около 18% составляют люди с высшим образованием, приблизительно 8% опрошенных – москвичи и т.д. Все эти показатели отражают те самые пропорции генеральной совокупности (т.е. всего населения России), которые позволяют даже при небольшом объеме выборки (1500 человек) сделать ее репрезентативной.

На сайте ФОМ www.fom.ru вы можете узнать о той сложной технологии, с помощью которой достигается эта репрезентативность.









Пример 4.

Снова о количестве детей

Вернемся к примеру, в котором выяснялся вопрос о количестве детей в семье женщин-бухгалтеров. Если в качестве генеральной совокупности подразумевались только женщины, имеющие профессию бухгалтера, то она еще может претендовать на репрезентативность (хотя, честно говоря, ее объем слишком мал).

Если же в качестве генеральной совокупности нас интересуют женщины в России вообще, то она явно нерепрезентативна. В подтверждение этому на ³ приведены данные уже знакомого вам сайта www.perepis2002.ru, полученные при проведении последней всероссийской переписи населения.

? Объясните, почему эти данные подтверждают нерепрезентативность первой выборки.







От выборки к статистическому ряду

При проведении статистического исследования каждый объект, участвующий в выборке, характеризуется каким-то набором свойств и признаков. И когда дело доходит до статистической обработки данных, полученных в выборке, то от предметов, людей или явлений остаются только ряды чисел. С этой точки зрения выборкой можно считать ряд данных (чаще всего числовых), полученных в результате статистического наблюдения. Такой ряд называют статистическим.

Если каждый элемент выборки описывается не одним, а несколькими признаками, то будем рассматривать не один ряд, а несколько рядов, связанных друг с другом.







Типы статистических данных

По типу представленных в них данных статистические ряды можно разделить на числовые и нечисловые. Например: возраст респондентов – числовой ряд, а их пол или образование – нечисловой.

В свою очередь числовые ряды делятся на дискретные и непрерывные – в зависимости от характера представленной этим рядом величины. Если количество возможных значений числовой величины конечно (и, как правило, невелико), то такая величина называется дискретной. Если величина может принимать любые значения из некоторого промежутка, то такая величина называется непрерывной. Например: количество детей в семье – величина дискретная, средний доход на одного члена семьи – величина непрерывная.

Деление величин на дискретные и непрерывные достаточно условно. Если у дискретной величины очень много возможных значений, то ее вполне можно рассматривать как непрерывную. Наоборот, если непрерывную величину измерять очень грубо, с большой погрешностью, то ее можно будет считать дискретной.









Пример 5.

Статистика хоккейного чемпионата

На ³ представлены результаты матчей чемпионата мира по хоккею, состоявшегося в 2007 году в Москве. На основе этой выборки можно получить дискретный статистический ряд – количество шайб, забитых за каждую игру.

? Что можно считать генеральной совокупностью в этом примере?









Пример 6.

Уровень загрязнения

В этом примере представлены данные экологического контроля за состоянием воздуха над различными районами Москвы. На трех листах таблицы представлено содержание оксида углерода, диоксида азота и оксида азота. Содержание этих веществ дается в долях предельно допустимой концентрации и является непрерывной величиной.

? Придумайте какие-нибудь вопросы, на которые, на ваш взгляд, можно найти ответы с помощью этой таблицы.









Пример 7.

Группа крови

В этом примере представлена случайная выборка из электронной картотеки пациентов (для сохранения врачебной тайны все пациенты анонимные). Для каждого пациента указан его пол, возраст, день поступления в клинику, день выписки и группа крови с указанием резус-фактора.

Группа крови – пример нечислового параметра, который может представлять значительный интерес в статистических медицинских исследованиях. Имеется довольно устойчивая статистика распределения людей по группам крови, причем это распределение неравномерное.

Знание такого распределения играет весьма важную практическую роль: опираясь на нее можно прогнозировать необходимые для медицины запасы крови каждой группы.

? А знаете ли вы свою группу крови?







Ранжирование и вариационный ряд

Вы уже видели, что объемы статистической информации, получаемой в реальных выборочных исследованиях, достаточно велики. Именно это и составляет главную проблему на первом этапе обработки статистических данных. Первый шаг, который может значительно облегчить работу с большими массивами данных, - это их упорядочение.

В статистике упорядочение данных, полученных в выборке, называют ранжированием, а упорядоченный по возрастанию статистический ряд – вариационным рядом. Например: статистический ряд –

2 2 3 3 3 3 4 2 3 3 2 3 2 3 2 3 2 4 3 2 2 3 2 4 5 2 3 3 2 4 3 2 3 4 3 3 2 3 5 3,

полученный по нему вариационный ряд –

2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 5 5.

Вариационный ряд позволяет моментально ответить на многие вопросы, которые остаются «скрытыми» внутри обычного статистического ряда: увидеть минимальное и максимальное значения ряда; оценить, какие значения повторяются чаще и т.д. Но при большом объеме выборки и вариационный ряд – не самая удобная форма представления полученной информации.









Пример 8.

Ранжирование в MS Excel

На ³ показан вариационный ряд, построенный для примера 5 с хоккейным чемпионатом. Ранжирование проводилось с помощью встроенной в MS Excel функции «Сортировка», которая может быть вызвана по кнопке или через меню «Данные > Сортировка»

? Какой матч чемпионата был наиболее результативным? Какой наименее?









ТЕСТЫ








Вопрос №1


Из   совокупности для исследования выбирают небольшое конечное множество элементов, которые составляют   выборку.







Вопрос №2


Чтобы можно было обобщить результаты, полученные в выборке, на всю генеральную совокупность, выборка должна быть

  • случайной;

  • большого объема;

  • репрезентативной;

  • конечной.







Вопрос №3


Данные, полученные в результате статистического наблюдения, называют   рядом. Упорядоченный по возрастанию такой ряд называют   рядом.







Вопрос №4


Статистические числовые ряды делятся на   и  .









ПРАКТИКУМ










Задание №1

С помощью ВЛ «Классическая вероятность» проведите три серии испытаний с двумя кубиками: в первой - 6 экспериментов, во второй - 100, в третьей – 1000. Для каждой серии определите, какие суммы очков выпадали чаще всего.

Выведите полученные результаты на  и сравните их с результатами одноклассников. Объясните полученные отличия.









Задание №2

В примерах к этому уроку рассматривались две выборки, в которых исследовалось количество детей в семье: первая содержала сведения о 100 семьях, вторая была получена в результате Всероссийской переписи населения и, следовательно, была близка ко всей генеральной совокупности.

С помощью  сделайте такую же выборку в своем классе и сравните полученные результаты с первыми двумя выборками. К какой из них ваши результаты ближе? Для какой генеральной совокупности вашу выборку можно считать репрезентативной?









Задание №3

На ³ три выборки с реальными результатами матчей чемпионатов мира по футболу, по хоккею с шайбой и по хоккею с мячом (какая выборка какому виду спорта соответствует - неизвестно).

Попробуйте определить, какая из них к какому виду относится.

Указание: вспомните, какое количество голов забивается обычно за игру в каждом из этих видов спорта.









Задание №4

На ³ записана таблица калорийности продуктов. Ранжируйте эту выборку и найдите в ней самый низкокалорийный и самый высококалорийный продукты.









Задание №5

Перед вами выборка с результатами чемпионата мира по хоккею 2007 года. Сколько матчей чемпионата завершилось с минимальным перевесом одной из команд? В каком матче был зафиксирован самый большой перевес?

Указание: подумайте, какой вариационный ряд, построенный по этой выборке, позволяет ответить на оба вопроса. Постройте его и найдите ответы.









Задание №6

Перед вами случайная выборка пациентов хирургического отделения. Ранжируйте ее по группе крови и определите, какая группа крови в этой выборке самая редкая? Сколько пациентов имеют эту группу крови?









Задание №7

Соберите с помощью  сведения о последних четвертных оценках своих одноклассников по математике, русскому языку и физике. Ранжируйте каждый из этих рядов и найдите минимальную, максимальную и наиболее «популярную» оценку по каждому из этих предметов.









ИССЛЕДОВАНИЯ








Как делают выборку?

На основании материалов сайта www.fom.ru выясните, по какой методике составляется выборка в опросах ФОМ. Сравните эту методику с другими (найдите их описание в сети Интернет). Подготовьте на эту тему доклад и презентацию.







Любимый предмет

Проведите в своей школе опрос о любимых школьных предметах. Составьте на его основе рейтинг школьных предметов. Выясните, наблюдается ли зависимость этого рейтинга от возраста школьников? От учителя, который ведет предмет?



1   ...   10   11   12   13   14   15   16   17   ...   21

Похожие:

Информатизация системы образования iconДанное учебное пособие разработано специально для тьюторов проекта...

Информатизация системы образования iconДвенадцатая международная научно-техническая конференция Измерение, контроль, информатизация
Государственное образовательное учреждение высшего профессионального образования

Информатизация системы образования iconКрасноярск электронный
Сборник содержит материалы, характеризующие уровень информатизации города Красноярска. Информация сопровождается результатами сравнительного...

Информатизация системы образования iconРаспоряжение
Нижегородской области от 3 июля 2009 года №453 "Об утверждении областной целевой программы "Информатизация Нижегородской области...

Информатизация системы образования iconСтатистика труда, занятости, образования, культуры, науки, новых...
Из общего числа форм 5 (26,3%) годовой периодичности представления данных, 6 (31,6%), месячной, 6 (31,6%) – квартальной, 2 (10,5%)...

Информатизация системы образования iconОтчет о результатах самообследования частного образовательного учреждения...
Нормативная и распорядительная документация вуза, организация делопроизводства и информатизация управленческой деятельности

Информатизация системы образования iconО Почетной грамоте министерства образования Тульской области
Самоуправления, осуществляющих управление в сфере образования, работники системы образования и архивного дела, иные лица и коллективы...

Информатизация системы образования iconСборник учебно-методических материалов для педагогов системы общего...
Учебно-методические материалы ориентированы на специалистов системы общего образования (педагогов, заместителей руководителей оу...

Информатизация системы образования iconПрактические рекомендации по выбору типовой модели системы управления...
Настоящие Практические рекомендации подготовлены в рамках Федеральной программы развития образования на 2005 год по проекту «Научно-методическое...

Информатизация системы образования iconПрограмма подготовки специалистов системы обеспечения вызова экстренных...
Программа предназначена для повышения квалификации специалистов системы-112

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск