Информатизация системы образования


НазваниеИнформатизация системы образования
страница17/21
ТипУчебник
filling-form.ru > Бланки > Учебник
1   ...   13   14   15   16   17   18   19   20   21

Числовые характеристики выборки



Английский статистик Р.Фишер писал: «Статистика может быть охарактеризована как наука о сокращении и анализе материала, полученного в наблюдениях». Предыдущая глава была посвящена «борьбе» с обилием статистической информации. Мы научились представлять ее более наглядно и более компактно: в виде таблиц, графиков, диаграмм.

Теперь мы пойдем еще дальше и попробуем охарактеризовать всю совокупность числовых данных, полученных в выборке, одним-двумя числами, которые будут своеобразной квинтэссенцией всей выборки.

5.1. Характеристики среднего



Среднее значение.

Пример 1. Средний балл по географии

Вычисление среднего в MS Excel.

Пример 2. Средняя цена монитора

Свойства среднего. «Средняя температура по больнице»

Мода. Всегда ли существует мода? Мода для нечисловых данных

Вычисление моды в MS Excel.

Пример 3. Самый «модный» счет

Медиана

Вычисление медианы в MS Excel.

Пример 4. Самый «средний» ноутбук

Устойчивость медианы

Какая характеристика лучше?

Пример 5. «Средний» гвоздь

Пример 6. «Среднее» время ДТП

Пример 7. «Средний» результат




НЕОБХОДИМЫЕ СВЕДЕНИЯ











Характеристики среднего (или средние характеристики) описывают положение всего статистического ряда на числовой прямой.

Среднее значение

Наиболее известной и употребительной такой характеристикой является среднее арифметическое всех членов данного ряда, т.е.



(для обозначения среднего используется черточка над буквой ).

В статистике эту величину называют еще средним значением или выборочным средним. В большинстве реальных исследований именно среднее арифметическое несет наиболее важную (но, разумеется, не всю!) информацию об изучаемом явлении. Достаточно вспомнить выражения «средний балл», «средняя зарплата», «средний доход», хорошо знакомые и понятные большинству людей, далеких от математики.







Пример 1.

Средний балл по географии

Ученик получил в течение первой учебной четверти следующие отметки по географии: 5, 2, 4, 5, 5, 4, 4, 5, 5, 5. Найдем его средний балл, т.е. среднее арифметическое всех членов ряда:



Именно эта величина, скорее всего, будет главным ориентиром для учителя при выставлении четвертной оценки. Заметьте, что среднее значение ряда вполне может не совпадать ни с одним из его элементов. В нашем примере средний балл получился 4,4, хотя все оценки выражались целыми числами.









Вычисление среднего в MS Excel

В MS Excel среднее значение можно вычислить как непосредственно по определению (найти сумму всех членов ряда и поделить на их количество), так и с помощью специальной функции СРЗНАЧ(), для которой достаточно задать диапазон ячеек, в которых записан числовой ряд. На ³ показаны оба этих способа.









Пример 2.

Средняя цена монитора

На ³ записан прайс-лист с ценами на различные модели мониторов. Для каждой категории мониторов (категории берутся по размерам) вычисляется средняя цена. Для вычислений используется статистическая функция СРЗНАЧ().







Свойства среднего

Среднее арифметическое числового ряда является его наиболее естественным «центром». Представим себе, что в каждой из точек на числовой оси находятся грузы одинаковой массы. Если теперь «подвесить» числовую ось в точке , то вся система будет находиться в равновесии. В физике такую точку называют центром масс.

Из определения среднего арифметического вытекает и еще целый ряд замечательных свойств, многие из которых вы откроете самостоятельно, выполняя задания практикума.

«Средняя температура по больнице»

Понятно, что среднее значение дает далеко неполное представление о поведении изучаемой величины. Например, на планете Меркурий средняя температура +15°. Исходя из этого статистического показателя, можно подумать, что на Меркурии умеренный климат, удобный для жизни людей. Однако на самом деле это не так. Температура на Меркурии колеблется от -150° до +350°.

Вообще, неполнота информации, заключенной в средних величинах, – излюбленная тема для всевозможных статистических шуток и анекдотов. Наиболее любимый из них: «средняя температура по больнице – 36,6°».







Мода

Вернемся к примеру 1 с оценками по географии: 5, 2, 4, 5, 5, 4, 4, 5, 5, 5. Среднее значение этого ряда получилось 4,4. Следуя этому результату, итоговую оценку, скорее всего, придется поставить 4. Но справедливо ли это? Ведь из 10-ти полученных учеником оценок целых шесть – пятерки. И это весомый аргумент в пользу итоговой пятерки: ведь именно такую оценку ученик получал в течение четверти чаще всего. В статистике она называется модой.

Итак, модой числового ряда называют число, которое встречается в этом ряду наиболее часто. Можно сказать, что оно в этом ряду самое «модное». Для нашего примера мода равна 5.

Всегда ли существует мода?

В отличие от среднего арифметического, которое можно вычислить для любого числового ряда, моды у ряда может вообще не быть. Пусть, например, тот же ученик получил следующие оценки: 3, 2, 4, 5, 5, 4, 4, 4, 5, 5. Здесь нет числа, встречающегося чаще других. Оценки 4 и 5 встречаются в этом ряду одинаково часто. Значит, у этого ряда нет моды. Иногда используют в этой связи другую терминологию: ряд, имеющий единственную моду, называют унимодальным, а ряд, у которого моды нет (или, если угодно, мод несколько) – полимодальным.

Мода для нечисловых данных

Особенностью моды является то, что ее, в отличие от среднего арифметического, можно использовать не только в числовых рядах. Если, например, опросить большую группу учеников, какой школьный предмет им нравится больше всего, то модой этого ряда ответов окажется тот предмет, который будут называть чаще остальных. Это одна из причин, по которой мода широко используется при изучении спроса и проведении других социологических исследований. Например, при решении вопросов, в пачки какого веса фасовать масло, какие открывать авиарейсы и т. п. предварительно изучается спрос и выявляется мода - наиболее часто встречающийся заказ. И даже выборы президента, с точки зрения статистики, не более, чем определение моды …



Вычисление моды в MS Excel

Для небольших по объему выборок моду можно вычислить «методом пристального взгляда» - правда, перед этим данные лучше ранжировать. Для больших выборок удобно использовать специальную функцию MS Excel, которая так и называется МОДА(). При ее вызове достаточно указать диапазон ячеек, в которых записаны данные выборки. На ³ показано, как это делается.









Пример 3.

Самый «модный» счет

На ³ представлены результаты матчей чемпионата России по футболу 2006 года. По результатам этой выборки построен ряд, показывающий количество мячей, забитых в каждом матче, и найдена его мода.

? А что делать, если нас интересует самый модный счет, который был зафиксирован? В этом случае пользоваться количеством забитых голов уже нельзя – одному и тому количеству голов может соответствовать разный счет.







Медиана

Еще одной важной средней характеристикой числового ряда является его медиана – число, которое делит его на две равных половины. Более точно, медианой числового ряда называют число этого ряда (или полусумму двух его чисел), которое будет находиться ровно посередине ряда после его ранжирования (т.е. упорядочения).

Чтобы найти медиану числового ряда, сначала его нужно ранжировать и получить вариационный ряд. В нашем примере 1 с оценками по географии он выглядит так: 2, 4, 4, 4, 5, 5, 5, 5, 5, 5. Если вариационный ряд содержит нечетное количество чисел, то нужно взять число, которое находится ровно посередине. Если же ряд содержит четное количество чисел (как в нашем примере), то нужно взять два средних числа и найти их полусумму: . Как видите, медиана в примере 1, как и мода, оказалась равна 5 – это еще один довод в пользу итоговой пятерки.



Вычисление медианы в MS Excel

Вычисление медианы в MS Excel можно провести по описанному выше алгоритму: сначала упорядочить ряд, а потом взять его среднее число (или полусумму двух средних). Но есть и специальная функция МЕДИАНА(), которая позволяет найти медиану автоматически по указанному диапазону ячеек. На ³ приведен пример такого вычисления.









Пример 4.

Самый «средний» ноутбук

Очень часто, покупая какую-либо техническую новинку, мы стараемся выбрать не очень дорогую (жалко денег!), но и не очень дешевую (плохое качество!) модель – «что-то среднее».

На ³ записан прайс-лист на ноутбуки. С помощью медианы найдена эта средняя цена и соответствующие ей модели компьютеров.









Устойчивость

медианы

Достоинством медианы является ее бόльшая по сравнению со средним арифметическим устойчивость к ошибкам. Представим себе, что при записи числового ряда

15,5; 13,4; 12,4; 16,2; 14,6; 12,8; 13,5; 14,3; 16,4; 15,9

произошла досадная оплошность: в одном из чисел мы пропустили десятичную запятую и вместо 16,2 написали 162. Тогда среднее арифметическое возрастет с 14,5 до 29,08 (в два раза), а медиана как была 14,45, так и останется!

? Убедитесь в этом с помощью таблицы, приведенной на ³.







Какая характеристика лучше?

Итак, мы ввели в рассмотрение три числовые характеристики для описания поведения числового ряда в среднем: среднее арифметическое; мода; медиана. Какая из них лучше характеризует поведение ряда? Ответить на этот вопрос однозначно нельзя: в каждом конкретном примере это может быть любая из них.









Пример 5.

«Средний» гвоздь

Гвозди в магазине продают на вес. Чтобы оценить, сколько гвоздей содержится в одном килограмме, покупатель решил найти вес одного гвоздя. Для повышения точности измерений он взвесил на лабораторных весах несколько разных гвоздей и получил следующий ряд чисел (вес гвоздей в граммах):

4,47; 4,44; 4,64; 4,32; 4,45; 4,32; 4,54; 4,58

Какую из характеристик – среднее арифметическое, моду или медиану этого ряда ему следует взять в качестве оценки для веса одного гвоздя?

Найдем все три характеристики:

; Мода; Медиана.

Самой подходящей по смыслу задачи является среднее арифметическое. Несильно отличается от него и медиана, которая тоже вполне пригодна для оценки среднего веса. А вот мода здесь вряд ли подойдет, поскольку все значения полученного ряда разные и совпадение двух чисел 4,32 вряд ли отражает какую-то существенную закономерность в изготовлении гвоздей.

Таким образом, при формальном существовании всех трех характеристик, разумно использовать можно только две из них. Какую именно – все равно, поскольку они в данном случае очень близки друг к другу.









Пример 6.

«Среднее» время ДТП

А вот пример, в котором наоборот, мода содержит больше полезной информации. На ³ записан ранжированный ряд, представляющий данные о времени дорожно-транспортных происшествий на улицах Москвы в течение одних суток (в виде час : мин):

0:15, 0:55, 1:20, … , 21:30, 21:45, 22:10, 22:35

Как и для любого ряда в данном случае мы можем найти среднее арифметическое - оно равно 13:33. Однако вряд ли имеет какой-то смысл утверждение типа «аварии на улицах Москвы происходят в среднем в 13 часов 33 минуты». В то же время, если сгруппировать данные этого ряда в интервалы, можно найти такой временной интервал, когда происходит наибольшее количество ДТП (такую характеристику называют модальным интервалом). Получив такую характеристику, соответствующим службам имеет смысл серьезно проанализировать, почему именно в этот временной интервал происходит наибольшее количество происшествий, и попытаться устранить их причины.









Пример 7.

«Средний» результат

На школьной спартакиаде проводится несколько квалификационных забегов на 100 метров, из которых в финал выходит ровно половина от числа всех участников. На ³ представлены результаты всех спортсменов:

15,5; 16,8; 21,8; 18,4; 16,2; 32,3; 19,9; 15,5; 14,7; 19,8; 20,5; 15,4.

Какое время позволяет пройти в финал? Здесь для ответа на вопрос нужно вычислить медиану: 17,6. Спортсменов, которые имеют результат выше найденного, будет как раз половина от числа всех участников. А вот результат выше среднего арифметического, которое равно здесь 18,9, еще не позволяет рассчитывать на выход в финал: в списке есть спортсмен с результатом 18,4, который не попадает в финал. Мода этого ряда равна 15,5 и дает слишком завышенную оценку для «среднего результата».









ТЕСТЫ


Вопрос №1


Укажите соответствие:

Среднее арифметическое

Значение ряда, которое повторяется чаще других

Мода

Середина ранжированного ряда

Медиана

«Центр масс» значений ряда



Вопрос №2


Какую среднюю характеристику можно использовать в нечисловых рядах?

  • среднее арифметическое;

  • мода;

  • медиана.






Вопрос №3


Какая средняя характеристика наиболее устойчива к случайным ошибкам при записи данных?

  • среднее арифметическое;

  • мода;

  • медиана.






Вопрос №4


На стадионе «Локомотив» была зафиксирована следующая посещаемость первых четырех футбольных матчей: 24000, 18000, 22000, 24000.

а) Какова была средняя посещаемость этих матчей?

б) Сколько зрителей должно посетить следующий матч, чтобы средняя посещаемость выросла?

  • не менее 24000;

  • больше 22000;

  • больше 18000;

  • не менее 20000.






Вопрос №5


Найдите медиану следующих рядов данных:

а) 8, 4, 9, 5, 2;

б)






Вопрос №6


Дан ряд из четырех чисел: 18, 25, 24, 25. Определите, какая из средних характеристик находится в каждом из следующих пунктов:

а) 18+25+24+25=92; 92 : 4 = 23;   = 23 р.

б) 18, 24, 25, 25; (24+25) : 2 = 24,5;   = 24,5 р.

в) 18, 25, 24, 25;   = 25 р.



ПРАКТИКУМ









Задание №1

На ³ таблица с данными многолетних наблюдений за максимальным уровнем весеннего подъема воды в реке Оке в районе г.Калуги. Найдите все средние характеристики этого числового ряда.








Задание №2

На ³ данные обо всех голах чемпионата Росси по футболу 2003 года. В одном из столбцов таблицы имеются сведения о том, на какой минуте матча был забит каждый гол. Найдите среднее, моду и медиану этого ряда данных. Как вы думаете, какие из этих характеристик могут оказаться полезными для футбольных тренеров?








Задание №3

На одной из станций московского метрополитена были замерены интервалы времени между поездами и получены результаты, представленные на ³ (в формате мин : сек). Найдите среднее значение интервала времени между поездами метро. Ответ получите в виде мин : сек.








Задание №4

На ³ записаны три таблицы с расписанием движения поездов с трех железнодорожных вокзалов Москвы. Найдите среднюю продолжительность одного рейса для каждого из вокзалов. Сравните полученные результаты и попробуйте их объяснить.








Задание №5

На ³ представлены результаты всех матчей чемпионата России по футболу 2006 года. Найдите самый «модный» счет.

Указание 1. С помощью MS Excel превратите счет каждого матча в двузначное число, например: 3:1 в 31.

Указание 2. Чтобы 3:1 и 1:3 превращалось в одно число берите в качестве первой цифры максимальную.








Задание №6

На ³ имеются данные о результатах трех мировых чемпионатов: по хоккею с шайбой, хоккею с мячом и футболу. Найдите среднее значение, моду и медиану для числа голов, забитых в одном матче, на каждом из этих чемпионатов. Сравните полученные величины между собой.








Задание №7

Проведите в ВЛ «Классическая вероятность» 5000 испытаний с двумя кубиками и найдите в каждом из них сумму очков и максимальное из чисел, выпавших на кубиках. У вас получится четыре ряда: первый кубик, второй кубик, сумма и максимум. Для каждого из этих рядов вычислите среднее, моду и медиану.

Сравните свои результаты с тем, что получилось у одноклассников, при помощи .








Задание №8

На ³ записана таблица простых чисел от 1 до 10 000. Найдите среднюю длину интервала между соседними простыми числами.








Задание №9

На ³ содержатся сведения о продажах автомобилей различных марок в одном из автосалонов г. Владимира. Найдите все средние характеристики для числа автомобилей, проданных за один день. Оцените, сколько автомобилей этот автосалон продаст за год?








Задание №10

На ³ записаны результаты финала Всероссийской олимпиады школьников по информатике 2007 года. Найдите среднее количество баллов по каждому классу и сравните эти средние между собой.








Задание №11

На ³ представлены данные экологического контроля за состоянием воздуха над различными районами Москвы – содержание оксида углерода в долях предельно допустимой концентрации. На основании этих данных ответьте на следующие вопросы:

  1. Какой район можно считать самым благополучным в экологическом отношении?

  2. Какой - самым неблагополучным?

  3. Какой месяц по этим данным наиболее благоприятный в экологическом отношении для всей Москвы в целом?

  4. Какой самый неблагоприятный?








Задание №12

На ³ записана итоговая таблица с результатами чемпионата России по футболу 2006 года. Понятно, что установить по ней количество голов, которое забивалось в каждой игре, невозможно. Какую из трех средних характеристик - среднее значение, моду или медиану - для этой величины можно вычислить по данной таблице? Вычислите ее.








Задание №13

С помощью  найдите средний рост и вес своих одноклассников.

Сравните полученные результаты с идеальным весом и ростом, приведенным в таблице.








Задание №14

С помощью  проведите опрос: сколько времени каждый из вас тратит на приготовление домашних заданий и просмотр телевизора. Найдите средние характеристики каждого из этих рядов. Какие выводы можно сделать по полученным результатам?








Задание №15

С помощью ВЛ «Анализ случайной выборки» постройте пять числовых рядов, у которых:

  1. все три средние характеристики – среднее арифметическое, мода и медиана – совпадают;

  2. все три средние характеристики – среднее арифметическое, мода и медиана – различны;

  3. равны между собой только среднее арифметическое и медиана;

  4. равны между собой только среднее арифметическое и мода;

  5. равны между собой только мода и медиана.








Задание №16

С помощью ВЛ «Анализ случайной выборки» найдите для числового ряда

1, 2, 3, 4,

все возможные значения , при которых:

  1. среднее арифметическое ряда равняется 3;

  2. мода равняется 3;

  3. медиана равняется 3.








Задание №17

На ³ представлены экономические показатели различных регионов России за несколько последних лет. В первой строке таблицы приведена средняя зарплата по всей России в целом, далее – по каждому из регионов. Найдите среднее арифметическое зарплат по регионам. Как вы думаете, почему оно не совпадает со средней зарплатой по России?








ИССЛЕДОВАНИЯ







СВОЙСТВА СРЕДНИХ

Каждое число исходного числового ряда увеличили на 10. Что произойдет с его средним арифметическим? модой? медианой? А если каждое число увеличили на ?

Все числа исходного числового ряда увеличили в два раза. Что произойдет с его средним арифметическим? модой? медианой? А если каждое число увеличили в раз?



1   ...   13   14   15   16   17   18   19   20   21

Похожие:

Информатизация системы образования iconДанное учебное пособие разработано специально для тьюторов проекта...

Информатизация системы образования iconДвенадцатая международная научно-техническая конференция Измерение, контроль, информатизация
Государственное образовательное учреждение высшего профессионального образования

Информатизация системы образования iconКрасноярск электронный
Сборник содержит материалы, характеризующие уровень информатизации города Красноярска. Информация сопровождается результатами сравнительного...

Информатизация системы образования iconРаспоряжение
Нижегородской области от 3 июля 2009 года №453 "Об утверждении областной целевой программы "Информатизация Нижегородской области...

Информатизация системы образования iconСтатистика труда, занятости, образования, культуры, науки, новых...
Из общего числа форм 5 (26,3%) годовой периодичности представления данных, 6 (31,6%), месячной, 6 (31,6%) – квартальной, 2 (10,5%)...

Информатизация системы образования iconОтчет о результатах самообследования частного образовательного учреждения...
Нормативная и распорядительная документация вуза, организация делопроизводства и информатизация управленческой деятельности

Информатизация системы образования iconО Почетной грамоте министерства образования Тульской области
Самоуправления, осуществляющих управление в сфере образования, работники системы образования и архивного дела, иные лица и коллективы...

Информатизация системы образования iconСборник учебно-методических материалов для педагогов системы общего...
Учебно-методические материалы ориентированы на специалистов системы общего образования (педагогов, заместителей руководителей оу...

Информатизация системы образования iconПрактические рекомендации по выбору типовой модели системы управления...
Настоящие Практические рекомендации подготовлены в рамках Федеральной программы развития образования на 2005 год по проекту «Научно-методическое...

Информатизация системы образования iconПрограмма подготовки специалистов системы обеспечения вызова экстренных...
Программа предназначена для повышения квалификации специалистов системы-112

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск