Информатизация системы образования


НазваниеИнформатизация системы образования
страница16/21
ТипУчебник
filling-form.ru > Бланки > Учебник
1   ...   13   14   15   16   17   18   19   20   21

4.3. Группировка данных и гистограмма



Пример 1. Сколько весит портфель первоклассника?

Интервальная таблица частот

Когда какую таблицу использовать? На сколько интервалов разбивать?

Пример 2. Интервальная таблица частот в MS Excel

Пример 3. Использование надстройки «Пакет анализа» в MS Excel

Пример 4. Интервальная таблица частот в ВЛ «Анализ случайной выборки»

Гистограмма частот

Пример 5. Гистограмма частот в MS Excel

Пример 6. Гистограмма частот в ВЛ «Анализ случайной выборки»

Пример 7. Деньги на «мобильнике»




НЕОБХОДИМЫЕ СВЕДЕНИЯ











Итак, таблица частот делает представление статистических данных намного компактнее и информативнее. Из нее сразу видно, какие различные значения присутствовали в выборке, какие из них повторялись чаще, а какие реже. Но всегда ли дело обстоит так хорошо?



Пример 1.

Сколько весит портфель первоклассника?


На школьниках 1-го «А» класса было проведено исследование для выяснения того, сколько весит портфель первоклассника. В результате взвешиваний был получен следующий статистический ряд (масса каждого портфеля в кг):

2,1; 2,45; 1,9; 2,6; 3,1; 1,95; 3,4; 4,3; 1,15; 2,7; 2,2; 3,2; 2,4; 2,2; 1,8; 1,5; 2,4; 2,25; 2,6; 1,75

На этот раз мы имеем дело с величиной, которая меняется непрерывно и может принимать любые значения из некоторого интервала. Правда, портфели взвешивались приближенно, с точностью до 50 г, но даже в этом случае почти все значения ряда оказались различными. Вот как будет выглядеть соответствующая таблица частот:

Масса портфеля

Абсолютная частота

Относительная частота

1,15

1

0,05

1,5

1

0,05

1,75

1

0,05

1,8

1

0,05

1,9

1

0,05

1,95

1

0,05

2,1

1

0,05

2,2

2

0,1

2,25

1

0,05

2,4

2

0,1

2,45

1

0,05

2,6

2

0,1

2,7

1

0,05

3,1

1

0,05

3,2

1

0,05

3,4

1

0,05

4,3

1

0,05

Как видите, абсолютная частота каждого значения оказалась равной 1 или 2. Ясно, что никакой наглядности такая таблица не прибавляет.






Интервальная таблица частот

В такой ситуации для наглядного представления результатов выборки приходится группировать данные в интервалы и представлять их в виде интервальной таблицы частот. Весь диапазон значений выборки разбивают на промежутки (чаще всего равные) и подсчитывают частоту попадания в каждый из них.

Вот как будет выглядеть интервальная таблица частот в примере 1, если разбить диапазон от 1 кг до 5 кг на четыре равных промежутка:

Масса портфеля

Абсолютная

частота

Относительная

частота

от 1 до 2 кг

6

0,3

от 2 до 3 кг

10

0,5

от 3 до 4 кг

3

0,15

от 4 до 5 кг

1

0,05

При попадании значения на границу промежутков его относят к какому-то одному из них (например, левому), чтобы не считать дважды. Так, если бы у кого-то из первоклассников портфель весил ровно 3 кг, мы включили бы это значение в промежуток от 2 до 3 кг.

Когда какую таблицу использовать?

Обычная таблица частот используется в том случае, если в выборке исследуется поведение дискретной величины, множество различных значений которой невелико. Интервальная таблица частот удобна для изучения непрерывных величин, которые могут принимать любые значения из некоторого промежутка.

На сколько интервалов разбивать?

При группировке данных интервалов должно быть не очень мало и не очень много – обычно 5-10. Если интервалов будет мало, то от нас ускользнут детали распределения, если много – то мы придем к такой же картине, которая была и без группировки.

Количество интервалов во многом зависит от объема выборки и обычно выбирается так, чтобы почти в каждом интервале, кроме быть может крайних, оказалось хотя бы по пять значений выборки.








Пример 2.

Интервальная таблица частот в MS Excel

При построении интервальной таблицы частот в MS Excel возникают определенные трудности. Для автоматического подсчета абсолютных частот теперь нельзя использовать функцию СЧЕТЕСЛИ() так, как мы делали это в обычной, не интервальной таблице: эта функция в качестве возможных условий подсчета допускает лишь =, >, <, <=, >=, а нам нужно проверять попадание каждого значения в интервал (т.е. использовать двойное неравенство).

Однако выход и здесь возможен. Нужно найти сначала накопленные абсолютные частоты. Для их отыскания достаточно проверять условие <= (меньше или равно):

СЧЕТЕСЛИ(Диапазон; “<=”&ПравыйКонецИнтервала)

Обратите внимание на знак «&» - он служит здесь для того, чтобы «приклеить» к знаку неравенства содержимое ячейки, где находится правый конец каждого очередного интервала.

На ³ показано, как построить этим способом интервальную таблицу частот для выборки цен на различные модели ноутбуков (портативных компьютеров). Вообще говоря, цена на ноутбук – величина дискретная, т.к. шаг ее изменения не может быть меньше 1 доллара. Но величина этого шага настолько мала по сравнению с диапазоном изменения цен (от 500 до 5000 долларов), что удобнее считать эту величину непрерывной. На ³ вы можете увидеть интервальную таблицу частот, в которой цена на ноутбуки сгруппирована в 8 интервалов по 500 долларов каждый.








Пример 3.

Использование надстройки «Пакет анализа» в MS Excel


MS Excel допускает построение интервальной таблицы частот и без использования сложных формул, но для этого нужно подключить к нему одну из так называемых «надстроек» - Пакет анализа данных.

Щелкните мышью по пункту меню «Сервис  Надстройки» и поставьте флажок (галочку) в строке «Пакет анализа» - он будет подключен. Теперь раскройте меню «Сервис  Анализ данных» и выберите в списке функций этого пакета «Гистограмма частот».

На экране появится окно, в котором вам нужно будет указать два параметра: входной интервал (диапазон ячеек с исходным рядом) и интервал карманов (диапазон, в котором перечислены правые концы всех интервалов).

На ³ показано, как этим способом построить интервальную таблицу частот для той же выборки, что и в примере 2. В дальнейшем вы можете сами выбрать тот из двух описанных способов, который вам кажется удобнее.








Пример 4.

Интервальная таблица частот в ВЛ «Анализ случайной выборки»

Группировка данных и построение интервальной таблицы частот в ВЛ «Анализ случайной выборки» происходит автоматически. Вам достаточно ввести значения исходного ряда данных или вставить их через буфер обмена, как вы делали это раньше.

После этого в выпадающем списке «Тип таблицы» нужно выбрать «интервальная» и задать количество интервалов для группировки – таблица будет построена автоматически.






Гистограмма частот

Вы уже знакомы с понятием полигона частот, который служит для графического представления данных, полученных в дискретной выборке. Для непрерывной выборки вместо полигона используется гистограмма частот: по горизонтальной оси откладываются интервалы значений, а над каждым интервалом строится прямоугольник, площадь которого равна относительной частоте попадания в данный интервал. Обратите внимание: именно площадь, а не высота. Хотя, если интервалы равные, то высоты всех прямоугольников отличаются от соответствующих частот только постоянным множителем – длиной интервала.

Вот так будет выглядеть гистограмма частот для примера с портфелями первоклассников:










Пример 5.

Гистограмма частот в MS Excel

В MS Excel гистограмма частот, как и полигон, строятся с помощью уже знакомого вам модуля – Мастера диаграмм. Напомним, что с его помощью вы можете построить любой график или диаграмму, ответив всего на 4 вопроса:

  1. Какой тип графика вас интересует?

  2. Где взять исходные данные?

  3. Как оформить график?

  4. Где его разместить?

На последние два вопроса можно не отвечать – использовать параметры, заданные по умолчанию.

На ³ показано, как строить гистограмму для выборки цен на ноутбуки.








Пример 6.

Гистограмма частот в ВЛ «Анализ случайной выборки»

В лаборатории «Анализ случайной выборки» гистограмма строится автоматически. Более того, вы можете интерактивно изменять количество интервалов группировки, наблюдая при этом за изменением гистограммы. Это дает возможность визуально выбрать наиболее подходящее количество интервалов. На ³ вы найдете соответствующий пример.








Пример 7.

Деньги на «мобильнике»

Итак, мы выяснили, что для представления дискретных статистических рядов удобно использовать обычную таблицу частот и полигон, а для непрерывных – интервальную таблицу и гистограмму.

Но на практике иногда встречается «смешанный» тип статистических данных, в котором среди всех возможных значений непрерывного ряда выделяется одно или несколько «особых» чисел, которые вполне могут встречаться в этом ряду многократно. Получается, что такой ряд состоит из двух частей – дискретной и непрерывной.

Пример такого ряда приведен на ³. Он получился, когда школьников попросили ответить на вопрос - сколько денег находится у каждого из них на текущем счету мобильного телефона. Те, у кого денег не оказалось, или телефона не было вовсе, ответили – ноль. Понятно, что доля таких школьников в выборке могла оказаться (и оказалась!) довольно существенной.








ТЕСТЫ







Вопрос №1


Для изучения   величин удобно группировать данные в   и представлять их в виде   таблицы частот.






Вопрос №2


Для графического представления интервальной таблицы частот служит

  • полигон частот;

  • гистограмма частот;

  • график частот.






Вопрос №3


Относительная частота каждого интервала таблицы частот численно равна

  • площади;

  • высоте

соответствующего прямоугольника гистограммы.








ПРАКТИКУМ









Задание №1

Перед вами выборка, полученная по результатам изучения обменного курса доллара в 20-ти обменных пунктах города:

26,45; 26,4; 26,41; 26,45; 26,66; 26,53; 26,55; 26,44; 26,8; 26,67; 26,77; 26,43; 26,7; 26,6; 26,68; 26,58; 26,55; 26,54; 26,57; 26,59

Разбейте весь интервал от 26,4 до 26,9 на пять интервалов, сгруппируйте данные и постройте по ним интервальную таблицу частот.








Задание №2

В отделе мужской обуви универмага в течение дня производился учет стоимости проданной обуви. Были получены следующие результаты (в рублях):

1200, 1110, 2300, 890, 320, 1200, 560, 1340, 1400, 1050, 1050, 4700, 3200, 2900, 2100, 2450, 890, 1110, 1200, 1200, 2300, 1050, 1400, 1200, 890, 320, 1320, 890, 1100, 1050

Представьте эти данные в виде интервальной таблицы абсолютных и относительных частот, разбив диапазон цен от 0 до 5000 рублей на интервалы длиной по 1000 рублей, и ответьте на вопросы:

  1. Какой интервал цен оказался самым популярным?

  2. Сколько процентов проданной обуви оказалось в этом интервале?








Задание №3

На ³ представлены статистические данные о странах мира. С помощью функции СЧЕТЕСЛИ() постройте интервальную таблицу частот по плотности населения в этих странах с шагом в 50 чел./кв.км., гистограмму относительных частот и ответьте на вопросы:

  1. Какой интервал плотности содержит наибольшее количество стран?

  2. В какой интервал плотности попадает Россия?

  3. Какой процент стран находится в этом интервале?








Задание №4

Стрелок, не целясь, стреляет в круглую мишень. Проведите с помощью ВЛ «Мишень» 5000 таких опытов. Экспортируйте полученные результаты в MS Excel и найдите расстояние от точки попадания до центра мишени. Сгруппируйте полученные данные с помощью надстройки «Пакет анализа» и постройте по ним гистограмму.

На какую из представленных на ³ гистограмм ваша гистограмма похожа больше? Попытайтесь это объяснить.








Задание №5

На ³ записана таблица, содержащая сведения о крупнейших авиакатастрофах XX века. С ее помощью вам нужно ответить на два вопроса:

  1. В какие годы начался бурный рост гражданской авиации?

  2. На каких самолетах летать безопаснее: больших или маленьких?

Какие частотные таблицы, графики, диаграммы помогут ответить на эти вопросы? Постройте их и ответьте на эти вопросы.








Задание №6

На ³ представлены статистические данные чемпионата России по футболу 2003 года. В таблице перечислены все голы и указано, кто и когда их забивал.

Сгруппируйте эти данные в интервалы и выясните, какая пятиминутка матча была наиболее опасной для взятия ворот в этом чемпионате.








Задание №7

На ³ записана хронологическая таблица с основными событиями из истории России в эпоху правления Рюриковичей. С ее помощью вам нужно выяснить, какие периоды из нее были наиболее насыщены событиями.

Постройте соответствующую таблицу частот и гистограмму. Попробуйте дать объяснение полученным результатам (вспомните историю России).








Задание №8

На ³ записана случайная выборка городов России с указанием расстояния, на котором они находятся от Москвы. Сгруппируйте эти данные в интервалы по 500 км, постройте по полученной таблице гистограмму частот и ответьте на вопросы:

  1. В каком интервале частота оказалась самой большой?

  2. Какого радиуса должен быть круг с центром в Москве, чтобы в нем оказалось около половины городов, участвующих в выборке?








Задание №9

На ³ представлены результаты финала Всероссийской олимпиады школьников по информатике 2007 г. Вам необходимо проанализировать распределение ее участников по классам и по количеству набранных баллов. В каком из этих случаев вы будете использовать группировку данных, а в каком нет? Постройте соответствующие таблицы и графики в ВЛ «Анализ случайной выборки».








Задание №10

На одном из предыдущих уроков вы собрали сведения о росте и весе своих одноклассников. Определите, какая из двух форм представления полученных данных – с группировкой или без нее – дает наиболее наглядное представление о распределениях частот в каждом из этих рядов. Постройте соответствующие таблицы и диаграммы. Обсудите полученные результаты








ИССЛЕДОВАНИЯ







Сколько весит портфель?

Проведите в своей школе исследование для выяснения вопроса, сколько весят портфели учеников разных классов (получите предварительно разрешение администрации). Сравните полученные результаты с нормами СанПиН, по которым вес портфеля с учебными принадлежностями не должен превышать 10% веса самого школьника. Если они противоречат нормам, внесите ваши предложения по облегчению портфелей.

Глава 5



1   ...   13   14   15   16   17   18   19   20   21

Похожие:

Информатизация системы образования iconДанное учебное пособие разработано специально для тьюторов проекта...

Информатизация системы образования iconДвенадцатая международная научно-техническая конференция Измерение, контроль, информатизация
Государственное образовательное учреждение высшего профессионального образования

Информатизация системы образования iconКрасноярск электронный
Сборник содержит материалы, характеризующие уровень информатизации города Красноярска. Информация сопровождается результатами сравнительного...

Информатизация системы образования iconРаспоряжение
Нижегородской области от 3 июля 2009 года №453 "Об утверждении областной целевой программы "Информатизация Нижегородской области...

Информатизация системы образования iconСтатистика труда, занятости, образования, культуры, науки, новых...
Из общего числа форм 5 (26,3%) годовой периодичности представления данных, 6 (31,6%), месячной, 6 (31,6%) – квартальной, 2 (10,5%)...

Информатизация системы образования iconОтчет о результатах самообследования частного образовательного учреждения...
Нормативная и распорядительная документация вуза, организация делопроизводства и информатизация управленческой деятельности

Информатизация системы образования iconО Почетной грамоте министерства образования Тульской области
Самоуправления, осуществляющих управление в сфере образования, работники системы образования и архивного дела, иные лица и коллективы...

Информатизация системы образования iconСборник учебно-методических материалов для педагогов системы общего...
Учебно-методические материалы ориентированы на специалистов системы общего образования (педагогов, заместителей руководителей оу...

Информатизация системы образования iconПрактические рекомендации по выбору типовой модели системы управления...
Настоящие Практические рекомендации подготовлены в рамках Федеральной программы развития образования на 2005 год по проекту «Научно-методическое...

Информатизация системы образования iconПрограмма подготовки специалистов системы обеспечения вызова экстренных...
Программа предназначена для повышения квалификации специалистов системы-112

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск