| НЕОБХОДИМЫЕ СВЕДЕНИЯ |
|
|
| В предыдущих параграфах мы рассмотрели числовые характеристики, позволяющие оценить поведение числового ряда в среднем. Около них, как правило, сосредоточена основная масса значений выборки.
Но чтобы получить более полное представление о поведении ряда в целом, нужно знать, насколько сильно его значения различаются между собой, как сильно они разбросаны, рассеяны вокруг средних. Для этого служат характеристики разброса.
|
Размах
| Простейшей характеристикой разброса является размах. Размах – это разность наибольшего и наименьшего значений выборки. Понятно, что размах может добавить много полезной информации к средним характеристикам. Так, для температуры на Меркурии, где средняя температура, напомним, около +15°, размах равен 350° - (-150°) = 500°. Конечно, такого перепада температур человек выдержать не может.
Размах очень просто вычисляется, но не всегда несет достоверную информацию, т.к. на его величину может сильно повлиять какое-то одно (возможно, ошибочное) значение выборки.
|
|
|
Пример 1.
Размах оценок по географии
| Мы снова возвращаемся к знакомому примеру – оценкам по географии:
5, 2, 4, 5, 5, 4, 4, 5, 5, 5.
Максимальная из полученных оценок – 5, минимальная – 2. Отсюда размах будет 5 – 2 = 3. Заметьте, что единственная двойка в этой выборке увеличивает размах с 2 до 3.
|
|
|
Вычисление размаха в MS Excel
| В MS Excel нет функции, вычисляющей непосредственно размах ряда, но зато есть функции МАКС() и МИН(), вычисляющие соответственно максимальное и минимальное значения в указанном диапазоне ячеек. Их разность и дает размах: МАКС() – МИН(), где в качестве аргумента нужно указать диапазон ячеек, содержащий исходный ряд данных. На ³ приведен пример их использования.
|
|
|
Пример 2.
Размах цен на мониторы
| На ³ представлен прайс-лист с ценами на различные модели мониторов. Для каждой категории мониторов (категории берутся по размерам) вычисляется размах цен. Для вычислений используются статистические функции МАКС() и МИН().
|
|
|
Среднее отклонение от среднего
| Казалось бы, естественной мерой разброса может быть величина, которую можно назвать средним отклонением от среднего. Понятно, как ее можно получить: сначала найти среднее значение , а затем вычислить среднее арифметическое всех отклонений от этого среднего:
С одной стороны, учитываются все отклонения, с другой – каждое из них в отдельности не может слишком сильно повлиять на общий результат (как это было с размахом). Но при ближайшем рассмотрении этот общий результат оказывается неожиданным…
|
Пример 3.
Среднее отклонение от средней оценки
| Найдем среднее отклонение от среднего для примера с оценками. Как вы помните, . Поэтому интересующее нас выражение будет выглядеть так:
Получилось, что среднее отклонение равно нулю! Может быть, это случайность?
? На записана электронная таблица с приведенными оценками и посчитано их среднее отклонение от среднего. Попробуйте изменить исходные оценки. Изменяется ли при этом среднее отклонение?
Равенство нулю уже не будет казаться столь удивительным, если вспомнить, что какая-то часть значений ряда лежит слева от среднего, а какая-то – справа. Поэтому при вычислении среднего отклонения часть слагаемых входит в сумму со знаком «плюс», а часть – со знаком «минус». Конечно, это еще не доказывает, что среднее отклонение всегда будет равно нулю, но уже кое-что объясняет. Строгое доказательство этого факта вам будет предложено провести самостоятельно в одной из задач этого параграфа.
|
|
|
Среднее для модулей отклонений
| Итак, среднее отклонение от среднего не может быть мерой разброса, поскольку оно всегда равно нулю. Но не будем так быстро отчаиваться – ведь идея вычислить среднее арифметическое всех отклонений была совсем неплохой. Просто эти отклонения нужно было суммировать без учета знака – тогда нуля уже не получится. Другими словами, заменим отклонения на их модули и найдем среднее арифметическое:
Для примера 1 с оценками по географии результат будет следующим:
Полученную величину уже вполне можно использовать, как одну из возможных мер разброса. И все-таки, в статистике она не нашла распространения и даже не получила никакого специального названия. Видимо, причиной тому стала функция «модуль числа», с которой не всегда приятно работать (возможно, вы уже имели возможность в этом убедиться). Статистики нашли другой выход…
|
Дисперсия
| Будем складывать не модули, а квадраты отклонений – они ведь тоже неотрицательные:
Полученная величина получила название дисперсии числового ряда. Для примера с оценками дисперсия будет:
|
Вычисление дисперсии в MS Excel
| Разумеется, в электронной таблице дисперсию можно вычислить по определению: найти среднее, вычислить для каждого числа исходного ряда квадрат отклонения, просуммировать эти квадраты и поделить на их количество. Гораздо быстрее можно вычислить дисперсию с помощью функции ДИСПР() – достаточно указать в качестве аргумента диапазон ячеек, содержащий все числа исходного ряда. На ³ показаны оба этих способа.
|
|
|
Пример 4.
Дисперсия при измерении веса портфелей
| Вернемся к выборке, полученной в результате измерения веса портфелей первоклассников. На ³ показано, как с помощью MS Excel посчитать дисперсию этой выборки. При этом используются два разных способа – непосредственное вычисление по определению и использование функции ДИСПР().
|
|
|
Стандартное отклонение
| У дисперсии есть один существенный недостаток: если исходные значения ряда измеряются в каких-то единицах (например, в килограммах), то у дисперсии эти единицы возводятся в квадрат («квадратные» килограммы). В нашем примере среднее значение веса получилось 2,4 кг, а вот дисперсия цен – около 0,49 ... «квадратных килограмма». Избавиться от таких странных единиц измерения можно, если использовать другую характеристику разброса - стандартное отклонение.
Стандартным отклонением (или средним квадратичным отклонением) числового ряда называется квадратный корень из дисперсии. За стандартным отклонением в статистике закрепилось «стандартное обозначение»: его всегда обозначают греческой буквой («сигма»). В рассмотренном примере стандартное отклонение будет , т.е. приблизительно 700 граммов.
Для оценки разброса по стандартному отклонению на практике очень часто используют так называемое правило трех сигм: 99% всех значений, полученных в выборке, лежит в интервале . Правда, для этого нужно, чтобы выборка была нормально распределена. О том, что это такое, мы поговорим позже, когда будем изучать распределения случайных величин.
|
Вычисление стандартного отклонения в MS Excel
| Разумеется, стандартное отклонение можно найти, вычислив корень из дисперсии: КОРЕНЬ(ДИСПР()). Но учитывая чрезвычайную популярность этой характеристики, для нее также есть отдельная функция: СТАНДОТКЛОНП(), где в качестве аргумента нужно указать диапазон ячеек, содержащий исходный ряд чисел. На ³ показаны оба этих способа.
|
|
|
Пример 3.
(продолжение)
| В том же примере с портфелями, где мы только что вычисляли дисперсию, посчитано стандартное отклонение (с использованием функции СТАНДОТКЛОНП() и без нее). Величина отклонения получилась около 700 г. Как уже говорилось выше, это позволяет приблизительно оценить тот диапазон, в котором почти наверняка окажется вес любого портфеля: от (2,4-0,7)=1,7 кг до (2,4+0,7)=3,1 кг.
|
|
|
| ТЕСТЫ |
|
|
Вопрос №1
| Характеристики ? показывают, как сильно значения ряда различаются между собой, как они рассеяны вокруг средних.
|
|
|
Вопрос №2
| Разность наибольшего и наименьшего значений ряда данных называется
амплитудой;
разбросом;
размахом;
рассеянием.
|
|
|
Вопрос №3
| Найдите размах и дисперсию числового ряда: 1, 2, 3, 4, 5.
|
|
|
Вопрос №4
| Отметьте верные утверждения:
если размах некоторого числового ряда равен 0, то он состоит из одинаковых чисел;
если дисперсия некоторого числового ряда равна 0, то он состоит из одинаковых чисел;
если ряд состоит из одинаковых чисел, то его размах равен 0;
если ряд состоит из одинаковых чисел, то его дисперсия равна 0;
если дисперсия ряда равна 0, то и его размах равен 0;
если размах ряда равен 0, то и его дисперсия равна 0.
|
|
|
Вопрос №5
| У какого из следующих рядов дисперсия больше:
первый ряд: 1, 2, 3, 4, 5;
второй ряд: 2, 3, 4, 5, 6.
|
|
|
| ПРАКТИКУМ |
Задание №1
| Дана таблица с данными многолетних наблюдений за максимальным уровнем весеннего подъема воды в реке Оке в районе г.Калуги. Найдите все характеристики разброса этого числового ряда.
|
|
|
Задание №2
| Перед вами три таблицы с расписанием движения поездов с трех железнодорожных вокзалов Москвы. Найдите стандартное отклонение для продолжительности рейсов по каждому из вокзалов. Сравните полученные результаты и попробуйте их объяснить.
|
|
|
Задание №3
| Перед вами уже знакомые данные о результатах трех мировых чемпионатов: по хоккею с шайбой, хоккею с мячом и футболу. Вычислите абсолютную разницу в счете каждого матча. Найдите для трех полученных рядов стандартные отклонения и сравните их между собой.
|
|
|
Задание №4
| Проведите 1000 испытаний с двумя кубиками и найдите в каждом из них сумму очков и максимальное из чисел, выпавших на кубиках. У вас получится четыре ряда: первый кубик, второй кубик, сумма и максимум. Для каждого из этих рядов вычислите стандартное отклонение.
Сравните свои результаты с результатами товарищей. Насколько они близки друг к другу?
|
|
|
Задание №5
| В таблице содержатся результаты ЕГЭ (средний балл) в 2005 году по всем регионам России. Найдите по эти данным предметы, для которых характерны самый маленький и самый большой разброс результатов.
|
|
|
Задание №6
| На представлены данные экологического контроля за состоянием воздуха над различными районами Москвы – содержание оксида углерода в долях предельно допустимой концентрации. На основании этих данных ответьте на вопросы:
Какой район самый стабильный в отношении экологической обстановки?
Какой самый нестабильный?
Какой месяц по этим данным наиболее стабильный по всем районам?
Какой самый нестабильный?
|
|
|
Задание №7
| С помощью найдите среднее значение и стандартное отклонение для веса и роста своих одноклассников. Сравните полученные результаты с допусками на нормальный вес и рост, приведенными в таблице.
|
|
|
Задание №8
| Постройте ряд из четырех или более чисел, у которого:
а) размах равен 0;
б) размах равен 1;
в) дисперсия равна 0;
г) дисперсия равна 1.
|
|
|
Задание №9
| При каком значении дисперсия числового ряда
1, 2, 3, 4,
будет минимальна? Чему она будет равна?
|
|
|
Задание №10
| Ребятам было поручено провести статистические наблюдения над ростом одноклассников. Коля записал рост всех ребят в сантиметрах:
164, 176, 170, …
а Оля – в метрах:
1,64; 1,76; 1,70; …
Затем они посчитали средний рост, дисперсию и стандартное отклонение. У Коли эти результаты составили соответственно 172, 16 и 4. Какие результаты получила при этом Оля?
|
|
|
Задание №11
| Докажите, что для любого числового ряда среднее отклонение от среднего значения равно нулю, т.е.
|
|
|
Задание №12
| Докажите, что дисперсия любого числового ряда может быть вычислена по формуле:
|
|
|
| ИССЛЕДОВАНИЯ |
|
|
СВОЙСТВА ХАРАКТЕРИСТИК РАЗБРОСА
| Каждое число исходного числового ряда увеличили на 10. Что произойдет с его размахом? дисперсией? стандартным отклонением? А если каждое число увеличили на ?
Все числа исходного числового ряда увеличили в два раза. Что произойдет с его размахом? дисперсией? стандартным отклонением? А если каждое число увеличили в раз?
|