3. Статистические характеристики ПРОЦЕССА Наиболее точно свойства процесса могут быть изображены в виде кривой распределения. Чаще всего в практике встречается нормальное распределение (рис. 3).
2
3
4
f(x)
X
Рис. 3. Кривая нормального распределения
Функция распределения при нормальном законе задается формулой:
.
По этой функции можно рассчитать вероятность попадания каждого значения исследуемой величины в заданный интервал, который обычно выражается в долях . Для интервала доля попадания составит 68,26 % (вне интервала 31,74 %); для интервала доля попадания 95,44 % (вне 4,56 %); для интервала доля попадания 99,73 % (вне 0,27 %); для интервала (вне 0,0064 %) доля попадания 99,9936 %; для интервала доля попадания 99,999966 %.
Для экспериментальных данных строят гистограмму распределения выборки отдельных значений (рис. 4).
0 Х Х
Рис. 4. Гистограмма распределения
На гистограмме по оси Y откладывается частота попадания в заданный интервал, по оси Х - интервалы значений исследуемой величины. По гистограмме можно оценить форму распределения, его положение и близость к нормальному или иному закону распределения.
Для статистического анализа реальной величины необходимо иметь численные характеристики процесса. Для этого используют следующие параметры: среднее значение выборки, среднеквадратическое отклонение результатов, размах и медиана.
Среднее значение выборки находится, как сумма результатов всех измерений, деленная на количество объектов в выборке:
,
где n - объем выборки (общее количество объектов в выборке), - индивидуальные значения измеренной величины.
Среднеквадратическое отклонение (или стандартное отклонение) вычисляется по формуле:
,
где n - объем выборки (общее количество объектов в выборке), - индивидуальные значения измеренной величины, - среднее значение выборки.
Размах - это разность между максимальным и минимальным значениями в выборке:
,
где - максимальное значение параметра в выборке, - минимальное значение параметра в выборке.
Средний размах или разность между последовательными точками рассчитывается так:
где - индивидуальные значения величины размаха.
Медиана - это точка на шкале измерения, которая делит количество данных ровно пополам, то есть половина данных находится ниже этой точки, а другая половина – выше. Если все значения расположены в порядке возрастания их величин, то медианой называется:
- при n нечетном ,
- при n четном ,
где n - количество измерений в выборке.
Наиболее полно исследуемую выборку характеризуют среднее значение и среднеквадратическое отклонение результатов, но эти параметры вычислить сложнее, чем размах и медиану. Кроме того, среднеквадратическое отклонение менее чувствительно к отдельным выбросам (выброс – зарегистрированное наблюдение, намного удаленное от диапазона вариаций остальных данных), и его рекомендуется применять при больших объемах выборки (десять и более значений параметра). В случае небольших выборок предпочтительнее использовать размах.
Медиана является показателем альтернативным среднему значению. Статистически она менее достоверна, чем среднее, но при малых объемах выборки (менее пяти значений параметра в выборке), является предпочтительной. Кроме того медиана вычисляется легче, чем среднее значение.
|