Плотность нормального распределения.

Одним из наиболее распространенных законов распределения непрерывной случайной величины является так называемый нормальный закон распределения. Этому закону подчиняются, например, распределение массы выловленной рыбы данного вида, распределение роста мужчин (женщин), дальность полета снаряда при стрельбе из орудия и многие другие.

Нормальным законом распределения вероятностей (или просто нормальным распределением) называется закон распределения непрерывной случайной величины, заданный плотностью распределения вида:

Плотность нормального распределения. , (3.5)

где числа a и s называются параметрами нормального распределения.

Они имеют вполне определенный смысл: а есть среднее значение случайной величины, имеющей нормальное распределение, s – стандартное отклонение этой случайной величины.

Непрерывная случайная величина, подчиняющаяся нормальному закону распределения, называется нормальной.

Функция распределения нормальной случайной величины может быть найдена по формуле (3.4) с использованием (3.5). Возникающий при этом интеграл не берется в элементарных функциях, и поэтому его значение обычно вычисляется на компьютере.

Функция (3.5) имеет максимум при х=а. Это означает, что возможные значения нормальной случайной величины группируются около ее среднего значения.

График нормального распределения (3.5) называется нормальной кривой или кривой Гаусса (рис. 3.1). Параметры нормального распределения определяют форму нормальной кривой: при постоянном а и увеличении s кривая растягивается вдоль оси Ох и при уменьшении s кривая вытягивается вдоль оси Оу.

Плотность нормального распределения.

Рис. 3.1. График плотности нормального распределения (3.1) при a=2 и s1=0,1, s2=0,2, s3=0,3.

Стандартное нормальное распределение.

Нормальная случайная величина называется нормированной (или стандартной), если значения параметров ее распределения a=0 и s=1

Плотность распределения нормированной случайной величины, подчиняющейся нормальному закону, называется стандартной плотностью нормального распределения и принимает вид:

Плотность нормального распределения. . (3.6)

Функция распределения нормированной нормальной случайной величины называется стандартной функцией нормального распределения и вычисляется по формуле

Плотность нормального распределения. . (3.7)

Эта функция не выражается через известные элементарные функции и ее значения могут быть найдены в специальных таблицах или вычислены на компьютере (например, в Excel).

Отметим некоторые свойства стандартной функцией нормального распределения (3.7):

1) F(0)=1/2;

2) F(x)®0 при х®-¥;

3) F(x)®1 при х®+¥.

На практике обычно при х5 силу свойства (3) полагают F(х)»1.

Вычисление функции и плотности нормального распределения в Excel.

В Excel среди статистических функций имеется функция НОРМРАСП, которая позволяет вычислять как плотность нормального распределения f(x) по формуле (3.5), так и интегральную функцию распределения F(x) по формуле (3.4), где f(x) задано (3.5). Данная функция имеет следующие параметры: НОРМРАСП(х; а; s; тип), где х – значение переменной, для которой следует вычислить функцию; а – среднее значение нормального распределения; s – стандартное отклонение этого распределения; тип – это логическое значение, определяющее тип функции распределения: тип принимает значения истина или ложь. Если указать в качестве этого параметра истина, то будет вычислена интегральная функция F(x) нормального распределения, а если – ложь, то плотность распределения f(x).

Во многих приложениях статистики необходимо для заданной вероятности g найти аргумент функции распределения х, т.е. вычислить функцию F[-1](g), обратную к F(x). Для этого в Excel имеется функция НОРМОБР(g; а; s), где g – вероятность нормального распределения, для которой следует найти значение переменной х; а – среднее значение этого распределения; s – его стандартное отклонение.

Для вычисления стандартной функции нормального распределения (3.7) в Excel имеется функция НОРМСТРАСП(х), где х – значение случайной величины, имеющей стандартное нормальное распределение. Естественно, что результат вычисления этой функции совпадает с результатом вычисления функции НОРМРАСП(х; 0; 1; истина).

Найти аргумент х стандартной функции нормального распределения по известной вероятности g можно с помощью функции НОРМСТОБР(g).

§3.3. Биномиальное распределение

Пусть случайная величина X есть число появлений события A в n независимых испытаниях, причем вероятность наступления A во всех событиях одинакова и равна p. Тогда вероятность появления m событий A (т.е. X=m) в n независимых испытаниях определяется по формуле Бернулли :

, (3.8)

где принято обозначение q=1-p, а величина есть число сочетаний из n элементов по m элементам:

Плотность нормального распределения. .

Закон распределения дискретной случайной величины X с возможными значениями m=0,1,…, n и вероятностями, описываемыми формулой (3.8), называется биномиальным распределением или распределением Бернулли.

Интегральная функция биномиального распределения вычисляется по формуле:

Плотность нормального распределения. . (3.9)

В Excel имеется функция БИНОМРАСП, позволяющая вычислять интегральную функцию распределения (3.9) и плотность распределения (3.8). Эта функция имеет следующие параметры: БИНОМРАСП(m; n; p; тип), где m – число появлений события А в n независимых испытаний Бернулли, р – вероятность появления события А в одном испытании; тип – параметр, определяющий тип вычисляемой функции. Это параметр такой же, как и для функции НОРМРАСП: если указать истина, то будет вычислена интегральная функция биномиального распределения по формуле (3.9), а если указать ложь, то будет вычислена вероятность по формуле Бернулли (3.8).

В формулу Бернулли (3.8) входит число сочетаний . Его можно вычислить с помощью функции ЧИСЛКОМБ(n; m).

§3.4. Распределение Пуассона

Пусть число независимых испытаний n очень велико, а вероятность p наступления события А мала. Тогда вероятность того, что случайная величина X примет значение m (т. е. событие А наступит m раз), вычисляется по формуле Пуассона:

. (3.10)

Закон распределения дискретной случайной величины X, принимающей значения m=0,1,…, n с вероятностями, определяемыми по формуле (3.10), называется распределением Пуассона. Число l=np называется параметром распределения Пуассона. Этот параметр имеет вполне определенный вероятностный смысл: среднее значение дискретной случайной величины, имеющей распределение Пуассона, равно l.

Интегральная функция распределения Пуассона определяется формулой:

Плотность нормального распределения. . (3.11)

Функция ПУАССОН позволяет вычислить в Excel вероятность по формуле Пуассона (3.10) и интегральную функцию по формуле (3.11). Аргументы у этой функции следующие: ПУАССОН(m; l; тип), где m – переменная, для которой вычисляется значение функции, l –параметр распределения Пуассона (среднее значение), а параметр – тип такой же, как и для предыдущих функций. Если на его месте указать Истина, то будет вычислена интегральная функция по формуле (3.11), а если – ложь, то вероятность по формуле Пуассона (3.10).

§3.5. Распределение Пирсона

Если Х1, Х1,…, Хn – независимые нормированные случайные величины, распределенные по нормальному закону (3.6), то случайная величина

Плотность нормального распределения. (3.12)

имеет распределение, называемое распределением Пирсона или распределением c2 с k=n степенями свободы. Число степеней свободы равно объему выборки минус число условий, при которых она была сформирована.

Так как в прикладных исследованиях всегда вычисляется среднее значение, то число степеней свободы равно объему выборки, уменьшенному на единицу, т.е. k=n-1.

Плотность распределения Пирсона при х0:

Плотность нормального распределения. , (3.13)

где Плотность нормального распределения. – нормировочный множитель, Г(z) – гамма-функция Эйлера (о ней будет написано подробнее в §3.9.). Интегральная функция распределения Пирсона вычисляется по стандартной формуле (3.4) с плотностью (3.13). Ее значения могут быть найдены в специальных таблицах или вычислены на компьютере (например, в Excel).

В Excel имеется функция ХИ2РАСП, которая вычислят вероятность того, что случайная величина (3.12) примет значение, больше переменной х, т.е. . Аргументы у этой функции следующие: ХИ2РАСП(х; k), где х – переменная, k – число степеней свободы распределения Пирсона.

Поскольку интегральная функция распределения определяется по формуле (3.1), как , а события и – противоположные, то

.

Таким образом, интегральную функцию распределения Пирсона можно вычислить в Excel по формуле: =1–ХИ2РАСП(х; k).

В Excel имеется функция ХИ2ОБР(a;k), вычисляющая критическую точку двухсторонней критической области распределения Пирсона для заданного уровня значимости a и числа степеней свободы k. Уровень значимости – это вероятность выполнения неравенства: , т.е. , где – случайная величина (3.12), – критическая точка распределения Пирсона, которая как раз и вычисляется функцией ХИ2ОБР(a;k). Критические точки необходимы для проверки статистических гипотез, о которых более подробно будет изложено в гл. 5.

§3.6. Распределение Стьюдента

Если Х – нормированная случайная величина, распределенная по нормальному закону, — случайная величина (3.12), имеющая распределение Пирсона с k степенями свободы, то случайная величина

Плотность нормального распределения. (3.14)

имеет распределение, называемое распределением Стьюдента (псевдоним Вильяма Госсета) или t-распределением с k степенями свободы. Обычно число степеней свободы k=n-1, где n – объем выборки.

Плотность распределения Стьюдента:

Плотность нормального распределения. , (3.15)

где Плотность нормального распределения. – нормировочный множитель, Г(z) – гамма-функция Эйлера. Интегральная функция распределения Стьюдента вычисляется по стандартной формуле (3.4) с плотностью (3.15). Ее значения могут быть найдены в специальных таблицах или вычислены на компьютере (например, в Excel).

Основное свойство распределения Стьюдента: при большом числе степеней свободы k®¥ справедливы асимптотические формулы:

Плотность нормального распределения. и Плотность нормального распределения. , поэтому

Плотность нормального распределения. .

Это означает, что при очень большом объеме выборки k»n, и плотность распределения Стьюдента (3.15) стремится к плотности стандартного нормального распределения (3.6). На практике при n30 распределение Стьюдента заменяется нормальным.

Закон Стьюдента (3.15) характеризует распределение выборочных средних в зависимости от объема выборки n в генеральной совокупности, имеющей нормальное распределение. С увеличением числа наблюдений n распределение Стьюдента быстро приближается к нормальному (3.6), уже при n30 практически не отличается от него и перестает зависеть от n. Однако при n

В Excel имеется функция СТЬЮДРАСП, которая вычисляет вероятность того, что случайная величина (3.14) примет значение, большее переменной х, т.е. . Аргументы у этой функции следующие: СТЬЮДРАСП(х; k; вид), где х – переменная, k – число степеней свободы распределения Стьюдента, вид – параметр, определяющий, вычислять одностороннее или двухстороннее распределение: если он равен 1, то вычисляется одностороннее, а если 2 – то двухстороннее.

Рассуждая аналогично § 3.5, можно заключить, что интегральная функция распределения Стьюдента вычисляется в Excel по формуле: =1–СТЬЮДРАСП(х;k;1) (обязательно оно должно быть односторонним, поэтому в качестве параметра вид указана 1).

Критические точки двухсторонней критической области распределения Стьюдента (см. гл. 5) для заданного уровня значимости a и числа степеней свободы k можно вычислить с помощью функции СТЬЮДРАСПОБР(a;k). Нахождение критических точек необходимо для проверки статистических гипотез при использовании критерия Стьюдента, которые подробно будут рассмотрены в гл. 5.

Критические точки односторонней критической области распределения Стьюдента могут быть получены заменой аргумента a на 2a в функции СТЬЮДРАСПОБР. Например, если двухсторонняя критическая точка для a=0,05 и k=10 вычисляется СТЬЮДРАСПОБР(0,05; 10) и равна 2,28139, то односторонняя критическая точка для того же уровня значимости 0,05 и числа степеней свободы вычисляется формулой СТЬЮДРАСПОБР(2*0,05; 10) и равна 1,812462.

§3.7. Распределение Фишера

Если и — две независимые случайные величины, имеющие распределение Пирсона соответственно с m и k степенями свободы, то случайная величина

Плотность нормального распределения. (3.16)

имеет распределение, называемое распределением Фишера или F-распределением с m и k степенями свободы. Распределение Фишера характеризуется двумя параметрами – степенями свободы m и k.

Плотность распределения Фишера при х0:

, (3.17)

где Плотность нормального распределения. – нормировочный множитель, Г(z) – гамма-функция Эйлера. Интегральная функция распределения Фишера вычисляется по стандартной формуле (3.4) с плотностью (3.17). Ее значения могут быть найдены в специальных таблицах или вычислены на компьютере (например, в Excel).

Установлено (Д. Снедекор), что величина, равная отношению исправленных дисперсий двух выборок из одной нормальной генеральной совокупности Плотность нормального распределения. подчиняется закону распределения Фишера (3.17). Всегда берется отношение большей дисперсии к меньшей ( ), чтобы F1. Степени свободы распределения Фишера равны m=nх-1 и k=nу-1, где nх и nу – объемы выборок, причем, дисперсия первой выборки должна быть больше. Величина F зависит только от исправленных дисперсий и не зависит от генеральных параметров, а ее распределение – только от чисел степеней свободы, причем при большом числе наблюдений его плотность стремится к плотности стандартного нормального распределения (3.6).

В Excel имеется функция FPACП, вычисляющая вероятность , где – случайная величина (3.16), х – переменная. Аргументы у этой функции следующие: FPACП(x; m; k), где х – переменная, m и k – степени свободы распределения Фишера. Интегральная функция распределения Фишера, определяемая по формуле (3.4) с плотностью (3.17) может быть вычислена в Excel по формуле: =1–FPACП(x; m; k).

Критическую точку распределения Фишера для заданного уровня значимости a и степеней свободы m и k можно вычислить с помощью функции FPACПОБР(a; m; k). Эта функция находит критическую точку из соотношения , где – случайная величина (3.16). Вычисление критических точек распределения Фишера необходимо для проверки статистических гипотез, о которых более подробно будет изложено в гл. 5.

Замечание: при использовании FPACПОБР(a; m; k) следует помнить, что второй аргумент m – число степеней свободы для той выборки, дисперсия которой больше. Такие критические точки содержатся в обычных таблицах статистических функций.

§3.8. Гипергеометрическое распределение

Пусть известно, что в генеральной совокупности объема N содержится М элементов с заданным признаком. Из этой генеральной совокупности производится выборка из n элементов. Тогда вероятность того, что среди отобранных n элементов ровно m будут иметь указанный признак, вычисляется по формуле

Плотность нормального распределения. . (3.18)

Вероятность, вычисляемая по формуле (3.18) называется гипергеометрической.

Пусть X — дискретная случайная величина, равная числу элементов с заданным признаком в выборке объема n из генеральной совокупности объема N, содержащей М элементов с заданным признаком. Тогда закон распределения дискретной случайной величины X, возможные значения которой m=0, 1, 2,…, min(M, n), а вероятности вычисляются по формуле (3.18), называется гипергеометрическим распределением.

Гипергеометрическая вероятность (3.18) вычисляется в Excel с помощью функции ГИПЕРГЕОМЕТ(m; n; M; N), где m – число элементов с заданным признаком в выборке, n – объем выборки, M – число элементов с заданным признаком в генеральной совокупности, N – объем генеральной совокупности.

§3.9. Другие статистический распределения

Помимо рассмотренных выше статистических распределений существует ряд менее используемых распределений.

09. Закон нормального распределения


Похожие статьи.

Понравилась статья? Поделиться с друзьями: