Функция распределения нормального распределения: Недопустимое название | Математика | Fandom

нормальное (Гауссово) распределение MathCAD 12 руководство

  • Статистика
  • 12.1. Статистические распределения
    • 12.1.1. Статистические функции
    • 12.1.2. Пример: нормальное (Гауссово) распределение
  • 12.2. Выборочные статистические характеристики
    • 12.2.1. Гистограммы
    • 12.2.2. Среднее и дисперсия
    • 12.2.3. Примеры: Выборочная оценка дисперсии и среднего нормальной случайной величины
    • 12.2.4. Корреляция
    • 12.2.5. Новые функции корреляционного анализа сигналов
    • 12.2.6. Коэффициенты асимметрии и эксцесса
    • 12.2.7. Статистические функции матричного аргумента
  • 12.3. Методы Монте-Карло
    • 12.3.1. Генерация псевдослучайных чисел
    • 12.3.2. Генерация коррелированных выборок
    • 12.3.3. Моделирование случайного процесса
    • 12.3.4. Пример: огибающая и фаза нормального случайного процесса

В теории вероятности доказано, что сумма различных независимых случайных слагаемых (независимо от их закона распределения) оказывается случайной величиной, распределенной согласно нормальному закону (так называемая центральная предельная теорема). Поэтому нормальное распределение хорошо моделирует самый широкий круг явлений, для которых известно, что на них влияют несколько независимых случайных факторов.

Перечислим еще раз встроенные функции, имеющиеся в Mathcad для описания нормального распределения вероятностей:

  •  dnorm(x,µ, σ) — плотность вероятности нормального распределения;
  •  pnorm(х,µ,σ) —функция нормального распределения;
  •  сnorm(х) — функция нормального распределения для µ=0,σ=1;
  •  qnorm(P,µ,σ) — обратная функция нормального распределения;
  •  rnorm(M,µ, σ) — вектор м независимых случайных чисел, каждое из которых имеет нормальное распределение:
  •  х — значение случайной величины;
  •  P — значение вероятности;
  •  µ — математическое ожидание;
  •  σ — среднеквадратичное отклонение.

Математическое ожидание и дисперсия являются, по сути, параметрами распределения. Плотность распределения для трех пар значений параметров показана на рис. 12.3. Напомним, что плотность распределения dnorm задает вероятность попадания случайной величины х в малый интервал от х до х+Δх. Таким образом, например, для первого графика (сплошная линия) вероятность того, что случайная величина х примет значение в окрестности нуля, приблизительно в три раза больше, чем вероятность того, что она примет значение в окрестности х=2. А значения случайной величины большие 5 и меньшие -5 и вовсе очень маловероятны.

Рис. 12.3. Плотность вероятности нормальных распределений

Рис. 12.4. Нормальные функции распределения


Функция распределения F(x) (cumulative probability) — это вероятность того, что случайная величина примет значение, меньшее или равное х. Как следует из математического смысла, она является интегралом от плотности вероятности в пределах от -∞ до х. Функции распределения для упомянутых нормальных законов изображены на рис. 12.4. Функция, обратная F(x) (inverse cumulative probability), называемая еще квантилем распределения, позволяет по заданному аргументу р определить значение х, причем случайная величина будет меньше или равна х с вероятностью р.

ПРИМЕЧАНИЕ

Здесь и далее графики различных статистических функций, показанные на рисунках, получены с помощью Mathcad без каких-либо дополнительных выражений в рабочей области.

Приведем несколько примеров, позволяющих почувствовать математический смысл рассмотренных функций на примере случайной величины х, распределенной по нормальному закону с µ=0 и σ=1 (листинги 12.1—12.5).

Листинг 12.1. Вероятность того, что х будет меньше 1.881

Листинг 12.2. 97-% квантиль нормального распределения

 


Листинг 12.3. Вероятность того, что х будет больше 2

 


Листинг 12.4. Вероятность того, что х будет находиться в интервале (2,3)

 


Листинг 12.5. Вероятность того, что |x|<2

 


Обратите внимание, что задачи двух последних листингов решаются двумя разными способами. Второй из них связан с еще одной встроенной функцией erf, называемой функцией ошибок (или интегралом вероятности, или функцией Крампа).

  •  erf(x) — функция ошибок.
  •  erfc(x)=1-erf(x).


Математический смысл функции ошибок ясен из листинга 12.5. Интеграл вероятности имеет всего один аргумент, в отличие от функции нормального распределения. Исторически последняя пересчитывалась через табулированный интеграл вероятности по формулам, приведенным в листинге 12.6 для произвольных значений параметров µ и σ(листинг 12.6).

Листинг 12.6. Вероятность того, что х будет в интервале (2,3)

Если вы имеете дело с моделированием методами Монте-Карло, то в качестве генератора случайных чисел с нормальным законом распределения применяйте встроенную функцию rnorm. В листинге 12.7 ее действие показано на примере создания двух векторов по M=500 элементов в каждом с независимыми псевдослучайными числами x1i и х2i распределенными согласно нормальному закону. О характере распределения случайных элементов векторов можно судить по рис. 12.5. В дальнейшем мы будем часто сталкиваться с генерацией случайных чисел и расчетом их различных средних характеристик.

Листинг 12.7. Генерация двух векторов с нормальным законом распределения

Рис. 12.5. Псевдослучайные числа с нормальным законом распределения (продолжение листинга 12.7)

Нравится

Твитнуть

Глава 7. Нормальный закон распределения

Рассмотрим еще один закон распределения непрерывной случайной величины, который, в силу его особой важности и исключительной роли в теории вероятностей, выносится в отдельную тему.

Нормальное распределение — наиболее часто встречающийся вид распределения. С ним имеют дело при анализе погрешностей ошибок, контроле технологических процессов, при анализе и прогнозировании различных экономических, социальных, демографических явлений. Наиболее важным условием возникновения нормального распределения является формирование признака как суммы большого числа независимых слагаемых, ни одно из которых не характеризуется исключительно большой по сравнению с другими дисперсией.

Еще одна причина, обусловливающая особое место этого закона распределения среди других, и главная особенность нормального распределения состоит в том, что оно является предельным, к которому с ростом числа наблюдений стремятся другие распределения.

Непрерывная случайная величина X имеет нормальный закон распределения (закон Гаусса) с параметрами р. и о (обозначают ), если ее плотность вероятности имеет вид:

, (1.42)

где – математическое ожидание Х,

– дисперсия ( – среднее квадратическое отклонение).

§ 7.1. Свойства функции плотности вероятности (кривой Гаусса) нормального закона распределения

1. существует при любых действительных Х.

2. .

3. Максимальное значение принимает в точке , при этом .

Рис. 16. Функция плотности вероятности (кривая Гаусса) нормального закона распределения

4. Кривая плотности нормального закона распределения симметрична относительно прямой .

5. Кривая плотности нормального закона распределения имеет две точки перегиба с координатами: .

§ 7.2. Математическое ожидание и дисперсия нормальной случайной величины

Рассмотрим, как будет изменяться кривая плотности вероятности нормального закона при изменении ее параметров — и .

Математическое ожидание или среднее значение ц характеризует центр рассеивания значений случайной величины и при изменении при неизменной дисперсии кривая будет смешаться вдоль оси абсцисс, не меняя своей формы (рис. 17).

Если же при неизменном математическом ожидании у случайной величины изменяется дисперсия, которая характеризует рассеяние значений случайной величины вокруг ее среднего, то кривая будет изменять свою форму, сжимаясь или растягиваясь, (так как площадь под ней должна оставаться единичной) не сдвигаясь вдоль оси абсцисс (рис. 18).

Таким образом, параметр (математическое ожидание) характеризует положение, а параметр (дисперсия) — форму кривой плотности вероятности.

Рис. 17. Сравнение плотности вероятности трех нормальных случайных величин с разными математическими ожиданиями, но одинаковыми дисперсиями

Рис. 18. Сравнение плотности вероятности трех нормальных случайных величин с одинаковыми математическими ожиданиями, но разными дисперсиями.

§ 7.3. Функция распределения случайной величины, распределенной по нормальному закону

Вычислим функцию распределения случайной величины, имеющей нормальный закон распределения.

По определению функции распределения:

.

Сделаем замену переменных и получим:

.

Первый интеграл, используя четность подынтегральной функции и то, что интеграл Эйлера – Пуассона равен , можно вычислить:

Таким образом, можно записать: .

Интеграл такого рода не выражается в элементарных функциях, но для — его нахождения используют особую функцию, так называемый интеграл вероятностей или функцию Лапласа, *» для которой составлены таблицы. Существует много разновидностей таких функций, например:

,

значения которой приведены в табл. 1 Приложений.

Именно такой вид функции Лапласа будем использовать далее.

Рис. 19. Функция Лапласа (интеграл вероятностей) Ф(t)

1. Ф(t) — нечетная функция, т.е. Ф(-t)=-Ф(t).

2. Ф(t) — монотонно возрастающая функция, т. е. при ; при t>5 можно считать .

Итак, используя интеграл вероятностей или функцию Лапласа Ф(t) можно выразить функцию распределения нормального закона.

х

Рис. 20. Функция распределения нормального закона распределения

, (1.43)

где – функция Лапласа (табл. 1 Приложений).

Стандартный нормальный закон распределения

Рассмотрим очень важный частный случай нормально распределенной случайной величины.

. (1.44)

, (1.45)

где – функция Лапласа (табл. 1 Приложений).

Значения функции плотности вероятности стандартного нормального закона или функции Гаусса представлены в табл. 7 Приложений.

Функция Гаусса:

  1. f(t) – четная функция, т. е. f(t)=f(-t)/

  2. f(t) – монотонно убывающая функция, т. е. при ; при t>5 можно считать .

Рис. 21. Функция Гаусса или плотности вероятности стандартного нормального закона распределения

Stats Stuff

Что общего между содержанием белка в коровьем молоке и IQ человека?

Обе переменные имеют примерно нормальное распределение. Нормальное распределение представляет собой хорошая модель для измерений многих видов, включая IQ, рост, и продолжительность беременности.

Распределение содержания белка в коровьем молоке имеет классическую колоколообразную форму нормального распределения. Большинство наблюдений близки к среднему (3,4 грамма) но некоторые из них намного больше или меньше. 92}\)


Стандартное нормальное распределение

Нормальное распределение, имеющее среднее значение 0 и дисперсию 1, называется «стандартным нормальным». распределение. Случайная величина, имеющая стандартное нормальное распределение, обычно обозначается с $Z$. Это $Z\sim N(0,1)$. Кроме того, мы используем $\phi(z)$ и $\Phi(z)$ для обозначения соответственно функция массы вероятности и кумулятивная функция распределения стандартная нормальная случайная величина.

ОБОЗНАЧЕНИЕ: Функция плотности вероятности стандартного нормального распределения обозначается $\phi(z)$, а кумулятивная функция распределения, $P(Z\leq z)$ через $\Phi(z)$.


Эмпирическое правило

Для нормального распределения площадь под кривой в пределах заданного числа стандартных отклонений (SD) среднее остается одинаковым независимо от значения среднего и стандартного отклонения. В частности, около 68% площади находится в пределах 1 стандартного отклонения от среднего, 95% находятся в пределах 2 стандартных отклонений от среднего, а 99,7% в пределах 3 стандартных отклонений от среднего.

Апплет эмпирического правила

Используйте переключатели внизу, чтобы показать области в пределах 1, 2 или 3 стандартных отклонений ($\sigma$) от среднего ($\mu$).

Изменить значения $\mu$ и $\sigma$ для проверки того, что площади в пределах заданного числа sd от среднего одинаковы независимо от значений среднего и стандарта. отклонение.

Зеленую букву «z» можно перетаскивать, чтобы отметить область в пределах стандартных отклонений «z» от среднего значения.


Стандартные единицы

Определение количества стандартных отклонений значения от среднего называется стандартизацией значение или преобразование его в стандартные единицы .

Стандартные единицы указывают, на сколько стандартных отклонений значение от среднего.

Для стандартизировать значение означает указать, на сколько стандартных отклонений значение отличается от среднего.

Пример : Стандартные единицы

Предположим, что средний рост учеников в конкретном классе статистики равен 69 дюймов со стандартным отклонением 4 дюйма. Сколько стандартных отклонений от среднего рост 73 дюйма? 63 дюйма?

73 дюйма больше среднего на 4 дюйма или на 1 стандартное отклонение.

63 дюйма равно 6 дюймам или 1,5 стандартных отклонения ниже среднего.

Когда мы стандартизируем нормально распределенную случайную величину, результирующая случайная величина имеет стандартное нормальное распределение. 92)$, чтобы найти, сколько стандартных отклонений значения x от среднего (т. е. для стандартизации x), вычтите $\mu$ из $x$ и разделите результат на стандартное отклонение: $z=\frac{x-\mu}{\sigma}$. Результат обычно обозначается буквой «z» и часто упоминается как z-оценка . 2)$ и значение $x$
$z=\frac{x-\mu}{\sigma}$.

Единицы стандартной нормальной кривой являются стандартными единицами. То есть, если $Z\sim N(0,1)$, значение Z, которое на 1 sd выше среднего, равно 1, значение, которое 2 sd ниже среднего составляет -2 и т. д.

Единицы стандартной нормальной кривой
Единицы стандартной нормальной кривой являются стандартными единицами.

Пример : Белок молока

Среднее содержание белка в молоке группы коров по неделям после отела составляет 3,4 г при стандартном отклонении 0,3 г.

  1. Сколько sd от среднего составляет значение 4,1 г?
  2. Express 3,2 г в стандартных единицах.
  3. Какое значение на 2,5 стандарта выше среднего?

  1. Сколько sd от среднего составляет значение 4,1 г?
    $z=\frac{4.1-3.4}{.3} = 2,333$.
    4,1 г на 2,333 SD ниже среднего.

  2. Express 3,2 г в стандартных единицах.
    $z=\frac{3. 2-3.4}{.3} = \frac{2}{3}$.
    3,2 г — это $\frac{2}{3}$ в стандартных единицах. 9bf(x)dx}\). Однако функция плотности вероятности обычной случайной величины нельзя проинтегрировать вручную. Чтобы найти вероятности, относящиеся к нормальному распределению, поэтому необходимо либо использовать программное обеспечение, либо использовать таблицу.

    Апплет нормальных вероятностей

    Используйте ползунки для настройки $\mu$ и $\sigma$.

    Перетащите оранжевый треугольник, чтобы изменить значение x в выражении $P(X\leq x)$. Полученная вероятность дана. 92)$:

    1. Вычислить z-показатель для $x$, $z=\frac{x-\mu}{\sigma}$.
    2. Найдите z-показатель в таблице, первые две цифры вдоль левого поля и третью цифру вверху.
    3. Значение в таблице в строке и столбце, указанных на предыдущем шаге, равно $P(X \leq x)$.

    Нормальная таблица CDF

    Z-значения указаны на полях таблицы. Тело таблицы содержит кумулятивные вероятности, $P(Z\leq z) = \Phi(z)$. 92)$.

    1. Найдите 3g в стандартных единицах: $z=\frac{3-3.4}{0.3} = -1.33$
    2. Найдите -1,3 вдоль левого поля таблицы.
    3. Найдите 0,03 вдоль верхнего поля таблицы.

    $\Phi(-1,33) = 0,1020$
    $P(X \leq -1,33) = 0,1020$

    Пример : Чтение обычной таблицы CDF

    Найти вероятность того, что стандартная нормальная случайная величина примет значение меньше -0,72. 92)\)

    Вычисление $P(X \leq 2)$ на TI-84

    2-Й ВАРС 2
    нижний: -1E99.
    верхний: 2
    мк: 3,4
    σ:0,3
    ВХОДИТЬ

    Примечания:

    1. Истинная нижняя конечная точка должна быть $-\infty$, так как калькулятор не может это обработать, введите что-то очень маленькое по сравнению со средним значением.
    2. При использовании калькулятора или программного обеспечения для нахождения нормальной вероятности обычно нет необходимости сначала стандартизировать.

    Пример : Найти нормальные вероятности

    Найти вероятность того, что стандартная нормальная случайная величина примет значение больше 0,63.


    $P(Z\leq 0,63) = \Phi(0,63) = 0,7357$.

    Использование дополнения правило, $P(Z > 0,63) = 1 — \Phi(0,63) = 1 — 0,7357 = 0,2643$

    Пример : Найти нормальные вероятности

    Предположим, $X\sim N(25, 9)$.

    1. Без каких-либо вычислений $P(X \leq 23)$ больше или меньше 0,5?
    2. Найдите $P(X \leq 23)$.

    1. Поскольку нормальная кривая симметрична относительно своего среднего значения, половина площади под кривой выше среднего, а половина ниже. $P(X \leq 23)$ должно быть меньше 0,5, поскольку 23 < 25.

    2. $P(X \leq 23) = P(Z \leq \frac{23-25}{3}) = \Phi (-0,67) = 0,2981$

    Чтобы найти вероятность того, что нормальная случайная величина примет значение в заданном интервале: $\small{P(a \leq X \leq b) = F(b)-F(a)}$. Калькулятор или программное обеспечение могут оценить эту вероятность напрямую. 92)$, что такое $P(2.5 \leq X \leq 3)$?


    Использование таблицы:
    $$\маленький{\начать{массив} {lcl}P(2.5 \leq X \leq 3) &=& F(3) — F(2.5) \\ &=& P(X \leq 3) — P(X \leq 2.5)\\ &=& P(Z \leq \frac{3-3.4}{.3}) — P(Z \leq \frac{2.5-3.4}{.3}) \\ &=& \Phi(-1.33) — \Phi(-3)\\ &=& 0,1020 — 0,0013 \\ &=& 0,1007 \end{массив}}$$


    С помощью калькулятора ТИ-84:

    нормальная cdf
    ниже: 2,5.
    верхний: 3
    мк: 3,4
    σ:0,3
    0,1007

    $P(2,5\leq X \leq 3)=0,1007$

    Пример : Найти нормальные вероятности

    $X\sim N(25, 9)$. Найдите $P(22 \leq X \leq 30)$.


    $$\начало{массив} {lcl}P(22 \leq X \leq 30 &=& F(30) — F(22) \\ &=& P(X \leq 30) — P(X \leq 22)\\ &=& P(Z \leq \frac{30-25}{3}) — P(Z \leq \frac{22-25}{3}) \\ &=& \Phi(1. 67) — \Phi(-1)\\ &=& 0,9525 — 0,1587\\ &=& 0,7938 \end{массив}$$

    Нахождение процентилей нормального распределения

    Чтобы найти процентили нормального распределения, подсчитайте, сколько sd составляет данный процентиль от среднего, затем найдите значение переменной, которая соответствует этому z-показателю.

    Пример : Найдите процентили с нормальным распределением

    Сколько стандартных отклонений от среднего составляет 70 й процентиль?

    Этот вопрос эквивалентен запросу значения z-значения, связанного с 70-м процентилем. Независимо от значений среднего и дисперсии нормального распределения z-показатель, соответствующий 70-му процентилю, одинаков.

    70 процентиль — это значение T, такое, что 70% площади меньше T.

    Чтобы найти T с помощью таблицы, найдите 0,7 в теле таблицы и найдите связанное счет. Поскольку точного значения 0,7 в таблице нет, разумно использовать ближайшее доступное значение, 0,6985. При чтении с полей z-показатель, связанный с 0,6985, равен 0,52, т. е. $P(Z \leq 0,52) = 0,6985$

    Более точное значение можно получить с помощью программного обеспечения или калькулятор (ниже). Использование любого из них показывает, что $z = 0,5244$, то есть $P(Z \leq 0,5244) = 0,7$

    Найдите Z-оценку, соответствующую заданному процентилю:

    Найдите 70-й процентиль на TI-84

    2-Й ВАРС 3
    invНорма 92)$,

    70 й процентиль на 0,52 стандартного отклонения выше среднего.

    0,52 стандартного отклонения составляет 0,52 доллара (0,3) = 0,156 доллара грамма.

    Значение, превышающее среднее значение на 0,52 стандартного отклонения, составляет 3,4 доллара США + 0,156 = 3,556 доллара США в граммах.

    70 й процентиль содержания белка в коровьем молоке составляет 3,556 грамма.

    Суммы нормальных случайных величин

    Линейная комбинация нормально распределенных случайных величин также имеет нормальное распределение. Например, если $X$ обычно распределены, а $Y$ распределены нормально, то ($\small{X+Y}$), ($\small{Y-X}$) и ($\small{2X+3Y}$) являются нормально распределенными случайными величинами. также. Свойства линейности облегчают поиск ожидаемого значения и дисперсии. 92}{п}\справа)$.

    • Предыдущий
    • Следующий

    Нормальное распределение и стандартное нормальное (гауссовское)

     

    Расположение меню: Analysis_Distributions_Normal .

     

    Стандартное нормальное распределение является наиболее важным непрерывным распределением вероятностей. Впервые он был описан де Муавром в 1733 г., а затем немецким математиком К. Ф. Гауссом (1777–1885). StatsDirect дает вам хвостовые области и процентные пункты для этого распределения (Хилл, 19 лет).73; Оде и Эванс, 1974; Вичура, 1988 г.; Джонсон и Коц, 1970).

     

    Нормальные распределения представляют собой семейство распределений с симметричной формой колокола:-

    Площадь под каждой из приведенных выше кривых одинакова, и большинство значений приходится на середину кривой. Среднее значение и стандартное отклонение нормального распределения определяют его высоту и ширину.

     

    Стандартное нормальное распределение (z-распределение) — это нормальное распределение со средним значением 0 и стандартным отклонением 1. Любая точка (x) нормального распределения может быть преобразована в стандартное нормальное распределение (z) с помощью формула z = (x-среднее) / стандартное отклонение. z для любого конкретного значения x показывает, на сколько стандартных отклонений x отличается от среднего значения для всех значений x. Например, если 1,4 м — это рост школьника, где средний для учеников его возраста/пола/этнической принадлежности 1,2 м со стандартным отклонением 0,4, то z = (1,4-1,2) / 0,4 = 0,5, т.е. составляет половину стандартного отклонения от среднего значения (значение в центре кривой).

    На приведенной выше диаграмме показана колоколообразная кривая нормального (гауссовского) распределения, наложенная на гистограмму выборки из нормального распределения. Многие популяции имеют нормальное или близкое к нормальному распределение. Существует также множество математических взаимосвязей между нормальным и другими распределениями. Большинство статистических методов делают «нормальные приближения», когда выборки достаточно велики.

     

    Центральная предельная теорема

    Чтобы понять, почему можно делать «нормальные приближения», рассмотрим центральную предельную теорему. Центральную предельную теорему можно объяснить следующим образом: если вы берете выборку из совокупности с некоторым произвольным распределением, выборочное среднее в пределе имеет тенденцию к нормальному распределению с тем же средним значением, что и совокупность, и с дисперсией, равной дисперсия генеральной совокупности, деленная на размер выборки. Таким образом, график гистограммы средних значений многих выборок, взятых из одной совокупности, будет формировать нормальную (колоколообразную) кривую независимо от распределения значений совокупности.

     

    Техническая проверка

    Хвостовая часть нормального распределения оценивается с точностью до 15 знаков после запятой с использованием дополнения функции ошибок (Abramowitz and Stegun, 1964; Johnson and Kotz, 1970). Квантиль нормального распределения рассчитывается с точностью до 15 знаков после запятой с использованием метода, основанного на AS 241 (Wichura, 1988).

     

    z0,001 = -3,0

30616781

Нижний хвост P(z= -3,030616781) = 0,001

z0.25 = -0.674489750196082

Lower tail P(z= 0.674489750196082) = 0.25

z1E-20 = -9.26234008979841

Lower tail P(z= -9.26234008979841) = 9.99999999999962E-21

 

The first два приведенных выше результата StatsDirect согласуются с точностью до 15 знаков после запятой со справочными данными Wichura (1988). Крайнее значение (нижний хвост P из 1E-20) правильно оценивается до 14 знаков после запятой.

 

Определение функции

Функция распределения Φ(z) стандартной нормальной переменной z:

 

StatsDirect вычисляет Φ(z) по дополнению функции ошибок (errc):

 

 

Copyright © 2000-2022 StatsDirect Limited, все права защищены.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *