Нормально разбираемся в Нормальном распределении / Хабр
Всем привет. Это пост про интуитивное понимание Нормального распределения.
Обычный курс теории вероятностей проходит следующим образом. Сначала вам даются понятные и относительно простые концепции. Все легко объясняется «на пальцах»: подбрасывание монеток, красные и белые шары в урнах, кролики в клетках и так далее.
Но в следующей теме вас бросают в яму к этому монстру:
Внезапно больше нет ни монет, ни урн, ни шаров. Вам только говорят запомнить эту функцию плотности вероятности Нормального распределения, что это очень важно и что график похож на колокол. В остальном вы предоставлены сами себе.
Старый-добрый колокол Гауссианы
Но что это такое? Почему там экспонента? Почему минус? Зачем делить на 2 сигма-квадрат? Откуда взялось число Пи? Куда делись монеты, шары, урны и кролики? Почему мы от интуитивных объяснений перешли к тупому запоминанию?
Каждая формула несет некоторую идею. В этом посте мы будем препарировать нормальное распределение, пока не поймем, что оно в себе несет. В конце мы выведем функцию плотности вероятности, чтобы понять, откуда она берется.
Я покажу, что, несмотря на пугающий вид, Нормальное распределение это не конь в вакууме. Это все еще про броски монеток, урны и другие вещи из реального мира.
СаморекламаЭта статья является переводом моей статьи из Substack Understanding the Normal Distribution for Real. Переходите туда если вам удобнее читать на английском или хочется получать такой контент по почте.
Так же у меня есть телеграм канал @boris_again
Препарируем монстра
Начнем изнутри. Разберемся в идеях, стоящих за этим куском:
Режем монстра на части.
Где это среднее, один из параметров распределения.
Посмотрим на график функции при :
Мы видим параболу. Она похожа на форму колокола, но перевернутую. Также заметьте, что ось произвольна, а не находится в диапазоне , так что это пока не распределение.
Обратите внимание, что чем дальше от среднего значения, тем больше значение функции. Во-вторых, квадрат позволяет нам одинаково относиться к отрицательным и положительным значениям. Он делает форму колокола симметричной.
Идея: определяет местоположение вершины колокола, и распределение становится симметричным.
Наконец-то, форма колокола! Но значения y отрицательны. Естественно у нас не может быть отрицательных вероятностей.
Что будет если менять ?
Меняем среднее
Вывод: Изменение перемещает пик колокола в другое место.
Добавим следующий кусок, деление на сигма квадрат:
Здесь сигма — это второй параметр распределения: стандартное отклонение. Квадрат сигмы — это дисперсия. Что это дает нашему распределению?
Попробуем поменять ее:
Меняем сигму
Идея: знаменатель с сигмой задает скорость изменения значения функции по мере удаления от среднего. Меньшие сигмы создают более узкие колоколообразные формы.
Мы можем рассматривать сигму как меру неопределенности. Малые сигмы указывают на то, что среднее значение более вероятно. Большие сигмы распределяют вероятность по более широкому диапазону.
Сигма возводится в квадрат, чтобы показать: неопределенность возрастает квадратично (быстро), а не линейно (медленно). Другими словами, небольшая вариация данных сильно меняет колоколообразную кривую.
Отлично, у нас есть колоколообразная кривая. Но она не похожа на распределение вероятностей. Чтобы это было распределение, выходы должны находиться в пределах и в сумме равняться 1. Вот здесь и появляется экспонента.
Давайте построим на график около нуля:
e(x)
Обратите внимание: экспонента отображает любой отрицательный вход в значение между 0 и 1. В нашем случае аргумент всегда отрицательный.
Отлично! Теперь все значения находятся между , и у нас получилась нужная нам колоколообразная кривая. Мы закончили.
На самом деле нет. Это прекрасная колоколообразная кривая, но в сумме значения не равны 1. Один только пик почти равен 1.
Как сделать так, чтобы сумма была равна 1? Нормализовать!
Как бы вы нормализовали такую последовательность чисел, как: ? Легко: разделить на сумму.
В нашем случае функция — это не просто последовательность чисел. Она непрерывна. Тем не менее, идея та же. Чтобы получить сумму давайте проинтегрируем:
Теперь, когда у нас есть сумма, давайте разделим функцию на нее:
Наконец, мы собрали все части, чтобы получить нормальное распределение.
Если вм нужны подробности вычисления интеграла, то я рекомендую это видео:
Связь с Биномиальным распределением
Нормальное распределение тесно связано с биномиальным. Давайте отвлечемся и рассмотрим биномиальное распределение поближе. Это поможет нам получить полное представление о нормальном распределении.
Представьте, что у вас есть Substack рассылка, и вы собираетесь запустить рекламную кампанию, нацеленную на 100 человек. Вы знаете свою конверсию в подписку: 10%. Какова вероятность того, что подпишутся ровно 5 человек?
Давайте представим каждого пользователя в виде броска монеты. Он либо регистрируются с вероятностью , либо нет. Это может быть описано распределением Bernoulli(n, p), которое имеет следующую функцию массы вероятности:
Идея: это бросок монеты, есть два возможных исхода, и с вероятностью выпадает орел.
Это распределение позволяет отвечать на вопросы типа «Какова вероятность выпадения орла для этой монеты?» или, более практично, «Какова вероятность того, что пользователь подпишется?».
Мы можем сложить несколько случайных величин Бернулли и получить Биномиальное распределение . Оно говорит нам о вероятности получения успехов из независимых испытаний Бернулли с вероятностью .
Биномиальное распределение объединяет все независимые испытания, чтобы ответить на новые вопросы: «Какова вероятность выпадения 3 орлов из 3 бросков?» или «Сколько пользователей мы можем ожидать при регистрации?»
Вот PMF Биномиального распределения:
Где это Биномиальный коэффициент.
Биномиальный коэффициент используется для того, чтобы учесть множество способов регистрации человек. Например, при наличии четырех посетителей существует шесть способов зарегистрироваться двум из них.
Давайте подставим наши значения, чтобы найти вероятность того, что зарегистрируются ровно пять человек:
Ожидаемое количество подписчиков среди 5 пользователей равно просто умноженное на , то есть 3. 387. Мы также можем получить вероятность регистрации хотя бы 5 подписчиков, просуммировав по и получим 0.94242.
Теперь давайте посмотрим, что происходит по мере роста числа испытаний.
Обратите внимание: с ростом результирующая PMF приближается к знакомой колоколообразной форме Нормального распределения.
Оказывается, что Нормальное распределение является предельным случаем биномиального распределения. Биномиальное распределение отвечает на вопрос: «Насколько вероятно получить k орлов из n бросков монеты?» Нормальное распределение имеет ту же идею, но дает приблизительный результат.
Нас интересует это приближение, потому что вычисление коэффициентов биномиального распределения для больших значений требует огромных вычислительных затрат. Факториалы в формуле являются самой большой проблемой. Например, для биномиальный коэффициент равен 75287520. Это очень дорогое вычисление, особенно если вам нужно суммировать по многим .
Вместо вычисления биномиальной PMF мы можем аппроксимировать его вычислением PDF нормального распределения. Это гораздо быстрее: нужно только подставить несколько чисел в формулу. Этот подход часто используется в опросах.
Основная идея нормального распределения: число успехов в большом количестве независимых испытаний типа «да или нет» распределено симметрично вокруг среднего значения, а форма распределения описывается функцией Гаусса.
Надеюсь, теперь PMF нормального распределения больше не является просто страшной формулой в вакууме. Она по-прежнему связана с подбрасыванием монет и реальной жизнью, как и Биномиальное распределение
Выводим Нормальное распределение
Почему именно такая функция позволяет нам аппроксимировать Биномиальное распределение? Чтобы ответить на этот вопрос, нам нужно будет вывести PMF нормального распределения. Есть несколько способов сделать это, но мы будем использовать наши знания о том, что нормальное распределение является предельным случаем биномиального распределения. Я опишу только основные шаги, так как детали вывода довольно длинные, но вы можете найти полный вывод в этой статье.
Нормальное распределение является предельным случаем Биномиального, если не очень мало, и выполняется условие:
Если это не так, мы получаем распределение Пуассона, что тоже круто, но выходит за рамки этого поста.
Помните биномиальный PMF? Предположим, у нас есть последовательность испытаний Бернулли, каждое с вероятностью успеха , и мы повторяем этот эксперимент раз. Пусть — количество успехов в n испытаниях. Тогда имеет биномиальное распределение с параметрами . Функция массы вероятности определяется как:
Самая тяжелая часть — факториал. Давайте воспользуемся приближением Cтирлинга, чтобы вычислить факториалы быстрее:
Подставив это в Биномиальный коэффициент мы получаем:
Это может выглядеть пугающе, но на самом деле это просто замена и некоторая перестановка терминов.
Подставляя это приближение в PMF Биномиального распределения, мы получаем:
Это функция плотности вероятности нормального распределения при , и квадратом :
Вывод: гауссиана появляется, когда мы заменяем вычисления факториалов в биномиальном приближении. {2}}=\sqrt{36}
Извлеките квадратный корень из обеих частей уравнения.
x-3=6 x-3=-6
Упростите.
x=9 x=-3
Прибавьте 3 к обеим частям уравнения.
3-8Ограничения домена | Алгебра среднего уровня
Результаты обучения
- Алгебраическое определение области определения функции
Функции представляют собой соответствие между двумя наборами, называемыми доменом и диапазоном . При определении функции вы обычно указываете, какими числами могут быть значения домена ( x ) и диапазона ( f(x) ). Но даже если вы говорите, что это реальные числа, это не значит, что все действительных чисел можно использовать для x . Это также не означает, что все действительные числа могут быть значениями функций, f ( x ). Могут быть ограничения по домену и диапазону. Ограничения частично зависят от функции типа .
В этом разделе все функции будут ограничены действительными числовыми значениями. То есть в домене могут использоваться только действительные числа, и только действительные числа могут находиться в диапазоне.
Существуют две основные причины ограничения доменов.
- Нельзя делить на [латекс]0[/латекс].
- Вы не можете извлечь квадратный (или другой четный) корень из отрицательного числа, так как результат не будет действительным числом.
Эти две проблемы вызывают беспокойство, если функция является одной из следующих:
- Рациональная функция, знаменатель которой потенциально может стать [латекс]0[/латекс] для некоторого значения или значений x, [латекс ]f\left(x\right)=\dfrac{x+1}{2-x}[/latex] — рациональная функция.
- Подкоренная функция с четным индексом (например, квадратный корень), где подкоренное число (количество под радикалом) потенциально может быть отрицательным для некоторого значения или значений
В следующей таблице приведены примеры ограничений домена для нескольких различных рациональных функций. Обратите внимание, что у рациональной функции переменная присутствует в знаменателе.
Функция | Ограничения для домена |
---|---|
[латекс] f(x)=\dfrac{1}{x}[/латекс] | Если [латекс]х=0[/латекс], вы будете делить на [латекс]0[/латекс], поэтому [латекс]х\neq0[/латекс]. |
[латекс] f(x)=\dfrac{2+x}{x-3}[/латекс] | Если [латекс]х=3[/латекс], вы будете делить на [латекс]0[/латекс], поэтому [латекс]х\neq3[/латекс]. |
[латекс] f(x)=\dfrac{2(x-1)}{x-1}[/латекс] | Хотя вы можете упростить эту функцию до [latex]f(x)=2[/latex], когда [latex]x=1[/latex], исходная функция будет включать деление на [latex]0[/latex], поэтому [латекс]x\neq1[/латекс]. 9{2}+1[/latex] никогда не может быть [latex]0[/latex]. Минимум это может быть [latex]1[/latex], поэтому нет опасности деления на [latex]0[/latex]. |
Квадратные корни из отрицательных чисел может произойти всякий раз, когда функция имеет переменную под радикалом с четным корнем. Посмотрите на следующие примеры и обратите внимание, что «квадратный корень из отрицательной переменной» не обязательно означает, что значение под радикалом отрицательно. Например, если [латекс]х=-4[/латекс], то [латекс]-х=-(-4)=4[/латекс], положительное число.
Функция | Ограничения для домена |
---|---|
[латекс] f(x)=\sqrt{x}[/латекс] | Если [latex]x<0[/latex], вы должны взять квадратный корень из отрицательного числа, поэтому [latex]x\geq0[/latex]. |
[латекс] f(x)=\sqrt{x+10}[/латекс] | Если [latex]x<−10[/latex], вы должны взять квадратный корень из отрицательного числа, поэтому [latex]x\geq−10[/latex]. |
[латекс] f(x)=\sqrt{-x}[/латекс] 9{2}+10[/latex] никогда не может быть отрицательным. Минимум это может быть [латекс]\sqrt{10}[/латекс], так что нет опасности извлечения квадратного корня из отрицательного числа. |
Итак, как именно вы определяете домен функции?
Как: Для заданной функции, записанной в виде уравнения, найдите область определения
- Определите входные значения.
- Определите любые ограничения на ввод и исключите эти значения из домена.
- Запишите домен в форме интервала, если это возможно. 9{2}-1[/латекс].
Показать решение
Как сделать. По заданной функции, записанной в виде уравнения, включающего дробную часть, найдите домен
- Определите входные значения.
- Определите любые ограничения на ввод. Если в формуле функции есть знаменатель, установите знаменатель равным нулю и найдите [latex]x[/latex] . Если формула функции содержит четный корень, установите подкоренное число больше или равно [latex]0[/latex] и затем решите.
- Запишите домен в форме интервала, исключив из домена любые ограниченные значения.
Пример
Найдите область определения функции [latex]f\left(x\right)=\dfrac{x+1}{2-x}[/latex].
Показать решение
Как: Дана функция, записанная в виде уравнения, включая четный корень, найти область определения
- Определите входные значения.
- Поскольку имеется четный корень, исключите все действительные числа, которые приводят к отрицательному числу в подкоренном члене. Установите подкоренное число больше или равное нулю и найдите [латекс]х[/латекс].
- Решение(я) являются областью определения функции. Если возможно, запишите ответ в интервальной форме.
Пример
Найдите область определения функции [latex]f\left(x\right)=\sqrt{7-x}[/latex].