Найти функцию распределения случайной величины и построить ее график: Найти функцию распределения и построить ее график.

Содержание

Функция распределения случайной величины



Стандартное обозначение:

И для дискретной, и для непрерывной случайной величины она определяется одинаково:

, где – вероятность того, что случайная величина  примет значение, МЕНЬШЕЕ, чем переменная , которая«пробегает» все действительные значения от «минус» до «плюс» бесконечности.

Построим функцию распределения для нашей подопытной игры:

Начинаем разбираться. Чему, например, равно значение ? Это вероятность того, что выигрыш будет меньше, чем –20. И это невозможное событие: . Совершенно понятно, что   и для всех «икс» из интервала , а также для . Почему? По определению функции распределения:
 – вы согласны?  Функция  возвращает вероятность того, что в точке  выигрыш будет СТРОГО МЕНЬШЕ «минус» пяти.

Таким образом: , если .


На интервале  функция , поскольку левее любой точки этого интервала есть только одно значение  случайной величины, которое появляется с вероятностью 0,5. Кроме того, сюда же следует отнести точку , так как:
 – очень хорошо осознайте этот момент!

Таким образом, если , то

Далее рассматриваем  промежуток . СТРОГО ЛЕВЕЕ любой точки этого промежутка находятся два выигрыша , поэтому:

И, наконец, если , то , ибо все значения  случайной величины  лежат СТРОГО левее любой точки интервала

Заметим, кстати, важную особенность: коль скоро функция  характеризует вероятность, то она может принимать значения лишь из промежутка  – и никакие другие!

Итак, функция распределения вероятностей ДСВ является кусочной и, как многие знают, в таких случаях принято использовать фигурные скобки:

График данной функции имеет разрывный «ступенчатый» вид:

Причём, функция  или её график однозначно определяют сам закон распределения: в точке  высота «ступеньки» (разрыв) составляет  (следим по графику), в точке  «скачок» разрыва равен  и, наконец, в точке  он равен в точности .
Таким образом, функция распределения вероятностей – это ещё один способ ЗАДАТЬ случайную величину. И этот способ особо важен для непрерывной случайной величины – по той причине, что её невозможно описать таблицей (ввиду бесконечного и несчётного количества принимаемых значений). Однако, всему своё время, и НСВ – тоже.

Освоим технические моменты решения типовой задачи:

Задача 93
Построить функцию распределения случайной величины

Найти вероятности того, что случайная величина примет значение из следующих промежутков:

…, пожалуй, достаточно.

Решение: На практике удобно использовать формальный алгоритм построения функции распределения:

Сначала берём первое значение   и составляем нестрогое неравенство . На этом промежутке .

На промежутке  (между  и ):

На промежутке  (между  и ):

На промежутке  (между  и ):

И, наконец, если  строго больше самого последнего значения , то:

Легко заметить, что с увеличением «икс» идёт накопление (суммирование) вероятностей, и поэтому функцию  иногда называют интегральной функцией распределения.

В практических задачах проведённые выше действия обычно выполняют устно, а результат сразу записывают под единую скобку:

Выполним чертёж:

и проконтролируем правильность решения с помощью «скачков» графика: в точке  «скачок» равен , в точке составляет , в точке  равен , и, наконец, в точке  – .

При выполнении чертежа от руки оптимален следующий масштаб:
горизонтальная ось:  1 ед. = 2 или 1 тетрадная клетка;
вертикальная ось: 0,1 = 1 тетрадная клетка.

На левых концах ступенек (кроме нижнего луча) можно ставить выколотые точки – дело вкуса. Левый нижний луч следует прочертить жирно (чтобы он не сливался с координатной осью) и до конца оси! Правая верхняя линия не должна заканчиваться раньше острия оси! Такие оплошности могут говорить о непонимании функции распределения, а это, как вы понимаете, скверно. То было ручное построение.

Ну а о том, как строить такие красивые графики в Экселе можно узнать в этом ролике на Ютубе, к слову, полигон (многоугольник) распределения строится ещё проще.

Переходим ко второй части задания, её коротко можно сформулировать так:

2.2.8. Вероятность попадания в промежуток

2.2.6. Многоугольник распределения



Полную и свежую версию этой книги в pdf-формате,
а также курсы по другим темам можно найти здесь.

Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!

С наилучшими пожеланиями, Александр Емелин


Интегральная функция распределения случайной величины и её свойства. Функция распределения дискретной случайно величины —

Теория

Задание случайной величины её законом распределения не обладает общностью, так как его нельзя использовать, например, для непрерывных случайных величин. Кроме того, даже для дискретных случайных величин закон распределения не удовлетворяет практическим требованиям.

Например, с точки зрения практики событие, состоящие в том, что некоторый прибор проработает, например, 1000 часов, не представляет интереса. Более важным является событие Х < 1000 или событие Х > 1000. Такое событие имеет вероятность, отличную от нуля, и при изменении Х вероятность события будет изменяться.

Следовательно, вероятность является функцией от х, которая и принимается в качестве интегральной функции распределения и которая является универсальной, пригодной для описания как непрерывных, так и дискретных случайных величин.

Определение 4. Интегральной функцией распределения вероятностей случайной величины Х называется функция

F(х), соответствующая вероятности того, что в результате опыта случайная величина Х примет значение меньшее х – некоторого значения случайной величины.

Таким образом, по определению

F(x) = Р(X < х), т.е. (3.1)

На числовой оси Ох случайная величина х сщдержится в интервале (– ∞, х) (рисунок 3. 4):

Рис. 3.4

Пример 9. Пусть для случайной величины X задан ряд распределения:

Х

х =1

х

= 2

х = 3

х = 4

х = 5

х = 6

P

p= 0,4

p= 0,24

p=0,19

P=0,1

p=0,04

p= 0,03

Записать интегральную функцию распределения и построить ее график.

Решение. F(x) = P(X < x) = 0, х х=1; F (x) = P(X < x) = P(X = x)= = p = 0,4; 1 < х ≤ 2; F

2 (x) = P(X < x) = P (X = x) + P (X = x) = 0,4 + 0,24 = = 0,64; 2 < х ≤ 3.

Событие Х < х может быть осуществлено, когда Х принимает значения х1 с вероятностью p= 0,4 или значение х с вероятностью p. В силу несовместности этих событии получается, что Р(Х < х) = p + p. Далее имеем

F(x) = P(X < x) = Р(X = x) + P(X = x) + P(X = x) = 0,4 + 0,24 + 0,19 = 0,83, 3< х ≤4;

F(x) = P(X < x) = 0,4 + 0,24+0,19 + 0,1 = 0,93, х< хх, 4 < х ≤ 5;

F(x) = P(X < x) = 0,4+0,24+0,19+0,1+0,04 = 0,97, х

< х х, 5 < х ≤ 6;

F(x) = P(X>x) = 0,4 + 0,24 + 0,19 + 0,1 + 0,04 + 0,03 = 1, х > 6.

Рис. 3.5

Таким образом, функция F(х) здесь составная (ступенчатая) и она претерпевает разрыв 1-го рода в точках хkи скачки этой функций равны pk = = Р(Х = хk) (k = 1, 2, 3, 4, 5, 6) (рисунок 3.5). Заметим, что функция распределе-ния для непрерывной случайной величины имеет форму плавной кривой (рисунок 3.6).

Функция и график, таблица I StudySmarter

Распределение вероятностей — это функция, которая дает индивидуальные вероятности возникновения различных возможных результатов эксперимента. Это математическое описание случайного явления с точки зрения его выборочного пространства и вероятностей событий.

Выражение распределения вероятностей

Распределение вероятностей часто описывается в виде уравнения или таблицы, которая связывает каждый результат вероятностного эксперимента с соответствующей вероятностью его возникновения.

Пример 1

Рассмотрим эксперимент, в котором случайная величина X = счету при правильном броске костей.

Так как здесь есть шесть равновероятных исходов, вероятность каждого исхода равна 1/6.

Соответствующее распределение вероятностей можно описать:

P (X = x) = 1/6, x = 1, 2, 3, 4, 5, 6

x

1

2

3

5

P (X = x)

1/6

1/6

1/6

1/6

1/6

1/6

Example 2

Правильная монета подбрасывается два раза подряд. X определяется как количество полученных голов. Запишите все возможные исходы и выразите распределение вероятности в виде таблицы и функции массы вероятности.

Решение 2

С орлом как H и решкой как T, есть 4 возможных исхода:

(T, T), (H, T), (T, H) и (H, H).

Следовательно, вероятность выпадения (X = x = количество орлов = 0) = (количество исходов с 0 орлами) / (общее количество исходов) = 1/4

(x = 1) = (количество исходов с 1 орлом) / (общее количество исходов) = 2/4

(x = 2) = (количество исходов с 2 орлами) / (общее количество исходов) = 1/4

Now let’s express the probability distribution

P (X = x) = 0.25, x = 0, 2

= 0.5, x = 1

Количество головок, х

0

1

2

P (X = x)

0. 25

0.5

0.25

Example 3

The random variable X has a функция распределения вероятностей

P (X = x) = kx, x = 1, 2, 3, 4, 5

Каково значение k?

Решение 3

Мы знаем, что сумма вероятностей функции распределения вероятностей должна быть равна 1,

Для x = 1, kx = k.

Для x = 2, kx = 2k.

И так далее.

Таким образом, мы имеем

k + 2k + 3k + 4k + 5k = 1

=> k = 1/15

Дискретное и непрерывное распределение вероятностей

Функции распределения вероятностей можно классифицировать как дискретные или домен принимает дискретный или непрерывный набор значений.

Дискретная функция распределения вероятностей

Математически дискретная функция распределения вероятностей может быть определена как функция p (x), которая удовлетворяет следующим свойствам:

1. Вероятность того, что x может принимать определенное значение, равна p(x). То есть

P (X = x) = p (x) = px

2. p (x) неотрицательно для всех действительных x.

3. Сумма p (x) по всем возможным значениям x равна 1, то есть

= 1

Дискретная функция распределения вероятностей может принимать дискретный набор значений – они не обязательно должны быть конечными. Все примеры, которые мы рассмотрели до сих пор, представляют собой дискретные функции вероятности. Это связано с тем, что все экземпляры функции дискретны — например, количество орлов, полученных при подбрасывании монеты. Это всегда будет 0, или 1, или 2, или… У вас никогда не будет, скажем, 1,25685246 решек, а это не входит в область применения этой функции. Поскольку функция предназначена для покрытия всех возможных исходов случайной величины, сумма вероятностей всегда должна быть равна 1.

Другие примеры дискретных распределений вероятностей:

  • X = количество голов, забитых футбольной командой в данном матче.

  • X = количество учащихся, сдавших экзамен по математике.

  • X = количество людей, родившихся в Великобритании за один день.

Дискретные функции распределения вероятностей называются массовыми функциями вероятностей.

Непрерывная функция распределения вероятностей

Математически непрерывную функцию распределения вероятностей можно определить как функцию f (x), которая удовлетворяет следующим свойствам:

1. Вероятность того, что x находится между двумя точками a и b, равна

p (a ≤ x ≤ b ) = f (x) dx

2. Оно неотрицательно для всех действительных x.

3. Интеграл функции вероятности равен

f (x) dx = 1

Непрерывная функция распределения вероятностей может принимать бесконечный набор значений на непрерывном интервале. Вероятности также измеряются в интервалах, а не в заданной точке. Таким образом, площадь под кривой между двумя различными точками определяет вероятность для этого интервала. Свойство, что интеграл должен быть равен единице, эквивалентно свойству для дискретных распределений, что сумма всех вероятностей должна быть равна единице.

Примеры непрерывных вероятностных распределений:

X = количество осадков в дюймах в Лондоне за март.

X = продолжительность жизни данного человека.

X = рост случайного взрослого человека.

Непрерывные функции распределения вероятностей называются функциями плотности вероятности.

Кумулятивное распределение вероятностей

Кумулятивная функция распределения вероятностей для случайной величины X дает вам сумму всех отдельных вероятностей до точки x включительно для расчета P (X ≤ x).

Это означает, что кумулятивная функция вероятности помогает нам найти вероятность того, что результат случайной величины находится в пределах и выше указанного диапазона.

Пример 1

Рассмотрим эксперимент, в котором случайная величина X равна количеству выпавших орлов при двукратном броске игральных костей.

Кумулятивное распределение вероятностей будет следующим:0021

No. of heads, x

0

1

2

P (X = x)

0.25

0.5

0.25

Cumulative Probability

P (X ≤ x)

0.25

0.75

1

The cumulative probability distribution gives us the probability that the количество полученных голов меньше или равно x. Итак, если мы хотим ответить на вопрос «какова вероятность того, что я не выиграю больше, чем решка», кумулятивная функция вероятности говорит нам, что ответ на этот вопрос равен 0,75.

Пример 2

Правильная монета подбрасывается три раза подряд. Случайная величина X определяется как количество выпавших орлов. Представьте кумулятивное распределение вероятностей с помощью таблицы.

Решение 2

Представление получения орла как H и решки как T, есть 8 возможных исходов:

(T, T, T), (H, T, T), (T, H, T), (T , Т, Н), (Н, Н, Т), (Н, Т, Н), (Т, Н, Н) и (Н, Н, Н).

Кумулятивное распределение вероятностей представлено в следующей таблице.

19 9000 2

. вопрос.

  1. Какова вероятность получить не более 1 головы?

  2. Какова вероятность получить хотя бы 1 голову?

Решение 3
  1. Совокупная вероятность P (X ≤ x) представляет собой вероятность выпадения не более x орлов.

Следовательно, вероятность выпадения не более 1 головы равна P (X ≤ 1) = 0,5

  1. Вероятность выпадения хотя бы 1 головы равна 1 — P (X ≤ 0) = 1 — 0,125 = 0,875

Равномерное распределение вероятностей

Распределение вероятностей, при котором все возможные исходы происходят с равной вероятностью, называется равномерным распределением вероятностей.

Таким образом, при равномерном распределении, если известно, что количество возможных исходов равно n вероятности, вероятность каждого исхода равна 1/n.

Пример 1

Вернемся к эксперименту, в котором случайная величина X = счету при броске честной кости.

Мы знаем, что вероятность каждого возможного исхода в этом сценарии одинакова, а число возможных исходов равно 6.

Таким образом, вероятность каждого исхода равна 1/6.

Функция массы вероятности, следовательно, будет,

P (X = x) = 1/6, x = 1, 2, 3, 4, 5, 6

Биномиальное распределение вероятностей используется, когда существует ровно два взаимоисключающих возможных исхода испытания. Исходы классифицируются как «успех» и «неудача», а биномиальное распределение используется для получения вероятности наблюдения x успехов в n испытаниях.

Интуитивно следует, что в случае биномиального распределения случайная величина X может быть определена как количество успехов, полученных в испытаниях.

Вы можете смоделировать X с биномиальным распределением, B (n, p), если:

  • имеется фиксированное количество испытаний, n

  • есть 2 возможных исхода, успех и неудача

  • существует фиксированная вероятность успеха p для всех испытаний

  • испытания независимы

Распределение вероятностей — основные выводы

    • возможные исходы эксперимента. Распределения вероятностей могут быть выражены как в виде функций, так и в виде таблиц.

    • Функции распределения вероятностей можно классифицировать как дискретные или непрерывные в зависимости от того, принимает ли область дискретный или непрерывный набор значений. Дискретные функции распределения вероятностей называются функциями массы вероятностей. Непрерывные функции распределения вероятностей называются функциями плотности вероятности.

    • Кумулятивная функция распределения вероятностей для случайной величины X дает вам сумму всех отдельных вероятностей до точки x включительно для расчета P (X ≤ x).

    • Распределение вероятностей, при котором все возможные исходы происходят с равной вероятностью, называется равномерным распределением вероятностей. При равномерном распределении вероятностей, если известно количество возможных исходов n, вероятность появления каждого исхода равна 1/n.

Что такое функция плотности вероятности и как ее найти

Для дискретных переменных вероятность является простой и может быть легко рассчитана. Но для непрерывных переменных, которые могут принимать бесконечные значения, вероятность также принимает диапазон бесконечных значений.

Функция, описывающая вероятность таких переменных, в статистике называется функцией плотности вероятности.

Что такое функция плотности вероятности?

Функция, которая определяет взаимосвязь между случайной величиной и ее вероятностью, так что вы можете найти вероятность переменной, используя функцию, называется функцией плотности вероятности (PDF) в статистике.

Различные типы переменных. В основном они бывают двух типов:

  1. Дискретная переменная. Переменная, которая может принимать только определенное конечное значение в определенном диапазоне, называется дискретной переменной. Обычно он разделяет значения конечным интервалом, например, суммой двух игральных костей. При бросании двух игральных костей и сложении полученного результата результат может принадлежать только набору чисел, не превышающему 12 (поскольку максимальный результат броска костей равен 6). Значения также определены.
  2. Непрерывная переменная: непрерывная случайная величина может принимать бесконечное число различных значений в пределах диапазона значений, например, количество осадков, выпадающих за месяц. Наблюдаемый дождь может достигать 1,7 см, но точное значение неизвестно. На самом деле это может быть 1,701, 1,7687 и т. д. Таким образом, вы можете определить только диапазон значений, в которые он попадает. В пределах этого значения он может принимать бесконечное число различных значений.

Теперь рассмотрим непрерывную случайную величину x, которая имеет функцию плотности вероятности, которая определяет диапазон вероятностей, принимаемых этой функцией, как f(x). После построения PDF-файла вы получите график, как показано ниже:                     

Рисунок 1: Функция плотности вероятности

На приведенном выше графике вы получаете колоколообразную кривую после построения зависимости функции от переменной. Синяя кривая показывает это. Теперь рассмотрим вероятность точки b. Чтобы его найти, нужно найти площадь под кривой слева от b. Это представлено P (b). Чтобы найти вероятность того, что переменная окажется между точками а и b, нужно найти площадь кривой между точками а и b. Поскольку вероятность не может быть больше P(b) и меньше P(a), ее можно представить в виде: 

Р(а) <= Х <= Р(б).

Рассмотрим приведенный ниже график, на котором показано распределение осадков в течение года в городе. По оси X отложено количество осадков в дюймах, а по оси Y — функция плотности вероятности. Вероятность некоторого количества осадков получается путем нахождения площади кривой слева от нее.

Рисунок 2: Функция плотности вероятности количества осадков

Для вероятности выпадения 3 дюймов осадков вы начертите линию, пересекающую ось y в той же точке графика, что и линия, проходящая от 3 по оси x. Это говорит вам о том, что вероятность выпадения 3 дюймов осадков меньше или равна 0,5.

Ниже приведены три основных шага:

  • Суммирование плотности с помощью гистограммы. Сначала вы преобразуете данные в дискретную форму, построив их в виде гистограммы. Гистограмма — это график со значениями категорий на оси X и ячейками разной высоты, дающий вам количество значений в этой категории. Количество бинов имеет решающее значение, поскольку оно определяет, сколько столбцов будет иметь гистограмма, и их ширину. Это скажет вам, как он будет отображать вашу плотность.
  • Выполнение оценки параметрической плотности: PDF-файл может принимать форму, аналогичную многим стандартным функциям. Форма гистограммы поможет вам определить, к какому типу относится эта функция. Вы можете рассчитать параметры, связанные с функцией, чтобы получить нашу плотность. Чтобы проверить, подходит ли наша гистограмма для этой функции, вы можете:
    1. Постройте график функции плотности и сравните форму гистограммы
    2. Сравнение образцов функции с фактическими образцами
    3. Использовать статистический тест
  • Выполнение непараметрической оценки плотности: в случаях, когда форма гистограммы не соответствует общей функции плотности вероятности или не может соответствовать ей, вы вычисляете плотность, используя все выборки в данных и применяя определенные алгоритмы. Одним из таких алгоритмов является оценка плотности ядра. Он использует математическую функцию для расчета и сглаживания вероятностей, чтобы их сумма всегда равнялась 1. Для этого вам потребуются следующие параметры:
  1. Параметр сглаживания (полоса пропускания): Управляет количеством выборок, используемых для оценки вероятности появления новой точки.
  2. Основная функция: Помогает контролировать распределение образцов.

Как реализовать функцию плотности вероятности в Python?

Вы увидите, как найти функцию плотности вероятности случайной выборки с помощью Python. Вы начинаете с импорта необходимых модулей, которые помогут вам построить гистограмму и найти распределение.

Рисунок 3: Импорт необходимых модулей

1. Построение гистограммы

Теперь сгенерируйте случайную выборку с функцией плотности вероятности, напоминающей колоколообразную кривую. Такой тип распределения вероятностей называется нормальным распределением.

Рисунок 4: Построение гистограммы

Используя библиотеку pyplot, вы построили распределение в виде гистограммы. Как видите, форма гистограммы напоминает кривую нормального распределения.

Рисунок 5: Гистограмма

При построении гистограммы важно использовать правильное количество интервалов. На приведенной выше диаграмме вы использовали 10 бинов. Посмотрите, что произойдет, если вы используете 4 корзины.

Рисунок 6: Гистограмма с 4 бинами

Как видите, эта гистограмма не так похожа на форму колокола, как гистограмма с 10 бинами. Это может затруднить распознавание типа распределения.

2. Выполнение оценки параметрической плотности

Теперь посмотрите, как выполнить оценку параметрической плотности. Во-первых, сгенерируйте нормальную выборку со средним значением 50 и стандартным отклонением 5. Генерируется 1000 выборок.

Рисунок 7: Создание образцов

Чтобы выполнить параметрическую оценку, предположим, что вам неизвестно распределение этих выборок. Первое, что вам нужно сделать с образцом, — это предположить его распределение. Предположим нормальное распределение. Параметрами, связанными с нормальным распределением, являются среднее значение и стандартное отклонение. Рассчитайте среднее значение и стандартное отклонение для образцов.

Рисунок 8: Расчет среднего значения и стандартного отклонения

Теперь определите нормальное распределение с указанными выше средним значением и стандартным отклонением.

Рисунок 9: Нормальное распределение

Теперь найдите распределение вероятностей для распределения, определенного выше.

Рисунок 10: Распределение вероятностей для нормального распределения

Теперь постройте распределение, которое вы определили, поверх выборочных данных.

Рисунок 11: График распределения по образцам

Как видите, предполагаемое вами распределение почти идеально подходит для образцов. Это означает, что выборка представляет собой нормальное распределение. Если бы это было не то же самое, вам пришлось бы предположить, что выборка относится к какому-то другому распределению, и повторить процесс.

3. Выполнение непараметрической оценки плотности

Теперь пришло время выполнить непараметрические оценки. Вы начинаете с импорта некоторых модулей, необходимых для этого.

Рисунок 12: Импорт необходимых модулей

Для выполнения непараметрических оценок необходимо использовать две нормальные выборки и соединить их вместе, чтобы получить выборку, которая не соответствует ни одному известному общему распределению.

 

Рисунок 13: Создание образца

Теперь нарисуйте распределение, чтобы увидеть, как оно выглядит.

Рисунок 14: График распределения

Теперь используйте оценку плотности ядра, чтобы получить модель, которую затем можно подогнать к вашей выборке, чтобы создать кривую распределения вероятностей.

Рисунок 15: Создание функции оценки плотности ядра

Теперь вы найдете распределение вероятности для нашей функции оценки плотности ядра.

Рисунок 16: Создание функции оценки плотности ядра

Наконец, нанесите функцию на образцы.

Рисунок 17: График распределения по образцам

Вы можете видеть, что оценки плотности ядра очень хорошо соответствуют образцам. Для дальнейшей точной настройки можно изменить полосу пропускания функции.

Ждете карьеры в области аналитики данных? Посетите учебный курс по аналитике данных и пройдите сертификацию уже сегодня.

Заключение 

Из этого руководства «Все, что вам нужно знать о функции плотности вероятности» вы поняли, что такое функция плотности вероятности в статистике. Затем вы посмотрели, как найти функцию плотности вероятности в статистике и Python.

Если вы заинтересованы в изучении функции плотности вероятности и связанных с ней статистических концепций, вы можете начать карьеру в области анализа данных. Программа сертификации аналитики данных Simplilearn — одна из самых полных онлайн-программ для этого.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

© 2015 - 2019 Муниципальное казённое общеобразовательное учреждение «Таловская средняя школа»

Карта сайта

No. of heads, x

0

1

2

3

P (X = x)

0. 125

0.375

0.375

0.125

Cumulative Probability

P (x ≤ x)

0,125

0,5

0,875

1