Дисперсия и среднее квадратичное отклонение. Примеры вычисления
Математическое ожидание не дает достаточно полной информации о случайной величине, поскольку одному и тому же значению математического ожидания может соответствовать множество случайных величин, будут различаться не только возможными значениями, но и характером распределения и самой природой возможных значений.
Например. Законы распределения двух случайных величин и заданные таблицами:
Вычислить математическое ожидание и
Решение. Находим математическое ожидание по класической формуле
Получили, что для двух различных законов распределения математическое ожидание принимает одинаковое значения (0), при этом возможные значения случайных величин и различаются. Из приведенного примера видно, что в случае равенства математических ожиданий случайные величин и имеют тенденцию к колебаниям относительно и причем имеет больший размах рассеяния относительно сравнительно случайной величине относительно . Поэтому математическое ожидание еще называют центром рассеяния. Для определения рассеяния вводится числовая характеристика, называемая дисперсией.
Для определения дисперсии рассматривается отклонение случайной величины от своего математического ожидания
Математическое ожидание такого отклонения случайной величины всегда равна нулю. В этом легко убедиться из следующего соотношения
Таки образом, отклонение не может быть мерой рассеивания случайной величины.
Дисперсией случайной величины называют математическое ожидание квадрата отклонения случайной величины от своего математического ожидания
Для дискретной случайной величины дисперсия вычисляется по формуле
для непрерывной находят интегрированием
Если непрерывная величина заданная на интервале то дисперсия равна интегралу с постоянными пределами интегрирования
Дисперсия обладает следующими свойствами
1. Если случайная величина состоит из одной тотчки — постоянная величина, то дисперсия равна нулю
2. Дисперсия от произведения постоянной на случайную величину равна квадрату постоянной умноженной на дисперсию случайной величины
3. Если и — постоянные величины, то для дисперсии справедлива зависимость
Это следует из двух предыдущих свойств.
Дисперсию можно вычислить по упрощенной формуле:
которая в случае дискретной случайной величины имеет вид
для непрерывной определяется зависимостью
и для непрерывной на промежутке соотношением
Приведенные формулы очень удобны в вычислениях, и их, в отличие от предыдущих, используют в обучении
Также следует помнить, что дисперсия всегда принимает неотрицательные значения . Она характеризует рассеяние случайной величины относительно своего математического ожидания. Если случайная величина измерена в некоторых единицах, то дисперсия будет измеряться в этих же единицах, но в квадрате.
Для сравнения удобно пользоваться числовыми характеристиками одинаковой размерности случайной величиной. Для этого вводят в рассмотрение среднее квадратичное отклонение – корень квадратный из дисперсии. Ее обозначают греческой буквой «сигма»
—————————————-
Рассмотрим примеры для ознакомления с практической стороной определения этих величин.
Пример 1. Закон распределения дискретной случайной величины заданы таблицей:
Вычислить дисперсию и среднее квадратическое отклонение .
Решение. Согласно свойствами дисперсии получим:
—————————————-
Пример2. Есть четыре электрические лампочки, каждая из которых имеет дефект с вероятностью ( — вероятность того, что лампочка без дефекта). Последовательно берут по одной лампочке, вкручивают в патрон и включают электрический ток. При включении тока лампочка может перегореть, и ее заменяют на другую. Построить закон распределения дискретной случайной величины — число лампочек, которые будут опробованы. Вычислить среднее квадратическое отклонение
Решение. Дискретная случайная величина — число лампочек, которые будут опробованы — приобретает такие возможных значений:
Вычислим соответствующие вероятности:
Последнюю вероятность можно трактовать следующим образом: четвертая лампочка будет испытана, когда третья перегорит, а четвертая — нет, или если и четвертая перегорит.
В табличной форме закон распределения иметь следующий вид:
Для нахождения среднего квадратического отклонения найдем сначала значение дисперсии. Для дискретной случайной величины она примет значение:
Среднее квадратичное отклонение находим добычей корня квадратного из дисперсии.
—————————————-
Пример 3. Закон распределения вероятностей дискретной случайной величины заданы в виде функции
Вычислить среднее квадратическое отклонение и дисперсию
Решение. С помощью функции распределения вероятностей формируем закон распределения в виде таблицы
На основе таблицы распределения вычисляем дисперсию
————————
Подобных примеров можно привести множество, основная их суть в правильном применении приведенных в начале статьи формул для вычисления дисперсии и математического ожидания. Применяйте их там где это необходимо и не допускайте ошибок при определении дисперсии.
Дисперсия случайной величины и ее свойства. Среднее квадратическое отклонение. Теория вероятностей и математическая статистика
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Краткая теория
Дисперсия и формула для ее вычисления
На практике часто требуется оценить рассеяние возможных значений случайной величины вокруг ее среднего значения. Например, в артиллерии важно знать, насколько кучно лягут снаряды вблизи цели, которая должна быть поражена.
На первый взгляд может показаться, что для оценки рассеяния проще всего вычислить все возможные значения отклонения случайной величины и затем найти их среднее значение. Однако такой путь ничего не даст, так как среднее значение отклонения, т. е. M[X-M(X)], для любой случайной величины равно нулю. Это свойство объясняется тем, что одни возможные отклонения положительны, а другие — отрицательны; в результате их взаимного погашения среднее значение отклонения равно нулю. Эти соображения говорят о целесообразности заменить возможные отклонения их абсолютными значениями или их квадратами. Так и поступают на деле. Правда, в случае, когда возможные отклонения заменяют их абсолютными значениями, приходится оперировать с абсолютными величинами, что приводит иногда к серьезным затруднениям. Поэтому чаще всего идут по другому пути, то есть вычисляют среднее значение квадрата отклонения, которое и называют дисперсией.
Дисперсией называется математическое ожидание квадрата отклонения случайной величины от :
Для того чтобы найти дисперсию, достаточно вычислить сумму произведений возможных значений квадрата отклонения на их вероятности.
Для вычисления дисперсии на практике удобно пользоваться следующей формулой:
Свойства дисперсии
Свойство 1.
Дисперсия равна разности между математическим ожиданием квадрата случайной величины и квадратом ее математического ожидания.
Свойство 2.
Дисперсия константы равна нулю:
Свойство 3.
Постоянный множитель выносится из-под знака дисперсии в квадрате:
Свойство 4.
Дисперсия суммы случайных величин:
где – ковариация случайных величин и
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Следствия из свойств дисперсии.
В частности, если и независимы, то
Прибавление константы в случайной величине не меняет ее дисперсии:
Дисперсия разности равна сумме дисперсий:
Среднеквадратическое отклонение
Для оценки рассеяния возможных значений случайной величины вокруг ее среднего значения кроме дисперсии служат и некоторые другие характеристики. К их числу относится среднее квадратическое отклонение.
Стандартное (среднее квадратичное) отклонение случайной величины определяется как корень из дисперсии и обозначается
Легко показать, что дисперсия имеет размерность, равную квадрату размерности случайной величины.
Смежные темы решебника:
- Математическое ожидание и его свойства
- Дискретная случайная величина
- Непрерывная случайная величина
Примеры решения задач
Пример 1
В коробке 20 конфет, из которых 4 с вареньем. Х – число конфет с вареньем среди двух случайно выбранных. Найти дисперсию случайной величины Х.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Случайная величина – число конфет с вареньем, может принимать значения 0,1,2
Найдем соответствующие вероятности:
Проверка:
Получаем следующий закон распределения СВ :
0 | 1 | 2 | |
0.6316 | 0.3368 | 0.0316 |
Математическое ожидание:
Дисперсию можно вычислить по формуле:
Искомая дисперсия:
Пример 2
Даны законы распределения независимых случайных величин X и Y:
xi | 0 | 1 |
ni |
0.![]() |
и
yi | 2 | 3 |
mi | 0.5 | 0.5 |
Найти закон распределения суммы (X+Y). Проверить равенство D(X+Y)=D(X)+D(Y).
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Распределение суммы :
0+2 | 0+3 | 1+2 | 1+3 | |
Окончательно получаем:
2 | 3 | 4 | Итого | |
0.![]() |
0.5 | 0.3 | 1 |
Вычислим математические ожидания:
Вычислим дисперсии:
Проверим равенство :
Равенство выполняется.
Пример 3
Вероятность изготовления бракованной детали на первом станке составляет 3%, на втором станке 5%. На первом станке было изготовлено 20 деталей, на втором 40 деталей. Найти математическое ожидание и дисперсию числа бракованных деталей.
Решение
Математическое ожидание биномиального распределения:
Дисперсия:
Математическое ожидание величины – числа бракованных деталей на 1-м станке:
Дисперсия:
Математическое ожидание величины – числа бракованных деталей на 2-м станке:
Дисперсия:
Математическое ожидание числа бракованных деталей:
Дисперсия числа бракованных деталей:
Ответ:
;
.
Пример 4
Случайные величины X,Y распределены по закону Пуассона. Найдите M{(X+Y)2}, если M(X)=40 и M(Y)=70, а коэффициент корреляции X и Yравен 0,8.
Решение
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Поскольку случайные величины и распределены по закону Пуассона и известны их математические ожидания, соответствующие дисперсии равны:
Пользуясь свойствами математического ожидания и дисперсии:
Подставляя числовые значения, получаем:
Ответ:
.
Задачи контрольных и самостоятельных работ
Задача 1
Независимые случайные величины X и Y заданы следующими законами:
x | 2.3 | 2.5 | 2.7 | 2.9 |
p | 0.4 | 0.3 | 0.2 | 0.1 |
y | 1 | 2 | 3 |
p | 0.3 |
0.![]() |
0.2 |
Укажите законы распределения случайной величины X+Y, X-Y и найдите их математическое ожидание и дисперсию.
Задача 2
Найти дисперсию, математическое ожидания, среднекваратическое отклонение ДСВ X, заданной законом распределения.
x | -5 | 2 | 3 | 4 |
p | 0,4 | 0,3 | 0,1 | 0,2 |
Написать F(x) и построить ее график.
Задача 3
Случайная величина X имеет плотность вероятности
Требуется
найти дисперсию Dx.
На сайте можно заказать решение контрольной или самостоятельной работы, домашнего задания, отдельных задач. Для этого вам нужно только связаться со мной:
ВКонтакте
WhatsApp
Telegram
Мгновенная связь в любое время и на любом этапе заказа. Общение без посредников. Удобная и быстрая оплата переводом на карту СберБанка. Опыт работы более 25 лет.
Подробное решение в электронном виде (docx, pdf) получите точно в срок или раньше.
Задача 4
Вероятность того, что прибор исправен, равна 0,8. X – число исправных приборов из двух выбранных. Найти дисперсию случайной величины X.
Задача 5
Случайные величины X и Y независимы. Найти дисперсию случайной величины Z=2X+3Y, если известно, что D(X)=4, D(Y)=5.
Задача 6
Найти
дисперсию дискретной случайной величины X – числа отказов элемента
некоторого устройства в десяти независимых опытах, если вероятность отказа
элемента в каждом опыте равна 0,9.
Задача 7
Дискретная случайная величина X имеет только два возможных значения: x1 и x2, причем x2>x1. Вероятность того, что X примет значение x1, равна 0,6. Найти закон распределения величины X, если математическое ожидание и дисперсия известны: M(X)=1,4; D(X)=0,24.
Задача 8
Закон распределения случайной величины ξ имеет вид:
ξ | -1 | 2 | 3 | 5 |
P | 1/4 | 1/2 | 1/8 | 1/8 |
Найти функцию распределения случайной величины ξ,
вычислить ее математическое ожидание, дисперсию и среднее квадратическое
отклонение. Вычислить вероятность P{5⁄2<ξ<5}.
Задача 9
Дискретная случайная величины X принимает лишь два значения. Большее из значений 3 она принимает с вероятностью 0,4. Кроме того, известна дисперсия случайной величины D(X)=6. Найти математическое ожидание случайной величины.
Задача 10
Найти дисперсию по заданному непрерывному закону распределения случайной величины X, заданному плотностью вероятности при и в остальных точках.
- Краткая теория
- Примеры решения задач
- Задачи контрольных и самостоятельных работ
Дисперсия — определение, формула, примеры, свойства
Дисперсия — это статистическое измерение, которое используется для определения разброса чисел в наборе данных по отношению к среднему значению или среднему значению. Квадрат стандартного отклонения даст нам дисперсию. Используя дисперсию, мы можем оценить, насколько растянуто или сжато распределение.
В статистике могут быть два типа дисперсии, а именно выборочная дисперсия и дисперсия генеральной совокупности. Символ дисперсии задается σ 2 . Дисперсия широко используется при проверке гипотез, проверке соответствия и выборке методом Монте-Карло. Чтобы проверить, насколько сильно различаются отдельные точки данных по отношению к среднему значению, мы используем дисперсию. В этой статье мы рассмотрим определение, примеры, формулы, приложения и свойства дисперсии.
1. | Что такое дисперсия? |
2. | Формула дисперсии |
3. | Дисперсия и стандартное отклонение |
4. | Как найти дисперсию? |
5. | Дисперсия и ковариация |
6. | Свойства отклонения |
7. | Часто задаваемые вопросы о Variance |
Что такое дисперсия?
Дисперсия является мерой дисперсии. Мера дисперсии — это величина, которая используется для проверки изменчивости данных о среднем значении. Данные могут быть двух типов — сгруппированные и разгруппированные. Когда данные выражаются в виде интервалов классов, они называются сгруппированными данными. С другой стороны, если данные состоят из отдельных точек данных, они называются несгруппированными данными. Выборочная и генеральная дисперсия может быть определена для обоих типов данных.
Дисперсия Определение
Дисперсия населения — Все члены группы известны как население. Когда мы хотим выяснить, как каждая точка данных в данной совокупности изменяется или распределяется, мы используем дисперсию совокупности. Он используется для получения квадрата расстояния каждой точки данных от среднего значения генеральной совокупности.
Выборочная дисперсия — Если размер генеральной совокупности слишком велик, трудно учесть каждую точку данных. В таком случае из совокупности берется определенное количество точек данных, чтобы сформировать выборку, которая может описать всю группу. Таким образом, выборочная дисперсия может быть определена как среднее квадратов расстояний от среднего. Дисперсия всегда рассчитывается относительно среднего значения выборки.
Общее определение дисперсии состоит в том, что она представляет собой ожидаемое значение квадратов отличий от среднего значения.
Пример дисперсии
Предположим, у нас есть набор данных {3, 5, 8, 1}, и мы хотим найти дисперсию генеральной совокупности. Среднее дается как (3 + 5 + 8 + 1) / 4 = 4,25. Тогда, используя определение дисперсии, мы получаем [(3 — 4,25) 2 + (5 — 4,25) 2 + (8 — 4,25) 2 + (1 — 4,25) 2 ] / 4 = 6,68 . Таким образом, дисперсия = 6,68.
9{2}}{n}\), где \(\overline{X}\) означает среднее, \(M_{i}\) — середина интервала i th , \(X_{i }\) — i -я точка данных , N — сумма всех частот, а n — количество наблюдений.
Среднее значение для сгруппированных данных = \(\frac{\sum M_{i}f_{i}}{\sum f_{i}}\)
Общая формула дисперсии задается как
Var (X) = E[( X – μ) 2 ]
Дисперсия и стандартное отклонение
Когда мы берем квадрат стандартного отклонения, мы получаем дисперсию заданных данных. Интуитивно мы можем думать о дисперсии как о числовом значении, которое используется для оценки изменчивости данных о среднем значении. Это означает, что дисперсия показывает, насколько далеко каждая отдельная точка данных от среднего, а также друг от друга. Когда мы хотим найти дисперсию точек данных относительно среднего значения, мы используем стандартное отклонение. Другими словами, когда мы хотим увидеть, как наблюдения в наборе данных отличаются от среднего, используется стандартное отклонение. о 2 — это символ, обозначающий дисперсию, а σ — стандартное отклонение. Дисперсия выражается в квадратных единицах, в то время как стандартное отклонение имеет ту же единицу, что и совокупность или выборка.
Как найти дисперсию?
Для нахождения дисперсии разгруппированных данных можно использовать следующие шаги:
- Найти среднее значение наблюдений. Это можно сделать, разделив сумму всех наблюдений на количество наблюдений.
- Вычтите среднее значение из каждого наблюдения.
- Возведение в квадрат каждого из этих значений.
- Сложите все значения, полученные на предыдущем шаге.
- Разделите значение из шага 4 на n (для дисперсии генеральной совокупности) или n — 1 (для дисперсии выборки).
Дисперсия биномиального распределения
Биномиальное распределение определяется как дискретное распределение вероятностей, в котором указано количество успешных результатов при проведении биномиального эксперимента n раз. Каждый раз, когда результат эксперимента может быть только 0 или 1. Допустим, у нас есть биномиальный эксперимент, который состоит из n испытаний, и вероятность успеха в каждом испытании определяется p, тогда дисперсия биномиального распределения дается как:
σ 2 = np (1 — p).
Здесь np также равно среднему значению.
Дисперсия распределения Пуассона
Распределение Пуассона — это еще один тип дискретного распределения вероятностей, который дает вероятность определенного количества событий, происходящих в течение определенного периода времени. Параметр распределения Пуассона определяется как λ. В этом распределении среднее значение и дисперсия равны. Дисперсия распределения Пуассона определяется как:
σ 2 = λ
Дисперсия равномерного распределения
Равномерное распределение является типом непрерывного распределения вероятностей. Это также известно как прямоугольное распределение, поскольку результат эксперимента будет лежать между минимальной и максимальной границей. Если a — минимальная граница, а b — максимальная граница, то дисперсия равномерного распределения будет следующей: (б + а) / 2.
Дисперсия и ковариация
Дисперсия используется для описания разброса набора данных и определения того, насколько далеко каждая точка данных находится от среднего значения. Ковариация показывает нам, как две случайные величины будут связаны друг с другом. Он измеряет, как одна переменная будет затронута из-за изменения другой случайной переменной. Если у нас есть положительная ковариация, это означает, что обе переменные движутся в одном направлении. Однако если у нас отрицательная ковариация, это означает, что обе переменные движутся в противоположных направлениях. Предположим, у нас есть две случайные величины x и y. Здесь x — зависимая переменная, а y — независимая переменная. Пусть n — количество точек данных в выборке, \(\overline{x}\) — среднее значение x, а \(\overline{y}\) — среднее значение y, тогда формула для ковариации приведена ниже. : 9{n}(x_{i} — \overline{x})(y_{i} — \overline{y})}{n — 1}\)
Свойства отклонения
Ниже приведены некоторые свойства дисперсии, которые могут помочь в решении как простых, так и сложных задач на суммы.
- Если значение дисперсии равно 0, это означает, что все точки данных в наборе данных имеют одинаковое значение.
- Большая дисперсия означает, что данные более сильно разбросаны по сравнению со средним значением. Точно так же небольшая дисперсия показывает, что значения точек данных ближе друг к другу и сгруппированы вокруг среднего значения.
- Var(X + C) = Var(X), где X — случайная величина, а C — константа.
- Var(aX + b) = a 2 , здесь a и b — константы.
- Вар(СХ) = С 2
Var(X), C — константа. - Var(X 1 + X 2 +……+ X n ) = Var(X 1 ) + Var(X 2 ) +……..+Var(X n ) где X 1 , X 2 ,……, X n — независимые случайные величины.
Статьи по теме:
- Калькулятор дисперсии
- Средний
- Вероятность
Важные примечания о дисперсии
- Дисперсия является мерой изменчивости данных и описывает, как точки данных распределены по отношению к среднему значению.
- Может быть два типа дисперсии — выборочная дисперсия и дисперсия генеральной совокупности.
- Могут быть два вида данных — сгруппированные и разгруппированные. Таким образом, мы можем иметь сгруппированную выборочную дисперсию, негруппированную выборочную дисперсию, сгруппированную дисперсию совокупности и негруппированную дисперсию совокупности.
- Дисперсия представляет собой квадрат стандартного отклонения.
- Ковариация описывает, как зависимая и независимая случайные величины связаны друг с другом.
Часто задаваемые вопросы о Variance
Что такое дисперсия в статистике?
Дисперсия в статистике — это мера дисперсии, которая показывает изменчивость точек данных по отношению к среднему значению. Выборочная дисперсия и дисперсия населения — это два типа дисперсии.
Как рассчитать дисперсию?
Дисперсия разгруппированных данных может быть рассчитана с помощью следующих шагов:
- Найдите среднее значение и вычтите его из каждой точки данных.
- Проведите суммирование квадратов значений, полученных на шаге 1.
- Разделите это значение на n(количество наблюдений) или n — 1, если необходимо рассчитать дисперсию генеральной совокупности или выборки соответственно.
Что дисперсия говорит вам о данных?
Дисперсия говорит нам, насколько разбросаны данные по отношению к среднему значению. Если данные более широко разбросаны по отношению к среднему, то дисперсия будет выше. Если данные сгруппированы около среднего значения, то дисперсия будет ниже.
Что такое дисперсия и стандартное отклонение?
Квадрат стандартного отклонения дает нам дисперсию. Стандартное отклонение будет иметь ту же единицу, что и данные, в то время как единица дисперсии будет отличаться, поскольку это квадратное значение.
Является ли дисперсия мерой дисперсии?
Дисперсия и стандартное отклонение являются наиболее часто используемыми показателями дисперсии. Стандартное отклонение — это квадратный корень из дисперсии. Эти меры помогают определить дисперсию точек данных по отношению к среднему значению.
Является ли дисперсия мерой центральной тенденции?
Дисперсия не является мерой центральной тенденции. Есть три меры центральной тенденции, а именно, среднее, медиана и мода. Дисперсия является мерой дисперсии.
Каковы преимущества дисперсии?
Одним из основных преимуществ дисперсии является то, что независимо от направления точек данных дисперсия всегда будет рассматривать отклонения от среднего значения одинаково. Кроме того, дисперсию можно использовать для проверки изменчивости в наборе данных.
4.5.3 Расчет дисперсии и стандартного отклонения
Содержание
Текст начинается
Тематическая навигация
- 4 Исследование данных
- 4.5 Меры рассеивания
- 4.5.1 Расчет диапазона и межквартильный диапазон
- 4.5.2 Визуализация графика прямоугольников и усов
- 4.5.3 Расчет дисперсии и стандартного отклонения
- 4.5 Меры рассеивания
В отличие от размаха и межквартильного размаха, дисперсия является мерой дисперсии, учитывающей разброс всех точек данных в наборе данных. Это мера дисперсии, которая используется чаще всего, наряду со стандартным отклонением, которое представляет собой просто квадратный корень из дисперсии. Дисперсия представляет собой среднеквадратичную разницу между каждой точкой данных и центром распределения, измеренным средним значением.
Пример 1. Расчет дисперсии и стандартного отклонения
Давайте посчитаем дисперсию следующего набора данных: 2, 7, 3, 12, 9.
Первым шагом является вычисление среднего значения. Сумма равна 33 и имеется 5 точек данных. Следовательно, среднее значение равно 33 ÷ 5 = 6,6. Затем вы берете каждое значение в наборе данных, вычитаете среднее значение и возводите в квадрат разницу. Например, для первого значения:
(2 — 6,6) 2 = 21,16
Квадраты разностей для всех значений складываются:
21,16 + 0,16 + 12,96 + 29,16 + 5,76 = 69,20
Сумма затем делится на количество точек данных:
69,20 ÷ 5 = 13,84
Дисперсия составляет 13,84. Чтобы получить стандартное отклонение, вы вычисляете квадратный корень из дисперсии, который равен 3,72.
Стандартное отклонение полезно при сравнении разброса двух отдельных наборов данных, которые имеют примерно одинаковое среднее значение. Набор данных с меньшим стандартным отклонением имеет более узкий разброс измерений вокруг среднего значения и, следовательно, обычно имеет сравнительно меньше высоких или низких значений. Элемент, выбранный случайным образом из набора данных с низким стандартным отклонением, имеет больше шансов быть близким к среднему значению, чем элемент из набора данных, стандартное отклонение которого выше. Однако на стандартное отклонение влияют экстремальные значения. Одно экстремальное значение может иметь большое влияние на стандартное отклонение.
Стандартное отклонение может быть трудно интерпретировать с точки зрения того, насколько большим оно должно быть, если учесть, что данные широко рассредоточены. Величина среднего значения набора данных влияет на интерпретацию его стандартного отклонения. Когда вы измеряете что-то в масштабе миллионов, наличие показателей, близких к среднему значению, не имеет такого же значения, как когда вы измеряете что-то в масштабе сотен. Например, показатель двух крупных компаний с разницей в годовом доходе в 10 000 долл. США считается довольно близким, а показатель двух людей с разницей в весе в 30 килограммов считается далеко отстоящим друг от друга. Вот почему в большинстве ситуаций полезно оценить размер стандартного отклонения по отношению к его среднему значению.
Помните о следующих свойствах при использовании стандартного отклонения:
- Стандартное отклонение чувствительно к экстремальным значениям. Одно очень экстремальное значение может увеличить стандартное отклонение и исказить дисперсию.
- Для двух наборов данных с одинаковым средним значением большее стандартное отклонение имеет тот, в котором данные более разбросаны от центра.
- Стандартное отклонение равно 0, если все значения равны (поскольку в этом случае все значения равны среднему).
Причина, по которой стандартное отклонение так популярно в качестве меры дисперсии, заключается в его связи с нормальным распределением, которое описывает многие природные явления и чьи математические свойства интересны в случае больших наборов данных. Когда переменная подчиняется нормальному распределению, гистограмма имеет форму колокола и симметрична, а лучшими показателями центральной тенденции и дисперсии являются среднее значение и стандартное отклонение. Это очень полезное распределение вероятностей и относительно простое в использовании. Доверительные интервалы часто основаны на стандартном нормальном распределении.
Однако, когда:
- набор данных мал,
- распределение асимметрично, или
- набор данных включает экстремальные значения
лучше использовать межквартильный диапазон.
- Статистика: сила данных! — Главная страница
- 1 Данные, статистическая информация и статистика
- 2 Источники данных
- 3 Сбор и обработка данных
- 4 Исследование данных
- 5 Визуализация данных
- Библиография
- Глоссарий
Что-то не работает? Есть ли устаревшая информация? Не можете найти то, что ищете?
Свяжитесь с нами и сообщите, как мы можем вам помочь.