Дисперсия вариационного ряда: Дисперсия вариационного ряда определяется как. Дисперсия и стандартное отклонение

Дисперсия вариационного ряда, ее свойства — Студопедия

Поделись с друзьями: 

( )-отклонение вариантов от среднего значения.

Дисперсией называется средняя арифметическая квадратов отклонений вариантов от их средней.

;

— среднее квадратическое отклонение.

Пример Вычислить дисперсию и среднее квадратическое отклонение распределения рабочих предприятия, по времени, затраченному на обработку одной детали.

xi ni xi¢ xi¢- (xi¢- )2 (xi¢- )2×ni
2-4 4-6 6-8 8-10 10-12 -4,4 -2,4 -0,4 1,6 3,6 19,36 5,76 0,16 2,56 12,96 813,12 420,48 24,64 524,8 336,96
Итого:      

Свойства дисперсии.

1. Если все варианты увеличить или уменьшить в k-раз, то дисперсия увеличится или уменьшится k2-раз.

Пример: Вычислить дисперсию распределения рабочих цеха№2 по заработной плате.

;

Разделим варианты на их общий делитель равный 5, ;

Тогда вычитать будем 21 от соответствующих значений.

xi xi/5 xi/5-21 ni (xi/5-21)2 (xi/5-21)2× ni
-6 -4 -2
Итого:      

2. Если варианты увеличить или уменьшить на одну и ту же величину, то дисперсия не изменится.

3. Если веса увеличить или уменьшить в одно и тоже число раз, то дисперсия не изменится.

Пример: Вычислить дисперсию цеха №3 рабочих по средней заработной плате. Разделим частоты на их наибольший общий числитель 4.

xi ni xi (xi— )2 (xi— )2× ni
-20 -10
     

;

;

4. Дисперсия относительно средней арифметической, равна дисперсии относительно произвольной постоянной , без квадрата разности между средней арифметической и этой постоянной.

;

Пример: Найти дисперсию распределения рабочих цеха№1 по заработной плате.

xi xi-95 (xi-95)2ni n
-20 -10 - - - -
Итого:  

;

.

5. Дисперсия равна средней арифметической квадрата варианта без квадратов средней арифметической.

;

Пример: Дано распределение рабочих по числу изготавливаемых деталей.

xi ni xi ×ni xi2 xi2× ni
Итого:  

; ;

;

Пусть совокупность разбита на

l-непересекающихся групп. Групповой дисперсией называется дисперсия членов j-той группы относительно их средней групповой .

,mlj— частоты вариантов в группе.

— объем группы.

Дисперсия распределения по тому же признаку всей совокупности относительно общей средней называется общей дисперсией.

Межгрупповой дисперсией называется средняя арифметическая квадратов отклонений групповых средних всех непересекающихся групп, от общей средней .

;

где Nj— объем групп;

.

Пример: Вычислить межгрупповую дисперсию рабочих по заработной плате и по цехам.

Nj 2 2×Nj
-15
Итого:    

;

Средней групповых дисперсий называется средняя арифметическая групповых дисперсий:

;

Определить среднюю групповых дисперсий распределения рабочих по заработной плате и по цехам.

Nj ×Nj
200/3
Итого:  

.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Формула дисперсии – лёгкий путь!



Эта формула выводится непосредственно из определения:

 – дисперсия равна разности средней арифметической

квадратов всех вариант статистической совокупности и квадрата средней самих этих вариант.

ОСМЫСЛЕННО повторяем ВСЛУХ и вникаем!

… Карл украл у Клары кораллы, а Клара украла у Карла кларнет!

Если что-то не очень понятно, то сейчас всё станет на свои места:

Для несгруппированных вариант  выборочной совокупности формула детализируется следующим образом:

и для готового вариационного ряда – так:
, где  – кратные (одинаковые) варианты дискретного ряда либо середины интервалов интервального ряда, а  – соответствующие частоты.

Для генеральной дисперсии  формулы те же, только с прописными буквами . Часто используют просто значок суммирования  – без переменной-счётчика, поскольку в контексте той или иной задачи и так понятно, что суммируется.

И начнём мы со знакомой подопытной задачи:

Пример 15

В результате 10 независимых измерений получены следующие данные:

В Примере 13  мы нашли дисперсию по определению: , таким образом, ответ известен заранее, и это всегда круто. Всегда, когда он правильный.

Решение: используем формулу .
Для её применения нужно найти выборочную среднюю, повторим действие: ,
вычислить квадраты всех вариант:

и их сумму:
Результаты вычислений удобно заносить в таблицу:

Осталось применить формулу:
, что мы и хотели увидеть – результат, естественно, совпал с полученным ранее по определению.

Ответ:

Теперь случай сформированного вариационного ряда. В Примере 14 мы потренировались на дискретном ряде, и сейчас очередь интервального:

Пример 16

С целью изучения вкладов в Сбербанке города проведено выборочное исследование, в результате которого получены следующие данные:

Вычислить выборочную дисперсию и среднее квадратическое отклонение, оценить соответствующие показатели генеральной совокупности.

Автор задачи заботливо подсчитал объем выборки , но не «закрыл» крайние интервалы. Такая вещь уже встречалась, и решение мы начинаем с этого закрытия:

поскольку длины внутренних интервалов составляют  д. е., то логично рассмотреть такую же длину и по краям, то бишь, интервалы от 200 до 400 и от 1000 до 1200 денежных единиц.

…Возможно, у вас возник вопрос, а как быть, если даны интервалы разной длины? В этом случае можно принять за «эталон» среднюю длину известных интервалов.

Для расчёта числовых характеристик перейдём к дискретному вариационному ряду, выбрав в качестве

вариант  середины интервалов, которые здесь видны устно:

В тяжёлых случаях, напоминаю, суммируем концы интервалов и делим их пополам, например: .

Кроме того, варианты целесообразно уменьшить в 1000 раз, поскольку в ходе дальнейших вычислений будут получаться гигантские числа. С современной техникой, это, конечно, не проблема, но смотреться будет некрасиво.

Сначала вычислим выборочную среднюю. Этот алгоритм уже обкатан: находим произведения , их сумму:

и по соответствующей формуле:
 тыс. д. е. (или 780 д. е.) – средний размер вклада.

Примечание: далее для компактной записи я буду использовать просто значок  – без переменной-«счётчика».

Теперь дисперсия. Её никто не запрещает рассчитать по определению , но заметьте, насколько легче формула  – для её применения всего-то лишь нужно рассчитать произведения  и их сумму  

(правый столбец таблицы). Несмотря на то, что многие читатели уже освоили технику вычислений в Экселе, я записал ещё один ролик (Ютуб):

Итак, по формуле вычисления дисперсии, получаем:
 тыс. д. е. в квадрате (так как по определению, дисперсия – есть величина квадратичная).

И, чтобы вернуться в размерность задачи, из дисперсии следует извлечь квадратный корень:

 тыс. д. е. или 240 денежных единиц. Полученный показатель называется:

3.2.6. Среднее квадратическое отклонение

3.2.4. Исправленная выборочная дисперсия

| Оглавление |



дисперсия — анализ различий в изменчивости между несколькими связанными временными рядами

Задавать вопрос

спросил

Изменено 8 лет, 10 месяцев назад

Просмотрено 997 раз

$\begingroup$

У меня есть постоянные временные ряды (ежегодно с 1950 по 2010 год) численности нескольких видов, отловленных разными группами. Эти ряды в некоторой степени связаны между собой, потому что количество всех отловленных видов зависит от одного и того же усилия (которое не всегда одинаково каждый год, но изменяется по-разному для каждой группы). Кроме того, части территории были группами отлова видов, являющихся общими основаниями.

Мои данные выглядят так: Год | группа | виды | изобилие

Как я могу проанализировать изменчивость (дисперсию) численности между видами и группами? Поэтому я хотел бы знать, для каких видов уловы колеблются сильнее, независимо от групп. И наоборот для групп.

Я мог бы рассчитать дисперсию каждого ряда (по видам и по группам), а затем провести дисперсионный анализ, но это не учитывало бы зависимости данных,… Кроме того, я уже выполнил взаимные корреляции, автокорреляции, спектральные анализы, … для других целей, но я не могу найти ничего, чтобы ответить на мой вопрос.

Можно ли вывести что-то вроде упорядоченного списка?

  • временной ряд
  • дисперсия

$\endgroup$

$\begingroup$

Проще всего запустить отдельные модели для каждого вида, получить остатки, возвести их в квадрат и посмотреть на взаимные корреляции и показатели согласованности. Возведение остатков в квадрат даст вам отклонения. Вы также можете посмотреть корреляции рядов квадратов остатков и уровня других видов. Возможно, изменчивость зависит от уровня поимки в тот или иной период.

Вы можете проявить фантазию и запустить что-то вроде GARCH, которое моделирует дисперсию стохастически. Эта модель даст вам оценку изменяющейся во времени дисперсии, которую вы снова сможете кросс-коррелировать с другими видами и т. д.

Все это относится к области исследовательского анализа. Как только вы это сделаете, это может дать вам больше идей с точки зрения моделирования всех видов одновременно, возможно, в рамках векторной авторегрессии (VAR) или модели в пространстве состояний. Последний интересен тем, что может моделировать скрытый (ненаблюдаемый) фактор, который может воздействовать сразу на все ряды.

$\endgroup$

2

$\begingroup$

Выбросить идею здесь, но как насчет временных рядов как реализации гауссовских процессов? В частности, функции ковариации будут параметризованы видами и группами. В зависимости от используемой функции ядра полученные значения параметров будут указывать на то, как гладкость временных рядов зависит от группы и вида. Что-то вроде: 9{th}$ группы соответственно.

Мне было бы интересно, если кто-нибудь еще думает по поводу вышеизложенного.

$\endgroup$

Зарегистрируйтесь или войдите в систему

Зарегистрируйтесь с помощью Google

Зарегистрироваться через Facebook

Зарегистрируйтесь, используя электронную почту и пароль

Опубликовать как гость

Электронная почта

Требуется, но не отображается

Опубликовать как гость

Электронная почта

Требуется, но не отображается

Нажимая «Опубликовать свой ответ», вы соглашаетесь с нашими условиями обслуживания, политикой конфиденциальности и политикой использования файлов cookie

.

Коэффициент вариации, дисперсия и стандартное отклонение

Существует множество способов количественной оценки изменчивости, однако здесь мы сосредоточимся на наиболее распространенных: дисперсия , стандартное отклонение и коэффициент вариации .

В области статистики мы обычно используем разные формулы при работе с данными населения и выборочными данными.

Образцы формул в сравнении с формулами населения

Когда у нас есть все население, каждая точка данных известна, поэтому вы на 100 % уверены в показателях, которые мы рассчитываем.

Когда мы берем выборку из этой совокупности и вычисляем выборочную статистику, она интерпретируется как аппроксимация параметра совокупности.

Более того, если мы извлечем 10 разных выборок из одной и той же совокупности, мы получим 10 разных показателей.

Статистики решили эту проблему, скорректировав алгебраические формулы для многих статистических данных, чтобы отразить эту проблему. Поэтому мы будем исследовать как популяционную, так и выборочную формулы, поскольку они обе используются.

Среднее значение, медиана и мода

Вы должны спросить себя, почему существуют уникальные формулы для среднего , медианы и моды . Ну, на самом деле, выборка означает — это среднее значение точек данных выборки, в то время как совокупность означает — это среднее значение точек данных совокупности. Как вы можете видеть на рисунке ниже, это две разные формулы, но технически они вычисляются одинаково.

После этого короткого пояснения пора перейти к дисперсии .

Формула дисперсии: выборочная дисперсия и дисперсия генеральной совокупности

Дисперсия измеряет дисперсию набора точек данных вокруг их среднего значения .

Дисперсия населения , обозначаемая как сигма в квадрате, равна сумме квадратов разностей между наблюдаемыми значениями и население означает , деленное на общее количество наблюдений.

Выборочная дисперсия , с другой стороны, обозначается как s в квадрате и равна сумме квадратов разностей между наблюдаемыми значениями выборки и средним значением выборки , деленная на количество наблюдений выборки минус 1.

Пристальный взгляд на формулу дисперсии населения

Когда знакомишься со статистикой, сложно сразу все понять. Поэтому давайте остановимся на секунду, чтобы изучить формулу для населения и попытаться прояснить ее смысл. Основная часть формулы — это ее числитель , вот что мы хотим понять.

Сумма различий между наблюдениями и средним значением , в квадрате. Таким образом, это означает, что чем ближе число к среднему , тем ниже будет результат, который мы получим. И чем дальше от значит это ложь, тем больше эта разница.

Почему мы возносимся на вторую ступень

Уравнивание различий преследует две основные цели.

  1. Во-первых, возводя числа в квадрат, мы всегда получаем неотрицательные вычисления. Не вдаваясь слишком глубоко в математику, интуитивно понятно, что дисперсия не может быть отрицательной. Дисперсия зависит от расстояния, а расстояние не может быть отрицательным .

Если, с другой стороны, мы вычисляем разность и не возводим во вторую степень, мы получим как положительные, так и отрицательные значения, которые при суммировании сокращаются, оставляя нас без информации о дисперсии.

  1. Во-вторых, возведение в квадрат усиливает эффект больших различий. Например, если означает, что равно 0, а у вас есть наблюдение 100, квадрат разброса равен 10 000!

Использование формулы расчета численности населения

Ладно, хватит сухой теории. Настало время практического примера. У нас есть совокупность из пяти наблюдений — 1, 2, 3, 4 и 5. Найдем ее дисперсию .

Начнем с вычисления среднего : (1 + 2 + 3 + 4 + 5) / 5 = 3.

Затем применим только что рассмотренную формулу: ((1 – 3) 2 + (2 – 3) 2 + (3 – 3) 2 + (4 – 3) 2 + (5 – 3) 2 ) / 5.

Когда мы делаем математику, мы получаем 2. Таким образом, дисперсия совокупности набора данных равна 2.

Расчет выборочной дисперсии

А как насчет выборочной дисперсии ? Это было бы приемлемо только в том случае, если бы нам сказали, что эти пять наблюдений были выборкой, взятой из населения. Итак, давайте представим, что это так. Образец означает, что снова равно 3. Числитель тот же, но знаменатель будет равен 4, а не 5.

Это дает нам выборочную дисперсию 2,5.

Почему результаты разные

Чтобы завершить тему дисперсии , мы должны интерпретировать результат. Почему дисперсия выборки больше, чем дисперсия генеральной совокупности ? В первом случае мы знали население. То есть у нас были все данные и мы рассчитали дисперсия . Во втором случае нам сказали, что 1, 2, 3, 4 и 5 — это выборка, взятая из большей совокупности.

Популяция выборки

Представьте, что в совокупности выборки были следующие 9 чисел: 1, 1, 1, 2, 3, 4, 5, 5 и 5.

Ясно, что числа одинаковы, но наблюдается концентрация вокруг двух крайних точек набора данных — 1 и 5. Дисперсия этой совокупности составляет 2,9.6.

Итак, наша выборочная дисперсия правильно скорректирована вверх, чтобы отразить более высокую потенциальную изменчивость. По этой причине существуют разные формулы для данных выборки и генеральной совокупности.

Формула стандартного отклонения: стандартное отклонение выборки и стандартное отклонение генеральной совокупности

Хотя дисперсия является общепринятой мерой разброса данных, в большинстве случаев получаемая вами цифра довольно велика. Более того, сравнивать трудно, потому что единица измерения – квадрат. Простое решение состоит в том, чтобы вычислить его квадратный корень и получить статистику, известную как 9.0083 стандартное отклонение .

В большинстве анализов стандартное отклонение имеет гораздо большее значение, чем дисперсия .

Формулы

Подобно дисперсии , также имеется совокупность и выборочное стандартное отклонение . Формулы таковы: квадратный корень из совокупности дисперсия и квадратный корень из выборки дисперсия соответственно. Я считаю, что нет необходимости в примере расчета. С работой справится любой, у кого в руках есть калькулятор.

Коэффициент вариации (CV)

Последней мерой, которую мы введем, является коэффициент вариации . Он равен стандартному отклонению , деленному на среднее значение .

\

Другое название термина относительное стандартное отклонение . Это простой способ запомнить его формулу — это просто стандартное отклонение относительно означает .

Как вы, наверное, догадались, снова есть формула популяции и выборки.

Зачем нужен коэффициент вариации

Таким образом, стандартное отклонение является наиболее распространенной мерой изменчивости для одного набора данных. Но зачем нам еще одна мера, такая как коэффициент вариации ? Ну, сравнивать стандартных отклонения двух разных наборов данных бессмысленно, но сравнивать коэффициентов вариации нет.

Аристотель однажды сказал:

«Скажи мне, я забуду. Покажи мне, я запомню. Вовлеки меня, я пойму».

 

Примеры сравнения стандартных отклонений

Чтобы вы не забыли, вот пример сравнения стандартных отклонений . Возьмем цены на пиццу в 10 разных заведениях Нью-Йорка. Как вы можете видеть на картинке ниже, они варьируются от 1 до 11 долларов.

Теперь представьте, что у вас есть только мексиканские песо. Для вас цены будут выглядеть скорее как 18,81 песо до 206,91 песо, учитывая обменный курс 18,81 песо за один доллар.

Давайте объединим наши знания и найдем стандартных отклонения и коэффициентов вариации этих двух наборов данных.

Данные выборки или совокупности
  1. Во-первых, мы должны увидеть, является ли это выборкой или популяцией. В Нью-Йорке всего 11 ресторанов? Конечно, нет. Очевидно, это образец, взятый из всех ресторанов города. Тогда мы должны использовать формулы для выборки меры изменчивости .

Нахождение среднего
  1. Во-вторых, мы должны найти среднее . означает в долларах равно 5,5, а означает в песо 103,46.

Расчет выборочной дисперсии и стандартного отклонения
  1. Третий шаг процесса — нахождение выборочной дисперсии . Следуя формуле, которую мы рассмотрели ранее, мы можем получить 10,72 доллара в квадрате и 379 долларов.3,69 песо в квадрате.

  1. Стандартные отклонения соответствующей выборки составляют 3,27 доллара и 61,59 песо, как показано на рисунке ниже.

Несколько наблюдений

Сделаем пару замечаний.

Во-первых, дисперсия дает результаты в квадратах, а стандартное отклонение в исходных единицах, как показано ниже.

Это основная причина, по которой профессионалы предпочитают использовать стандартное отклонение в качестве основной меры изменчивости. Это напрямую интерпретируется. Квадратные доллары ничего не значат даже в области статистики.

Во-вторых, мы получили стандартных отклонения 3,27 и 61,59 для одной и той же пиццы в тех же 11 ресторанах Нью-Йорка. Однако это кажется неправильным. Давайте исправим это, используя наш последний инструмент — коэффициент вариации .

Преимущество коэффициента вариации

Мы можем разделить стандартных отклонения на соответствующие средние . Как видно на картинке ниже, мы получаем два коэффициента вариации .

Результат тот же — 0,60.

Важно: Обратите внимание, что это не доллары, песо, доллары в квадрате или песо в квадрате. Это всего лишь 0,60.

Это показывает нам большое преимущество дает нам коэффициент вариации . Теперь мы можем с уверенностью сказать, что два набора данных имеют одинаковую изменчивость, чего мы и ожидали заранее.

На картинке выше вы можете увидеть основные преимущества коэффициента вариации .

Плюсы и минусы каждой из мер изменчивости

Напомним, что существует три основных показателя изменчивости дисперсии , стандартное отклонение и коэффициент вариации . Каждый из них имеет разные сильные стороны и области применения. Обычно мы предпочитаем стандартное отклонение дисперсии , потому что это можно интерпретировать напрямую. Однако коэффициент вариации имеет преимущество над стандартным отклонением , когда дело доходит до сравнения данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *