Найти общую дисперсию: Виды дисперсий

Общая дисперсия

Характеризует вариацию признака, который зависит от всех условий в данной совокупности.

, где — общая средняя для всей изучаемой совокупности.

Межгрупповая дисперсия

Отражает вариацию изучаемого признака, который возникает под влиянием признака-фактора, положенного в основу группировки. Она характеризует колеблемость групповых (частных) средних около общей средней

, где — средняя по отдельным группам;- средняя общая; fi – численность отдельных групп.

Средняя из внутригрупповых дисперсий

Характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием других, не учитываемых факторов, и не зависит от условия (признака-фактора), положенного в основу группировки. Определяется:

1. Рассчитаем общую дисперсию.

Пример.

Расчет общей дисперсии, складывающейся под влиянием всех факторов (объема выручки предприятия и форма собственности)

Объем выручки продукции в среднем на 1 предприятие, млрд. р. (х)

Число предприятий по форме собственности

Расчет общей дисперсии

Государ-ственные

fr

Приватизи-рованные

fn

Всего

F0

x/

x/f0

x/

(x/-)2

(x/-)2f0

1,0-1,2

3

3

1,1

3,3

-0,714

0,5098

1,5294

1,2-1,4

4

4

1,3

5,2

-0,514

0,2642

1,0568

1,4-1,6

17

17

1,5

25,5

-0,314

0,0986

1,6762

1,6-1,8

11

15

26

1,7

44,2

-0,114

0,0129

0,3354

1,8-2,0

13

6

19

1,9

36,1

+0,086

0,0074

0,1406

2,0-2,2

18

5

23

2,1

48,3

+0,286

0,0818

1,8814

2,2-2,4

6

6

2,3

13,8

+0,486

0,2362

1,4172

2,4-2,6

2

2

2,5

5,0

+0,686

0,4706

0,9412

Итого:

50

50

100

181,4

8,9782

Находим выработку в среднем на одно предприятие

Определяем общую дисперсию

Т.

е. колеблемость объема выручки по исследуемым предприятиям составила 0,089782 млрд.р, что обусловлено и мощностью предприятия и формой собственности.

2. Рассчитаем среднюю из внутригрупповых дисперсий

Теперь рассмотрим, как складываются показатели выручки и ее вариации по группам в зависимости от форм собственности.

Расчет средней дисперсии по государственным предприятиям

fГ

fГ

(-)2

(-)2 fГ

1,7

11

18,7

-0,3

0,09

0,99

1,9

13

24,7

-0,1

0,01

0,13

2,1

18

37,8

0,1

0,01

0,18

2,3

6

13,8

0,3

0,09

0,54

2,5

2

5,0

0,5

0,25

0,5

Итого:

50

100

2,34

В среднем на одно государственное предприятие выручка составила

, колеблемость его в совокупности гос. предприятий равна

или 46,8 млн.р.

Таким образом, 46,8 млн.р характеризуют вариацию признака внутри группы гос.предпр.

Производим расчет показателей по приватизированным предприятиям

FП

fП

(-)2

(-)2 fП

1,1

3

3,3

-0,528

0,7288

0,8363

1,3

4

5,2

-0,328

0,1076

0,4303

1,5

17

25,5

-0,128

0,0164

0,2785

1,7

15

25,5

0

0,0052

0,778

1,9

6

11,4

0,72

0,0739

0,4439

2,1

5

10,5

0,272

0,2228

1,1139

Итого:

50

81,4

0,472

3,1807

, что ниже выручки предприятий, находящихся в государственной собственности. Вариация равна

0,06361млрд.р. или 63,61 млн.р., что выше чем в группе гос.предприятий.

Средняя из групповых дисперсий дает обобщающую характеристику случайной вариации, возникающую под влиянием неучтенных факторов

3. Рассчитаем межгрупповую дисперсию

Мерой колеблемости частных средних вокруг общей средней является межгрупповая дисперсия (дисперсия групповых средних)

Расчет межгрупповой дисперсии

Группы предприятий по форме собственности

Средний объем выручки одного предприятия,

Число предприятий,

()2

()2fi

Государственные

2,0

50

0,186

0,0346

1,7298

Приватизированные

1,628

50

-0,186

0,0346

1,7298

Итого:

100

3,4596

= 1,814 млрд. р.

Общая дисперсия — Энциклопедия по экономике

Межлабораторная дисперсия — составляющая общей дисперсии. При сопоставлении результатов, полученных в двух или более лабораториях, рассеивание результатов оказывается большим, чем при том же числе испытаний в одной лаборатории, причем всегда имеется некоторое расхождение между средними значениями, полученными в разных лабораториях. Это приводит к появлению межлабораторной дисперсии, являющейся именно той составляющей общей дисперсии, которая обусловлена расхождением между средними значениями, полученными в разных лабораториях.  [c.7]
Квадрат коэффициента множественной корреляции называется коэффициентом детерминации (D) D = R. Коэффициент детерминации показывает, какая доля вариации результативного показателя связана с вариацией факторных показателей. В основе расчета коэффициента детерминации и коэффициента множественной корреляции лежит правило сложения дисперсий, согласно которому общая дисперсия (а2)  [c.281]

По аналитической группировке можно измерить связь с помощью еще одного показателя эмпирического корреляционного отношения. Этот показатель обозначается греческой буквой г (эта). Он основан на правиле разложения дисперсии, согласно которому общая дисперсия s2y равна сумме внутригрупповой и межгрупповой дисперсий.  [c.128]

Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Соответственно оно рассчитывается как отношение факторной дисперсии к общей дисперсии результативного признака  [c.129]


Очевидно, что по правилу сложения дисперсий величина s2 меньше, чем величина общей дисперсии.  [c.173]

Эта величина меньше общей дисперсии без учета районирования (а2 = 2,24). Следовательно, и величина ошибки выборки при районированном отборе будет меньше  [c.178]

Поскольку я2, и 522 рассматриваются как выборочные оценки общей дисперсии а2, то формула (7.37) может быть записана так  [c.210]

Для измерения тесноты связи применяется несколько показателей. При парной связи теснота связи измеряется прежде всего корреляционным отношением, которое обозначается греческой буквой г). Квадрат корреляционного отношения — это отношение межгрупповой дисперсии результативного признака, которая выражает влияние различий группировочного факторного признака на среднюю величину результативного признака, к общей дисперсии результативного признака, выражающей влияние на него всех причин и условий. Квадрат корреляционного отношения называется коэффициентом детерминации  [c.232]

Это выражение соответствует выражению т)2 (см. формулу (8.2)). Тождество коэффициента детерминации и квадрата корреляционного отношения служит основанием для интерпретации величины г2л, как доли общей дисперсии результативного признака у, которая объясняется вариацией признака-фактора х (и связью между вариацией обоих признаков). Собственно говоря, основным показателем тесноты связи и следовало бы считать коэффициент детерминации  [c.242]

Общую дисперсию уровней динамического ряда, измеряемую суммой квадратов отклонений этих уровней от их средней ве-  [c.354]


Легко заметить, что сумма составляющих дисперсий больше общей дисперсии, что кажется ошибкой. На самом деле, однако, нужно учесть, что колебания — величина не скалярная, а векторная, т. е. имеет не только размер, но и направление, знак. Тренд отделен от колебаний, а все случайные и сезонные колебания могут иметь и совпадающие и несовпадающие знаки, т. е. они могут частично погашать друг друга, что имеет место особенно в конце изучаемого периода. Поэтому общая колеблемость, измеряемая суммой квадратов отклонений (9.47) значительно меньше, чем сумма дисперсий за счет сезонной и случайной колеблемости. По данным табл. 9.10 общая колеблемость составила 288,2. Находим отношение этой величины к сумме сезонной и случайной дисперсий  [c.355]

На эту величину корректируем сезонную и случайную суммы квадратов отклонений и окончательно получаем следующее разложение общей дисперсии уровней ряда (табл. 9.11)  [c.355]

Данные табл. 9.12 позволяют сделать интересное заключение о различии характера динамики признаков. Если из общей дисперсии (суммы квадратов отклонений от среднего уровня) урожайности 10341 большую часть составляет дисперсия за счет колеблемости 7678, то для себестоимости преобладающим моментом общей дисперсии, равной 405,16, является не колеблемость, дающая только 133,34, а тренд это эффект скрытой инфляции до 1989 г.  [c.366]

Для типичных акций несистематический риск составляет примерно 70% общего риска, или общей изменчивости акции. Иными словами, систематический риск обусловливает изменчивость отдельной акции только примерно на 30%. Доля общего риска, вызванного колебаниями рынка, представлена статистикой R для регрессии избыточного дохода на акцию по избыточному доходу на рыночный портфель. (R2 измеряет долю общей дисперсии зависимой переменной, которая объясняется независимой переменной это есть ничто иное, как квадрат коэффициента корреляции.) Доля общего риска, величина которой различна для каждой компании, равна 1 — Л2.  [c.115]

Если изучаемая совокупность состоит из нескольких групп, образованных на основе какого-либо признака, то помимо показателей общей вариации (общая дисперсия) определяют также вариацию признака под влиянием группировочного фактора (межгрупповая дисперсия о2) и вариацию признака под влиянием всех остальных факторов (внутригрупповые дисперсии оу2).  [c. 68]

Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий  [c.69]

Доля межгрупповой дисперсии в общей дисперсии носит название эмпирического коэффициента детерминации (т)2 — эта квадрат)  [c.69]

Q общая дисперсия результативного признака, обусловленная влиянием всех факторов в совокупности — aj  [c.468]

Коэффициент детерминации — R2 вычисляется как отношение факторной дисперсии к общей дисперсии, индекс корреляции — R является корнем квадратным из коэффициента детерминации. Для оценки значимости индекса R рассчитывается показатель  [c.468]

Как мы знаем подобное линейное приближение дается методом главных компонент. Если действительное расположение точек не сильно отклоняется от плоскости, этот метод может дать неплохое начальное приближение. Однако, оказывается, что в даном случае это не так. Среднеквадратичное отклонение для случая двух главных компонент оказалось равным почти половине от общей дисперсии Е, =0. 47.  [c.191]

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R  [c.7]

Тот же результат даст и индекс множественной детерминации, определенный через соотношение остаточной и общей дисперсии результативного признака.  [c.117]

Так как собственные векторы известны, по формуле (7.29) можно определить главные компоненты. При этом обычно довольствуются меньшим, чем л, числом главных компонент, но достаточным, чтобы воспроизвести большую часть дисперсии. По мере выделения главных компонент доля общей дисперсии становится все меньше и меньше. Процедуру вычисления главных компонент прекращают в тот момент, когда собственные значения, соответствующие каждый раз наибольшим дисперсиям, становятся пренебрежимо малыми. Количество выделенных главных компонент г в общем случае значительно меньше числа объясняющих переменных т. По г главным компонентам строится матрица Z. С помощью главных компонент оцениваются параметры регрессии  [c. 317]

В дисперсионном анализе кроме общей дисперсии вычисляют  [c.196]

В терминах дисперсионного анализа общая дисперсия Zlt, оцененная по всем  [c.61]

Если принимается гипотеза Я0 а2 = О, то дисперсию воспроизводимости а2 можно оценить выборочной общей дисперсией SQ2, которая имеет на (п — 1) степеней свободы больше, чем S2. Если же принимается гипотеза Н а2 0, то  [c.130]

Дисперсионный анализ показал, что результат учета в сильной степени зависит от того, на каких деревьях, ярусах и в каких квадратах они получены. Общая дисперсия  [c.150]

Чтобы уменьшить общую дисперсию, в дальнейшем план выборочных учетов предусматривал получение выборок на одних и тех же деревьях в различное время года и в разные годы. В этом случае было получено  [c.150]

Формула (7.14 ) предполагает равенство серий по числу единиц, если это условие не выполняется, то в числитель выражения (7.14 ) вводится вес — число единиц в у -й серии, f-, тогда в знаменателе указывается не г, а 1/ . Межсерийная дисперсия представляет часть общей дисперсии признака х, и потому ее использование направлено на уменьшение ошибки выборки. Однако значение г намного меньше п, так как число отобранных гнезд намного меньше числа единиц наблюдения. Этот фактор увеличивает ошибку выборки. Его действие более значительно, нежели понижающее влияние межсерийной дисперсии — в результате ошибка серийной выборки в среднем больше ошибки выборки при отборе единицами.  [c.172]

Общая дисперсия стх2 измеряет вариацию признака во всей совокупности под влиянием всех факторов, обусловивших эту вариацию  [c.68]

Рассмотрим портфель с равными долями инвестиций в N акций. Следовательно, в каждую акцию инвестируется 1/N совокупных инвестиций. Следовательно, дисперсия в каждом квадрате равна (1/N)2 общей дисперсии, а ковари-ация — (1/N) общей ковариации. Имеется ТУ квадратов с дисперсиями и TV2- N квадратов с ковариацией. Следовательно  [c.153]

Подставляя значения логарифма факторного признака, заполняем гр. 8 таблицы (равенство ее итога с итогом гр. 3 свидетельствует о точности расчета). После этого производится последовательный расчет гр. 9 (разность гр.З и гр. 8 возводится в квадрат). Итог гр. 9 делится на число групп в таблице, в результате получена остаточная дисперсия о2ост = 1,55488. Общая дисперсия результативного признака определяется по формуле (средняя квадрата результативного признака минус квадрат его средней)  [c.206]

В том случае, если влияние факторов х, и х2, а также их взаимодействия xtx2 несущественно, дисперсию воспроизводимости [c.142]

анова — Как вычислить % вклада в общую дисперсию

Задать вопрос

спросил

Изменено 1 год, 9 месяцев назад

Просмотрено 811 раз

$\begingroup$

Я хотел бы определить процентную долю дисперсии, которую каждая группа вносит в наблюдаемую общую дисперсию. Я хотел бы знать самый простой способ вычислить это и получить некоторую интуицию относительно того, почему дисперсия отдельных групп может быть больше, чем общая дисперсия. Я предполагаю, что небольшая выборка имеет большую дисперсию, например, если вы возьмете эти данные:

 Групповое значение
А 1
А 0
А 1
А 0
Б 1
Б 0
Б 1
Б 0
 

С общей дисперсией = 0,285 и дисперсией группы A или B = 0,333

Этот пост, кажется, указывает на то, что ковариация также может играть роль (хотя речь идет о регрессии) 1.

Эти страницы приведены в контексте ANOVA Total Variance и объяснения процента дисперсии, но это менее интуитивно понятно 2. Является ли это единственное решение, чтобы подойти к этому в контексте ANOVA — нельзя ли использовать отдельные отклонения непосредственно в расчете процента отклонения, внесенного в общее количество?

Пример данных:

 Группа grp_std/tot_std tot_std grp_std
А 1,196069104 148.9800206 178.1903997
Б 1.132546514 148.9800206 168. 726803
С 0,706222371 148,9800206 105,2130234
Д 0,94767407 148,9800206 141,1845025
Е 0,905727021 148,9800206 134,9352302
 

(прошу прощения, если формат данных неверен, пожалуйста, дайте мне знать, если есть лучший способ вставить таблицу)

  • анова
  • дисперсия
  • описательная статистика

$\endgroup$

2

Зарегистрируйтесь или войдите в систему

Зарегистрируйтесь с помощью Google

Зарегистрироваться через Facebook

Зарегистрируйтесь, используя электронную почту и пароль

Опубликовать как гость

Электронная почта

Требуется, но никогда не отображается

Опубликовать как гость

Электронная почта

Требуется, но не отображается

Нажимая «Опубликовать свой ответ», вы соглашаетесь с нашими условиями обслуживания, политикой конфиденциальности и политикой использования файлов cookie

.

r в квадрате — Является ли Коэффициент детерминации «объясненной дисперсией» или отношением объясненной дисперсии к общей дисперсии

спросил

Изменено 1 год, 2 месяца назад

Просмотрено 246 раз

$\begingroup$

Я нашел во многих текстах, что коэффициент детерминации, или R-квадрат, часто упоминается как «объясненная дисперсия». Когда, если быть точным, кажется, что это отношение объясненной дисперсии к общей дисперсии.

Не будет ли объясненная дисперсия общей дисперсией — необъяснимой дисперсией?

  • дисперсия
  • r-квадрат

$\endgroup$

0

$\begingroup$

Общая дисперсия разлагается на объясненную дисперсию и необъяснимую дисперсию (это сложнее, если вы отклоняетесь от обычного метода наименьших квадратов, но я думаю, что вы находитесь в этой настройке).

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *