10. Выборочная дисперсия как точечная оценка генеральной дисперсии, ее смещенность и состоятельность. Несмещенная оценка генеральной дисперсии.
Для того, чтобы наблюдать рассеяние количественного признака значений выборки вокруг своего среднего значения , вводят сводную характеристику- выборочную дисперсию.
Если все значения признака выборки различны, то
если же все значения имеют частоты n1, n2,…,nk, то
Для характеристики рассеивания значений признака выборки вокруг своего среднего значения пользуются сводной характеристикой — средним квадратическим отклонением.
Вычисление дисперсии- выборочной или генеральной, можно упростить, используя формулу:
Замечание: если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов.
Для исправления выборочной дисперсии достаточно умножить ее на дробь
получим исправленную дисперсию S2. Исправленная дисперсия является несмещенной оценкой.
В качестве оценки генеральной дисперсии принимают исправленную дисперсию.
Для оценки среднего квадратического генеральной совокупности используют исправленное среднее квадратическое отклонение
Пример: По выборке объема N=41 найдена смещенная оценка генеральной дисперсии . Найти несмещенную оценку дисперсии генеральной совокупности.
Решение. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия
Несмещенной оценкой генеральной дисперсии является «исправленная дисперсия»
или
Таким образом, мы получаем искомую несмещенную оценку дисперсии генеральной совокупности:
11. Интервальные оценки неизвестных параметров генеральной совокупности. Доверительная вероятность. Интервальная оценка мат. ожидания нормально распределенного признака при известном среднем квадратическом отклонении.Интервальной оценкой называется числовой интервал, который определяется двумя числами – границами интервала, содержащего неизвестный параметр генеральной совокупности.
Доверительным интервалом называется интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.
Доверительная вероятность – вероятность, что событие вероятности 1- можно считать невозможным, a = 1- – уровень значимости. В качестве доверительных вероятностей используют вероятности, близкие к 1 (например, 0,95; 0,99; 0,999).
Для малых выборок (n<30) нормально распределенного количественного признака Х доверительный интервал имеет вид:
,
где – коэффициент Стьюдента, значение которого определяется величиной доверительной вероятности и числом степеней свободы f = n — 1.
Для больших выборок (n<30) нормально распределенного количественного признака Х доверительный интервал имеет вид:
,
где – коэффициент Стьюдента, значение которого определяется величиной доверительной вероятности и числом степеней свободы f = n – 1.
Пусть математическое ожидание выборочной средней нормального распределения равно a и среднее квадратическое отклонение – σ.
Требуется найти доверительные интервалы, покрывающие параметр a с надежностью γ, т.е.
Для решения воспользуемся формулой вычисления вероятности заданного отклонения из теории вероятностей:Проведя замены X на и σ на , получим
Найдя из последнего равенства , можем написать
Приняв во внимание, что доверительная вероятность задана и равна γ, и заменив выборочную среднюю на окончательно имеем
Смысл полученного равенства:
С надежностью γ можно утверждать, что доверительный интервал ) покрывает неизвестный параметр a, точность оценки .
Число t определяется из соотношения .
По таблице функции Лапласа находят аргумент t, которому соответствует значение функции Лапласа
1) При возрастании объема выборки n число δ убывает, следовательно точность увеличивается;
2) Увеличение надежности оценки приводит к увеличению t. Как следствие, возрастает δ и уменьшается точность оценки.
Замечание 2. Как следует из равенства точности оценки, минимальный объем выборки, который обеспечит заданную точность оценки математического ожидания, равен:
Выборочная дисперсия. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия — Студопедия
Поделись с друзьями
Смещенной оценкой генеральной дисперсии служит выборочная дисперсия. Эту величину вводят для того, чтобы охарактеризовать рассеяние наблюдаемых значений количественного признака выборки вокруг среднего значения .
Определение. Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения . Если значения признака x1, x2, …, xk имеют соответственно частоты n1, n2, …, nk, причем n1 + n2 + … + nk = n, то
Эта оценка является смещенной, так как ,
где DГ – генеральная дисперсия – среднее арифметическое квадратов отклонения значения признака генеральной совокупности от их среднего значения .
Теорема.Выборочная дисперсия равна среднему квадратов значений признака минус квадрат выборочной средней.
Для вычисления выборочной дисперсии эта формула наиболее удобна.
Замечание. Если перейти к условным вариантам ui = xi – c , то дисперсия при этом не изменится.
Оценка генеральной дисперсии по исправленной выборочной.
Пусть из генеральной совокупности в результате n независимых наблюдений
над количественным признаком Х извлечена повторная выборка объема n:
Значения признака | xi | x1 | x2 | … | xk |
Частоты | ni | n1 | n2 | … | nk |
При этом n1 + n2 + … + nk = n. Требуется по данным выборки найти неизвестную генеральную дисперсию DГ. Если в качестве оценки DГ принять выборочную дисперсию, то эта оценка будет приводить к систематическим ошибкам, давая заниженное значение DГ. Объясняется это тем, что математическое ожидание выборочной дисперсии не равно оцениваемой D Г, а равно .
Легко «исправить» выборочную дисперсию так, чтобы ее математическое ожидание было равно генеральной дисперсии. Достаточно для этого умножить на дробь n/(n–1). Сделав это, мы получим исправленную дисперсию, которую обычно обозначают .
Несмещенной оценкой генеральной дисперсии служит исправленная выборочная дисперсия:
.
Более удобна форма:
.
В условных вариантах она имеет вид:
,
причем если ui = xi – c, то ; если , то .
Задача 1.
Из генеральной совокупности извлечена выборка объемом n = 60
Найти несмещенную оценку генеральной средней.
Решение. Несмещенной оценкой генеральной средней является выборочная средняя: ,
где ─ варианта выборки, ─ частота варианты ; объем выборки.
.
Ответ: .
Задача 2.
Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:
7.
2: Выборочная дисперсия — Статистика LibreTexts- Последнее обновление
- Сохранить как PDF
- Идентификатор страницы
- 13702
В разделе 6.2 мы ввели выборочное среднее \(\bar{X}\) как инструмент для понимания среднего значения генеральной совокупности. В этом разделе мы формализуем эту идею и расширим ее, чтобы определить выборочная дисперсия
, инструмент для понимания дисперсии населения. До сих пор \(\mu\) обозначало среднее или ожидаемое значение случайной величины. Другими словами, он представлял собой параметр распределения вероятностей. В контексте статистики основное внимание уделяется совокупности объектов, где объекты могут быть реальными людьми, и нас интересует определенная характеристика людей, например, рост или IQ. 2\) дисперсии населения. 9n_{i=1}X_i,\label{xbar}$$
можно использовать для оценки среднего значения генеральной совокупности \(\mu\).
Обратите внимание на использование строчных букв «\(x_i\)» в определении 7.2.1 для элементов совокупности. Это отличается от заглавных букв «\ (X_i \)», используемых для обозначения элементов случайной выборки. Поскольку значения в совокупности фиксированы, хотя и неизвестны на практике, было бы нецелесообразно представлять их заглавными буквами, которые по соглашению зарезервированы для случайных величин.
Мы утверждаем, что выборочное среднее \(\bar{X}\) является «очевидной» оценкой среднего значения генеральной совокупности \(\mu\), поскольку элементы генеральной совокупности в уравнении \ref{mu} просто заменяются соответствующими выборочные элементы в уравнении \ref{xbar}. В дополнение к тому, что это естественный выбор для оценки \(\mu\), \(\bar{X}\) обладает еще одним желательным свойством, которое связано со следующим результатом, сформулированным в следствии 6. 2.1 для нормально распределенных совокупностей.
Теорема \(\PageIndex{1}\)
92}{n}\end{выравнивание*}
Теорема 7.2.1 дает формулы для ожидаемого значения и дисперсии выборочного среднего, и мы видим, что они обе зависят от среднего и дисперсии генеральной совокупности. Тот факт, что ожидаемое значение среднего значения выборки точно равно среднему значению генеральной совокупности, указывает на то, что среднее значение выборки является несмещенной оценкой среднего значения генеральной совокупности. Это связано с тем, что в среднем мы ожидаем, что значение \(\bar{X}\) будет равно значению \(\mu\), которое является именно тем значением, которое используется для оценки. Это очень желательное свойство для оценщиков, поскольку оно придает больше уверенности в использовании их значений для понимания неизвестной характеристики генеральной совокупности. Мы сохраним цель использования несмещенных оценок, так как сейчас рассматриваем оценку дисперсии генеральной совокупности. 92\) соответственно. Таким образом, мы показали, что величина, с которой мы начали в уравнении \ref{t}, равна случайной величине со стандартным нормальным распределением, деленной на квадратный корень из независимой случайной величины с распределением хи-квадрат, деленной на ее степени свобода. Именно это определение распределения \(t\) дано в определении 7.1.3.
Обратите внимание на то, что говорит результат теоремы 7.2.5: при выборке из нормально распределенной совокупности, если мы возьмем выборочное среднее и вычтем его ожидаемое значение \(\mu\) и разделим на его стандартное отклонение 92\) , то полученная случайная величина имеет \(t\) распределение с \((n-1)\) степенями свободы. Распределение больше не является стандартным нормальным распределением, потому что теперь мы оценили дисперсию генеральной совокупности, что приводит к увеличению общей изменчивости количества, заданного в уравнении \ref{t}. Чтобы учесть эту возросшую изменчивость, нам нужно распределение с более толстыми хвостами , что и обеспечивает распределение \(t\). Обратите также внимание на то, что степени свободы распределения \(t\), моделирующего величину в уравнении \ref{t}, на единицу меньше, чем размер выборки, потому что мы теряем степень свободы, используя выборочную дисперсию для оценки дисперсии генеральной совокупности. . Этот результат обеспечивает основу для многих методов статистического вывода.
7.2: Sample Variance распространяется по недекларированной лицензии и был создан, изменен и/или курирован LibreTexts.
- Наверх
- Была ли эта статья полезной?
- Тип изделия
- Раздел или Страница
Вы можете использовать команду
mean
в MATLAB, чтобы вычислить выборочное среднее значение для данной выборки. В частности, для заданного вектора $x=$$[$$x_1$, $x_2$, $\cdots$, $x_n$ $]$ функцияmean(x)
возвращает среднее значение выборки. \begin{выравнивание}%\метка{} \frac{x_1+x_2+\cdots+x_n}{n}. \end{выравнивание} Кроме того, функцииvar
иstd
можно использовать для вычисления выборочной дисперсии и выборочного стандартного отклонения соответственно.Пусть $T$ — это время, необходимое для выполнения конкретной задачи на фабрике. Чтобы оценить среднее значение и дисперсию $T$, мы наблюдаем случайную выборку $T_1$,$T_2$,$\cdots$,$T_6$. Таким образом, $T_i$ являются i.i.d. и имеют то же распределение, что и $T$. Получаем следующие значения (в минутах):
\begin{уравнение}%\метка{} 18, 21, 17, 16, 24, 20. \end{уравнение} Найдите значения выборочного среднего, выборочной дисперсии и выборочного стандартного отклонения для наблюдаемой выборки.