Доверительный интервал как построить: Построение доверительного интервала для математического ожидания генеральной совокупности

Доверительный интервал для оценки значения случайной величины. Примеры решения задач



Образовательные онлайн сервисы: теория и практика

  • Главная
  • Примеры
    • Математический анализ
    • Векторная алгебра и аналитическая геометрия
    • Линейная алгебра
    • Теория вероятностей и математическая статистика
    • Математическое программирование
      Методы оптимизации
    • Математика в экономике
      Экономическая статистика
  • Видео-уроки
    • Математический анализ
    • Векторная алгебра и Аналитическая геометрия
    • Линейная алгебра
    • Теория вероятностей и математическая статистика
    • Математическое программирование. Методы оптимизации
  • Готовые работы
    • Математический анализ
    • Векторная алгебра и аналитическая геометрия
    • Линейная алгебра
    • Теория вероятностей и математическая статистика
    • Математическое программирование
      Методы оптимизации
    • Математика в экономике
      Экономическая статистика
    • Другое
  • Контакты


Полезные материалы:

  • Учебники
  • Справочники
  • Онлайн калькуляторы
  • Помощь в решении
  • Онлайн занятия в Zoom

Доверительный интервал для оценки истинного значения случайной величины

Задача

В результате 10 независимых измерений некоторой случайной величины Х, выполненных с одинаковой точностью, получены опытные данные, приведенные в таблице.

X1

X2

X3

X4

X5

X6

X7

X8

X9

X10

6,9

7,3

7,1

9,5

9,7

7,9

7,6

9,1

6,6

9,9

Предполагая, что результаты измерений подчинены нормальному закону распределения вероятностей, оценить истинное значение Х при помощи доверительного интервала, покрывающего истинное значение величины Х с доверительной вероятностью 0,95.

Решение:

Поскольку в задаче имеется выборка малого объема, применим распределение Стьюдента.
Фактически требуется построить доверительный интервал для оценки математического ожидания а при неизвестном значении среднеквадратического отклонения из нормально распределенной генеральной совокупности.

Требуется отыскать такое число , для которого верно равенство

В этой формуле:

— выборочное среднее
— стандартное (среднеквадратическое) отклонение
a  — математическое ожидание
n  — объем выборки (нашем случае 10)
 — величина, в сумме с доверительной вероятностью дающая 1 (в нашем случае 0,05)

Величину  (в нашем случае ) находим по таблицам распределения Стьюдента. Она равна 2,262.
Находим выборочное среднее как среднее арифметическое

Рассчитаем среднеквадратическое отклонение через исправленную выборочную дисперсию:

Тогда

Получаем:

Ответ: истинное значение случайной величины лежит в доверительном интервале (7,257; 9,063) с доверительной вероятностью 0,95.



Задать вопрос
Заказать помощь

Отзывы

+7-911-7987704

vk.com/id286009794

Написать в Whatsapp

Написать в Viber

@matem96

Skype: matem96.ru



Доверительный интервал для оценки дисперсии в EXCEL. Примеры и описание

Построим доверительный интервал для оценки дисперсии случайной величины, распределенной по нормальному закону, в MS EXCEL .

Построение доверительного интервала для оценки среднего приведено в статье Доверительный интервал для оценки среднего (дисперсия известна) в MS EXCEL . Процедура построения доверительного интервала для оценки дисперсии имеет много общего с процедурой для оценки среднего , поэтому в этой статье она изложена менее подробно, чем в указанной статье.

Формулировка задачи. Предположим, что из генеральной совокупности имеющей нормальное распределение с неизвестным средним значением μ и неизвестной дисперсией σ 2 взята выборка размера n. Необходимо на основании этой выборки оценить дисперсию распределения и построить доверительный интервал .

Примечание : Построение доверительного интервала для оценки среднего относительно нечувствительно к отклонению генеральной совокупности от нормального закона . А вот при построении доверительного интервала для оценки дисперсии требование нормальности является строгим.

СОВЕТ : Для построения Доверительного интервала

нам потребуется знание следующих понятий:

  • дисперсия и стандартное отклонение ,
  • доверительный интервал для оценки среднего ,
  • выборочное распределение статистики ,
  • уровень доверия/ уровень значимости ,
  • нормальное распределение и распределение ХИ-квадрат .

В качестве точечной оценкой дисперсии распределения, из которого взята выборка , используют Дисперсию выборки s 2 .

Также, перед процедурой проверки гипотезы , исследователь устанавливает требуемый уровень значимости – это допустимая для данной задачи ошибка первого рода , т.е. вероятность отклонить

нулевую гипотезу , когда она верна ( уровень значимости обозначают буквой α (альфа) и чаще всего выбирают равным 0,1; 0,05 или 0,01)

В статье про ХИ2-распределение показано, что выборочное распределение статистики y=(n-1) s 2 2 , имеет ХИ2-распределение с n-1 степенью свободы.

Воспользуемся этим свойством и построим двухсторонний доверительный интервал для оценки дисперсии :

где χ 2 α/2,n-1 верхний α/2-квантиль распределения ХИ-квадрат с n -1 степенью свободы ( такое значение случайной величины χ 2 n-1 , что P (

χ 2 n-1 >= χ 2 α/2,n-1 )=α/2) . Чтобы найти этот квантиль в MS EXCEL используйте формулу =ХИ2.ОБР.ПХ(α; n-1) . χ 2 1-α/2,n-1 – верхний 1-α/2-квантиль , который равен нижнему α/2- квантилю. Чтобы найти этот квантиль в MS EXCEL используйте формулу =ХИ2.ОБР(α; n-1) .

Примечание : В файле примера на листе Квантили показан расчет квантилей для распределения ХИ2 . На рисунке выделена область соответствующая уровню доверия 95%, которая ограничена верхним и нижним

квантилем . Обратите внимание, что в отличие от нормального и t-распределения распределение ХИ2 несимметрично, поэтому для двустороннего доверительного интервала потребуется вычислить два квантиля , значения которых будут отличаться.

Примечание : Доверительный интервал для стандартного отклонения может быть получен путем извлечения квадратного корня из вышеуказанного выражения.

В файле примера на листе 2х сторонний создана форма для расчета и построения двухстороннего доверительного интервала .

Для построения односторонних доверительных интервалов используйте нижеследующие выражения:

В следующей задаче найдем

верхний односторонний доверительный интервал для дисперсии .

Автоматический аппарат заполняет емкости с растворителем. Предполагается, что объемы налитой жидкости в емкостях распределены по нормальному закону . Если разброс значений объемов будет слишком велик, то значительная часть емкостей будет существенно переполнена или не заполнена. Для оценки дисперсии в качестве выборки взято 20 наполненных жидкостью емкостей. На основе выборки была вычислена дисперсия выборки s 2 , которая составила 0,0153 (литров 2 ). Принято решение оценить верхний уровень дисперсии с уровнем доверия 95%.

Для решения задачи воспользуемся выражением

Сначала найдем верхний (1-α)-квантиль (или равный ему нижний α-квантиль ) ХИ2-распределения с n-1 степенью свободы при у ровне значимости α равном 1-0,95=0,05. Это можно сделать в MS EXCEL по формулам: =ХИ2.ОБР.ПХ(1-0,05; 20-1) или =ХИ2.ОБР(0,05; 20-1)

В результате получим верхний доверительный интервал для дисперсии: σ 2 <=0,0287

Или тоже, но словами и для стандартного отклонения: «Значения выборки показывают, что с вероятностью 95%, стандартное отклонение процесса наполнения емкости растворителем меньше или равно 0,17 литров».

Ход решения приведен в файле примера на листе 1 сторонний .

СОВЕТ : О построении других доверительных интервалов см. статью Доверительные интервалы в MS EXCEL .

Доверительный интервал

Статистики используют доверительный интервал для описания степени неопределенности связанный с выборочной оценкой населения параметр.

Как интерпретировать доверительные интервалы

Предположим, что 90% доверительный интервал утверждает, что среднее значение населения больше 100 и меньше 200. Как бы вы интерпретировали это утверждение?

Некоторые люди думают, что это означает 90% вероятность того, что среднее значение населения находится между 100 и 200. Это неверно. Как и любое население параметр, среднее значение населения является константой, а не случайная переменная. Это не меняется. вероятность того, что константа попадает в любой заданный диапазон всегда 0,00 или 1,00.

уровень достоверности описывает неопределенность, связанную методом выборки . Предположим, мы использовали один и тот же метод выборки для выбора разные выборки и вычислить другую интервальную оценку для каждого образца. Некоторые интервальные оценки будут включать реальную популяцию параметр, а некоторые нет. Уровень достоверности 90% означает что мы ожидаем, что 90% интервальных оценок будут включать параметр населения; 9Уровень достоверности 5% означает, что 95% интервалов будут включать этот параметр; и так далее.

Требования к данным доверительного интервала

Чтобы выразить доверительный интервал, вам нужны три части Информация.

  • Уровень уверенности
  • Статистика
  • Погрешность

С учетом этих входных данных диапазон доверительного интервала составляет определяется выборочной статистикой + погрешность . И неопределенность, связанная с доверительный интервал определяется доверительным уровнем.

Часто предел погрешности не указывается; вы должны его рассчитать. Ранее мы описали как рассчитать погрешность.

Объявление

Как построить доверительный интервал

Существует четыре этапа построения доверительного интервала.

  • Идентифицируйте выборочную статистику. Выберите статистику (например, выборочное среднее, выборочная доля), которые вы будете использовать для оценить параметр совокупности.
  • Выберите уровень достоверности. Как мы отмечали в предыдущем разделе, уровень достоверности описывает неопределенность выборки метод. Часто исследователи выбирают достоверность 90%, 95% или 99%. уровни; но можно использовать любой процент.
  • Найдите предел погрешности. Если вы работаете над домашним заданием задача или тестовый вопрос, может быть указана погрешность. Однако часто вам нужно будет вычислить предел погрешности, на основе одного из следующих уравнений.

    Погрешность = критическое значение * стандартное отклонение статистики

    Погрешность = критическое значение * стандартная ошибка статистики

    Для руководства см. как рассчитать погрешность.
  • Укажите доверительный интервал. Неопределенность обозначается по уровню уверенности. И диапазон уверенности интервал определяется следующим уравнением.

    Доверительный интервал = выборочная статистика + Погрешность

Пример задачи в следующем разделе использует четыре вышеуказанных шага. для построения 95% доверительного интервала для среднего балла. Следующий несколько уроков обсуждают эту тему более подробно.

Калькулятор объема выборки

Как вы уже догадались, четыре шага, необходимые для интервал может включать много трудоемких вычислений. Стат Трек Калькулятор размера выборки сделает это за вас — быстро, легко и просто. без ошибок. Помимо построения доверительного интервала, калькулятор создает сводный отчет, в котором перечислены основные выводы и аналитические документы методы. Всякий раз, когда вам нужно построить доверительный интервал, рассмотрите с помощью Калькулятора размера выборки. калькулятор бесплатный. Его можно найти в Stat Trek Главное меню на вкладке Инструменты статистики. Или вы можете нажать кнопку ниже.

Калькулятор размера выборки

Проверьте свое понимание

Задача 1

Предположим, мы хотим оценить средний вес взрослого мужчины в Округ Декалб, Джорджия. Мы берем случайную выборку из 1000 мужчин из населения в 1 000 000 человек и взвесить их. Мы находим, что средний человек в нашей выборке весит 180 фунтов, а стандартное отклонение образец 30 фунтов. Что такое 95% доверительный интервал.

(А) 180 + 1,86
(Б) 180 + 3,0
(С) 180 + 5,88
(Г) 180 + 30
(E) Ничего из вышеперечисленного

Решение

Правильный ответ (А). Чтобы указать доверительный интервал, мы работаем через четыре шага ниже.

Последний урок Следующий урок

Доверительные интервалы


Интервал 4 плюс-минус 2

Доверительный интервал — это диапазон значений мы достаточно уверены, что наше истинное значение находится в нем.

Пример: Средний рост

Мы измерили рост 40 случайно выбранных мужчин и получили средний рост 175см ,

Мы также знаем, что стандартное отклонение роста мужчин равно 20см .

95% доверительный интервал (позже мы покажем, как его рассчитать):

« ± » означает «плюс или минус», поэтому 175 см ± 6,2 см означает

  • 175 см − 6,2 см = 168,8 см от до 
  • 175 см + 6,2 см = 181,2 см

И наш результат говорит, что истинное среднее ВСЕХ мужчин (если бы мы могли измерить все их росты), вероятно, будет между 168,8 см и 181,2 см

Но это может быть не так. !

«95%» означает, что 95% экспериментов, подобных нашим, будут включать истинное среднее значение, но 5% не будет .

Таким образом, существует вероятность 1 из 20 (5%), что наш доверительный интервал НЕ включает истинное среднее значение.

Расчет доверительного интервала

Шаг 1 : начните с

  • количество наблюдений n
  • среднее X
  • и стандартное отклонение с

Примечание: мы должны использовать стандартное отклонение всей совокупности , но во многих случаях мы этого не узнаем.

Мы можем использовать стандартное отклонение для выборки , если у нас достаточно наблюдений (по крайней мере, n=30, надеюсь, больше).

Используя наш пример:

  • количество наблюдений n = 40
  • означает X = 175
  • стандартное отклонение с = 20

Шаг 2 : решить, какой доверительный интервал мы хотим: 95% или 99% являются общим выбором. Затем найдите значение «Z» для этого доверительного интервала здесь:

.

Достоверность
Интервал
З
80% 1,282
85% 1.440
90% 1,645
95% 1,960
99% 2,576
99,5% 2,807
99,9% 3,291

Для 95% значение Z равно 1,960

Шаг 3 : используйте это значение Z в этой формуле для доверительного интервала

X ± Z с √n

Где:

  • X это среднее
  • Z — выбранное значение Z из таблицы выше
  • s стандартное отклонение
  • n количество наблюдений

А у нас есть:

175 ± 1,960 × 20 √40

Что такое:

175 см ± 6,20 см

Другими словами: от 168,8 см до 181,2 см

Значение после ± называется пределом погрешности

Погрешность в нашем примере составляет 6,20 см

Калькулятор

У нас есть калькулятор доверительного интервала, который облегчит вам жизнь.

Симулятор

У нас также есть очень интересный симулятор нормального распределения. где мы можем начать с некоторого теоретического «истинного» среднего значения и стандартного отклонения, а затем взять случайные выборки.

Это помогает нам понять, как случайные выборки иногда могут быть очень хорошими или плохими для представления основных истинных значений.

Другой пример

Пример: Яблоневый сад

Яблоки достаточно большие?

На деревьях сотни яблок, поэтому вы случайным образом выбираете только 46 яблок и получаете:

  • Среднее значение 86
  • a Стандартное отклонение 6.2

Итак, посчитаем:

X ±  Z s √n

Мы знаем:

  • X среднее = 86
  • Z значение Z = 1,960 (из таблицы выше для 95%)
  • s стандартное отклонение = 6,2
  • n количество наблюдений = 46

86 ± 1,960 × 6,2 √46 = 86 ± 1,79

Таким образом, истинное среднее значение (всех сотен яблок) равно , вероятно, находится между 84,21 и 87,79

Истинное среднее значение

Теперь представьте, что мы собираем ВСЕ яблоки сразу и измеряем их ВСЕ по упаковке. машина (это роскошь, обычно не встречающаяся в статистике!)

И истинное среднее оказывается 84,9

Давайте разложим все яблоки на земле от меньшего к большему:


Каждое яблоко зеленая точка,
наши наблюдения отмечены синим цветом

Наш результат не был точным … он в конце концов случайный … но истинное среднее значение находится внутри нашего доверительного интервала 86 ± 1,79 (другими словами, от 84,21 до 87,79)

Теперь истинное означает, что не может быть внутри доверительного интервала, но в 95% случаев он будет!

95% всех «95% доверительных интервалов» будут включать истинное среднее значение.

Возможно, у нас была эта выборка со средним значением 83,5:


 Каждое яблоко представляет собой зеленую точку,
 наши наблюдения отмечены фиолетовым

 

. Это  не включает истинное среднее значение. Это может произойти примерно в 5 % случаев при доверительном интервале 95 %.

Итак, как мы узнаем, принадлежит ли наша выборка к «счастливым» 95% или к несчастливым 5%? Если мы не измерим все население, как указано выше, мы просто не будем знать .

Это риск при отборе проб, у нас может быть «плохая» выборка.

Пример в исследовании

Вот доверительный интервал, используемый в реальных исследованиях дополнительных упражнений для пожилых людей :

О чем это говорит? Глядя на строку «Мужской», мы видим:

  • 1226 Мужчины (47,6% всех людей)
  • имел «HR» (см. ниже) со средним значением 0,92 ,
  • и 95% 95% доверительный интервал (95% ДИ) от 0,88 до 0,97 (что также составляет 0,92±0,05)

«ЧСС» — это мера пользы для здоровья (чем меньше, тем лучше), поэтому здесь говорится, что истинная польза от физических упражнений для более широкой популяции мужчин имеет 95% вероятность находиться между 0,88 и 0,97

где ниже лучше. Таким образом, HR 0,92 означает, что испытуемые были в лучшем состоянии, а 1,03 — немного хуже.

Стандартное нормальное распределение

Все это основано на идее стандартного нормального распределения, где значение Z является «Z-показателем»

Например, Z для 95% равен 1,960, и здесь мы видим, что диапазон от -1,96 до +1,96 включает 95% всех значений:


От -1,96 до +1,96 стандартное отклонение составляет 95%

Применение этого к нашему образцу выглядит так:


Также от -1,96 до +1,96 стандартных отклонений, включая 95%

Заключение

Доверительный интервал основан на среднем значении и стандартном отклонении. Его формула:

Х ± Z с √n

Где:

  • X это среднее
  • Z — значение Z из таблицы ниже
  • s стандартное отклонение
  • n количество наблюдений

Достоверность
Интервал
З
80% 1.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

© 2015 - 2019 Муниципальное казённое общеобразовательное учреждение «Таловская средняя школа»

Карта сайта