Повторные независимые испытания: Электронная библиотека БГУ: Invalid Identifier

Глава 4. Повторные независимые испытания

При решении вероятностных задач часто приходится сталкиваться с ситуациями, в которых одно и то же испытание повторяется многократно. Под испытанием понимается осуществление определенного комплекса условий, в результате которых может произойти (или нет) то или иное событие пространства элементарных событий.

  • Повторные независимые испытания — многократные испытания, в которых вероятность появления события А в каждом испытании не меняется в зависимости от исходов других испытаний. Впервые схема независимых испытаний была рассмотрена Я. Бернулли1 для важнейшего частного случая k=2.

  • Под схемой Бернулли понимают проведение серии в n испытаний, в каждом из которых возможны два исхода: либо наступит событие А, либо не наступит, т. е. произойдет противоположное ему и при этом:

  1. все п испытаний независимы;

  1. вероятность события А в каждом отдельном испытании постоянна и не меняется от испытания к испытанию:

П ример. К случайным событиям, удовлетворяющим условиям схемы Бернулли, относятся: многократное подбрасывание монеты (событие А – например, выпадение «орла»), многократная стрельба по мишени (событие А – например, попадание в мишень) и т. п.

В случае небольшого числа испытаний n вероятность того, что в n независимых испытаниях событие А наступит ровно m раз, определяется в соответствии с формулой Бернулли:

(1.24)

где n – число испытаний Бернулли;

m – число испытаний, в которых наступило событие А;

q=1-p – вероятность противоположного события ;

– число сочетаний из n элементов по m (1.6).

Д оказательство.

Обозначим через появление события А в i-м испытании. Вероятность того, что А, наступают при определенных m испытаниях (например, с номерами ), а при остальных n-m не наступает, равна:

.

По теореме сложения вероятностей для несовместных событий (1.13), искомая вероятность равна сумме вероятностей полученного значения для всех возможных способов m появлений события А в n испытаниях. В соответствии с правилами комбинаторики, число таких способов определяется числом сочетаний из n по m (1.6):

.

Пример 4.1. После года хранения на складе в среднем 10% аккумуляторов выходит из строя. Определить вероятность того, что после года хранения из 12 аккумуляторов окажутся годными:

а) 10,

б) больше половины.

Решение.

Проводится 12 независимых испытаний, состоящих в проверке годности аккумулятора. Для каждого из 12 аккумуляторов вероятность события А – аккумулятор после года хранения годный – по условию постоянна и равна:

А. Требуется определить вероятность того, что из 12 аккумуляторов ровно 10 будут годными, т. е. вероятность . Поскольку испытания удовлетворяют условиям схемы Бернулли, то эту вероятность можно определить по формуле Бернулли (1.24):

Б. Требуется определить вероятность того, что из 12 аккумуляторов более 12/2=6 будут годными, т. е. вероятность . При этом по теореме сложения для несовместных событий (1.13):

,

так как события не совместны.

Так как испытания удовлетворяют условиям схемы Бернулли, то вероятности можно определить по формуле Бернулли (1.24):

При вычислении вероятностей в условиях большого числа испытаний n можно столкнуться со значительными вычислительными трудностями. В связи с этим возникла необходимость в построении асимптотических (приближенных) формул, позволяющих с достаточной степенью точности определить . Одними из них являются теоремы Муавра – Лапласа2

Повторные независимые испытания.

Примеры решения задач



Образовательные онлайн сервисы: теория и практика

  • Главная
  • Примеры
    • Математический анализ
    • Векторная алгебра и аналитическая геометрия
    • Линейная алгебра
    • Теория вероятностей и математическая статистика
    • Математическое программирование
      Методы оптимизации
    • Математика в экономике
      Экономическая статистика
  • Видео-уроки
    • Математический анализ
    • Векторная алгебра и Аналитическая геометрия
    • Линейная алгебра
    • Теория вероятностей и математическая статистика
    • Математическое программирование. Методы оптимизации
  • Готовые работы
    • Математический анализ
    • Векторная алгебра и аналитическая геометрия
    • Линейная алгебра
    • Теория вероятностей и математическая статистика
    • Математическое программирование
      Методы оптимизации
    • Математика в экономике
      Экономическая статистика
    • Другое
  • Контакты


Полезные материалы:

  • Учебники
  • Справочники
  • Онлайн калькуляторы
  • Помощь в решении
  • Онлайн занятия в Zoom

Повторные независимые испытания

Задача 1.
Вероятность выигрыша по одному любому лотерейному билету равна 0,02. Чему равна вероятность выигрыша: а) по трем билетам; б) не более двух билетов; в) хотя бы по одному билету; для владельца четырех билетов.

Решение: n = 4; p = 0,02; q = ,98.
Так как число испытаний мало, применяем формулу Бернулли .
а)

б)

в)
Задача 2.
Доля изделий высшего сорта на данном предприятии составляет 90 %. Найти вероятность того, что среди наудачу взятых 100 изделий высшего сорта окажется 84 изделия.
Решение: n=100; p=0,9; m=84; np=90. Так как число испытаний n

=100 – велико, а произведение np==90>10, применяем к решению локальную формулу Лапласа:
.
Так как функция — четная, имеем: .

По таблице приложения находим .

Искомая вероятность . Задача 3.
Магазин получил 1000 бутылок минеральной воды. Вероятность того, что при перевозке бутылка окажется разбитой, равна 0,003. Найти вероятность того, что магазин получил разбитых бутылок: а) ровно две; б) меньше двух; в) больше одной; г) хотя бы одну.
Решение:n=1000; p=0,003; .
Так как число испытаний n=1000 – велико, p – мало, а , применяем формулу Пуассона:
а) ;
б) ;
в) ;
г) .
Задача 4.
Доля изделий высшего сорта продукции составляет 80 %. Найти вероятность того, что в партии из 900 изделий высшего сорта будет:

а) заключено между 700 и 750; б) не меньше 750; в) не больше 600. Решение:n=900, p=0,8, q=0,2, np=720.

.
а) Согласно интегральной теореме Лапласа
.
Функция  — нечетная, поэтому .

По таблице приложения находим .

Искомая вероятность .
б)

в)
.



Задать вопрос
Заказать помощь

Отзывы

+7-911-7987704

vk.com/id286009794

Написать в Whatsapp

Написать в Viber

@matem96

Skype: matem96.ru



Стьюдент-тест с повторными измерениями — Руководства по математике и статистике от Центра математики и статистики UB

Дженна Леманн

Схема повторных измерений или

парных выборок заключается в минимизации смешанных переменных, таких как характеристики участников, путем использования одного и того же человека на нескольких уровнях фактора или объединения участников в пары в каждой группе на основе схожих характеристик или отношений, а затем их принимать участие в различных процедурах. Совпадающие субъекты — еще одно слово, используемое для описания этого типа теста, и оно используется специально для обозначения планов, в которых разные люди совпадают по своим характеристикам. Участники часто совпадают по возрасту, полу, расе, социально-экономическому статусу или другим демографическим характеристикам, но также могут быть сопоставлены по другим характеристикам, которые исследователи могут счесть возможными путаницами. Исследования близнецов — хороший пример такого плана; один близнец должен быть сопоставлен с другим — они не могут быть сопоставлены с чужим близнецом.

Чтобы повторить различия между t-критерием с повторными измерениями и другими видами тестов, которые вы, возможно, изучили до этого момента, t-тест для одной выборки вращается вокруг получения выводов о обработанной популяции на основе среднего значения выборки и необработанной популяции. среднее (без стандартного отклонения). Независимые выборочные t-тесты предназначены для сравнения средних значений двух выборок (обычно контрольной группы/группы без лечения и группы, получавшей лечение), чтобы сделать выводы о том, как могут быть различия между этими двумя группами в более широкой популяции. В каждой группе используются разные, случайно назначенные участники. Стьюдентные тесты связанных выборок аналогичны t-тестам независимых выборок, за исключением того, что они используют одного и того же человека для нескольких тестовых групп или они сопоставляют людей на основе их характеристик или отношений, чтобы сократить посторонние переменные, которые могут мешать данным.

 

Средняя разница и расчетная стандартная ошибка средней разницы

Средняя разница вычисляется путем вычитания двух баллов, полученных от каждого человека (поскольку есть две группы тестирования), сложения всех этих различий и последующего деления этого числа на количество баллов. Это сделано потому, что вместо того, чтобы просто сравнивать средние значения между двумя выборками, как в t-критерии независимых выборок, у нас есть возможность сначала вычислить разницу между каждым человеком, чтобы увидеть, как на него повлияло лечение.

Расчетная стандартная ошибка средней разницы является мерой того, насколько средняя разница может варьироваться от одного случая к другому. Это отличается от независимых измерений, потому что вместо объединения дисперсии между двумя выборками вы основываете свою сумму квадратов на разнице между двумя оценками, а затем вычисляете предполагаемую стандартную ошибку, как если бы вы использовали t-критерий для одной выборки.

 

Проверка гипотез с повторными измерениями t-критерий

Нулевая и альтернативная гипотезы записываются следующим образом:

или что между двумя состояниями нет разницы

или что существует значительная разница между двумя условиями

Шаги для расчета t-критерия с повторными измерениями (все необходимые формулы можно найти в глоссарии статистических формул):

  1. Сформулируйте нулевую и альтернативную гипотезы
  2. Найдите критическую область (помните, что это )
  3. Рассчитайте статистику t, используя формулу t, после вычисления предполагаемой стандартной ошибки средней разницы.
  4. Примите решение.

Опять же, у этого подхода есть свои преимущества и недостатки.

Преимущества:

  • Требуется меньше предметов
  • Хорошо подходит для изучения изменений во времени (развитие, обучение, изучение)
  • Уменьшает или устраняет вызванные индивидуальными различиями между участниками либо объединение участников на основе характеристик, либо использование одного и того же человека дважды.

Недостатки:

  • Увеличивает вероятность того, что внешние факторы, которые меняются с течением времени, могут быть ответственны за изменения результатов участников.
  • Участие в первом сеансе может повлиять на результаты второго сеанса (практика, усталость и т. д.).

 

Величина эффекта для повторных измерений t-критерий

Опять же, d Коэна является предпочтительным измерением размера эффекта. В этом случае это разница среднего значения выборки по среднему отклонению выборки (поэтому, что бы вы ни нашли в качестве дисперсии, извлеките из нее квадратный корень, чтобы получить среднее отклонение выборки).

 

Изменчивость как мера согласованности

Если лечение постоянно добавляет несколько баллов к оценке каждого человека, то набор оценок различий группируется вместе на кривой нормального распределения с относительно небольшой вариабельностью. В этой ситуации при небольшой вариабельности легко увидеть эффект лечения, и он, вероятно, будет значительным. Высокая вариабельность означает отсутствие согласованности с эффектом лечения, а это означает, что труднее увидеть какие-либо различия между группами, и маловероятно, что будут обнаружены существенные различия.

 

Степени свободы

Раньше, когда мы работали с независимыми t-критериями, степени свободы были для каждой выборки, так что в итоге получилось . Однако для t-критерия повторных измерений нам нужны только степени свободы для средней разницы. Таким образом, общее количество степеней свободы равно .


Первоначально эта глава была опубликована в блоге Центра поддержки математики Балтиморского университета 11 июня 2019 г.

повторных измерений ANOVA — Понимание повторных измерений ANOVA

Введение

Повторные измерения ANOVA эквивалентны однофакторному ANOVA, но для связанных, а не независимых групп, и являются расширением зависимого t-критерия. ANOVA с повторными измерениями также называется внутрисубъектным ANOVA или ANOVA для коррелированных выборок. Все эти названия подразумевают природу повторных измерений ANOVA, то есть тест для обнаружения любых общих различий между связанными средними значениями. Существует множество сложных планов, в которых можно использовать повторяющиеся измерения, но в этом руководстве мы будем ссылаться на самый простой случай — однофакторный дисперсионный анализ с повторными измерениями. Для этого конкретного теста требуется одна независимая переменная и одна зависимая переменная. Зависимая переменная должна быть непрерывной (интервал или отношение), а независимая переменная — категориальной (номинальной или порядковой).

Когда использовать повторные измерения ANOVA

Мы можем анализировать данные, используя повторные измерения ANOVA для двух типов дизайна исследования. Исследования, которые исследуют либо (1) изменения средних баллов в течение трех или более моментов времени, либо (2) различия в средних баллах в трех или более различных условиях. Например, для (1) вы можете исследовать влияние 6-месячной программы тренировок на кровяное давление и хотите измерить кровяное давление в 3 отдельных временных точках (вмешательство до, в середине и после тренировки), что будет позволяют разработать временной курс для любого эффекта упражнений. Для (2) вы можете попросить одних и тех же испытуемых съесть разные виды пирожных (шоколадный, карамельный и лимонный) и оценить вкус каждого из них, вместо того, чтобы разные люди пробовали каждый отдельный торт. Важным моментом в этих двух планах исследования является то, что одни и те же люди измеряются более одного раза по одной и той же зависимой переменной (то есть, почему это называется повторными измерениями).

В повторных измерениях ANOVA независимая переменная имеет категории, называемые уровнями или связанными группами . Когда измерения повторяются с течением времени, например, при измерении изменений артериального давления в результате программы физических упражнений и тренировок, независимая переменная равна на . Каждый уровень (или связанная группа ) представляет собой определенный момент времени. Следовательно, для исследования упражнения-тренировка будет три временных момента, и каждый временной момент представляет собой уровень независимой переменной (схема плана повторяющихся измерений показана ниже):

Если измерения проводятся в различных условиях, условия представляют собой уровни (или связанные группы) независимой переменной (например, тип торта является независимой переменной, а шоколадный, карамельный и лимонный торт являются уровнями независимой переменной). Схема схемы повторных измерений в различных условиях показана ниже. Следует отметить, что часто уровни независимой переменной называют не условиями, а обработок . Какой из них вы хотите использовать, зависит от вас. Не существует правильного или неправильного соглашения об именах. Вы также увидите независимую переменную, чаще называемую внутрисубъектным фактором .

На двух вышеприведенных схемах показан пример каждого типа плана повторных измерений ANOVA, но вы также часто будете видеть эти планы в табличной форме, например, как показано ниже:

Эта конкретная таблица описывает исследование с участием шести субъектов (S 1 до S 6 ), выполняемых при трех условиях или в трех временных точках (от T 1 до T 3 ). Как подчеркивалось ранее, внутрисубъектный фактор также можно было бы обозначить как «лечение» вместо «время/состояние». Все они относятся к одному и тому же: субъектам, подвергающимся повторным измерениям либо в разные моменты времени, либо в разных условиях/обработках.

Гипотеза для повторных измерений ANOVA

Повторные измерения ANOVA проверяет наличие каких-либо различий между родственными средними значениями генеральной совокупности. Нулевая гипотеза (H 0 ) states that the means are equal:

H 0 : µ 1 = µ 2 = µ 3 = … = µ k

where µ = population mean и k = количество связанных групп. Альтернативная гипотеза (H A ) утверждает, что средние значения родственной совокупности не равны (по крайней мере, одно среднее значение отличается от другого среднего):

H A : по крайней мере два средних значения значительно отличаются

В нашем примере с физическими упражнениями нулевая гипотеза (H 0 ) состоит в том, что среднее кровяное давление одинаково во все моменты времени (до, 3 месяца и 6 месяцев). Альтернативная гипотеза состоит в том, что среднее кровяное давление значительно отличается в один или несколько моментов времени. Повторные измерения ANOVA не сообщат вам, в чем заключаются различия между группами, поскольку это комплексный статистический тест. То же самое было бы верно, если бы вы исследовали различные состояния или методы лечения, а не временные точки, как в этом примере. Если ваши повторные измерения ANOVA статистически значимы, вы можете запустить апостериорные тесты, которые могут указать, где именно возникают эти различия. Вы можете узнать, как запустить соответствующие апостериорные тесты для повторных измерений ANOVA в SPSS Statistics, на странице 2 нашего руководства: Однофакторный повторный анализ ANOVA в SPSS Statistics.

Логика дисперсионного анализа повторных измерений

Логика дисперсионного анализа повторных измерений очень похожа на логику дисперсионного анализа между субъектами. Напомним, что межгрупповой ANOVA разделяет общую изменчивость на межгрупповую изменчивость (SS b ) и внутригрупповую изменчивость (SS w ), как показано ниже:

В этом плане внутригрупповая изменчивость (SS w ) определяется как ошибка изменчивости (SS ошибка ). После деления на соответствующие степени свободы средняя сумма квадратов между группами (MS b ) и внутри групп (MS w ) и вычисляется F -статистика как отношение MS b к MS w (или MS ошибка ), как показано ниже:

A дисперсионный анализ с повторными измерениями вычисляет F -статистику аналогичным образом:

Преимущество дисперсионного анализа с повторными измерениями состоит в том, что внутригрупповая изменчивость (SS w ) выражает изменчивость ошибки (SS ошибка ) в независимом (между субъектами) дисперсионном анализе дисперсионный анализ с повторными измерениями может дополнительно разделить этот член ошибки, уменьшив его размер, как показано ниже:

Это приводит к увеличению значения F -статистики из-за уменьшения знаменателя и приводит к увеличению мощности теста для обнаружения значительных различий между средними значениями (более подробно это обсуждается позже). . Математически, как показано выше, мы разделяем изменчивость, связанную с различиями между группами (SS условия ) и изменчивость внутри групп (SS w ) точно так же, как мы делаем в межсубъектном (независимом) ANOVA. Однако с помощью повторных измерений ANOVA, поскольку мы используем одних и тех же субъектов в каждой группе, мы можем устранить изменчивость из-за индивидуальных различий между субъектами, обозначенную как SS 9.0132 субъекта из внутригрупповой изменчивости (SS w ). Как это достигается? Проще говоря, мы рассматриваем каждый предмет как блок. То есть каждый субъект становится уровнем фактора, называемого субъектами. Затем мы вычисляем эту изменчивость, как мы делаем с любым межсубъектным фактором. Возможность вычитания субъектов SS оставит нам меньший член SS error , как показано ниже:

0132 ошибка отражает только индивидуальную изменчивость каждого состояния. Вы можете распознать в этом эффект взаимодействия субъекта с условиями; то есть, как субъекты реагируют на различные условия.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *