Теория вероятностей и статистика в средней и старшей школе – Курсы – Национальный исследовательский университет «Высшая школа экономики»
Курс знакомит с основными понятиями, алгоритмами и методами решения задач в области теории вероятностей и математической статистики, необходимыми для преподавания в средней и старшей школе.
Подать заявкуЗадать вопрос
Курс «Теория вероятностей и статистика в средней и старшей школе» разработан для учителей математики и студентов педагогических специальностей. Он поможет подгтовиться к преподаванию одноимённого учебного предмета и соответствующих разделов математики в 7-9 и 10-11 классах. Вы познакомитесь с основными понятиями курса теории вероятности и математической статистики (классическая вероятность, геометрическая вероятность, алгебра событий, вероятности суммы и произведения событий, формула Бернулли, закон больших чисел для схемы Бернулли, функции распределения, числовые характеристики случайных величин), научитесь применять различные алгоритмы и методы для решения задач в области теории вероятностей и статистики, а также сможете объяснить сложные математические понятия простым языком, понятным ученикам средней и старшей школы.
Отдельные занятия посвящены месту и роли теории вероятностей и статистики в рабочих программах предметной области «Математика и информатика» и особенностям решения задач по этой теме на ОГЭ и ЕГЭ по математике.
Для кого
Курс «Теория вероятностей и статистика» будет полезен для:
учителей математики
чтобы систематизировать или получить знания и подготовиться к преподаванию нового учебного предмета
студентов педагогических специальностей
чтобы дополнить знания о методике преподавания глубокой теоретической подготовкой
методистов
чтобы проектировать образовательные программы и помогать коллегам решать сложные профессиональные задачи
Программа обучения
Место учебного предмета “Теория вероятностей и статистика” в средней и старшей школе3 часа
Классическая и геометрическая вероятности 3 часа
Элементы комбинаторики3 часа
Алгебра событий.
Вероятности суммы и произведения событий 3 часаСерии независимых испытаний. Формула Бернулли 3 часа
Формула полной вероятности и формулы Байеса 3 часа
Свойства формулы Бернулли. Наивероятнейшее число. Закон больших чисел в схеме Бернулли3 часа
Случайные величины. Методы описания случайных величин 3 часа
Основные числовые характеристики случайных величин Математическое ожидание, дисперсия, среднее квадратическое отклонение 3 часа
Важнейшие распределения. Распределения Бернулли, Пуассона, нормальное и показательное распределения 3 часа
Элементы математической статистики. Генеральная совокупность, выборки 3 часа
Статистические оценки. Статистические оценки основных числовых характеристик 3 часа
Статистические гипотезы. Проверка гипотез 3 часа
Решение задач по теории вероятностей и статистике в ОГЭ и ЕГЭ по математике 3 часа
Итоговая аттестация2 часа
Формат обучения
Продолжительность общая в часах
45 часов
Условия приема
Наличие среднего или высшего профессионального образования или обучение по программам среднего или высшего профессионального образования
Формат обучения
Смешанный
Состав группы
Нормативная численность группы 20 человек
Язык обучения
русский
Формат
Смешанный. Вы можете учиться очно в Нижнем Новгороде или онлайн
Расписание
По вторникам и четвергам в вечернее время
После окончания курса «Теория вероятностей и статистика в средней и старшей школе» вы сможете:
Решать задачи в области теории вероятностей и статистики
анализировать задачи и выбирать оптимальный способ решения
Преподавать разделы теории вероятностей и статистики в курсе математики в средней и старшей школе
проводить учебные занятия в соответсвии с требованиями ФГОС
Повысить качество подготовки учеников к олимпиадам и конкурсам
Выбирать интересные направления исследований и проектов и познакомить учеников с новыми сложными задачами
Преимущества обучения на курсе «Теория вероятностей и статистика в средней и старшей школе»
01
Экспертные преподаватели
02
Методическая поддержка
03
Удобные время и формат обучения
Стоимость и условия
Факультет информатики, математики и компьютерных наук НИУ ВШЭ — Нижний Новгород
Теория вероятностей для ШАД
Пройдём все темы, обозначенные в требованиях к поступащим в ШАД по теории вероятностей. Прорешаем задачи прошлых годов. Лекция и семинар каждую неделю. Автор — кандидат физико-математических наук и преподаватель мехмата МГУ — Александр Лыков.
Теория вероятностей — первостепенный предмет для подготовки к экзамену в ШАД. В письменный экзамен в ШАД обычно входит 1-2 задачи по этому предмету. Знания пригодятся и на собеседованиях и во время непосредственной учёбы, например для машинного обучения.
Автор курса
Александр Лыков
Кандидат физико-математических наук. Преподаватель теории вероятностей на мехмате МГУ с 2015 года. Автор более 30 научных работ.
Профиль Александра в ИСТИНЕ МГУ
Преподаватели
Илларионов Егор
Кандидат физико-математических наук c 2017 года. Доцент кафедры теории вероятностей мехмата МГУ.
Опыт преподавания более 8 лет по курсам теории вероятностей, математической статистики, случайным процессам и основам машинного обучения. Эксперт Центра добычи углеводородов Сколковского института науки и технологий.
Автор более 30 научных работ.
Егор будет проводить лекции.
Профиль Егора в ИСТИНЕ МГУ
Меликян Маргарита
Преподаватель на кафедре Высшей математики МФТИ и мехмате МГУ с 2019 года.
Маргарита будет проводить семинары.
Профиль Маргариты в ИСТИНЕ МГУ
Решение задачи из экзамена в ШАД
Полноценная программа
Наша цель — дать вам полноценное обучение.
Именно поэтому наша программа длится 2 месяца и включает в себя лекцию и семинар каждую неделю.
Программа включает в себя проверяемые домашние работы.
Программа по теории вероятностей
1 неделя
1 неделя
Классическая вероятность.
Комбинаторика. «Карты, кости, два слона»
2 неделя
2 неделя
Условная вероятность.
Формулы полной вероятности
Теорема Байеса.
Домашнее задание 1
3 неделя
3 неделя
Математическое ожидание дискретных случайных величин.
4 неделя
4 неделя
Геометрические вероятности.
Домашнее задание 2
5 неделя
5 неделя
Случайные величины.
Распределение случайных величин.
6 неделя
6 неделя
Математическое ожидание непрерывных случайных величин.
Домашнее задание 3
7 неделя
7 неделя
Случайные векторы.
8 неделя
8 неделя
Простейшее случайное блуждание.
Предельные теоремы.
Домашнее задание 4
График занятий
Длительность и лекций, и семинаров: 80 минут.
10 часов в неделю необходимо уделять для успешного обучения.
Старт курса: 25 ноября 2022 года
Среда
18:30 — 19:50
Семинар
Закрепление пройденного на лекции материала. Решение и разбор задач, использование изложенных на лекции концептов на практике.
Пятница
18:30 — 19:50
Лекция
Систематическое изложение материала и разбор основных теоретических концептов, необходимых для успешного написания экзамена.
Вопрос
Где будут проходить занятия?
Ответ
Занятия будут проходить онлайн, на платформе Zoom.
График занятий расположен вышеВопрос
Будут ли записи лекций и семинаров?
Ответ
Записи лекций и семинаров будут доступны в вашем личном аккаунте на нашей платформе.
Вопрос
Какой уровень знаний необходимо иметь для курса?
Ответ
Необходимо знать темы недель 1-8 из курса по математическому анализу.
Программа курса по математическому анализу доступна по ссылке.
Вопрос
Будет ли проверка домашних работ?
Ответ
Да, проверка работ будет.
Вопрос
Если я оплачу половину курса, когда он закончится?
Ответ
Он закончится на мидтерме, включая сам мидтерм и его проверку.
Единая платформа
Мы создали единую платформу в которой есть все необходимые материалы, элементы контроля и записи занятий.
Комьюнити
Мы создаем рабочие чаты для наших программ: вы можете задать вопросы преподавателю, обсудить различные темы или общаться на общие темы.
Click to order
Ваш заказ:
Телеграм
Нажимая на кнопку оплатить, вы принимаете условия обработки персональных данных и договора-оферты.
Теория вероятностей | Encyclopedia.com
История теории вероятностей
Счет
Эксперименты
Правила вероятностей
Эмпирическая вероятность
Использование вероятностей
Ресурсы в области практического применения математики, связанные с теорией вероятностей
вероятность того, что данное событие произойдет. Шанс или вероятность возникновения события (или группы отдельных событий, объединенных в одно «событие») определяется путем деления количества выбранных событий на общее количество возможных событий. Например, каждая из шести граней игральной кости имеет один шанс из шести выпасть при одном броске, вероятность 1/6. Поскольку половина граней игральной кости — четные числа, вероятность выпадения четного числа при любом броске равна 1/2.
Впервые вдохновленная проблемами, с которыми столкнулись игроки семнадцатого века, теория вероятностей превратилась в одну из самых полезных областей математики, находящую применение во многих различных науках и отраслях, включая, конечно же, азартные игры.
Раздел математики, известный как теория вероятностей, был вдохновлен проблемами азартных игр. Самая ранняя работа была выполнена Джироламо Кардано (1501-1576), итальянским математиком, врачом и игроком. В его руководстве Liber de Ludo Aleae, Кардано обсуждает многие из основных концепций вероятности вместе с систематическим анализом проблем с азартными играми. К сожалению, работа Кардано мало повлияла на развитие вероятности, потому что его руководство, которое не появлялось в печати до 1663 г., не получило должного внимания.
В 1654 году другой игрок по имени Шевалье де Мере предложил игру в кости, которая, по его мнению, принесет прибыль. Он готов поспорить даже на деньги, что сможет выбросить хотя бы одну 12 из 24 бросков двух костей. Однако, когда Шевалье начал терять деньги, он попросил своего друга-математика Блеза Паскаля (1623–1662) проанализировать это предложение. Паскаль определил, что это предложение будет проигрывать примерно в 51% случаев. Вдохновленный этим предложением, Паскаль начал изучать больше таких задач. Он обсуждал их с другим известным математиком, Пьером де Ферма (1601-1665), и вместе они заложили основы теории вероятностей.
Теория вероятностей занимается определением взаимосвязи между количеством повторений определенного события и числом повторений любого события. Например, сколько раз выпадет орел при 100-кратном подбрасывании монеты. Определение вероятностей можно сделать двумя способами; теоретически и эмпирически. Пример подбрасывания монеты помогает проиллюстрировать разницу между двумя подходами. Используя теоретический подход, мы заключаем, что в каждом броске есть две возможности: орел или решка. Предполагая, что каждое событие равновероятно, вероятность того, что монета выпадет орлом, составляет 1/2 или 0,5. Эмпирический подход не использует предположение о равной вероятности. Вместо этого проводится настоящий эксперимент по подбрасыванию монеты и подсчитывается количество выпавших голов. Тогда вероятность равна количеству выпавших орлов, деленному на общее количество подбрасываний.
Теоретический подход к определению вероятностей требует способности подсчитывать количество вариантов, в которых могут произойти определенные события. В некоторых случаях подсчет прост, потому что событие может произойти только одним способом. Например, есть только один способ, при котором на одном броске кости выпадет 4. Однако в большинстве случаев подсчет не всегда является легким делом. Представьте, что вы пытаетесь подсчитать, сколько способов получить пару в 5-карточном покере.
Фундаментальный принцип подсчета часто используется, когда из одного и того же набора объектов делается множество выборок. Предположим, мы хотим узнать, сколько различных способов четыре человека могут выстроиться в карнавальную очередь. Первое место в очереди может занять любой из четырех человек. Вторую может занять любой из трех человек, которые остались. Третье место может быть заполнено любым из двух оставшихся людей, а четвертое место занимает последний человек. Таким образом, общее количество способов, которыми четыре человека могут составить линию, равно произведению 4×3×2×1 = 24. Это произведение можно сократить до 4! (читай «4 факториала»). В общем, произведение натуральных чисел от 1 до n можно обозначить как n! что равно n× (n-1)× (n-2)×…2× 1. Следует отметить, что 0! по определению равен 1,
Приведенный выше пример карнавальной линии иллюстрирует ситуацию с перестановками. Перестановка — это любое расположение n объектов в определенном порядке. Как правило, число перестановок n объектов равно n!. Теперь предположим, что мы хотим построить линию, используя только двух из четырех человек. В этом случае любой из четырех человек может занять первое место, а любой из трех оставшихся людей может занять второе место. Следовательно, количество возможных сочетаний или перестановок двух человек из группы из четырех человек, обозначенное как P 4,2 равно 4×3 = 12. В общем случае количество перестановок n объектов, взятых по r за раз, равно
P n,r = n × (n-1) × (n- 2) × … × (n-r+1)
Более компактно это можно записать как P n,r = n!/(n-r)!
Во многих случаях порядок, в котором объекты выбираются из группы, не имеет значения. Например, мы можем захотеть узнать, сколько разных клубов из 3 человек можно сформировать из 125 студентов. Используя перестановки, в некоторых клубах будут одни и те же люди, просто расположенные в другом порядке. Мы только хотим подсчитать количество клубов, в которых есть разные люди. В этих случаях, когда порядок не важен, мы используем так называемую комбинацию. В общем, количество комбинаций обозначается как C n,r или
равно P n,r /r! или C n,r = n!/r!× (n-r)! Для нашего примера с клубом количество различных клубов из трех человек, которые могут быть сформированы из 125 студентов, равно C125,3 или 125!/3!× 122! = 317 750.
Теория вероятностей занимается определением вероятности того, что определенное событие произойдет во время данного случайного эксперимента. В этом смысле эксперимент — это любая ситуация, связанная с наблюдением или измерением. Случайные эксперименты — это эксперименты, результаты которых могут различаться независимо от начальных условий, и которые до сих пор будут называться просто экспериментами.
Результаты, полученные в ходе эксперимента, называются исходами. Когда бросается кубик, результатом является число, указанное на верхней стороне. Для любого эксперимента множество всех результатов называется выборочным пространством. Выборочное пространство S в примере с игральной костью обозначается S=, что представляет собой все возможные числа, которые могут получиться в результате броска игральной кости. Обычно мы рассматриваем выборочные пространства, в которых все исходы равновероятны.
Выборочное пространство эксперимента классифицируется как конечное или бесконечное. Когда существует ограничение на количество результатов в эксперименте, например, при выборе одной карты из колоды карт, пространство выборки является конечным. С другой стороны, бесконечное выборочное пространство возникает, когда количество результатов не ограничено, например, когда дротик брошен в цель с континуумом точек.
В то время как выборочное пространство описывает множество всех возможных результатов эксперимента, событие — это любое подмножество выборочного пространства. При броске двух игральных костей набор исходов события, такого как сумма 4 на двух игральных костях, представлен как Е =.
В некоторых экспериментах оцениваются несколько событий, и для описания связи между ними требуется теория множеств. События могут быть объединены в союзы, пересечения и дополнения. Объединение двух событий A и B — это событие, которое содержит все исходы, содержащиеся в событиях A и B. Математически оно представляется как A ∩ B. Пересечение одних и тех же двух событий — это событие, которое содержит только исходы, присутствующие как в A, так и в B, и обозначается A ∩ B. Дополнение события A, представленное A ´ , это событие, которое содержит все результаты выборочного пространства, не найденные в A.
Мы можем видеть, как теория множеств используется для математического описания результатов реальных экспериментов. Предположим, что A представляет событие, в котором при первом броске выпадает 4, а B представляет событие, в котором общее число на костях равно 5.
A = {(4,1), (4,2), (4 ,3), (4,4), (4,5), (4,6)} и
B = {(3,2), (2,3), (1,4)}
Соединение множество A∪B включает в себя все исходы из обоих множеств,
Составной набор A∩B включает только события, общие для обоих наборов. Наконец, дополнение события A будет включать все события, в которых 4 не выпало первым.
Если предположить, что все исходы в пространстве выборки равновероятны, то вероятность события А равна числу возможных вариантов возникновения события, m, деленному на общее число возможных исходов, n. Символически обозначим вероятность события A как P(A) = m/n. Пример этого иллюстрируется рисунком из колоды карт. Чтобы найти вероятность такого события, как получение туза при извлечении одной карты из колоды карт, мы должны знать количество тузов и общее количество карт. Каждый из 4 тузов представляет занятость события, в то время как все 52 карты представляют место выборки. Тогда вероятность этого события составляет 4/52 или 0,08.
Используя характеристики наборов выборочного пространства и события, можно создать основные правила для вероятности. Во-первых, поскольку m всегда равно или меньше n, вероятность любого события всегда будет числом от 0 до 1. Во-вторых, если событие обязательно произойдет, его вероятность равна 1. Если точно не произойдет , его вероятность равна 0. В-третьих, если два события взаимоисключающие, то есть они не могут произойти одновременно, то вероятность того, что одно из них произойдет, равна сумме их вероятностей. Например, если событие А представляет собой выпадение 6 на игральной кости, а событие В представляет собой выпадение 4, вероятность того, что произойдет одно из этих событий, составляет 1/6 + 1/6 = 2/6 или 0,33. Наконец, сумма вероятностей того, что событие произойдет и что оно не произойдет, равна 1,9.0003
Третье вышеприведенное правило представляет собой частный случай сложения вероятностей. Во многих случаях два события не исключают друг друга. Предположим, мы хотим узнать вероятность того, что выпадет либо красная карта, либо король. Эти события не являются взаимоисключающими, потому что мы можем выбрать красную карточку, которая также является королем. Вероятность любого из этих событий в данном случае равна сумме отдельных вероятностей за вычетом суммы объединенных вероятностей. В этом примере вероятность получения короля составляет 4/52, вероятность получения красной карты составляет 26/52, а вероятность получения красного короля составляет 2/52. Следовательно, шансы вытянуть красную карточку или короля составляют 4/52 + 26/52 — 2/52 = 0,54.
Часто вероятность одного события зависит от присутствия другого события. Если мы выберем человека наугад, вероятность того, что он владеет яхтой, мала. Однако, если мы узнаем, что этот человек богат, вероятность, безусловно, будет выше. Такие события, в которых вероятность одного события зависит от другого, называются условными вероятностями. Математически, если событие A зависит от другого события B, то условная вероятность обозначается как P(AǀB) и равна P(A∩B)/P(B), когда P(B)∩= 0. Условные вероятности полезны. всякий раз, когда мы хотим ограничить наш расчет вероятности только теми случаями, в которых происходят как событие A, так и событие B.
События не всегда зависят друг от друга. Эти независимые события имеют одинаковую вероятность независимо от того, произойдет ли другое событие. Например, вероятность прохождения теста по математике не зависит от вероятности того, что пойдет дождь.
Используя идеи зависимых и независимых событий, можно разработать правило для определения вероятностей множественных событий. В общем, для зависимых событий A и B вероятность того, что оба события произойдут, равна P (A ∩ B) = P (B) × P (AǀB). Если события A и B независимы, то P(A∩B) = P(A)×P(B). Предположим, мы провели эксперимент, в котором мы бросили кубик и подбросили монету. Эти события независимы, поэтому вероятность выпадения 6 и решки будет (1/6) × 1/2 = 0,08.
Теоретический подход к определению вероятностей имеет определенные преимущества; вероятности можно вычислить точно, и эксперименты с многочисленными испытаниями не нужны. Однако это зависит от классического представления о том, что все события в ситуации равновозможны, и во многих случаях это неверно. Прогнозирование погоды является примером такой ситуации. В любой день будет солнечно или пасмурно. Если предположить, что все возможности равновероятны, то вероятность солнечного дня будет равна 1/2, и ясно, что это чепуха.
КЛЮЧЕВЫЕ ТЕРМИНЫ
Комбинация — Метод подсчета событий, порядок которых не имеет значения.
Условные вероятности — Вероятность наступления события при условии наличия связанного с ним второго события.
Эмпирический подход — Метод определения вероятностей на основе экспериментов.
Событие — Набор событий, удовлетворяющих желаемому условию.
Независимые вероятности — Вероятность занятия одного события не зависит от занятия или отсутствия занятия другого события.
Закон больших чисел — Математическое понятие, утверждающее, что по мере увеличения числа испытаний эмпирического эксперимента частота события, деленная на общее число испытаний, приближается к теоретической вероятности.
Математическое ожидание — Средний результат, ожидаемый при многократном повторении эксперимента или пари.
Взаимоисключающие — Относится к событиям, которые не могут произойти одновременно.
Итоги — Результат одного эксперимента.
Перестановка — Любое расположение объектов в определенном порядке.
Пространство выборки — Набор всех возможных результатов любого эксперимента.
Теоретический подход — Метод определения вероятностей путем математического расчета количества возможных событий.
Эмпирический подход к определению вероятностей опирается на данные реальных экспериментов для определения приблизительных вероятностей вместо предположения о равной вероятности. Вероятности в этих экспериментах определяются как отношение частоты появления события f(E) к количеству испытаний в эксперименте n, что символически записывается как P(E) = f(E)/n. Если наш эксперимент включает в себя подбрасывание монеты, эмпирическая вероятность выпадения орла равна количеству выпадения орла, деленному на общее количество подбрасываний.
Связь между этими эмпирическими вероятностями и теоретическими вероятностями определяется законом больших чисел. В нем говорится, что по мере увеличения числа испытаний эксперимента эмпирическая вероятность приближается к теоретической вероятности. Это имеет смысл, поскольку мы ожидаем, что если мы будем бросать кубик много раз, каждое число будет выпадать примерно в 1/6 случаев. Изучение эмпирических вероятностей известно как статистика.
Теория вероятностей была первоначально разработана, чтобы помочь игрокам определить наилучшую ставку в данной ситуации. Предположим, у игрока есть выбор между двумя ставками; она могла либо поставить 4 доллара на бросок монеты и получить 8 долларов, если выпадет орел, либо поставить 4 доллара на бросок кости и заработать 8 долларов, если выпадет 6. Используя идею математического ожидания, она могла определить, какая ставка лучше. Математическое ожидание определяется как ожидаемый средний результат, когда эксперимент или пари повторяются большое количество раз. В своей простейшей форме он равен произведению суммы, которую игрок может выиграть, и вероятности события. В нашем примере игрок рассчитывает выиграть 8 долларов × 0,5 = 4 доллара при подбрасывании монеты и 8 долларов × 0,17 = 1,33 доллара при броске кости. Поскольку ожидание при подбрасывании монеты выше, эта ставка лучше.
Когда возможно более одной выигрышной комбинации, ожидание равно сумме индивидуальных ожиданий. Рассмотрим ситуацию, в которой человек может купить один из 500 лотерейных билетов, где первый приз составляет 1000 долларов, а второй — 500 долларов. В этом случае его или ее ожидание составляет 1000 долларов × (1/500) + 500 долларов × (1/500) = 3 доллара. Это означает, что если бы одна и та же лотерея повторялась много раз, можно было бы ожидать выигрыша в среднем 3 доллара с каждого купленного билета.
КНИГИ
Каплан, Майкл и Эллен Каплан. Шансы есть. . . . : Приключения в вероятности. Нью-Йорк: Viking Adult, 2006.
Розенталь, Джеффри С. Удар молнии: любопытный мир вероятностей. Вашингтон, округ Колумбия: Джозеф Генри Пресс, 2006.
Росс, Шелдон. Первый курс теории вероятностей. Аппер-Сэдл-Ривер, Нью-Джерси: Prentice Hall, 2005.
Перри Романовски
Элементарная теория вероятностей | Знания о здоровье
Статистика: Элементарная теория вероятностейВероятность определяет вероятность того, что определенное событие произойдет. Он определяется как положительное число от 0 (событие невозможно) до 1 (событие обязательно). Таким образом, чем выше вероятность данного события, тем более вероятно, что оно произойдет. Если А является определенным событием, то вероятность наступления А выражается как Р(А). Вероятность может быть выражена несколькими способами. частотный подход заключается в наблюдении ряда конкретных событий из общего числа событий. Таким образом, мы можем сказать, что вероятность рождения мальчика равна 0,52, потому что из большого числа одноплодных рождений мы наблюдаем 52% мальчиков. А 9Подход, основанный на модели 0167 , заключается в том, что модель или механизм определяет событие; таким образом, вероятность выпадения «1» на беспристрастном кубике равна 1/6, поскольку существует 6 возможностей, каждая из которых равновероятна, и все они складываются в единицу. Подход, основанный на мнении , заключается в том, что мы используем наш прошлый опыт, чтобы предсказать будущее событие, поэтому мы можем дать вероятность того, что наша любимая футбольная команда выиграет следующий матч, или будет ли завтра дождь.
Имея два события A и B, мы часто хотим определить вероятность того или иного события или обоих событий.
Правило сложения
Правило сложения используется для определения вероятности возникновения хотя бы одного из двух (или более) событий. В общем, вероятность события A или B определяется как:
P(A или B) = P(A) + P(B) – P(A и B)
Если A и B являются взаимоисключающими , это означает, что они не могут встречаться вместе, то есть P(A и B)=0. Следовательно, для взаимоисключающих событий вероятность возникновения А или В определяется выражением:
P(A или B) = P(A) + P(B)
Пример. Если событие A состоит в том, что человек имеет группу крови O, а событие B состоит в том, что у него группа крови B, то эти события взаимно исключительным, поскольку человек может быть либо одним, либо другим. Следовательно, вероятность того, что данное лицо относится либо к группе О, либо к группе В, равна Р(А)+Р(В).
Правило умножения
Правило умножения определяет вероятность того, что два (или более) события произойдут одновременно. В общем, вероятность того, что произойдут события A и B, определяется как:
P(A и B) = P(A) x P(B | A) = P(B) x P(A | B)
Обозначение P(B | A) представляет собой вероятность того, что событие B произойдет при условии, что событие A произошло, когда читается символ ‘|’, является ‘данной’. Это пример условной вероятности , при условии, что событие А произошло. Например, вероятность вытянуть туза червей из хорошо перетасованной колоды составляет 1/51. Вероятность туза червей при условии, что карта красная, составляет 1/26.
Пример: если событие A — человек заболел невропатией, а событие B — диабет, то P(A|B) — это вероятность развития невропатии при условии, что он диабетик.
Если A и B являются независимыми событиями , то вероятность события B не зависит от вероятности события A (и наоборот). Другими словами, P(B | A) = P(B). Следовательно, для независимых событий вероятность того, что произойдут события A и B, определяется как:
P(A и B) = P(A) x P(B)
Пример: если событие A состоит в том, что у человека группа крови O, а событие B – в том, что он диабетик, то вероятность того, что у кого-то есть группа крови O а быть диабетиком — это P(A)xP(B), предполагая, что диабет не связан с группой крови человека.
Обратите внимание, что если A и B исключают друг друга, то P(A|B)=0
Теорема Байеса
Из приведенного выше правила умножения мы видим, что:
P(A) x P(B | A) = P(B) x P(A | B)
Это приводит к так называемой теореме Байеса:
\({\ rm{P}}\left( {\rm{B|A}}} \right) = {\rm{\;}}\frac{{{\rm{P}}\left( {\rm{ A|B}}} \right){\rm{P}}\left( {\rm{B}} \right)}}{{{\rm{P}}\left({\rm{A}} \right)}}\)
Таким образом, вероятность B при A равна вероятности A при B, умноженной на вероятность B, деленную на вероятность A.
Эта формула не подходит, если P(A)=0, то есть если A является событием, которое не может произойти.
Ниже приведен пример использования теоремы Байеса.
Чувствительность и специфичность
Результаты многих диагностических тестов представлены в виде непрерывной переменной (то есть такой, которая может принимать любое значение в заданном диапазоне), например, диастолического артериального давления или уровня гемоглобина. Однако для простоты обсуждения мы сначала предположим, что они были разделены на положительные и отрицательные результаты. Например, положительный диагностический результат «гипертонии» — это диастолическое артериальное давление выше 9.0 мм рт.ст.; тогда как для «анемии» требуется уровень гемоглобина менее 12 г/дл.
Для каждой диагностической процедуры (которая может включать лабораторное исследование взятого образца) необходимо задать ряд фундаментальных вопросов. Во-первых, если болезнь присутствует, какова вероятность того, что результат теста будет положительным? Это приводит к понятию чувствительности теста. Во-вторых, если заболевание отсутствует, какова вероятность того, что результат теста будет отрицательным? Этот вопрос относится к специфике теста. Ответить на эти вопросы можно только в том случае, если известен «истинный» диагноз. В случае органического заболевания это можно определить с помощью биопсии или, например, дорогостоящей и рискованной процедуры, такой как ангиография при заболеваниях сердца. В других ситуациях это может быть мнение «эксперта». Такие тесты обеспечивают так называемый «золотой стандарт».
Пример
Рассмотреть результаты анализа N-концевого промозгового натрийуретического пептида (NT-proBNP) для диагностики сердечной недостаточности при обследовании общей популяции у лиц старше 45 лет и у пациентов с существующий диагноз сердечной недостаточности, полученный Hobbs, Davis, Roalfe, et al (BMJ 2002) и обобщенный в таблице 1. Сердечная недостаточность была идентифицирована, когда NT-proBNP > 36 пмоль/л.
Таблица 1. Результаты анализа NT-proBNP в общей популяции старше 45 лет и у пациентов с ранее диагностированной сердечной недостаточностью (согласно Hobbs, David, Roalfe et al. , BMJ 2002)
Положительный результат теста на сердечную недостаточность мы обозначаем как T+, а положительный результат теста на сердечную недостаточность обозначается как T+, а положительный результат теста на сердечную недостаточность обозначается как T+. Распространенность сердечной недостаточности у этих субъектов составляет 103/410=0,251, или примерно 25%. Таким образом, вероятность наличия заболевания у субъекта, выбранного случайным образом из объединенной группы, оценивается как 0,251. Мы можем записать это как P(D+)=0,251.
Чувствительность теста – это доля больных, у которых также положительный результат теста. Таким образом, чувствительность определяется выражением e/(e+f)=35/103=0,340 или 34%. Теперь чувствительность представляет собой вероятность положительного результата теста (событие T+) при наличии заболевания (событие D+) и может быть записана как P(T+|D+), где ‘|’ читается как «дано».
Специфичностью теста является доля здоровых людей, дающих отрицательный результат теста. Таким образом, специфичность составляет h/(g+h)=300/307=0,977 или 98%. Теперь специфичность — это вероятность отрицательного результата теста (событие T-) при отсутствии заболевания (событие D-) и может быть записана как P(T-|D-).
Поскольку чувствительность зависит от наличия заболевания, а специфичность – от его отсутствия, теоретически они не зависят от распространенности заболевания. Например, если мы удвоим количество пациентов с истинной сердечной недостаточностью со 103 до 206 в таблице 1, так что теперь распространенность составит 103/(410+103)=20%, то мы можем ожидать, что в два раза больше пациентов будут давать положительный результат теста. Таким образом, 2×35=70 будет иметь положительный результат. В этом случае чувствительность будет 70/206=0,34, что не изменилось по сравнению с предыдущим значением. Аналогичный результат получается для специфичности.
Чувствительность и специфичность являются полезными статистическими данными, поскольку они дают согласованные результаты для диагностического теста в различных группах пациентов с различной распространенностью заболевания. Это важный момент; чувствительность и специфичность являются характеристиками теста, а не популяции, к которой применяется тест. Однако на практике, если заболевание встречается очень редко, точность, с которой можно оценить чувствительность, может быть ограниченной. Это связано с тем, что количество субъектов с заболеванием может быть небольшим, и в этом случае доля правильно диагностированных лиц будет иметь значительную неопределенность.
Два других широко используемых термина: частота ложноотрицательных результатов (или вероятность ложноотрицательных результатов), определяемая как f/(e+f)=1-чувствительность, и частота ложноположительных результатов (или вероятность ложноположительных результатов). ) или g/(g+h)=1-специфичность.
Эти концепции суммированы в таблице 2.
Таблица 2: Сводка определений чувствительности и специфичности
Это важно для соответствия. вверху, а результат теста внизу. Поскольку чувствительность = 1–P (ложноотрицательный) и специфичность = 1–P (ложноположительный), возможно, полезная мнемоника для напоминания об этом состоит в том, что «чувствительность» и «отрицательный» содержат «n» в них, а «специфичность» и «положительный». в них есть буква «р».
Прогностическая ценность теста
Предположим, к врачу обращается пациент с болью в груди, указывающей на стенокардию, и что доступны результаты исследования, описанного в таблице 3.
Таблица 3: Результаты теста на толерантность к упражнениям у пациентов с подозрением на болезнь коронарной артерии
Распространенность коронарной болезни Артери У этих пациентов 1023/1465 = 0.70. . Таким образом, врач считает, что у пациента ишемическая болезнь сердца с вероятностью 0,70. Что касается пари, можно было бы поставить шансы примерно 7:3 на то, что у пациента действительно ишемическая болезнь сердца. Теперь пациент проходит тест с физической нагрузкой, и результат положительный. Как это меняет шансы? Сначала необходимо рассчитать вероятность наличия у пациента заболевания при положительном результате теста. Из таблицы 3 930 мужчин с положительным тестом, из них 815 с ишемической болезнью сердца. Таким образом, оценка 0,70 для пациента корректируется в сторону увеличения до вероятности заболевания при положительном результате теста 815/930=0,88.
Это дает прогностическое значение положительного теста (положительное прогностическое значение):
P(D+|T+) = 0,88.
Прогностическая ценность отрицательного теста (отрицательная прогностическая ценность):
P(D-|T-) = 327/535 = 0,61.
На эти значения влияет распространенность заболевания. Например, если количество больных в таблице 3 удвоится, то прогностическая ценность положительного теста станет 1630/(1630+115)=0,9.3 и прогностическая ценность отрицательного теста 327/(327+416)=0,44.
Роль теоремы Байеса
Предположим, что событие A происходит при положительном результате нагрузочного теста, а событие B происходит при положительном результате ангиографии. Таким образом, вероятность наличия как положительного теста с физической нагрузкой, так и заболевания коронарной артерии равна P(T+ и D+). Из таблицы 3 вероятность выбрать одного мужчину с положительным тестом на физическую нагрузку и с ишемической болезнью сердца из группы 1465 мужчин составляет 815/1465=0,56.
Однако из правила умножения:
P(T+ и D+) = P(T+|D+)P(D+)
P(T+|D+)=0,80 – чувствительность теста, а P(D+)= 0,70 — распространенность коронарной болезни, поэтому P(T+ и D+)=0,80×0,70=0,56, как и раньше.
Теорема Байеса позволяет связать прогностическую ценность положительного теста с чувствительностью теста, а прогностическую ценность отрицательного теста связать со специфичностью теста. Теорема Байеса позволяет сочетать предварительные оценки шансов диагноза с возможными результатами теста для получения так называемой «апостериорной» оценки диагноза. Он отражает процедуру вынесения клинического суждения.
В терминах теоремы Байеса диагностический процесс резюмируется следующим образом: } \right) = {\ rm {\;}} \ frac {{{\ rm {P}} ({\ rm {T}} + | {\ rm {D}} + ) {\ rm {P}} \left( {{\rm{D}} + } \right)}}{{{\rm{P}}\left( {{\rm{T}} + } \right)}}\)
Вероятность P(D+) — это априорная вероятность, а P(D+|T+) — апостериорная вероятность.
Теорему Байеса полезно обобщить, если мы выражаем ее в терминах вероятности события, а не вероятности. Формально, если вероятность события равна p , то коэффициенты определяются как p / (1- p ). Вероятность того, что у человека есть ишемическая болезнь сердца, до тестирования по таблице равна 0,70, поэтому шансы равны 0,70/(1-0,70)=2,33 (что также можно записать как 2,33:1).
Отношение правдоподобия
С точки зрения шансов мы можем обобщить теорему Байеса, используя так называемое положительное отношение правдоподобия (LR+), определяемое как:
\({\rm{LR}} + = {\ rm {\;}} \ frac {{{\ rm {P}} ({\ rm {T}} + | {\ rm {D}} + )}} {{{\ rm {P}} ({\rm{T}} + |D — )}} = \frac{{{\rm{Чувствительность}}}}{{1 — {\rm{Специфичность}}}}\)
Таким образом, отношение правдоподобия положительного теста — это вероятность получения положительного результата, когда у субъекта есть заболевание, к вероятности положительного результата теста при условии, что у субъекта , а не есть заболевание.
Можно показать, что теорему Байеса можно обобщить следующим образом:
Вероятность заболевания после теста = Вероятность заболевания до теста x отношение правдоподобия , поэтому вероятность заболевания после теста составляет 3,08×2,33=7,2. Это можно проверить по рассчитанной ранее посттестовой вероятности 0,88, так что посттестовые шансы составляют 0,88/(1–0,88)=7,3. (Это отличается от 7.2 из-за ошибок округления в расчетах.)
Пример
Этот пример иллюстрирует теорему Байеса на практике путем вычисления положительного прогностического значения для данных таблицы 3.
Мы используем формулу влево ( {{\ rm {D}} + {\ rm {| T}} + } \ right) = {\ rm {\;}} \ frac {{{\ rm {P}} ({\ rm {T }} + |{\rm{D}} + ){\rm{P}}\left( {{\rm{D}} + } \right)}}{{{\rm{P}}\left( {{\rm{T}} + } \right)}}\)
Из таблицы: P(T+)=930/1465=0,63, P(D+)=0,70 и P(T+|D+)= 0,80, таким образом:
Положительное прогностическое значение = (0,8 x 0,7)/0,63 = 0,89
. .. это то, что мы рассчитали ранее (за исключением небольшой ошибки округления).
Пример
Распространенность заболевания составляет 1 на 1000, и существует тест, который может выявить его с чувствительностью 100% и специфичностью 95%. Какова вероятность того, что у человека есть заболевание при положительном результате теста?
Многие люди, не задумываясь, могут предположить, что ответ будет 0,95, специфичность.
Используя теорему Байеса, однако: \frac{{{\rm{Чувствительность\;}} \times {\rm{Распространенность}}}}{{{\rm{Вероятность\;положительного\;результата}}}}\)
Для расчета вероятности положительного результата рассмотрим 1000 человек, из которых один человек болен. Тест обязательно обнаружит этого человека. Однако он также даст положительный результат у 5% из 999 человек без заболевания. Таким образом, общее количество срабатываний равно 1+(0,05×999)=50,95 и вероятность положительного результата 50,95/1000=0,05095.
Таким образом:
\({\rm{P}}\left( {{\rm{D}} + {\rm{|T}} + } \right) = {\rm{\;}}\ frac{{1{\rm{\;}} \times 0,001}}{{0,05095}} = 0,02\)
Полезность теста будет зависеть от распространенности заболевания в популяции, к которой он относится. было применено. В общем, полезный тест — это тот, который значительно изменяет предтестовую вероятность. Если заболевание очень редкое или очень распространенное, то вероятности заболевания при отрицательном или положительном тесте относительно близки, и поэтому тест имеет сомнительную ценность.
Независимость и взаимоисключающие события
В таблице 3, если бы результаты теста на толерантность к физической нагрузке были совершенно не связаны с наличием у пациента ишемической болезни сердца, то есть они были бы независимыми, мы могли бы ожидать:
P(D+ и T+ )= P(T+) x P(D+).
Если мы оценим P(D+ и T+) как 815/1465=0,56, P(D+)=1023/1465=0,70 и P(T+)=930/1465=0,63, то разница:
P(D+ и Т+) – P(D+)P(T+)=0,56–(0,70×0,63)=0,12
.…является грубой мерой того, являются ли эти события независимыми. В этом случае размер разницы предполагает, что они не являются независимыми. Очевидно, что вопрос о том, являются ли события независимыми, является важным и относится к статистическому выводу.
В общем, перед клиницистом стоит не простой вопрос «есть ли у больного заболевание сердца?», а целый набор различных диагнозов. Обычно эти диагнозы можно считать взаимоисключающими; то есть, если у пациента есть одно заболевание, у него нет ни одного из альтернативных дифференциальных диагнозов. Однако, особенно у пожилых людей, у пациента может быть ряд заболеваний, которые все имеют сходные симптомы.
Иногда учащиеся путают независимые события и взаимоисключающие события, но из вышеизложенного видно, что взаимоисключающие события не могут быть независимыми. Понятия независимости и взаимоисключающих событий используются для обобщения теоремы Байеса и ведут к анализу решений в медицине.
Ссылки
- Статистические примечания BMJ http://bmj.bmjjournals.com/cgi/content/full/329/7458/168
- Кэмпбелл М.Дж., Мачин Д. и Уолтерс С.Дж. Медицинская статистика: подход, основанный на здравом смысле 4-е изд.