Теория вероятностей и статистика: Кафедра прикладной математики и информатики (Нижний Новгород) – Национальный исследовательский университет «Высшая школа экономики»

Содержание

Кафедра прикладной математики и информатики (Нижний Новгород) – Национальный исследовательский университет «Высшая школа экономики»

Публикации

Application of an Adaptive Domain-Specific Interface in a Decision-Support System for Planning Railroad Technical Services

Ulitin, B., Babkin, E., Babkina, T.

In bk.: Model-Driven Organizational and Business Agility. MOBA 2022. Lecture Notes in Business Information Processing, vol 457. Iss. 457: Model-Driven Organizational and Business Agility. MOBA 2022. Switzerland: Springer, 2022. P. 110-124.

Все публикации

Также были подведены итоги Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ в 2022 году и реализации Программы привлечения российских постдоков в НИУ ВШЭ для выполнения научных проектов в 2021/22 учебном году. Доклады по всем трем вопросам сделал проректор НИУ ВШЭ Дмитрий Дагаев.

«Атмосфера и люди — самое ценное, что есть на программе, — все те, кто искренне любит свою профессию, подходит с идеями и со смыслами к своей работе. А если мы работаем с вдохновением, то и показатели эффективности у образовательной программы будут высокими» — подведены итоги работы академических руководителей и заведующих кафедрами в 2021/2022 году по ключевым показателям эффективности. Результаты оценки прокомментировали сотрудники НИУ ВШЭ – Нижний Новгород.

В Высшей школе экономики стартовал очередной конкурс на замещение должностей профессорско-преподавательского состава (ППС) в Москве, Санкт-Петербурге, Нижнем Новгороде и Перми. Конкурсная заявка предусматривает выбор претендентом предпочтительной карьерной траектории — академической, образовательно-методической или практико-ориентированной, и этот выбор должен быть подтвержден данными в анкете.

В рамках всероссийского проекта «Урок цифры» в лицее №38 прошел открытый урок «Искусственный интеллект в образовании».  Преподаватель  кафедры прикладной математика и информатики  НИУ ВШЭ – Нижний Новгород Санжар Досов рассказал школьникам 9-11 классов о том, как нейронные сети меняют нашу жизнь.

В XXI веке целые индустрии научились использовать искусственный интеллект для мышления, языки программирования для общения, а компьютерное зрение – для анализа визуальной информации.

Все новости

О кафедре

Кафедра ПМИ создана в 2006 году как выпускающая кафедра по направлению «Прикладная математика и информатика».

Целью деятельности кафедры «Прикладной математики и информатики» является подготовка высококвалифицированных специалистов (бакалавров и магистров) по направлению 010500 «Прикладная математика и информатика», обладающих знаниями и квалификацией, необходимыми для профессионального моделирования и информационного обеспечения экономических и бизнес процессов, анализа и обработки данных.

Научная деятельность

Кафедра выполняет межкафедральные (кафедры Информационных систем и технологий, Математики и др.) исследовательские проекты, национальные проекты в составе общих исследовательских групп (РФФИ, проекты Минобрнауки РФ и др.) с участием  партнеров из Института прикладной математики им. М. Келдыша РАН, Математического института им. В. Стеклова РАН, Института прикладной физики РАН, МГУ им. М. Ломоносова, ННГУ им Н. Лобачевского. Осуществляется международное сотрудничество с различными научными центрами Европы и США.

Теория вероятностей и математическая статистика для инженерно-технических направлений

  • Скопировать в буфер библиографическое описание

    Энатская, Н. Ю.  Теория вероятностей и математическая статистика для инженерно-технических направлений : учебник и практикум для вузов / Н.  Ю. Энатская, Е. Р. Хакимуллин. — Москва : Издательство Юрайт, 2020. — 399 с. — (Высшее образование). — ISBN 978-5-534-02662-7. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/450364 (дата обращения: 06.11.2022).

  • Добавить в избранное

Учебник и практикум для вузов

  • Нравится
  • 1 Посмотреть кому понравилось
  • Поделиться
    • Описание
    • Программа курса
    • Видео: 50
    • Тесты: 5
    • Задания: 43
    • Нет в мобильном приложении
    Ознакомиться
    • Аннотация
    • Программа курса
    • Медиаматериалы 50
    • Тесты 5

    Курс прошел практическую апробацию и написан на основе читаемых авторами на протяжении многих лет одноименных курсов. Представленные в курсе дисциплины дают студентам ориентацию при решении многих практических задач ряда направлений, составляют начальный уровень для получения более широкого и глубокого образования в области теории вероятностей. Материал приводится на уровне, требующем для понимания математических основ начальных курсов вузов, таких как классический математический анализ и элементы линейной алгебры.

    Что такое теория вероятностей?

    Теория вероятностей — это раздел математики, посвященный анализу случайных явлений. Это важный навык для специалистов по данным, использующих данные, на которые повлияла случайность.

    Поскольку случайность существует повсюду, использование теории вероятностей позволяет анализировать случайные события. Цель состоит в том, чтобы определить вероятность возникновения события, часто используя числовую шкалу от 0 до 1, где число «0» указывает на невозможность, а «1» указывает на уверенность.

    Классический пример — подбрасывание монеты, где может быть два возможных варианта: орел или решка. Здесь вероятность выпадения орла или решки при одном броске составляет 50%. При проведении собственного эксперимента вы можете обнаружить, что результаты могут различаться. Но если вы продолжите подбрасывать монету, результат станет ближе к 50/50.

    Вероятность играет жизненно важную роль во многих областях научных исследований. Исследователи могут интегрировать неопределенность в свои исследовательские модели как способ описания своих результатов. Это позволяет0009 прогностическое распределение результатов, связанных с тем, что могло наблюдаться в прошлом.

    Случайность и неопределенность — популярные темы, связанные с вероятностью. В бестселлерах Нассима Талеба «Черный лебедь» и «Одураченные случайностью, » утверждается, что редкие события обычно имеют большее значение, чем обычные, потому что размер их эффекта не так ограничен. Кроме того, из-за их редкости результаты вряд ли будут определены.

    Талеб популяризировал то, что он называет событием «черного лебедя», которое случается редко, имеет катастрофические последствия, когда оно действительно происходит, и может быть объяснено задним числом таким образом, что многие считают, что это было на самом деле предсказуемо.

    Вероятность обычно используется исследователями данных для моделирования ситуаций, когда эксперименты, проведенные в одинаковых обстоятельствах, дают разные результаты (например, в случае бросания игральной кости или монеты).

    Он также имеет множество практических применений в деловом мире. Возьмем, к примеру, страховую отрасль, где актуарные записи отображают ожидаемую продолжительность жизни людей определенного возраста. Вместо того, чтобы предсказывать, что произойдет с каждым отдельным человеком, цель состоит в том, чтобы зафиксировать коллективный результат, охватывающий большое количество людей.

    Аналогичные подходы применялись в генетике, где оценка вероятности генетического заболевания связана с частотой возникновения, а не с прогнозами относительно конкретного человека.

    Еще одно распространенное применение вероятности также широко применяется в клинических испытаниях, когда изучаются новые методы лечения заболеваний, лекарства или хирургические методы лечения. При оценке того, можно ли считать лечение успешным или неудачным, клиническое испытание направлено на определение того, является ли новое лечение более успешным, чем преобладающий стандарт лечения.

    В качестве примера здесь можно привести тестирование эффективности новой вакцины, такое как тестирование вакцины Солка на полиомиелит, проведенное в 1954 году с участием почти двух миллионов детей. Вакцина, организованная Службой общественного здравоохранения США, почти устранила полиомиелит как проблему здравоохранения в промышленно развитых странах.

    Существует три типа вероятности, которые обычно используются для сбора данных статистического вывода. К ним относятся: 

    Классический

    Этот тип вероятности, также известный как аксиоматический метод, включает набор связанных с ним аксиом (правил). Например, у вас может быть правило, согласно которому вероятность должна быть больше 0,5%, чтобы оно было действительным.

    Относительная частота

    Это включает в себя рассмотрение коэффициента возникновения единичного события по сравнению с общим числом результатов. Этот тип вероятности часто используется после сбора данных эксперимента для сравнения подмножества данных с общим объемом собранных данных.

    Субъективная вероятность

    При использовании субъективного подхода вероятность представляет собой вероятность того, что что-то произойдет, исходя из собственного опыта или личного суждения. Здесь нет формальных расчетов субъективной вероятности, поскольку она основана на чьих-то убеждениях, суждениях и личных рассуждениях.

    Например, во время спортивного мероприятия болельщики одной команды рассказывают, за кого они болеют. Это основано на фактах или мнениях, которых они придерживаются лично относительно игры, двух играющих команд и шансов на победу команды.

    Теория вероятностей — это инструмент, используемый исследователями, предприятиями, инвестиционными аналитиками и многими другими для управления рисками и анализа сценариев.

    Эпидемиология

    Возьмите эпидемиологию, которая является наукой о распространении болезней. Исследователи в этой области изучают частоту заболеваний, оценивая, как вероятность различается между группами людей. Современным примером этого является использование вероятности эпидемиологами для оценки причинно-следственной связи между воздействием и заболеванием коронавирусом.

    Теория вероятностей часто используется для раскрытия ключевых факторов, обозначающих взаимосвязь между воздействием и рисками для здоровья. Целью здесь является количественная оценка неопределенности. Эти знания могут подтолкнуть к курсу действий, основанному на наилучших результатах для тех, кто страдает от различных заболеваний.

    Страхование

    Актуарии , которые часто работают в страховой отрасли, в основном используют вероятность, статистику и другие инструменты обработки данных для расчета вероятности неопределенных будущих событий, происходящих в течение определенного периода времени. Затем они применяют другие концепции данных, чтобы определить сумму денег, которую необходимо отложить на покрытие будущих убытков.

    Малый бизнес

    Есть еще мир малого бизнеса, где владельцы не всегда могут полагаться на свои догадки и инстинкты, чтобы управлять успешной компанией. В сегодняшней конкурентной бизнес-среде вероятностный анализ может предоставить предпринимателям ключевые показатели, указывающие путь к наиболее прибыльным и продуктивным путям. Этот анализ предлагает контролируемый способ прогнозирования потенциальных результатов.

    Например, если коммерческое предприятие рассчитывает ежемесячно получать от 500 000 до 750 000 долларов дохода, график начнется с 500 000 долларов в нижней части и 750 000 долларов в верхней части. Для типичного распределения вероятностей график будет напоминать колоколообразную кривую, где наименее вероятные исходы располагаются ближе к крайним концам диапазона, а наиболее вероятные — ближе к средней точке крайних значений.

    Метеорология

    Прогноз погоды служит еще одним примером теории вероятностей. Вероятность осадков или суровой погоды привязана к конкретному географическому положению. В результате прогнозирование можно рассматривать как сочетание вероятности возникновения погодных явлений и охвата этого события. Согласно информационному заявлению Американского метеорологического общества: 

    «Прогноз вероятности включает числовое выражение неопределенности в отношении прогнозируемого количества или события. В идеале все элементы (температура, ветер, осадки и т. д.) прогноза погоды должны включать информацию, точно определяющую присущую им неопределенность. Опросы постоянно указывали на то, что пользователям нужна информация о неопределенности или достоверности прогнозов погоды. Широкое распространение и эффективная передача информации о неопределенности прогнозов, вероятно, принесет существенные экономические и социальные выгоды, поскольку пользователи могут принимать решения, которые четко учитывают эту неопределенность».

    Исследователям данных необходимо учитывать ряд преимуществ и недостатков с вероятностью .

    Классический

    Классический метод вероятности используется, когда все вероятные исходы имеют равную вероятность наступления и каждый исход известен заранее. В приведенном выше примере с подбрасыванием монеты используется классический подход к вероятности. Классический подход предлагает простой подход к примерам из реального мира, который легко усваивается теми, кто не имеет математического или естественнонаучного образования.

    Что касается ограничений, то классический подход не подходит для проектов с бесконечным числом возможных результатов. Это также неэффективно в сценариях, где каждый исход не равновероятен, как в случае бросания взвешенного игрального кубика. Эти ограничения влияют на способность этого подхода решать более сложные задачи.

    Относительная частота

    В отличие от классического подхода, относительная частота дает преимущество в возможности обработки сценариев, в которых результаты имеют различную теоретическую вероятность (или вероятность) возникновения. Этот подход также может управлять вероятностной ситуацией, когда возможные результаты неизвестны.

    Хотя вы можете использовать вероятность относительной частоты в более разнообразных ситуациях и настройках, чем классическая вероятность, у нее есть несколько ограничений. Первое ограничение относительной частоты связано с проблемой «бесконечных повторений». Вот где эксперименты, обладающие бесконечным числом раз, не могут быть проанализированы с помощью этой теории. Таким образом, хотя можно провести большое количество испытаний, это число не может быть бесконечным.

    Субъективный

    Проблемы, которые выигрывают от субъективной вероятности, это те, которые требуют некоторого уровня веры, чтобы сделать их возможными. Например, кандидат, проигравший в опросах, может использовать субъективную вероятность, чтобы обосновать свое участие в гонке.

    Субъективная вероятность также выигрывает от того, что известно как проблема эталонного класса. В задаче с эталонным классом присвоение вероятности определенному событию может потребовать классификации этого события. Эта классификация может быть субъективной, и поэтому изменение классификации может изменить вероятность события.

    Например, если вы хотите определить вероятность того, что человек заразится инфекционным заболеванием, таким как COVID-19, нам нужно начать с оценки того, какие классы людей имеют отношение к проблеме. Именно здесь могут быть установлены различные эталонные классы. Можно использовать широкий класс, такой как «все жители США». Или его можно сузить, скажем, до «всех жителей штатов X, Y и Z, где происходит 80% смертей». Другими словами, в зависимости от выбранного эталонного класса будут возникать разные вероятности.

    Вероятность позволяет ученым, работающим с данными, оценить достоверность результатов конкретного исследования или эксперимента. Эксперимент — это запланированное исследование, которое проводится в контролируемых условиях. Когда результат еще не определен заранее, эксперимент называется случайным экспериментом. Дважды подбрасывание монеты является примером случайного эксперимента.

    Современные специалисты по обработке и анализу данных должны иметь представление об основных понятиях теории вероятностей, включая ключевые понятия, связанные с распределением вероятностей, статистической значимостью, проверкой гипотез и регрессией. Узнайте больше о концепциях статистики, которые регулярно используют специалисты по обработке и анализу данных; распределение вероятностей является лишь одним из них.

    Согласно прогнозам Бюро трудовой статистики (BLS), с 2020 по 2030 год количество рабочих мест для специалистов по информатике увеличится на 22 %. По мере того как организации ищут новые решения для сбора и анализа огромных объемов данных, специалисты по данным будут пользоваться большим спросом в самых разных секторах и отраслях по всему миру, а их средняя зарплата составит 126,8 тысяч долларов в год. Для многих из этих вакансий потребуется степень магистра в области компьютерных наук или смежных областях. Ознакомьтесь с онлайн-магистерскими программами по науке о данных и найдите лучшую степень для своих карьерных целей.

    Последнее обновление: апрель 2022 г.

    Термины и теории статистики вероятностей, которые нужно знать

    Я хочу обсудить некоторые фундаментальные термины и концепции, связанные с вероятностью и статистикой, которые встречаются практически в любой литературе по машинному обучению и ИИ.

    Что такое вероятность?

    Вероятность — это мера вероятности того, что событие произойдет в случайном эксперименте. Статистика вероятностей выражается числом от нуля до единицы, где ноль указывает на невозможность, а единица на уверенность.

     

    Probability Statistics and Theory Concepts to Know

    13 Probability Statistics and Theory Terms to Know

    1. Random experiment
    2. Sample space
    3. Random variables
    4. Probability
    5. Conditional probability
    6. Independence
    7. Conditional independence
    8. Ожидание
    9. Дисперсия
    10. Распределение вероятностей
    11. Совместное распределение вероятностей
    12. Условная вероятность
    13. Фактор

     

    Случайный эксперимент

    Случайный эксперимент — это физическая ситуация, результат которой нельзя предсказать, пока он не будет наблюдаться.

     

    Пространство выборки

    Пространство выборки — это набор всех возможных результатов случайного эксперимента.

    Пример выборочного пространства для случайного эксперимента с подбрасыванием монеты. | Изображение: Parag Radke

     

    Случайные величины

    Случайная величина — это переменная, возможные значения которой являются числовыми результатами случайного эксперимента. Существует два типа случайных величин:

    1. Дискретная случайная величина: Это переменная, которая может принимать только исчисляемое число различных значений, таких как ноль, один, два, три, четыре и т. д. Дискретные случайные величины обычно, но не обязательно, считаются .
    2. Непрерывная случайная величина: Это переменная, которая принимает бесконечное число возможных значений. Непрерывные случайные величины обычно являются измерениями.
    Пример случайных величин для эксперимента по подбрасыванию монеты. | Изображение: Параг Радке

    Хотите узнать больше о машинах? 10 лучших алгоритмов машинного обучения, которые должен знать каждый новичок Вероятность количественно определяется как число от нуля до единицы, где, грубо говоря, ноль указывает на невозможность, а единица на уверенность. Чем выше вероятность события, тем больше вероятность того, что событие произойдет.

     
    Пример

    Простым примером является подбрасывание честной (беспристрастной) монеты. Поскольку монета честная, два исхода — «орел» и «решка» — равновероятны. Поскольку другие исходы невозможны, вероятность выпадения «орла» или «решки» составляет 0,5 или 50%.

     

    Условная вероятность

    Условная вероятность – это мера вероятности наступления события при условии, что по предположению, презумпции, утверждению или свидетельствам другое событие уже произошло. Если интересующим событием является А, а событие В известно или предполагается, что оно произошло, «условная вероятность А при заданном В» обычно записывается как П(А|В) .

    Уравнение для расчета условной вероятности броска игральной кости. | Изображение: Parag RadkeУсловно-вероятностное решение для броска игральной кости. | Изображение: Parag Radke

     

    Независимость

    Два события называются независимыми друг от друга, если вероятность того, что одно событие произойдет, никоим образом не влияет на вероятность возникновения другого события. Другими словами, если у нас есть наблюдения об одном событии, это не влияет на вероятность другого. Для независимых событий A и B верно следующее:

    Известные истинные события для двух независимых событий. | Изображение: Parag Radke
     
    Пример

    Допустим, вы бросили кубик и подбросили монету. Вероятность выпадения любого числа на кубике никоим образом не влияет на вероятность выпадения орла или решки на монете.

     

    Условная независимость

    События A и B условно независимы при наличии третьего события C точно в том случае, если появление A и появление B являются независимыми событиями в их условном распределении вероятностей при заданном C. Другими словами, A и B являются условно независимым при данном C, тогда и только тогда, когда при знании того, что C уже произошло, знание о том, происходит ли A, не дает дополнительной информации о вероятности возникновения B. И знание того, происходит ли B, не дает дополнительной информации о вероятности возникновения A.

    Пример формулы условной независимости. | Изображение: Parag Radke
     
    Пример

    В коробке две монеты, обычная монета и фальшивая двуглавая монета (P(H)=1P(H)=1) . Я выбираю монету наугад и подбрасываю ее дважды.

    Пусть: 

    • A = При первом подбрасывании монеты выпадает HH.
    • B = При втором подбрасывании монеты выпадает HH.
    • C = Выбрана монета 1 (обычная).

    Если C уже наблюдается, т.е. мы уже знаем, выбрана обычная монета или нет, события A и B становятся независимыми, так как исход одного не влияет на исход другого события.

     

    Ожидание

    Ожидание случайной величины X записывается как E(X). Если мы наблюдаем N случайных значений X, то среднее значение N будет приблизительно равно E(X) для больших N. Говоря более конкретно, ожидание — это то, что вы ожидаете от результата эксперимента в среднем. если повторять эксперимент большое количество раз.

    Расчет ожидания для случайной величины. Ожидание 3,5. Если подумать, 3,5 находится на полпути между возможными значениями, которые может принять кубик, и это то, чего вы должны были ожидать. | Изображение: Параг Радке

     

    Дисперсия

    Дисперсия случайной величины X — это мера того, насколько концентрировано распределение случайной величины X вокруг ее среднего значения. Он определяется как:

    Расчет дисперсии в эксперименте по измерению бросков кубиков. | Изображение: Parag Radke

     

    Распределение вероятностей

    Распределение вероятностей — это математическая функция, которая отображает все возможные результаты случайного эксперимента с соответствующей вероятностью. Это зависит от случайной величины X и от того, является ли она дискретной или непрерывной.

     

    1. Дискретное распределение вероятностей
     

    Математическое определение дискретной функции вероятности p(x) – это функция, удовлетворяющая следующим свойствам. Это называется функцией массы вероятности.

    Распределение вероятностей для одного броска монеты. | Изображение: Parag Radke

     

    2. Непрерывное распределение вероятностей
     

    Математическое определение непрерывной функции вероятности f(x) – это функция, которая удовлетворяет следующим свойствам. Это называется функцией плотности вероятности.

    Пример функции плотности вероятности подбрасывания монеты. | Изображение: Parag Radke Видео, объясняющее основы вероятности. | Видео: Khan Academy

    Подробнее о науке о данныхОбъяснение эмпирического правила нормального распределения

     

    Совместное распределение вероятностей

    Если X и Y — две случайные величины, то распределение вероятностей, определяющее их одновременное поведение в ходе случайного эксперимента, называется совместное распределение вероятностей. Совместная функция распределения X и Y определяется как: 9n строк в таблице. | Изображение: Parag Radke

     

    Распределение условной вероятности (CPD)

    Если Z является случайной величиной, которая зависит от других переменных X и Y, то распределение P(Z|X,Y) называется условным распределением вероятности (CPD) Z относительно X и Y. Это означает, что для каждой возможной комбинации случайных величин X, Y мы представляем распределение вероятностей по Z.

     

    «интеллект», который может быть либо
    низкий (I_0) или высокий (I_1) . Они записываются на курс, и у этого курса есть свойство под названием «Сложность», которое может принимать двоичные значения легко (D_0) или сложно (D_1) . Учащийся получает «Оценку» за курс в зависимости от его успеваемости. Оценка может принимать три значения: G_1(лучший) , (G_2) или (G_3)(худший) . Тогда CPD P(G|I,D) выглядит следующим образом:

     Условная таблица распределения вероятностей для оценок. | Изображение: Параг Радке

    Существует ряд операций, которые можно выполнить над любым распределением вероятностей, чтобы получить интересные результаты. Некоторые из важных операций включают в себя:

     

    1. Кондиционирование/редукция

    Если у нас есть распределение вероятностей n случайных величин X1, X2 … Xn, и мы делаем наблюдение относительно k переменных, что они приобрели определенные значения a1, a2 , …, ак, значит, мы уже знаем их задания. Затем строки в JD, которые не согласуются с наблюдением, могут быть удалены, и у нас останется меньше строк. Эта операция известна как редукция.

    Операция редукции для эксперимента с подбрасыванием монеты. | Изображение: Parag Radke
     
    2. Маргинализация

    Эта операция берет распределение вероятностей по большому набору случайных величин и создает распределение вероятностей по меньшему подмножеству переменных. Эта операция известна как маргинализация подмножества случайных величин. Это очень полезно, когда у нас есть большой набор случайных переменных в качестве функций, и нас интересует меньший набор переменных и то, как он влияет на результат.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *