Задачи по теории игр с решениями примеры: Примеры решений по теории игр

Содержание

Пять задач по теории игр для интегрированных уроков — журнал

Автор текста: Алина Мирошникова

В начальной школе интегрированные уроки по требованиям новой программы появятся уже этой осенью. Но в старших классах без интеграции тоже не обойтись. Ведь если знания сортировать по школьным дисциплинам, ученики не смогут овладеть большинством перспективных профессий будущего. Например, биотехнологиями. Как можно интегрировать уроки с помощью игр, рассказал Виталий Шатковский — учитель информатики, победитель конкурса «Учитель года — 2017», руководитель студии программирования в житомирском Центре научно-технического творчества. Вот несколько игр, которые могут быть интересны и полезны школьникам.

Что такое теория игр?

Открытия, отмеченные пятью нобелевскими премиями. Почти 80 лет назад Джон Нейман и Оскар Моргенштерн математически вычислили стратегии игры в покер, где участники могут блефовать, а решения меняются в зависимости от поведения остальных игроков. Впоследствии другой ученый, Джон Нэш (тот самый, о котором снят фильм «Игры разума») проанализировал другие игры при условии, что действия одних игроков влияют на результаты других. Например, до начала партии в шахматы в распоряжении игроков — 400 вариантов только первых ходов. А дальше количество ходов резко возрастает. И современные IT-технологии позволяют обрабатывать даже этот огромный объем данных.

Теория игр дает математические инструменты для предсказания стратегии оппонента. Под игрой подразумевают ситуацию, где есть предмет конфликта и заинтересованные стороны. Поэтому теория игр применяется в конфликтологии. Также ее используют в математике, информатике, экономике, политологии, психологии, юриспруденции, спорте, социальных науках, биологии, разработке искусственного интеллекта, проведении аукционов.

В повседневной жизни — для любого решения в условиях неопределенности. Скажем, интернет-покупка или выбор сообщений, при котором мы отбраковываем фейки и недобросовестную информацию.

Правила. Это более зрелищная версия игры «Камень-ножницы-бумага», где по знакам рук определяют победителя.

В этой игре вместо знака используют пантомимический образ, о котором договариваются до начала игры. Например, разведенные вверх и вниз руки — пасть дракона.

Что касается «силы» персонажей, то самурай убивает дракона. Принцесса покоряет сердце самурая. А дракон съедает принцессу. Выбор игроки демонстрируют одновременно, по команде «раз-два-три».

Стратегии. По статистике, с наибольшей вероятностью (38%) новички выберут дракона, потому что фигура кажется сильной (33% — самурая, 29% — принцессу). Но в классе играют не новички, поэтому подумают на шаг дальше и выберут самурая, который преодолеет дракона. А для того, кто предвидит и этот выбор одноклассников, правильная стратегия — выбрать принцессу.


Чему учит? Думать на несколько шагов вперед и избавиться от стереотипов, ведь фигура или ситуация, которая кажется слабой, может принести победу.

Правила. В городе построили новую короткую дорогу. Сегодня она открывается для проезда. Какую дорогу вы выбираете — старую или новую? Проголосуйте. Например, с помощью бесплатной интернет-платформы Kahoot.

Стратегии. Дорога открылась. Все водители, которые так долго этого ждали, двинутся туда. Возникнет затор. Таким образом, вам стоит выбрать старую дорогу. Впрочем, статистика показывает, что именно так думают 75% людей (это докажут и результаты голосования на Kahoot). Поэтому на самом деле новая дорога почти свободна, следует выбрать ее. Это парадокс Браеса в «переводе» с математического языка на бытовой.

Можно сделать еще один шаг. Сообщить эту стратегию ученикам (как это, собственно, делает Виталий Шатковский) и снова предложить им определиться, куда поехать.


Парадокс в том, что новая информация не меняет круг соображений: после разъяснений учителя все теперь знают, что правильный ответ — новая дорога. Поэтому все так и проголосуют — якобы стоит выбрать старую. Но все умные — большинство выберет старую. Поэтому правильный ответ не меняется: опять же новая дорога.

Чему учит? Ориентироваться на компетентность и осведомленность остальных игроков, вычислять их стратегии.

Правила. Каждый из игроков выбирает любое целое число от 1 до 100. Затем определяют среднее арифметическое и вычисляют две трети от него (округленно). Тот, кто назвал ближайшее к этому результату — получит приз. Поэтому цель игрока — угадать эти две трети, ориентируясь на гипотезы: что именно загадают в группе.

Стратегии. Если все загадают 100, две трети этого — 67. Поэтому большее число нет смысла называть. Это максимальное число, называя которое, можно рассчитывать на приз. Поскольку все это знают, они выберут именно 67. Поэтому игрок, который это предвидит, должен выбрать две трети от 67, то есть 45.


Теперь вопрос в том, сколько раз повторять эту процедуру. Это зависит от компетентности игроков. Чем более осведомлены в игре и математически подкованы игроки, тем меньше будет число.

Если бы все мыслили идеально рационально, то выбрали бы 1 для голосования и для ответа. Пришлось бы признавать победителями всех. Это так называемое равновесие Нэша. То есть решение, при котором игрок не может увеличить выигрыш, изменив свою стратегию, если другие участники своих стратегий не меняют.

Чему учит? Равновесие Нэша побуждает избирать целью не победу, не поражение соперников, а лучший для себя вариант, даже если он приносит выгоду конкурентам.

Правила. Двое изолированных подозреваемых в тяжком преступлении получают предложение: если один свидетельствует против другого, который хранит молчание, первый освобождается, а второй получает максимальный срок за решеткой. Если оба молчат, их приговаривают к символическому сроку за хранение оружия. Если оба свидетельствуют, получают по два года. Как лучше поступить?

Стратегии. Меньше всего пострадают оба участника группы, если будут молчать. Но если забыть об интересах другого участника, можно получить приз (свободу), который выгоднее небольшого срока за решеткой.


Если игрок действует с максимальной выгодой для себя, группа от этого проигрывает. И это — пока еще не решенная проблема многих обществ.

В транспорте выгоднее не платить за проезд. Но если так поступят все, общество проиграет. На субботник выгоднее не идти, сэкономить время и силы, ведь и так уберут. Но если все поступят так же, субботник не состоится.

Чему учит? Личные интересы противоречат групповым. При этом есть надежда, что группа «как-то без нас обойдется». Но когда проигрывает группа, это вредит каждому из участников.

Правила. Купюру необходимо приобрести на аукционе. Выигрывает тот, кто предложит самую высокую цену. Аукцион завершается, если никто из игроков не предлагает новой надбавки.

При этом заплатить должен не только победитель, но и каждый игрок — ту последнюю цену, которую он предлагал на момент завершения торгов. При этом купюру получит только победитель, остальные остаются с пустыми руками.

Стратегии. Когда гривну пытаются купить за 1, 5 или 10 копеек — выгода очевидна. Поэтому ставки быстро растут. Но когда за гривну начинают предлагать суммы больше ее номинальной стоимости, кажется, понятно: это бессмысленно.


Однако, скажем, когда на аукционе двое: один игрок предлагает гривну, а другой, если не сделает новых предложений, теряет 99 копеек и проигрывает. Поэтому проще объявить 1 гривну и 1 копейку. Тогда если соперник не предложит надбавку, игрок получит гривну вместо гривны из собственного кармана, а потеряет всего 1 копейку. Это ошибочная стратегия.

Игроки продолжают рассуждать таким образом еще долго. По статистике, победитель покупает банкноту за сумму, в 5-10 раз превышающую стоимость купюры, то есть теряет до 900%.

Чему учит? Стоит вовремя остановиться. Под вопросом оказывается рациональность игроков. Иногда проигрыш малой кровью — более хороший вариант, чем бессмысленная победа.

Поділитися цією статтею

    Матричные игры: примеры решения задач

    • Платёжная матрица, чистые стратегии, цена игры
    • Седловая точка в матричных играх
    • Матричные игры с оптимальной смешанной стратегией
    • Сведение матричной игры к задаче линейного программирования
    • Игры с матрицей 2 Х 2
    • Составление матричной игры

    Матричной игрой в математической теории игр называется игра двух лиц с нулевой суммой, в которой в распоряжении каждого из них имеется конечное множество стратегий. Правила матричной игры определяет платёжная матрица, элементы которой — выигрыши первого игрока, которые являются также проигрышами второго игрока.

    Матричная игра является антагонистической игрой. Первый игрок получает максимальный гарантированный (не зависящий от поведения второго игрока) выигрыш, равный цене игры, аналогично, второй игрок добивается минимального гарантированного проигрыша.

    Под стратегией понимается совокупность правил (принципов), определяющих выбор варианта действий при каждом личном ходе игрока в зависимости от сложившейся ситуации.

    Теперь обо всём по порядку и подробно.

    В матричной игре её правила определяет платёжная матрица.

    Рассмотрим игру, в которой имеются два участника: первый игрок и второй игрок. Пусть в распоряжении первого игрока имеется m чистых стратегий, а в распоряжении второго игрока — n чистых стратегий. Поскольку рассматривается игра, естественно, что в этой игре есть выигрыши и есть проигрыши.

    В платёжной матрице

    элементами являются числа, выражающие выигрыши и проигрыши игроков. Выигрыши и проигрыши могут выражаться в пунктах, количестве денег или в других единицах.

    Составим платёжную матрицу:

    .

    Если первый игрок выбирает i-ю чистую стратегию, а второй игрок — j-ю чистую стратегию, то выигрыш первого игрока составит aij единиц, а проигрыш второго игрока — также aij единиц.

    Так как aij + (- aij) = 0, то описанная игра является матричной игрой с нулевой суммой.

    Простейшим примером матричной игры может служить бросание монеты. Правила игры следующие. Первый и второй игроки бросают монету и в результате выпадает «орёл» или «решка». Если одновременно выпали «орёл» и «орёл» или «решка» или «решка», то первый игрок выиграет одну единицу, а в других случаях он же проиграет одну единицу (второй игрок выиграет одну единицу).

    Такие же две стратегии и в распоряжении второго игрока. Соответствующая платёжная матрица будет следующей:

    .

    Задача теории игр — определить выбор стратегии первого игрока, которая гарантировала бы ему максимальный средний выигрыш, а также выбор стратегии второго игрока, которая гарантировала бы ему максимальный средний проигрыш.

    Как происходит выбор стратегии в матричной игре?

    Вновь посмотрим на платёжную матрицу:

    .

    Сначала определим величину выигрыша первого игрока, если он использует i-ю чистую стратегию. Если первый игрок использует i-ю чистую стратегию, то логично предположить, что второй игрок будет использовать такую чистую стратегию, благодаря которой выигрыш первого игрока был бы минимальным. В свою очередь первый игрок будет использовать такую чистую стратегию, которая бы обеспечила ему максимальный выигрыш. Исходя из этих условий выигрыш первого игрока, который обозначим как

    v1, называется максиминным выигрышем или нижней ценой игры.

    При решении задач на цену игры и определение стратегии для этих величин у первого игрока следует поступать следующим образом. Из каждой строки выписать значение минимального элемента и уже из них выбрать максимальный. Таким образом, выигрыш первого игрока будет максимальным из минимальных. Отсюда и название — максиминный выигрыш. Номер строки этого элемента и будет номером чистой стратегии, которую выбирает первый игрок.

    Теперь определим величину проигрыша второго игрока, если он использует j-ю стратегию. В этом случае первый игрок использует такую свою чистую стратегию, при которой проигрыш второго игрока был бы максимальным. Второй игрок должен выбрать такую чистую стратегию, при которой его проигрыш был бы минимальным. Проигрыш второго игрока, который обозначим как

    v2, называется минимаксным проигрышем или верхней ценой игры.

    При решении задач на цену игры и определение стратегии для определения этих величин у второго игрока следует поступать следующим образом. Из каждого столбца выписать значение максимального элемента и уже из них выбрать минимальный. Таким образом, проигрыш второго игрока будет минимальным из максимальных. Отсюда и название — минимаксный выигрыш. Номер столбца этого элемента и будет номером чистой стратегии, которую выбирает второй игрок. Если второй игрок использует «минимакс», то независимо от выбора стратегии первым игроком, он проиграет не более

    v2 единиц.

    Пример 1. Дана матричная игра с платёжной матрицей

    .

    Определить максиминную стратегию первого игрока, минимаксную стратегию второго игрока, нижнюю и верхнюю цену игры.

    Решение. Справа от платёжной матрицы выпишем наименьшие элементы в её строках и отметим максимальный из них, а снизу от матрицы — наибольшие элементы в столбцах и выберем минимальный из них:

    Наибольший из наименьших элементов строк — 2, это нижняя цена игры, ей соответствует первая строка, следовательно, максиминная стратегия первого игрока первая. Наименьший из наибольших элементов столбцов — 5, это верхняя цена игры, ей соответствует второй столбец, следовательно, минимаксная стратегия второго игрока — вторая.

    Теперь, когда мы научились находить нижнюю и верхнюю цену игры, максиминную и минимаксную стратегии, пришло время научиться обозначать эти понятия формально.

    Итак, гарантированный выигрыш первого игрока:

    .

    Первый игрок должен выбрать чистую стратегию, которая обеспечивала бы ему максимальный из минимальных выигрышей. Этот выигрыш (максимин) обозначается так:

    .

    Первый игрок использует такую свою чистую стратегию, чтобы проигрыш второго игрока был максимальным. Этот проигрыш обозначается так:

    .

    Второй игрок должен выбрать свою чистую стратегию так, чтобы его проигрыш был минимальным. Этот проигрыш (минимакс) обозначается так:

    .

    Ещё пример из этой же серии.

    Пример 2. Дана матричная игра с платёжной матрицей

    .

    Определить максиминную стратегию первого игрока, минимаксную стратегию второго игрока, нижнюю и верхнюю цену игры.

    Решение. Справа от платёжной матрицы выпишем наименьшие элементы в её строках и отметим максимальный из них, а снизу от матрицы — наибольшие элементы в столбцах и выберем минимальный из них:

    Наибольший из наименьших элементов строк — 3, это нижняя цена игры, ей соответствует вторая строка, следовательно, максиминная стратегия первого игрока вторая. Наименьший из наибольших элементов столбцов — 5, это верхняя цена игры, ей соответствует первый столбец, следовательно, минимаксная стратегия второго игрока — первая.

    Если верхняя и нижняя цена игры одинаковая, то считается, что матричная игра имеет седловую точку.

    Верно и обратное утверждение: если матричная игра имеет седловую точку, то верхняя и нижняя цены матричной игры одинаковы. Соответствующий элемент одновременно является наименьшим в строке и наибольшим в столбце и равен цене игры.

    Таким образом, если , то — оптимальная чистая стратегия первого игрока, а — оптимальная чистая стратегия второго игрока. То есть равные между собой нижняя и верхняя цены игры достигаются на одной и той же паре стратегий.

    В этом случае матричная игра имеет решение в чистых стратегиях.

    Пример 3. Дана матричная игра с платёжной матрицей

    .

    Найти нижнюю и верхнюю цену игры. Имеет ли данная матричная игра седловую точку?

    Решение. Справа от платёжной матрицы выпишем наименьшие элементы в её строках и отметим максимальный из них, а снизу от матрицы — наибольшие элементы в столбцах и выберем минимальный из них:

    Нижняя цена игры совпадает с верхней ценой игры. Таким образом, цена игры равна 5. То есть . Цена игры равна значению седловой точки . Максиминная стратегия первого игрока — вторая чистая стратегия, а минимаксная стратегия второго игрока — третья чистая стратегия. Данная матричная игра имеет решение в чистых стратегиях.

    Решить задачу на матричную игру самостоятельно, а затем посмотреть решение

    Пример 4. Дана матричная игра с платёжной матрицей

    .

    Найти нижнюю и верхнюю цену игры. Имеет ли данная матричная игра седловую точку?

    Правильное решение и ответ.

    В большинстве случаев матричная игра не имеет седловой точки, поэтому соответствующая матричная игра не имеет решений в чистых стратегиях.

    Но она имеет решение в оптимальных смешанных стратегиях. Для их нахождения нужно принять, что игра повторяется достаточное число раз, чтобы на основании опыта можно было предположить, какая стратегия является более предпочтительной. Поэтому решение связывается с понятием вероятности и среднего (математического ожидания). В окончательном же решении есть и аналог седловой точки (то есть равенства нижней и верхней цены игры), и аналог соответствующих им стратегий.

    Итак, чтобы чтобы первый игрок получил максимальный средний выигрыш и чтобы средний проигрыш второго игрока был минимальным, чистые стратегии следует использовать с определённой вероятностью.

    Если первый игрок использует чистые стратегии с вероятностями , то вектор называется смешанной стратегией первого игрока. Иначе говоря, это «смесь» чистых стратегий. При этом сумма этих вероятностей равна единице:

    .

    Если второй игрок использует чистые стратегии с вероятностями , то вектор называется смешанной стратегией второго игрока. При этом сумма этих вероятностей равна единице:

    .

    Нет времени вникать в решение? Можно заказать работу!

    Если первый игрок использует смешанную стратегию p, а второй игрок — смешанную стратегию q, то имеет смысл математическое ожидание выигрыша первого игрока (проигрыша второго игрока). Чтобы его найти, нужно перемножить вектор смешанной стратении первого игрока (который будет матрицей из одной строки), платёжную матрицу и вектор смешанной стратегии второго игрока (который будет матрицей из одного столбца):

    .

    Если уже подзабыто произведение матриц, то следует повторить материал.

    Пример 5. Дана матричная игра с платёжной матрицей

    .

    Определить математическое ожидание выигрыша первого игрока (проигрыша второго игрока), если смешанная стратегия первого игрока , а смешанная стратегия второго игрока .

    Решение. Согласно формуле математического ожидания выигрыша первого игрока (проигрыша второго игрока) оно равно произведению вектора смешанной стратегии первого игрока, платёжной матрицы и вектора смешанной стратегии второго игрока:

    Оптимальной смешанной стратегией первого игрока называется такая смешанная стратегия , которая обеспечивала бы ему максимальный средний выигрыш , если игра повторяется достаточное число раз.

    Оптимальной смешанной стратегией второго игрока называется такая смешанная стратегия , которая обеспечивала бы ему минимальный средний проигрыш , если игра повторяется достаточное число раз.

    По аналогии с обозначениями максимина и минимакса в случах чистых стратегий оптимальные смешанные стратегии обозначаются так (и увязываются с математическим ожиданием, то есть средним, выигрыша первого игрока и проигрыша второго игрока):

    ,

    .

    В таком случае для функции E существует седловая точка, что означает равенство .

    Для того, чтобы найти оптимальные смешанные стратегии и седловую точку, то есть решить матричную игру в смешанных стратегиях, нужно свести матричную игру к задаче линейного программирования, то есть к оптимизационной задаче, и решить соответствующую задачу линейного программирования.

    Для того, чтобы решить матричную игру в смешанных стратегиях, нужно составить прямую задачу линейного программирования и двойственную ей задачу. В двойственной задаче расширенная матрица, в которой хранятся коэффициенты при переменных в системе ограничений, свободные члены и коэффициенты при переменных в функции цели, транспонируется. При этом минимуму функции цели исходной задачи ставится в соответствие максимум в двойственной задаче.

    Функция цели в прямой задаче линейного программирования:

    .

    Система ограничений в прямой задаче линейного программирования:

    Функция цели в двойственной задаче:

    .

    Система ограничений в двойственной задаче:

    Оптимальный план прямой задачи линейного программирования обозначим

    ,

    а оптимальный план двойственной задачи обозначим

    Линейные формы для соответствующих оптимальных планов обозначим и ,

    а находить их нужно как суммы соответствующих координат оптимальных планов.

    В соответствии определениям предыдущего параграфа и координатами оптимальных планов, в силе следующие смешанные стратегии первого и второго игроков:

    ,

    .

    Математики-теоретики доказали, что цена игры следующим образом выражается через линейные формы оптимальных планов:

    ,

    то есть является величиной, обратной суммам координат оптимальных планов.

    Нам, практикам, остаётся лишь использовать эту формулу для решения матричных игр в смешанных стратегиях. Как и формулы для нахождения оптимальных смешанных стратегий соответственно первого и второго игроков:

    ,

    ,

    в которых вторые сомножители — векторы. Оптимальные смешанные стратегии также, как мы уже определили в предыдущем параграфе, являются векторами. Поэтому, умножив число (цену игры) на вектор (с координатами оптимальных планов) получим также вектор.

    Пример 6. Дана матричная игра с платёжной матрицей

    .

    Найти цену игры V и оптимальные смешанные стратегии и .

    Решение. Составляем соответствующую данной матричной игре задачу линейного программирования:

    Приводим задачу к канонической форме и решаем задачу и двойственную ей задачу симплекс-методом.

    Получаем решение прямой задачи:

    .

    Находим линейную форму оптимальных планов как сумму найденных координат:

    .

    Получаем решение двойственной задачи:

    .

    Находим линейную форму оптимальных планов как сумму найденных координат:

    .

    Находим цену игры:

    .

    Находим оптимальную смешанную стратегию первого игрока:

    .

    Находим оптимальную смешанную стратегию второго игрока:

    .

    Пусть дана игра с платёжной матрицей

    Если эта матричная игра имеет седловую точку, то она имеет решение в чистых стратегиях, как показано в параграфах 1 и 2.

    Если же игра не имеет седловой точки, то она имеет решение в оптимальных смешанных стратегиях. Для этого простейшего случая матричной игры при её решениях путём сведения к задаче линейного программирования были найдены формулы стратегий игроков и цены игры, благодаря которым такая игра решается менее трудоёмким способом.

    Формула для нахождения оптимальной смешанной стратегии первого игрока:

    .

    Формула для нахождения оптимальной смешанной стратегии второго игрока:

    .

    Формула для нахождения цены игры:

    .

    Пример 7. Дана матричная игра с платёжной матрицей

    .

    Найти оптимальные смешанные стратегии игроков и цену игры.

    Решение. Оптимальные смешанные стратегии первого игрока получаем по соответствующей из приведённых формул:

    .

    Оптимальные смешанные стратегии второго игрока получаем также по соответствующей формуле:

    .

    Цена игры:

    .

    Матричная игра, седловая точка, чистые стратегии, смешанные стратегии… А для чего всё это? Рассмотрим на примере, как с помощью матричных игр решаются экономические задачи.

    Пример 8. Составить матричную игру для следующей задачи.

    Предприятие может выпускать три вида продукции (A1, A2, A3), получая при этом прибыль, зависящую от спроса, который может быть в одном из четырёх состояний (B1, B2, B3, B4). Дана матрица, элементы которой aij характеризуют прибыль, которую получит предприятие при выпуске i-й продукции с j-м состоянием спроса.

    B1B2B3B1
    A13368
    A291042
    A37754

    Решение. Задача сводится к матричной игре предприятия A против спроса B.

    Прежде чем решать задачу, можно упростить игру, проведя анализ платёжной матрицы и отбросив стратегии, заведомо невыгодные или дублирующие. Вторая стратегия (второй столбец матрицы) является явно невыгодной для игрока B по сравнению с первой (элементы второго столбца больше элементов первого столбца), так как цель игрока B — уменьшить выигрыш игрока A. Поэтому второй столбец можно отбросить. Получим следующую матрицу:

    .

    Далее составляется и решается задача линейного программирования. Это мы уже умеем.

    Нет времени вникать в решение? Можно заказать работу!

    К началу страницы

    Поделиться с друзьями

    Теория игр: основы. Примеры записи и решения игр из жизни

    Материалы по векторам и матрицам

    Векторы: определения и действия над векторами

    Произведение двух матриц

    Линейное программирование

    Задача и теоремы линейного программирования, примеры формулировки задач

    Симплекс-метод решения задач линейного программирования: типичный пример и алгоритм

    Решение задач теории игр с помощью графических, алгебраических и симплексных методов

    Этот метод можно использовать только в играх без седловой точки и с платежной матрицей типа n X 2 или 2 X n.

    Example: Graphical Method for Game Theory

    Consider the following pay-off matrix

    Player A Player B
      B 1 B 2
    A 1 -2 4
    A 1 8 3
    A 1 9 0

    Решение.

    В игре нет седловой точки, как показано в следующей таблице.

    Player A   Player B Minimum Probability
    B 1 B 2
    A 1 -2 4 -2 Q 1
    Q 1
    1
    1
    . 0012 A 2 8 3 3 q 2
    A 3 9 0 0 q 3
    Maximum 9 4    
    Probability p 1 p 1    

    Максимум = 4, Минимакс = 3

    Сначала проведем две параллельные линии на расстоянии 1 единицу расстояния друг от друга и отметим шкалу на каждой. Две параллельные линии представляют стратегии игрока B.
    Если игрок A выбирает стратегию A1, игрок B может выиграть -2 (т. е. потерять 2 единицы) или 4 единицы в зависимости от выбора стратегий B. Значение -2 откладывается по вертикальной оси для стратегии B 1 , а значение 4 откладывается по вертикальной оси для стратегии B 9. 0029 2 . Затем проводится прямая линия, соединяющая две точки.
    Точно так же мы можем построить стратегии A 2 и A 3 . Проблема изображена на следующем рисунке.

    Нижняя точка V в заштрихованной области указывает ценность игры. Из приведенного выше рисунка стоимость игры составляет 3,4 единицы. Точно так же мы можем нарисовать график для игрока B.

    Точка оптимального решения (т.е. точка максимина) находится на пересечении двух линий:

    E1 = -2p 1 + 4P 2 и
    E2 = 8P 1 + 3P 2

    Сравнение вышеуказанных уравнений, мы имеем

    -2P 1 + 4P 2 = 8P 1 + 3P. 2

    Замена P 2 = 1 -P 1
    -2P 1 + 4 (1 -P 1 ) = 8p 1 + 3 (1 -P 1 )
    P. 1  = 1/11
    p 2  = 10/11

    Подстановка значений p 1  и p 2  в уравнении E1

    V = -2 (1/11) + 4 (10/11) = 3,4 единицы имеет только два варианта действий, а другой — более двух, называются играми 2 X n или n X 2 .

    Если эти игры не имеют седловой точки или сводятся методом доминирования, то перед решением этих игр выписываем все подигры 2 X 2 и определяем ценность каждой подигры 2 X 2.

    Этот метод иллюстрируется следующим примером.

     Example: 2 x n Games

    Determine the solution of game for the pay-off matrix given below:

    9раствор

    Очевидно, что нет седловой точки и ни один образ действий не доминирует над другим. Поэтому мы рассматриваем каждую подигру 2 X 2 и получаем их значения.

    (A)

      Player B
    Player A   I II III
    I -3
    Игрок B
    Игрок A Игрок A . 0014 I II
    I -3 -1
    II 4 1

    The saddle point is 1. So the value of game, V1 is 1.

    (b)

      Player B
    Player A   I II
    I -3 7
    II 4 -2

    This game has no saddle point, so we use the algebraic метод.

    Стоимость игры, V2 = (-3) X (-2) – (7 X 4)
    ————————-
    (-3 — 2) — (7 + 4 )
    = 11

    8

    (в)

      Player B
    Player A   II III
    I -1 7
    II 1 -2

    В этой игре нет седловой точки, поэтому воспользуемся алгебраическим методом.

    Ценность игры, V3 = (-1) X (-2) – (7 X 1)
    ————————
    (-1 — 2) — (7 + 1)
    = 5

    11

    Подигра 2 X 2 с наименьшим значением (c), и, следовательно, решение этой игры обеспечивает решение большей игры.

    Используя алгебраический метод :

    A играет (11.03, 8/11)
    Играет B (0, 11.09, 11.02)
    Ценность игры 5/11.

    В этом разделе мы поговорим об алгебраическом методе  используется для решения смешанных стратегических игр . Здесь мы предоставили формулы и примеры алгебраического метода.

    Consider the zero sum two person game given below:

      Player B
    Player A   I II
    I а б
    II C D

    Решение игры:

    A Play’s (P, 1 — P)

    Где:

    , где:

    P =
    DI —

    9
    P =
    P =

    9
    P =

    1 P =

    1 P =

    1. ——————–
    (a + d) – (b + c)

    Игра B (q, 1 – q)

    где:

    2 – b
    q = ——————-
    (a + d) – (b + c)

     

    Ценность игры, V = ad – bc
    ——————–
    (a + d) — (b + c)

     Алгебраический метод Пример 1. Теория игр

    Рассмотрим игру с сопоставлением монет. Два игрока, A и B, кладут монету. Если монеты совпадают (т. е. обе монеты орлом или обе решкой), A получает вознаграждение, в противном случае B. Однако совпадение орла дает двойную премию. Получите лучшие стратегии как для игроков, так и для ценности игры.

      Игрок Б
    Player A   I II
    I 2 -1
    II -1 1

    Раствор.

    В этой игре нет седловой точки .

    р = 1 – (-1)
    ———————–
    (2 + 1) — (-1 – 1)
    = 2

    5

    1- P = 3/5

    Q = 1- (-1)
    ————— + 1)-(-1-1)
    = 2

    5

    1-Q = 3/5

    V = 2 X 1-(-1) X (-1)
    ———————— 
    (2 + 1) – (-1 – 1)
    = 1
    —-
    5
    Пример 2. Алгебраический метод в Теория игр

    Solve the game whose payoff matrix is ​​given below:

      Player B
    Player A   I II
    I 1 7
    II 6 2

    .

    В этой игре нет седловая точка .

    p = 2 – 6
    ———————–
    (1 + 2) – (7 + 6)
    = 2
    —-
    5

    1 – p = 3/5

    q = 2 – 7
    ———————–
    (1 + 2) — (7 + 6)
    = 1
    —- 2

    1 – q = 1/2

     

    V = 1 X 2 – (7 X 6)
    —————————
    (1 + 2) – (7 + 6)
    = 4

     

    Simplex Method: Example 1

    Maximize z = 3x 1  + 2x 2

    subject to

    -x 1  + 2x 2  ≤ 4
    3x 1  + 2x ≤ 14
    x 1  – x 2  ≤ 3

    x 1 , x 2 ≥ 0

    Решение.

    Сначала преобразуйте все ограничения неравенства в LPP в ограничение равенства, чтобы задачу можно было записать в стандарте from. Этого можно добиться, добавив переменную резерва к каждому ограничению. Переменные Slack всегда добавляются к ограничениям типа «меньше».

    Преобразование неравенства в равенства

    -x 1 + 2x 2 + x 3 = 4
    3x 1 + 2x 2 + x 4 = 140039+ 2x 2 + x 4 = 14 + 2 + x 4 = 1400229 x 2 + x 4 = 140039+ 2x 2 + x 4 = 140030+ 2x 2 + x 4 .1 — x 2 + x 5 = 3
    x 1 , x 2 , x 3 , x 4 , x 5 ≥ 0

    , где x 3 , x x 4  и x 5  являются резервными переменными.

    Поскольку переменные резерва представляют собой неиспользованные ресурсы, их вклад в целевую функцию равен нулю. Включив эти резервные переменные в целевую функцию, мы получим

    Максимизация z = 3x 1  + 2x 2  + 0x 3  + 0x 4  + 0x 5

    Исходное базовое допустимое решение

    Теперь предположим, что ничего нельзя произвести. Следовательно, значения переменных решения равны нулю.
    x 1  = 0, x 2  = 0, z = 0

    Когда мы ничего не производим, очевидно, что у нас остаются неиспользованные мощности
    x 3  = 4, x 4 , x = 5  = 3

    Заметим, что текущее решение имеет три переменные (переменные резерва x 3 , x 4  и x 5 ) с ненулевыми значениями решения и двумя переменными (переменные решения x 1  и x 2 ) с нулевыми значениями. Переменные с ненулевыми значениями называются базовыми переменными. Переменные с нулевыми значениями называются неосновными переменными.

    Simplex Method: Таблица 1

    A 11 = -1, A 12 = 2, A 13 = 1, A 14 = 0, A 15 = 0, B 1  = 4
    A 21 = 3, A 22 = 2, A 23 = 0, A 24 = 1, A 25 = 0, B 2 = 14
    A 31 = 1, A A 32 = -1, A 33 = 0, A 34 = 0, A 35 = 1, B 3 = 3

    Расчет значений для индекса (Z J . – c j )

    z – c 1  = (0 X (-1) + 0 X 3 + 0 X 3 + 0 X -3)0229 z 2 – c 2  = (0 X 2 + 0 X 2 + 0 X (-1)) – 2 = -2
    z 3 – c 3  = (0 X 1 + 0 X 0 + 0 X 0) – 0 = 0
    z 4 – c 4  = (0 X 0 + 0 X 1 + 0 X 0) – 0 = 0
    z – c 5  = ( 0 X 0 + 0 X 0 + 0 X 1) – 0 = 0

    Выберите наименьшее отрицательное значение из z j  – c (т. е. – 3). Таким образом, столбец под x 1 является ключевым столбцом.
    Теперь найдите минимальное положительное значение
    Минимум (14/3, 3/1) = 3
    Таким образом, строка x 5 является ключевой строкой.
    Здесь опорный (ключевой) элемент = 1 (значение в точке пересечения).
    Следовательно, x 5  выходит, а x входит.

    Элементы следующей таблицы получаем по следующим правилам:

    1. Если значения z j – c j положительны, то включение любой базовой переменной не увеличит значение целевой функции. Следовательно, настоящее решение максимизирует целевую функцию. Если имеется более одного отрицательного значения, в качестве базовой переменной выбирается переменная, соответствующая которой значение z j – c j является наименьшим (наиболее отрицательным), так как это максимизирует прибыль.
    2. Числа в замещающей строке могут быть получены путем деления элементов ключевой строки на опорный элемент, а числа в двух других строках могут быть рассчитаны по формуле: —
    (соответствующий номер ключевого ряда) X (соответствующий номер ключевого столбца)
        поворотный элемент

    Вычисляющие значения для таблицы 2

    x 3 Руб

    A 11 = -1 -1 x (-1)/1) = 0
    A 12 = 2 -(-1)/1) = 0
    A 12 = 2 -(-1)/1) = 0
    A 12 = 2 -(-1)/1) = 0
    A 12 = 2 -1) X ((-1)/1) = 1
    a 13  = 1 – 0 X ((-1)/1) = 1
    a 14  = 0 – 0 X ((-1)/ 1) = 0
    a 15  = 0 – 1 X ((-1)/1) = 1
    b 1  = 4 – 3 X ((-1)/1) = 7

    x 4 ряд

    a 21  = 3 – 1 X (3/1) = 0
    a 22 = 2 – (-1) X (3/1) = 5
    a 23 = 0 – 0 X (3/1) = 0
    a 24  = 1 – 0 X (3/1) = 1
    a 25 = 0 – 1 X (3/1) = -3
    b 2 = 14 – 3 X (3/1) = 5

    x 1 ряд =

    a 3900 1/1 = 1
    a 32  = -1/1 = -1
    a 33  = 0/1 = 0
    a 34  = 0/1 = 0
    a 35 0 = =  1
    b 3  = 3/1 = 3

    Таблица 2

      c j 3 2 0 0 0  
    c B Basic variables
    B
    x 1 x 2 x 3 x 4 x 5 Solution values ​​
    b (= X
    B )
    0 x 3 0 1 1 0 1 7
    0 x 4 0 5 0 1 -3 5
    3 x 1 1 -1 0 0 1 3
    z j -C J 0 -5 0 0 3
    9002 . 0012 — C J )

    Z 1 — C 1 = (0 x 0 + 0 x 0 + 3 x 1) — 3 = 0
    Z 2 — C 2) = (0 X 1 + 0 X 5 + 3 X (-1)) – 2 = -5
    z – c 3  = (0 X 1 + 0 X 0 + 3 X 0) – 0 = 0
    z 4 – c 4  = (0 X 0 + 0 X 1 + 3 X 0) – 0 = 0
    z 5 – c 5  = (0 X 1 + 0 X (-3) ) + 3 X 1) – 0 = 3

    Ключевой столбец = x столбец
    Минимум (7/1, 5/5) = 1
    Ключевой ряд = x 4 ряд
    Сводной элемент = 5
    x 4 отправлений и x 2 входов.

    Расчетные значения для таблицы 3 0
    a 13 = 1 – 0 X (1/5) = 1
    a 14  = 0 – 1 X (1/5) = -1/5
    a 15  = 1 – (-3) X (1/5) = 8/5
    b 1  = 7 – 5 X (1/5) = 6

    x 2 ROW

    A 21 = 0/5 = 0
    A 22 = 5/5 = 1
    A 23 = 0/5 = 0
    A 24 = 1/5.
    A 25 = -3/5
    B 2 = 5/5 = 1

    x 1 ROW

    A 31 = 1 -0 x (-1/5) = 1
    A 32 = -1 – 5 X (-1/5) = 0
    a 33 = 0 – 0 X (-1/5) = 0
    a 34  = 0 – 1 X (-1/5) = 1/5
    a 35  = 1 – (-3) X (-1/5) = 2/5
    b 3  = 3 – 5 X (-1/5) = 4

    Не преобразовывайте дроби в десятичные, потому что многие дроби в процессе сокращаются, а преобразование в десятичные вызовет ненужные сложности.

    Simplex Method: Final Optimal Table

      c j 3 2 0 0 0  
    c B Basic variables
    B
    x 1 x 2 x 3 x 4 x 5 Solution values ​​
    b (= X
    B )
    0 x 3 0 0 1 -1/5 8/5 6
    2 x 2 0 1 0 1/5 -3/5 1
    3 x 1 1 0 0 1/5 2/5 4
    z j -c j   0 0 0 1 0  

    Since все значения zj – c j положительны, это оптимальное решение.
    x 1 = 4, x 2  = 1
    z = 3 X 4 + 2 X 1 = 14.

    Наибольшая прибыль в размере 14 рупий получается, когда 1 единица x 2  и 4 единицы х 1  выпускаются. Приведенное выше решение также указывает на то, что 6 единиц все еще не используются, о чем свидетельствует переменная резерва x 3  в столбце X B .

    Нравится:

    Нравится Загрузка…

    Теория игр

    Что такое теория игр?

    Теория игр — это теоретическая основа для понимания социальных ситуаций между конкурирующими игроками. В некотором отношении теория игр — это наука о стратегии или, по крайней мере, об оптимальном принятии решений независимыми и конкурирующими субъектами в стратегической обстановке.

    Key Takeaways

    • Теория игр — это теоретическая основа для понимания социальных ситуаций между конкурирующими игроками.
    • Теория игр предназначена для обеспечения оптимального принятия решений независимыми и конкурирующими субъектами в стратегической обстановке.
    • Используя теорию игр, можно разработать реальные сценарии для таких ситуаций, как ценовая конкуренция и выпуск продуктов (и многие другие), и предсказать их результаты.
    • Сценарии включают дилемму заключенного и игру в диктатора среди многих других.
    • Различные типы теории игр включают кооперативную/некооперативную, нулевую/ненулевую сумму и одновременную/последовательную.
    Теория игр

    Как работает теория игр

    Ключевыми пионерами теории игр были математик Джон фон Нейман и экономист Оскар Моргенштерн в 1940-х годах. Многие считают математика Джона Нэша первым значительным продолжением работы фон Неймана и Моргенштерна.

    В центре внимания теории игр находится игра, которая служит моделью интерактивной ситуации между рациональными игроками. Ключ к теории игр состоит в том, что выигрыш одного игрока зависит от стратегии, реализуемой другим игроком.

    Игра определяет личность, предпочтения и доступные стратегии игроков, а также то, как эти стратегии влияют на результат. В зависимости от модели могут потребоваться различные другие требования или допущения.

    Теория игр имеет широкий спектр приложений, включая психологию, эволюционную биологию, войну, политику, экономику и бизнес. Несмотря на многочисленные достижения, теория игр все еще остается молодой и развивающейся наукой.

    Согласно теории игр действия и выбор всех участников влияют на результат каждого из них. Предполагается, что игроки в игре рациональны и будут стремиться максимизировать свои выигрыши в игре.

    Полезные термины теории игр

    Каждый раз, когда у нас возникает ситуация с двумя или более игроками, которая включает известные выплаты или поддающиеся количественной оценке последствия, мы можем использовать теорию игр, чтобы определить наиболее вероятные исходы. Начнем с определения нескольких терминов, обычно используемых при изучении теории игр:

    • Игра : Любой набор обстоятельств, результат которого зависит от действий двух или более лиц, принимающих решения (игроков)
    • Игроки : Принятие стратегических решений в контексте игры
    • Стратегия : Полный план действий, которые игрок предпримет с учетом набора обстоятельств, которые могут возникнуть в игре
    • Выплата :   Выплата, которую игрок получает за достижение определенного результата (Выплата может быть в любой измеримой форме, от долларов до полезности. )
    • Информационный набор : информация, доступная в данный момент в игре (Термин информационный набор чаще всего применяется, когда в игре есть последовательный компонент.)
    • Равновесие : Момент в игре, когда оба игрока приняли решение и достигнут результат

    Равновесие Нэша

    Равновесие Нэша — это достигнутый результат, который означает, что ни один игрок не может увеличить выигрыш, изменив решения в одностороннем порядке. Это также можно рассматривать как «без сожалений» в том смысле, что после принятия решения игрок не будет сожалеть о решениях с учетом последствий.

    В большинстве случаев равновесие Нэша достигается со временем. Однако, как только равновесие Нэша будет достигнуто, оно не будет отклоняться от него. После того, как мы научимся находить равновесие Нэша, посмотрим, как одностороннее движение повлияет на ситуацию. Есть ли в этом смысл? Так не должно быть, и поэтому равновесие Нэша описывается как «без сожалений». Как правило, в игре может быть более одного равновесия.

    Однако это обычно происходит в играх с более сложными элементами, чем два выбора двумя игроками. В одновременных играх, которые повторяются с течением времени, одно из этих множественных равновесий достигается после некоторых проб и ошибок. Этот сценарий различных вариантов выбора в течение долгого времени до достижения равновесия чаще всего разыгрывается в деловом мире, когда две фирмы определяют цены на продукты с высокой степенью взаимозаменяемости, такие как авиабилеты или безалкогольные напитки.

    Вы когда-нибудь видели, чтобы тренер соперника брал тайм-аут прямо перед тем, как кикер другой команды должен попытаться забить победный бросок с игры? Th

    Влияние теории игр

    Теория игр присутствует почти в каждой отрасли или области исследований. Его обширная теория может относиться ко многим ситуациям, что делает ее универсальной и важной теорией для понимания. Вот несколько областей исследований, на которые непосредственно повлияла теория игр.

    Экономика

    Теория игр произвела революцию в экономике, решив важнейшие проблемы предшествующих математических экономических моделей. Например, неоклассическая экономическая теория изо всех сил пыталась понять предпринимательское ожидание и не могла справиться с несовершенной конкуренцией. Теория игр переключила внимание с установившегося равновесия на рыночный процесс.

    Экономисты часто используют теорию игр для понимания поведения олигополистических фирм. Это помогает предсказать вероятные результаты, когда фирмы участвуют в определенных действиях, таких как установление цен и сговор.

    Бизнес

    В бизнесе теория игр полезна для моделирования конкурирующего поведения между экономическими агентами. У предприятий часто есть несколько стратегических вариантов, которые влияют на их способность получать экономическую выгоду. Например, предприятия могут столкнуться с такими дилеммами, как отказаться от существующих продуктов, разработать новые или использовать новые маркетинговые стратегии.

    Компании также часто могут выбирать своего противника. Некоторые сосредотачиваются на внешних силах и конкурируют с другими участниками рынка. Другие ставят внутренние цели и стремятся быть лучше предыдущих версий себя. Будь то внешние или внутренние компании, они всегда конкурируют за ресурсы, пытаясь нанять лучших кандидатов у своих конкурентов и отвлечь внимание клиентов от конкурирующих товаров.

    Теория игр в бизнесе может больше всего напоминать игровое дерево, как показано ниже. Компания может начать с позиции один и должна решить два исхода. Однако постоянно приходится принимать другие решения; окончательная сумма выплаты не известна до тех пор, пока не будет принято окончательное решение.

    Пример дерева игры.

    Интернет-энциклопедия философии

    Управление проектами

    Управление проектами включает социальные аспекты теории игр, поскольку разные участники могут иметь разное влияние. Например, руководитель проекта может быть поощрен за успешное завершение проекта по развитию здания. Между тем, строитель может быть заинтересован в том, чтобы работать медленнее из соображений безопасности или отложить проект, чтобы потратить больше оплачиваемых часов.

    При работе с внутренней командой теория игр может быть менее распространенной, поскольку все участники, работающие на одного и того же работодателя, часто имеют более общий интерес к успеху. Однако сторонние консультанты или внешние стороны, помогающие проекту, могут быть поощрены другими способами, не связанными с успехом проекта.

    Цены на потребительские товары

    Стратегия покупок в Черную пятницу лежит в основе теории игр. Концепция гласит, что если компании снизят цены, больше потребителей купят больше товаров. Отношения между потребителем, товаром и финансовым обменом для передачи права собственности играют важную роль в теории игр, поскольку у каждого потребителя свой набор ожиданий.

    Помимо масштабных распродаж в преддверии праздников, компании должны использовать теорию игр при установлении цен на продукты для запуска или в ожидании конкуренции со стороны конкурирующих товаров. Компания должна сбалансировать слишком низкую цену на товар и не получать прибыль, но слишком высокая цена на товар может отпугнуть покупателей от товара-заменителя.

    Типы теорий игр

    Кооперативные и некооперативные игры

    Хотя существует множество типов теорий игр (например, симметричные/асимметричные, одновременные/последовательные и т. д.), наиболее распространенными являются кооперативные и некооперативные теории игр. Кооперативная теория игр имеет дело с тем, как взаимодействуют коалиции или кооперативные группы, когда известны только выигрыши. Это игра между коалициями игроков, а не между отдельными людьми, и в ней ставится вопрос о том, как формируются группы и как они распределяют выигрыш между игроками.

    Некооперативная теория игр имеет дело с тем, как рациональные экономические агенты взаимодействуют друг с другом для достижения своих целей. Наиболее распространенной некооперативной игрой является стратегическая игра, в которой перечислены только доступные стратегии и результаты, являющиеся результатом комбинации выборов. Упрощенный пример реальной некооперативной игры — камень-ножницы-бумага.

    Игры с нулевой суммой и игры с ненулевой суммой

    Когда существует прямой конфликт между несколькими сторонами, стремящимися к одному и тому же результату, этот тип игры часто представляет собой игру с нулевой суммой. Это означает, что на каждого победителя приходится проигравший. В качестве альтернативы это означает, что полученная коллективная чистая выгода равна потерянной коллективной чистой выгоде. Почти каждое спортивное событие представляет собой игру с нулевой суммой, в которой одна команда побеждает, а другая проигрывает.

    Игра с ненулевой суммой — это игра, в которой все участники могут выиграть или проиграть одновременно. Рассмотрите деловые партнерства, которые являются взаимовыгодными и способствуют повышению ценности для обеих сторон. Вместо того, чтобы конкурировать и пытаться «выиграть», выигрывают обе стороны.

    Инвестирование и торговля акциями иногда считается игрой с нулевой суммой. Ведь один участник рынка купит акцию, а другой участник продаст ту же акцию по той же цене. Однако, поскольку разные инвесторы имеют разные аппетиты к риску и цели инвестирования, сделка может быть взаимовыгодной для обеих сторон.

    Игры с одновременным ходом или с последовательным ходом

    Много раз в жизни теория игр представляла собой ситуации с одновременными ходами. Это означает, что каждый участник должен постоянно принимать решения, в то время как их противник принимает решения. По мере того, как компании разрабатывают свои планы маркетинга, разработки продуктов и операционных планов, конкурирующие компании одновременно делают то же самое.

    В некоторых случаях имеет место преднамеренное чередование этапов принятия решений, когда одна сторона может видеть действия другой стороны, прежде чем делать свои собственные. Это обычно всегда присутствует на переговорах; одна сторона перечисляет свои требования, затем у другой стороны есть определенное количество времени, чтобы ответить и перечислить свои собственные.

    Один выстрел против повторных игр

    Наконец, теория игр может начинаться и заканчиваться в одном экземпляре. Как и многое в жизни, лежащее в основе соревнование начинается, развивается, заканчивается и не может быть переделано. Это часто имеет место в случае с фондовыми трейдерами, которые должны мудро выбирать свою точку входа и точку выхода, поскольку их решение не может быть легко отменено или повторено.

    С другой стороны, некоторые повторяющиеся игры продолжаются и никогда не заканчиваются. В играх такого типа часто каждый раз участвуют одни и те же участники, и каждая сторона знает, что произошло в прошлый раз. Например, рассмотрим конкурирующие компании, пытающиеся установить цену на свои товары. Всякий раз, когда один из них корректирует цену, это может сделать и другой. Эта круговая конкуренция повторяется в течение цикла продукта или сезонности продаж.

    В приведенном ниже примере показано изображение дилеммы заключенного (обсуждается в следующем разделе). В этом изображении после первой итерации выигрыша нет. Вместо этого происходит вторая итерация игры, приносящая с собой новый набор результатов, невозможных в играх с одним выстрелом.

    Пример повторяющейся игры.

    Интернет-энциклопедия философии

    Примеры теории игр

    Теория игр анализирует несколько «игр». Ниже мы лишь кратко опишем некоторые из них.

    Дилемма заключенного

    Дилемма заключенного — самый известный пример теории игр. Рассмотрим пример двух преступников, арестованных за преступление. У прокуратуры нет веских доказательств, чтобы осудить их. Однако для получения признания чиновники выводят заключенных из одиночных камер и допрашивают каждого в отдельных камерах. Ни один из заключенных не имеет возможности общаться друг с другом. Официальные лица представляют четыре сделки, часто отображаемые в виде поля 2 x 2.

    1. =Если оба признаются, каждый из них получит по пять лет тюремного заключения.
    2. Если Заключенный 1 признается, а Заключенный 2 нет, Заключенный 1 получит три года, а Заключенный 2 — девять лет.
    3. Если Заключенный 2 признается, а Заключенный 1 нет, Заключенный 1 получит 10 лет, а Заключенный 2 — два года.
    4. Если ни один из них не признается, каждый будет отбывать по два года тюрьмы.

    Самая благоприятная стратегия — не признаваться. Однако ни один из них не знает о стратегии другого, и без уверенности в том, что один из них не признается, оба, вероятно, признаются и получат пятилетний тюремный срок. Равновесие Нэша предполагает, что в дилемме заключенного оба игрока сделают ход, который лучше для них по отдельности, но хуже для них в совокупности.

    Выражение «око за око» было определено как оптимальная стратегия для оптимизации дилеммы заключенного. Око за око было введено Анатолием Рапопортом, который разработал стратегию, в которой каждый участник повторяющейся дилеммы заключенного следует курсу действий, согласующемуся с предыдущим ходом их противника. Например, если его спровоцировать, игрок впоследствии ответит возмездием; если это неспровоцировано, игрок сотрудничает.

    На изображении ниже показана дилемма, когда выбор участника в столбце и выбор участника в строке могут конфликтовать. Например, обе стороны могут получить наиболее благоприятный исход, если обе выберут строку/столбец 1. Однако каждая из сторон сталкивается с риском сильных неблагоприятных исходов, если другая сторона не выберет такой же исход.

    Пример статической игры для двух человек.

    Интернет-энциклопедия философии

    Игра «Диктатор»

    Это простая игра, в которой игрок А должен решить, как разделить денежный приз с игроком Б, который не имеет никакого отношения к решению игрока А. Хотя это не стратегия теории игр как таковая , она дает некоторые интересные сведения о поведении людей. Эксперименты показывают, что около 50 % оставляют все деньги себе, 5 % делят их поровну, а остальные 45 % отдают другому участнику меньшую долю.

    Игра «диктатор» тесно связана с ультиматумной игрой, в которой игроку А дается определенная сумма денег, часть которой должна быть отдана игроку Б, который может принять или отклонить данную сумму. Суть в том, что если второй игрок отклоняет предложенную сумму, то и A, и B ничего не получают. Игры с диктатором и ультиматумом содержат важные уроки по таким вопросам, как благотворительность и филантропия.

    Дилемма волонтера

    В дилемме волонтера кто-то должен взять на себя работу по дому или работу для общего блага. Наихудший возможный результат реализуется, если никто не добровольно. Например, рассмотрим компанию, в которой процветает бухгалтерское мошенничество, хотя высшее руководство не знает об этом. Некоторые младшие сотрудники бухгалтерского отдела знают о мошенничестве, но не решаются сообщить об этом высшему руководству, потому что это приведет к увольнению сотрудников, причастных к мошенничеству, и, скорее всего, к судебному преследованию.

    Если вас заклеймят как разоблачителя, это также может иметь некоторые последствия в будущем. Но если никто не согласится, крупномасштабное мошенничество может привести к банкротству компании и потере работы всеми.

    Игра «Сороконожка»

    Игра «Сороконожка» — это игра в расширенной форме в теории игр, в которой два игрока поочередно получают шанс получить большую долю медленно растущего денежного запаса. Это устроено так, что если игрок передает тайник своему противнику, который затем забирает тайник, игрок получает меньшую сумму, чем если бы он взял банк.

    Игра с многоножкой завершается, как только игрок забирает тайник, при этом этот игрок получает большую часть, а другой игрок получает меньшую часть. В игре есть предопределенное общее количество раундов, которое заранее известно каждому игроку.

    Теория игр существует практически во всех сферах жизни. Поскольку решения других людей вокруг вас влияют на ваш день, теория игр относится к личным отношениям, покупательским привычкам, просмотру СМИ и хобби.

    Типы стратегий теории игр

    Участники теории игр могут выбирать между несколькими основными способами игры. В общем, каждый участник должен решить, на какой уровень риска он готов пойти и как далеко он готов зайти, чтобы добиться наилучшего возможного результата.

    Максимакс Стратегия

    Максимаксная стратегия не предполагает хеджирования. Участник либо ва-банк, либо весь в ауте; они либо выиграют по-крупному, либо столкнутся с худшими последствиями. Рассмотрим новые начинающие компании, выводящие на рынок новые продукты. Их новый продукт может привести к увеличению рыночной капитализации компании в пятьдесят раз. С другой стороны, неудачный запуск продукта сделает компанию банкротом. В любой ситуации участник готов рискнуть для достижения наилучшего результата, даже если возможен худший результат.

    Максимин Стратегия

    Максиминная стратегия в теории игр приводит к тому, что участник выбирает лучший выигрыш из худшего. Участник решил хеджировать риск и пожертвовать полной выгодой в обмен на избежание худшего исхода. Часто компании сталкиваются с этой стратегией и принимают ее при рассмотрении судебных исков. Договариваясь во внесудебном порядке и избегая публичного судебного разбирательства, компании соглашаются на неблагоприятный исход. Однако этот исход мог быть и хуже из-за подвигов суда или еще худшего судебного решения.

    Доминирующая стратегия

    В доминирующей стратегии участник выполняет действия, которые являются лучшим результатом для игры, независимо от того, что решили сделать другие участники. В бизнесе это может быть ситуация, когда компания решает масштабироваться и выйти на новый рынок, независимо от того, решила ли конкурирующая компания также выйти на рынок. В «Дилемме заключенного» доминирующей стратегией будет признание.

    Чистая стратегия

    Чистая стратегия влечет за собой наименьшее количество стратегических решений, поскольку чистая стратегия — это просто определенный выбор, который делается независимо от внешних сил или действий других. Рассмотрим игру «камень-ножницы-бумага», в которой один участник решает бросать одну и ту же фигуру в каждом испытании. Поскольку исход для этого участника заранее определен (исходы либо определенной формы, либо не такой конкретной формы), стратегия определяется как чистая.

    Смешанная стратегия

    Смешанная стратегия может показаться случайной, но для разработки плана смешивания элементов или действий требуется много размышлений. Рассмотрим отношения между бейсбольным питчером и отбивающим. Питчер не может каждый раз бросать одну и ту же подачу; в противном случае отбивающий мог бы предсказать, что будет дальше. Вместо этого питчер должен смешивать свою стратегию от подачи к подаче, чтобы создать ощущение непредсказуемости, от которого он надеется извлечь выгоду.

    Ограничения теории игр

    Самая большая проблема с теорией игр заключается в том, что, как и большинство других экономических моделей, она основана на предположении, что люди — это рациональные действующие лица, преследующие собственные интересы и стремящиеся к максимизации полезности. Конечно, мы социальные существа, которые часто сотрудничают за свой счет. Теория игр не может объяснить тот факт, что в одних ситуациях мы можем попасть в равновесие по Нэшу, а в других — нет, в зависимости от социального контекста и игроков.

    Кроме того, теория игр часто с трудом учитывает такие человеческие элементы, как лояльность, честность или сочувствие. Хотя статистические и математические расчеты могут диктовать, каким должен быть наилучший курс действий, люди могут не пойти по этому пути из-за непредсказуемых и сложных сценариев самопожертвования или манипуляции. Теория игр может анализировать набор моделей поведения, но не может точно предсказать человеческий фактор.

    В какие игры играют в теории игр?

    Это называется теорией игр, поскольку теория пытается понять стратегические действия двух или более «игроков» в данной ситуации, содержащей установленные правила и исходы. Хотя теория игр используется в нескольких дисциплинах, она в первую очередь используется в качестве инструмента при изучении бизнеса и экономики.

    «Игры» могут заключаться в том, как две конкурирующие фирмы будут реагировать на снижение цен другой, должна ли одна фирма приобретать другую или как трейдеры на фондовом рынке могут реагировать на изменения цен. Теоретически эти игры можно разделить на дилеммы заключенного, игру в диктатора, ястреб-и-голубь, Баха или Стравинского.

    Какие предположения об этих играх?

    Как и многие экономические модели, теория игр также содержит набор строгих допущений, которые должны выполняться, чтобы теория могла делать хорошие прогнозы на практике. Во-первых, все игроки являются рациональными акторами, стремящимися к максимизации полезности и обладающими полной информацией об игре, правилах и последствиях. Игрокам не разрешается общаться или взаимодействовать друг с другом. Возможные исходы не только известны заранее, но и не могут быть изменены. Теоретически количество игроков в игре может быть бесконечным, но в большинстве игр будет только два игрока.

    Что такое равновесие Нэша?

     Равновесие по Нэшу – это важное понятие, относящееся к стабильному состоянию в игре, когда ни один игрок не может получить преимущество, в одностороннем порядке изменив стратегию, при условии, что другие участники также не меняют свои стратегии.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    © 2015 - 2019 Муниципальное казённое общеобразовательное учреждение «Таловская средняя школа»

    Карта сайта