Эволюционная теория игр - Evolutionary game theory

Эволюционная теория игр ( EGT ) - это приложение теории игр к развивающимся популяциям в биологии . Он определяет структуру соревнований, стратегий и аналитики, в которых может быть смоделировано дарвиновское соревнование. Она возникла в 1973 году с формализации соревнований Джона Мейнарда Смита и Джорджа Р. Прайса , анализируемых как стратегии и математические критерии, которые можно использовать для прогнозирования результатов конкурирующих стратегий.

Эволюционная теория игр отличается от классической теории игр тем, что уделяет больше внимания динамике изменения стратегии. На это влияет частота конкурирующих стратегий в популяции.

Эволюционная теория игр помогла объяснить основы альтруистического поведения в дарвиновской эволюции . Он, в свою очередь, заинтересовал экономистов , социологов , антропологов и философов .

История

Классическая теория игр

Классическая теория некооперативных игр была задумана Джоном фон Нейманом для определения оптимальных стратегий в соревнованиях между противниками. В состязании участвуют игроки, каждый из которых может выбрать ход. Игры могут быть однократными или повторяющимися. Подход игрока к своим ходам составляет его стратегию. Правила определяют исход ходов, предпринятых игроками, и результаты производят выплаты игрокам; правила и результирующие выплаты могут быть выражены в виде деревьев решений или в виде матрицы выигрышей . Классическая теория требует от игроков делать рациональный выбор. Каждый игрок должен учитывать стратегический анализ, который проводят его противники, чтобы сделать свой собственный выбор ходов.

Проблема ритуализированного поведения

Биолог-математик Джон Мейнард Смит моделировал эволюционные игры.

Эволюционная теория игр началась с проблемы, как объяснить ритуализированное поведение животных в конфликтной ситуации; «Почему животные такие« джентльменские или женственные »в конкурсах на ресурсы?» Ведущие этологи Нико Тинберген и Конрад Лоренц предположили, что такое поведение существует на благо вида . Джон Мейнард Смит считал, что это несовместимо с дарвиновской мыслью, согласно которой отбор происходит на индивидуальном уровне, поэтому личный интерес вознаграждается, а стремление к общему благу - нет. Мэйнард Смит, математический биолог, обратился к теории игр, как это было предложено Джорджем Прайсом, хотя попытки Ричарда Левонтина использовать эту теорию не увенчались успехом.

Адаптация теории игр к эволюционным играм

Мейнард Смит понял, что эволюционная версия теории игр не требует от игроков рациональных действий - только то, что у них есть стратегия. Результаты игры показывают, насколько хороша была эта стратегия, точно так же, как эволюция проверяет альтернативные стратегии на способность выживать и воспроизводиться. В биологии стратегии - это генетически унаследованные черты, которые контролируют действия человека, аналогично компьютерным программам. Успех стратегии определяется тем, насколько хороша стратегия при наличии конкурирующих стратегий (включая ее саму) и от частоты, с которой эти стратегии используются. Мейнард Смит описал свою работу в своей книге « Эволюция и теория игр» .

Участники стремятся создать как можно больше копий самих себя, и выигрыш выражается в единицах приспособленности (относительная ценность способности воспроизводить). Это всегда многопользовательская игра с множеством конкурентов. Правила включают динамику репликатора, другими словами, как более приспособленные игроки будут порождать больше копий самих себя в популяции и как менее подходящие будут отбракованы в уравнении репликатора . Динамика репликатора моделирует наследственность, но не мутацию, и для простоты предполагает бесполое размножение. Игры запускаются повторно без каких-либо условий завершения. Результаты включают динамику изменений в популяции, успешность стратегии и любые достигнутые состояния равновесия. В отличие от классической теории игр, игроки не выбирают свою стратегию и не могут ее изменить: они рождаются со стратегией, и их дети наследуют ту же стратегию.

Эволюционные игры

Модели

Эволюционная теория игр анализирует дарвиновские механизмы с помощью системной модели с тремя основными компонентами - популяцией , игрой и динамикой репликатора . Системный процесс состоит из четырех фаз:

1) Модель (как сама эволюция) имеет дело с популяцией (Pn). Население будет демонстрировать вариации среди конкурирующих индивидов. В модели это соревнование представлено игрой.

2) Игра проверяет стратегии людей в соответствии с правилами игры. Эти правила производят разные выплаты - в единицах приспособленности (скорости производства потомства). Конкурирующие особи встречаются в парных состязаниях с другими, как правило, в очень смешанном распределении популяции. Сочетание стратегий в популяции влияет на результаты выплат, изменяя шансы того, что любой человек может встретиться в соревнованиях с различными стратегиями. Участники покидают парное соревнование, в результате чего их приспособленность определяется результатом соревнования, представленным в матрице выплат .

3) На основе этой результирующей пригодности каждый член популяции затем подвергается репликации или отбраковке, определяемой точной математикой процесса динамики репликатора . Этот общий процесс затем производит новое поколение P (n + 1). У каждого выжившего теперь новый уровень физической подготовки, определяемый результатом игры.

4) Новое поколение занимает место предыдущего, и цикл повторяется. Состав популяции может перейти к эволюционно стабильному состоянию, в которое не может вторгнуться никакая мутантная стратегия.

Эволюционная теория игр охватывает дарвиновскую эволюцию, включая конкуренцию (игру), естественный отбор (динамика репликатора) и наследственность. Эволюционная теория игр внесла свой вклад в понимание группового отбора , полового отбора , альтруизма , родительской заботы , совместной эволюции и экологической динамики. Многие противоречащие интуиции ситуации в этих областях получили прочную математическую основу благодаря использованию этих моделей.

Обычный способ изучения эволюционной динамики в играх - это уравнения репликатора . Они показывают скорость роста доли организмов, использующих определенную стратегию, и эта скорость равна разнице между средним выигрышем от этой стратегии и средним выигрышем для популяции в целом. Уравнения непрерывного репликатора предполагают бесконечные популяции, непрерывное время , полное перемешивание, и что стратегии порождают верные. В аттракторы (стабильные фиксированные точки) уравнений эквивалентны эволюционно стабильных состояний . Стратегия, способная пережить все «мутантные» стратегии, считается эволюционно стабильной. В контексте поведения животных это обычно означает, что такие стратегии запрограммированы и находятся под сильным влиянием генетики , что делает стратегию любого игрока или организма определяемой этими биологическими факторами.

Эволюционные игры - это математические объекты с разными правилами, выплатами и математическим поведением. Каждая «игра» представляет разные проблемы, с которыми приходится иметь дело организмам, и стратегии, которые они могут использовать для выживания и воспроизводства. Эволюционным играм часто дают красочные названия и прикрытия, которые описывают общую ситуацию в конкретной игре. Репрезентативные игры включают ястреба-голубя , войну на истощение , охоту на оленей , продюсер-скаунджер , трагедию общества и дилемму заключенного . Стратегии для этих игр включают ястреба, голубя, буржуа, исследователя, перебежчика, оценщика и возмездия. Различные стратегии соревнуются по правилам конкретной игры, а математика используется для определения результатов и поведения.

Ястребиный голубь

Решение игры с голубем-ястребом для V = 2, C = 10 и начальной базы пригодности B = 4. Приспособленность ястреба к разным смесям населения показана черной линией, а голубя - красной. ESS (стационарная точка) будет существовать, когда приспособленность ястреба и голубя одинакова: ястребы составляют 20% населения, а голуби - 80% населения.

Первая игра, которую проанализировал Мейнард Смит, - это классическая игра « Ястреб-голубь» . Он был задуман для анализа проблемы Лоренца и Тинбергена - состязания за общий ресурс. Конкурсанты могут быть как ястребом, так и голубем. Это два подтипа или морфа одного вида с разными стратегиями. Ястреб сначала проявляет агрессию, затем переходит в драку, пока не выиграет, либо не получит травму (проиграет). Голубь сначала проявляет агрессию, но, столкнувшись с серьезной эскалацией, спасается бегством. Если не столкнуться с такой эскалацией, голубь попытается поделиться ресурсом.

Матрица выплат для игры с голубем-ястребом
встречает ястреба встречает голубя
если ястреб V / 2 - C / 2 V
если голубь 0 V / 2

Учитывая, что ресурсу присвоено значение V, урон от проигрыша в бою оценивается стоимостью C:

  • Если ястреб встречает голубя, ястреб получает полный ресурс V
  • Если ястреб встречает ястреба, в половине случаев он выигрывает, в половине случаев проигрывает ... так что средний результат будет тогда V / 2 минус C / 2.
  • Если голубь встречает ястреба, голубь отступит и ничего не получит - 0
  • Если голубь встречает голубя, оба делятся ресурсом и получают V / 2

Однако фактический выигрыш зависит от вероятности встречи с ястребом или голубем, что, в свою очередь, представляет собой процентное соотношение ястребов и голубей в популяции на момент проведения конкретного соревнования. Это, в свою очередь, определяется результатами всех предыдущих конкурсов. Если цена проигрыша C больше, чем ценность выигрыша V (нормальная ситуация в мире природы), математика завершается эволюционно стабильной стратегией (ESS), смесь двух стратегий, в которой популяция ястребов равна V / C. . Популяция возвращается к этой точке равновесия, если новые ястребы или голуби производят временное возмущение в популяции. Решение игры с голубем-ястребом объясняет, почему большинство соревнований животных включает в себя только ритуальные боевые действия в соревнованиях, а не прямые сражения. Результат вовсе не зависит от поведения « хорошего вида », как предполагает Лоренц, а исключительно от последствий действий так называемых эгоистичных генов .

Война на истощение

В игре с голубем-ястребом ресурс является общим, что дает выигрыши обоим голубям, которые встречаются в парном состязании. Если ресурс не подлежит совместному использованию, но альтернативный ресурс может быть доступен путем отступления и попытки в другом месте, чистые стратегии «ястреб» или «голубь» менее эффективны. Если нераспределенный ресурс сочетается с высокой стоимостью проигрыша в состязании (травма или возможная смерть), выигрыши как ястреба, так и голубя еще больше уменьшаются. Тогда становится жизнеспособной более безопасная стратегия демонстрации с меньшими затратами, блефа и ожидания победы - стратегия блефа. Тогда игра становится одной из накапливаемых затрат, либо затрат на демонстрацию, либо затрат на длительное неразрешенное взаимодействие. По сути, это аукцион; Победитель - участник, который проглотит более высокую цену, в то время как проигравший получит ту же цену, что и победитель, но не получит ресурсов. Полученная в результате математическая теория эволюционной теории игр привела к оптимальной стратегии временного блефа.

Война на истощение за разные ценности ресурса. Обратите внимание на время, необходимое для того, чтобы 50% участников покинули турнир, в сравнении со стоимостью (V) ресурса, за который идет борьба.

Это связано с тем, что в войне на истощение любая стратегия, которая является непоколебимой и предсказуемой, нестабильна, потому что в конечном итоге она будет вытеснена стратегией мутантов, которая полагается на тот факт, что она может превзойти существующую предсказуемую стратегию, вложив дополнительную небольшую дельту ресурса ожидания. чтобы гарантировать, что он выиграет. Следовательно, только случайная и непредсказуемая стратегия может удержаться в популяции блефующих. По сути, участники выбирают приемлемые затраты, которые будут понесены в зависимости от ценности искомого ресурса, фактически делая случайную ставку как часть смешанной стратегии (стратегии, в которой участник имеет несколько или даже много возможных действий в своей стратегии. ). Это реализует распределение ставок для ресурса с определенным значением V, где ставка для любого конкретного конкурса выбирается случайным образом из этого распределения. Распределение (ESS) можно вычислить с помощью теоремы Бишопа-Каннингса, которая верна для любой ESS со смешанной стратегией. Функция распределения в этих соревнованиях была определена Паркером и Томпсоном следующим образом:

В результате совокупное количество бросивших курить для любой конкретной стоимости m в этом решении "смешанной стратегии" составляет:

как показано на соседнем графике. Подтверждено интуитивное ощущение, что более высокие значения искомого ресурса приводят к увеличению времени ожидания. Это наблюдается в природе, как у самцов навозных мух, соревнующихся за места спаривания, где время выхода из участия в соревнованиях соответствует предсказанию математической теории эволюции.

Асимметрии, которые позволяют новые стратегии

Навозная муха ( Scatophaga stercoraria ) - игрок войны на истощение
Креветка-богомол охраняет свой дом с помощью буржуазной стратегии
Примеры стратегии животных: исследуя поведение, а затем определяя как затраты, так и ценность ресурсов, полученных в соревновании, можно проверить стратегию организма.

В войне на истощение не должно быть ничего, что сигнализировало бы противнику о размере ставки, иначе противник может использовать сигнал в эффективной контр-стратегии. Однако существует стратегия мутанта, которая может лучше блефовать в войне на истощение, если существует подходящая асимметрия, - буржуазная стратегия. Буржуа использует некую асимметрию, чтобы выйти из тупика. В природе одна из таких асимметрий - владение ресурсом. Стратегия состоит в том, чтобы сыграть ястреба, если он владеет ресурсом, но показать его, а затем отступить, если он не владеет. Это требует большей познавательной способности, чем ястреб, но буржуазия обычна во многих состязаниях животных, таких как состязания креветок-богомолов и пятнистых древесных бабочек .

Социальное поведение

Альтернативы теоретико-игровому социальному взаимодействию

Такие игры, как ястребиный голубь и война на истощение, представляют собой чистое соревнование между людьми и не имеют сопутствующих социальных элементов. В тех случаях, когда существует социальное влияние, у конкурентов есть четыре возможных альтернативы стратегическому взаимодействию. Это показано на рисунке рядом, где знак «плюс» представляет выгоду, а знак «минус» - стоимость.

  • В кооперативных или мутуалистических отношениях и «донор», и «получатель» почти неразличимы, поскольку оба получают выгоду в игре, сотрудничая, то есть пара находится в игровой ситуации, когда оба могут получить выгоду, выполняя определенную стратегию, или, альтернативно, оба должны действовать согласованно из-за некоторых ограничивающих факторов, которые фактически ставят их «в одну лодку».
  • В альтруистических отношениях донор за свой счет приносит пользу получателю. В общем случае получатель будет иметь родственные отношения с дарителем, и пожертвование будет односторонним. Поведение, при котором выгоды предоставляются альтернативно (в обоих направлениях) за определенную плату, часто называют «альтруистическим», но при анализе можно увидеть, что такой «альтруизм» возникает из оптимизированных «эгоистичных» стратегий.
  • Злоба - это, по сути, «обратная» форма альтруизма, когда союзнику помогают нанести урон его конкурентам. В общем случае союзник связан с родством, и его выгода - более легкая конкурентная среда для союзника. Примечание: Джордж Прайс, один из первых математиков альтруизма и злобы, счел эту эквивалентность особенно тревожной на эмоциональном уровне.
  • Эгоизм - это базовый критерий любого стратегического выбора с точки зрения теории игр - стратегии, не нацеленные на самовыживание и самовоспроизведение, недолговечны для любой игры. Однако критически важно, что на эту ситуацию влияет тот факт, что конкуренция происходит на нескольких уровнях - то есть на генетическом, индивидуальном и групповом уровне.

Конкурсы эгоистичных генов

Суслики- самки Белдинга рискуют жизнью, громко крича тревогу, защищая близкородственных самок-членов колонии; самцы менее близки и не зовут.

На первый взгляд может показаться, что участниками эволюционных игр являются люди, присутствующие в каждом поколении и принимающие непосредственное участие в игре. Но люди живут только в одном игровом цикле, и вместо этого на протяжении этих многопоколенческих игр на самом деле конкурируют друг с другом стратегии. Таким образом, в конечном итоге именно гены разыгрывают полную конкуренцию - эгоистичные гены стратегии. Конкурирующие гены присутствуют в человеке и в некоторой степени во всех его родственниках. Иногда это может сильно повлиять на то, какие стратегии выживают, особенно в вопросах сотрудничества и отступничества. Уильям Гамильтон , известный своей теорией родственного отбора , исследовал многие из этих случаев, используя теоретико-игровые модели. Связанное с родством отношение к игровым состязаниям помогает объяснить многие аспекты поведения социальных насекомых , альтруистическое поведение при взаимодействии родителей и потомков, поведение взаимной защиты и совместную заботу о потомстве . Для таких игр Гамильтон определил расширенную форму приспособленности - инклюзивную приспособленность , которая включает в себя потомство человека, а также любые эквиваленты потомства, найденные в родственниках.

Математика родственного отбора
Концепция родственного отбора такова:
инклюзивный фитнес = собственный вклад в фитнес + вклад всех родственников .

Пригодность измеряется относительно средней численности населения; например, приспособленность = 1 означает рост со средней скоростью для популяции, приспособленность <1 означает уменьшение доли в популяции (вымирание), приспособленность> 1 означает увеличение доли в популяции (захват).

Включено приспособленность индивидуального ш I является суммой его специфической пригодности себе я плюс специфической пригодность каждого относительно взвешенного по степени связанности , который приравнивает к суммированию всех г J * Ь J .... ... где r j - родство конкретного родственника, а b j - приспособленность этого конкретного родственника, производя:

Если человек a i жертвует своим «собственным средним эквивалентом пригодности, равным 1», принимая стоимость пригодности C, а затем, чтобы «вернуть эту потерю», w i все равно должен быть 1 (или больше 1) ... и используя R * B для представления результатов суммирования в:

1 <(1-С) + РБ .... или перестановкой ..... R> C / B .

Гамильтон вышел за рамки родственных связей и начал работать с Робертом Аксельродом , анализируя игры сотрудничества в условиях, не связанных с родством, где вступал в игру взаимный альтруизм .

Эусоциальность и родственный отбор

Рабочие- мясные муравьи (всегда самки) относятся к родителю в 0,5 раза, сестре в 0,75, ребенку в 0,5 и брату в 0,25 раза. Поэтому значительно выгоднее помочь родить сестру (0,75), чем иметь ребенка (0,5).

Рабочие-насекомые- эусоциальные насекомые лишаются репродуктивных прав своей королевы. Было высказано предположение, что родственный отбор, основанный на генетическом составе этих рабочих, может предрасполагать их к альтруистическому поведению. Большинство обществ насекомых обладают гаплодиплоидной половой детерминацией, что означает необычно близкое родство рабочих.

Это объяснение эусоциальности насекомых, однако, было оспорено несколькими высокопоставленными теоретиками эволюционных игр (Новак и Уилсон), которые опубликовали спорное альтернативное теоретико-игровое объяснение, основанное на последовательном развитии и эффектах группового отбора, предложенных для этих видов насекомых.

Дилемма заключенного

Трудность теории эволюции, признанная самим Дарвином, заключалась в проблеме альтруизма . Если основа для отбора находится на индивидуальном уровне, альтруизм вообще не имеет смысла. Но универсальный отбор на уровне группы (на благо вида, а не отдельного человека) не выдерживает проверки математикой теории игр и, конечно же, не является общим случаем в природе. Тем не менее, у многих социальных животных существует альтруистическое поведение. Решение этой проблемы можно найти в применении эволюционной теории игр к игре «дилемма заключенного» - игре, которая проверяет выгоды сотрудничества или отказа от сотрудничества. Это самая изученная игра во всей теории игр.

Анализ дилеммы заключенного представляет собой повторяющуюся игру. Это дает участникам возможность отомстить за дезертирство в предыдущих раундах игры. Многие стратегии были протестированы; лучшая конкурентная стратегия - это общее сотрудничество с сдержанной ответной реакцией, если это необходимо. Самый известный и один из самых успешных из них - это « око за око» с простым алгоритмом.

def tit_for_tat(last_move_by_opponent):
    if last_move_by_opponent == defect:
        defect()
    else:
        cooperate()

Выплата за один раунд игры определяется матрицей выплат за один раунд игры (показанной на гистограмме 1 ниже). В играх с несколькими раундами в каждом конкретном раунде можно сделать различные варианты - сотрудничать или совершить ошибку, что приведет к выплате определенного раунда. Однако именно возможные накопленные выигрыши за несколько раундов учитываются при формировании общих выигрышей для различных многоэтапных стратегий, таких как «око за око».

Выплаты в двух разновидностях игры-дилеммы заключенного Дилемма
заключенного: сотрудничать или
отказываться. Выплата (искушение побегом против сотрудничества) > Выплата (взаимное сотрудничество) > Выплата (совместное отступничество) > Выплата (присоска сотрудничает, но противник. дефекты)

Пример 1: Простая игра с дилеммой заключенного в один раунд. Классическая игра с дилеммой заключенного дает игроку максимальную выгоду, если он отступает, а его партнер сотрудничает (этот выбор известен как искушение ). Однако, если игрок сотрудничает, а его партнер отказывает, он получает наихудший результат (расплата за бездельников). В этих условиях выигрыша лучший выбор ( равновесие по Нэшу ) - отказаться.

Пример 2: повторяется дилемма заключенного. Используемая стратегия - это « око за око», которая изменяет поведение в зависимости от действий, предпринятых партнером в предыдущем раунде, т.е. вознаграждение за сотрудничество и наказание за отступничество. Эффект от этой стратегии в накоплении выигрыша за многие раунды состоит в том, чтобы обеспечить более высокий выигрыш за сотрудничество обоих игроков и меньший выигрыш за отступничество. Это устраняет соблазн отступить. Выплата лохов также становится меньше, хотя «вторжение» в результате чистой стратегии отступничества не устраняется полностью.

Пути к альтруизму

Альтруизм имеет место, когда один человек за счет (C) для себя применяет стратегию, которая приносит пользу (B) другому человеку. Цена может состоять в потере способности или ресурса, который помогает в битве за выживание и воспроизводство, или в дополнительном риске для собственного выживания. Стратегии альтруизма могут возникнуть через:

Тип Относится к: Ситуация Математический эффект
Родственный отбор - (включая пригодность родственных участников) Родственники - генетически родственные особи Участники эволюционной игры - это гены стратегии. Лучшее вознаграждение для человека не обязательно является лучшим вознаграждением для гена. В любом поколении ген игрока находится не только у одного человека, но и в родственной группе. Самый высокий выигрыш в пригодности для родственной группы выбирается естественным отбором. Следовательно, стратегии, включающие самопожертвование со стороны отдельных лиц, часто оказываются в выигрыше - это эволюционно стабильная стратегия. Животные должны жить в родственных группах во время части игры, чтобы возможность для этого альтруистического жертвоприношения когда-либо имела место. Игры должны учитывать инклюзивную физическую форму. Функция приспособленности - это совокупная приспособленность группы связанных участников, каждый из которых взвешен по степени родства, относительно общей генетической популяции. Математический анализ этого геноцентрического взгляда на игру приводит к правилу Гамильтона, согласно которому родство альтруистического донора должно превышать соотношение затрат и выгод самого альтруистического акта:
R> c / b R - взаимосвязь, c - стоимость, b - выгода
Прямая взаимность Конкурсанты, торгующие одолжениями в парных отношениях Теоретико-игровое воплощение "Я почешу тебе спину, если ты почешь мою". Пара людей обменивается услугами в игре, состоящей из нескольких раундов. Люди узнают друг друга как партнеры. Термин «прямой» применяется, потому что ответная услуга возвращается только партнеру в паре. Характеристики многораундовой игры создают опасность дезертирства и потенциально меньшую отдачу от сотрудничества в каждом раунде, но любое такое отступление может привести к наказанию в следующем раунде, превращая игру в повторяющуюся дилемму заключенного. Таким образом, на первый план выходит семейство стратегий «око за око».
Косвенная взаимность Связанные или не связанные участники обмениваются услугами, но без партнерства. Ответная услуга «подразумевается», но без конкретного идентифицированного источника, кто ее должен ее оказать. Ответная услуга не исходит от какого-либо конкретного установленного партнера. Возможность косвенной взаимности существует для конкретного организма, если он живет в группе людей, которые могут взаимодействовать в течение длительного периода времени.

Утверждалось, что человеческое поведение при установлении моральных систем, а также расходование значительной энергии в человеческом обществе на отслеживание репутации индивидов является прямым следствием зависимости общества от стратегий косвенного взаимного обмена.

Игра очень восприимчива к дезертирству, так как прямой ответный удар невозможен. Следовательно, косвенная взаимность не сработает без учета социального рейтинга - меры прошлого сотрудничества. Математика приводит к модифицированной версии правила Гамильтона, где:
q> c / b, где q (вероятность узнать социальную оценку) должно быть больше, чем соотношение затрат и выгод.

Организмы, использующие социальную оценку, называются Дискриминаторами и требуют более высокого уровня познания, чем стратегии простой прямой взаимности. Как сказал биолог-эволюционист Дэвид Хейг: «Для прямой взаимности нужно лицо; для косвенной взаимности нужно имя».

Эволюционно стабильная стратегия

Матрица выигрыша для игры «Ястреб-голубь» с добавлением стратегии оценщика. Он «изучает своего оппонента», ведя себя как ястреб, когда сопоставляется с противником, он оценивает «слабее», как голубь, когда противник кажется больше и сильнее. Assessor - это ESS, поскольку он может вторгаться в популяции как ястребов, так и голубей, и может противостоять вторжению мутантов-ястребов или голубей.

Эволюционно стабильная стратегия (ЕСС) сродни равновесие Нэша в классической теории игр, но с математически расширенными критериями. Равновесие по Нэшу - это игровое равновесие, в котором для любого игрока нерационально отклоняться от своей нынешней стратегии при условии, что другие придерживаются своих стратегий. ESS - это состояние игровой динамики, при котором в очень большой популяции конкурентов другая мутантная стратегия не может успешно проникнуть в популяцию, чтобы нарушить существующую динамику (которая сама зависит от состава популяции). Следовательно, успешная стратегия (с ESS) должна быть как эффективной против конкурентов, когда это редко - войти в предыдущую конкурирующую популяцию, так и успешной, когда позже будет большая доля в популяции - для защиты. Это, в свою очередь, означает, что стратегия должна быть успешной, когда она борется с другими, такими же, как она сама.

ESS - это не:

  • Оптимальная стратегия: это максимизирует физическую форму, а многие состояния ESS намного ниже максимальной пригодности, достижимой в фитнес-ландшафте. (В качестве примера см. График ястребиного голубя выше.)
  • Единственное решение: часто в конкурентной ситуации может существовать несколько условий ESS. Конкретный конкурс может стабилизироваться в любой из этих возможностей, но позже серьезное изменение условий может переместить решение в одно из альтернативных состояний ESS.
  • Всегда присутствовать: возможно, что не будет ESS. Эволюционная игра без ESS - это игра «камень-ножницы-бумага», которая встречается у таких видов, как ящерица с пятнами сбоку ( Uta stansburiana ).
  • Непревзойденная стратегия: ESS - это всего лишь непреодолимая стратегия.
Самки воронкообразных пауков (Agelenopsis aperta) соревнуются друг с другом за обладание своей паутиной пустыни, используя стратегию оценщика.

Состояние ESS можно решить, исследуя либо динамику изменения населения для определения ESS, либо решая уравнения для условий стабильной стационарной точки, которые определяют ESS. Например, в игре с голубем-ястребом мы можем посмотреть, существует ли статическое состояние смешивания популяции, при котором приспособленность голубей будет точно такой же, как приспособленность ястребов (следовательно, оба имеют одинаковые темпы роста - статическая точка).

Пусть вероятность встречи с ястребом = p, поэтому вероятность встречи с голубем равна (1-p)

Пусть Whawk равняется награде за ястреба ...

Whawk = выплата за шанс встретить голубя + выплата за шанс встречи с ястребом

Взяв результаты матрицы выплат и подставив их в приведенное выше уравнение:

Whawk = V · (1-p) + (V / 2-C / 2) · p

Аналогично для голубя:

Wdove = V / 2 · (1-p) + 0 · (p)

так....

Wdove = V / 2 · (1-п)

Приравнивание двух приспособлений, ястреба и голубя

V · (1-p) + (V / 2-C / 2) · p = V / 2 · (1-p)

... и решая для p

р = V / C

поэтому для этой «статической точки», где процент населения является ESS, решается как ESS (процент Hawk) = V / C

Точно так же, используя неравенства, можно показать, что дополнительный мутант ястреба или голубя, входящий в это состояние ESS, в конечном итоге приводит к меньшей приспособленности для своего вида - как к истинному равновесию по Нэшу, так и к равновесию ESS. Этот пример показывает, что, когда риск травмы или смерти в соревновании (стоимость C) значительно превышает потенциальное вознаграждение (значение выгоды V), стабильная популяция будет смешиваться между агрессорами и голубями, и доля голубей превысит это значение. агрессоров. Это объясняет поведение, наблюдаемое в природе.

Нестабильные игры, циклические паттерны

Камень ножницы Бумага

Камень ножницы Бумага
Мутантное вторжение для матрицы выплат "камень-ножницы-бумага" - бесконечный цикл
Компьютерная симуляция игры "камень ножницы" из бумаги. Соответствующая RPS игра расплата матрицы показана. Начиная с произвольной популяции, процентное соотношение трех морфов выстраивается в непрерывно меняющийся паттерн.

Камень-ножницы-бумага, включенные в эволюционную игру, использовались для моделирования природных процессов при изучении экологии . Используя методы экспериментальной экономики , ученые использовали RPS-игры для тестирования динамического поведения человека в условиях социальной эволюции в лабораториях. Социальное циклическое поведение, предсказанное эволюционной теорией игр, наблюдалось в различных лабораторных экспериментах.

Ящерица с боковыми пятнами играет в RPS и другие циклические игры

Первый пример RPS в природе был замечен в поведении и окраске горла маленькой ящерицы из западной части Северной Америки. Боковой Расплывшиеся ящерицы ( Ута stansburiana ) является полиморфным с тремя цветными горлового морфов , что каждый проводить различные стратегии спаривания

Боковые Расплывшиеся ящерицы эффективно использует рок-ножницы-бумагу стратегии спаривания
  • Оранжевое горло очень агрессивно и действует на большой территории, пытаясь спариваться с многочисленными самками на этой большой территории.
  • Неагрессивное желтое горло имитирует окраску и поведение самок ящериц и «украдкой» проскальзывает на территорию оранжевого горла, чтобы спариваться с находящимися там самками (тем самым захватывая популяцию).
  • Синегорло спаривается с одной женщиной и тщательно охраняет ее, что делает невозможным успех кроссовок и, следовательно, занимает их место в популяции.

Однако синее горло не может преодолеть более агрессивное оранжевое горло. Более поздние исследования показали, что синие самцы альтруистичны по отношению к другим синим самцам с тремя ключевыми чертами: они сигнализируют синим цветом, они узнают и поселяются рядом с другими (неродственными) синими самцами, и они даже будут защищать своего партнера от оранжевого, смерть. Это отличительная черта другой игры сотрудничества, предполагающей эффект зеленой бороды .

Самки одной популяции имеют одинаковый цвет горла, и это влияет на то, сколько потомства они производят, и на размер потомства, что порождает циклы плотности, еще одна игра - игра rK. Здесь r - мальтузианский параметр, определяющий экспоненциальный рост, а K - емкость популяции. Самки оранжевого окраса имеют большие кладки и меньшее потомство и хорошо себя чувствуют при низкой плотности. Желтые самки (и синие) имеют меньшие кладки и более крупное потомство и чувствуют себя лучше, когда популяция превышает вместимость, а популяция сокращается до низкой плотности. Оранжевый цвет вступает во владение, и это порождает непрерывные циклы оранжевого и желтого цветов, тесно связанные с плотностью населения. Идея циклов из-за регуляции плотности двух стратегий возникла у Денниса Читти , который работал с грызунами, следовательно, такие игры приводят к «циклам Читти». Есть игры внутри игр внутри игр, встроенных в естественные популяции. Они управляют циклами RPS у мужчин с периодичностью четыре года и циклами rK у женщин с периодичностью в два года.

Общая ситуация соответствует игре «камень, ножницы, бумага», создающей четырехлетний цикл популяции. Игра RPS у самцов ящериц с боковыми пятнами не имеет ESS, но имеет равновесие по Нэшу (NE) с бесконечными орбитами вокруг аттрактора NE. С того времени у ящериц было обнаружено много других полиморфизмов с тремя стратегиями, и некоторые из них имеют динамику RPS, объединяющую игру самцов и игру регуляции плотности у одного пола (самцов). Совсем недавно было показано, что млекопитающие поддерживают одну и ту же игру RPS у мужчин и игру rK у женщин, с полиморфизмом цвета шерсти и поведением, которое управляет циклами. Эта игра также связана с эволюцией ухода за самцами у грызунов и моногамии, а также с развитием видообразования. Есть игры-стратегии, связанные с циклами популяции грызунов (и циклами ящериц).

Когда он прочитал, что эти ящерицы, по сути, были вовлечены в игру со структурой «камень-ножницы-бумага», Джон Мейнард Смит, как говорят, воскликнул: «Они прочитали мою книгу!».

Сигнализация, половой отбор и принцип инвалидности

Павлиний хвост может быть примером принципа гандикапа в действии.

Помимо трудности объяснения того, как альтруизм существует во многих эволюционировавших организмах, Дарвина также беспокоила вторая загадка - почему у значительного числа видов есть фенотипические признаки, которые явно невыгодны им с точки зрения их выживания, - и должны в процессе естественный разрез - например, массивная неудобная структура перьев, найденная в хвосте павлина. Относительно этого вопроса Дарвин написал своему коллеге: «Когда я смотрю на перо в хвосте павлина, меня тошнит». Это математика эволюционной теории игр, которая не только объяснила существование альтруизма, но и объясняет совершенно нелогичное существование павлиньего хвоста и других подобных биологических препятствий.

При анализе проблемы биологической жизни совсем не отличаются от проблем, которые определяют экономику - поедание (сродни приобретению ресурсов и управлению ими), выживанию (конкурентная стратегия) и воспроизводству (инвестиции, риск и доход). Теория игр изначально задумывалась как математический анализ экономических процессов, и именно поэтому она оказалась столь полезной для объяснения столь многих видов биологического поведения. Одно важное дальнейшее уточнение модели эволюционной теории игр, имеющее экономический подтекст, основано на анализе затрат. Простая модель костюма предполагает, что все участники несут одинаковый штраф, связанный с затратами на игру, но это не так. Более успешные игроки будут наделены или накопят более высокий «резерв богатства» или «доступность», чем менее успешные игроки. Этот эффект богатства в эволюционной теории игр представлен математически как « потенциал удержания ресурсов (RHP)» и показывает, что эффективные затраты для конкурента с более высоким RHP не так велики, как для конкурента с более низким RHP. Поскольку индивид с более высоким RHP является более желательным партнером для создания потенциально успешного потомства, логично, что при половом отборе RHP должна была развиться, чтобы каким-то образом сигнализировать конкурирующие соперники, и для того, чтобы это сработало, эта сигнализация должна быть сделана честно. . Амоц Захави развил это мышление, используя так называемый « принцип гандикапа », когда превосходящие соперники демонстрируют свое превосходство дорогостоящей демонстрацией. Поскольку люди с более высоким RHP могут должным образом позволить себе такой дорогостоящий дисплей, эта сигнализация по своей сути является честной и может восприниматься как таковая приемником сигнала. В природе это иллюстрируется дорогостоящим оперением павлина . Математическое доказательство принципа гандикапа было разработано Аланом Графеном с использованием эволюционного теоретико-игрового моделирования.

Коэволюция

Два типа динамики:

  • Эволюционные игры, которые приводят к стабильной ситуации или точке застоя для конкурирующих стратегий, которые приводят к эволюционно стабильной стратегии
  • Эволюционные игры, которые демонстрируют циклическое поведение (как в игре с RPS), где пропорции конкурирующих стратегий непрерывно меняются во времени в общей популяции
Соревновательная коэволюция - тритон с грубой кожей ( Tarricha granulosa ) очень токсичен из-за эволюционной гонки вооружений с хищником, обыкновенной подвязочной змеей ( Thamnophis sirtalis ), которая, в свою очередь, очень терпима к яду. Эти двое вовлечены в гонку вооружений Красной Королевы .
Взаимная коэволюция - орхидея Дарвина ( Angraecum sesquipedale ) и сфинкс мотылька Моргана ( Xanthopan morgani ) имеют взаимные отношения, когда моль получает пыльцу, а цветок опыляется .

Третий, коэволюционный , динамичный, сочетает внутривидовую и межвидовую конкуренцию. Примеры включают конкуренцию хищник-жертва и коэволюцию паразита-хозяина, а также мутуализм. Созданы эволюционные игровые модели для парных и многовидовых коэволюционных систем. Общая динамика различается между конкурентными системами и мутуалистическими системами.

В конкурентной (не мутуалистической) межвидовой коэволюционной системе виды вовлечены в гонку вооружений, где, как правило, сохраняются адаптации, которые лучше конкурируют с другими видами. Это отражают как игровые выплаты, так и динамика репликатора. Это приводит к динамике Красной Королевы, где главные герои должны «бежать как можно быстрее, чтобы оставаться на одном месте».

Был разработан ряд моделей эволюционной теории игр, охватывающих коэволюционные ситуации. Ключевым фактором, применимым в этих коэволюционных системах, является постоянная адаптация стратегии в такой гонке вооружений. Поэтому коэволюционное моделирование часто включает генетические алгоритмы для отражения мутационных эффектов, в то время как компьютеры моделируют динамику общей коэволюционной игры. Полученная динамика изучается при изменении различных параметров. Поскольку одновременно действуют несколько переменных, решения становятся областью оптимизации с несколькими переменными. Математическими критериями определения стабильных точек являются эффективность по Парето и доминирование по Парето, мера пиков оптимальности решения в многомерных системах.

Карл Бергстром и Майкл Лахманн применяют эволюционную теорию игр к разделению выгод в мутуалистических взаимодействиях между организмами. Дарвиновские предположения о приспособленности моделируются с использованием динамики репликатора, чтобы показать, что организм, развивающийся более медленными темпами в мутуалистических отношениях, получает непропорционально высокую долю выгод или выгод.

Расширение модели

Математическая модель анализа поведения системы необходимо сначала быть как можно более простым , чтобы помочь в разработке базы понимания основ, или «первые эффекты порядка», относящийся к тому , что в настоящее время изучается. Имея это понимание, уместно посмотреть, влияют ли другие, более тонкие параметры (эффекты второго порядка) на первичное поведение или формируют ли оно дополнительное поведение в системе. После основополагающей работы Мейнарда Смита в области эволюционной теории игр этот предмет получил ряд очень важных расширений, которые пролили больше света на понимание эволюционной динамики, особенно в области альтруистического поведения. Вот некоторые из этих ключевых расширений эволюционной теории игр:

Пространственная игра
В пространственно-эволюционной игре участники соревнований встречаются в фиксированных позициях сетки и взаимодействуют только с ближайшими соседями. Здесь показана динамика соревнований Ястребиных Голубей, показаны участники Ястребов и Голубей, а также изменения стратегии, происходящие в различных ячейках.

Пространственные игры

Географические факторы эволюции включают поток генов и горизонтальный перенос генов . Пространственные игровые модели представляют геометрию, помещая участников в решетку ячеек: соревнования проводятся только с ближайшими соседями. Выигрышные стратегии захватывают эти непосредственные окрестности, а затем взаимодействуют с соседними районами. Эта модель полезна для демонстрации того, как группы кооператоров могут вторгаться и вносить альтруизм в игру «Дилемма заключенных», где «Око за око» (TFT) - это равновесие по Нэшу, но НЕ также и ESS. Пространственная структура иногда абстрагируется до общей сети взаимодействий. Это основа эволюционной теории графов .

Последствия обладания информацией

В эволюционной теории игр, как и в традиционной теории игр, критически важное значение имеет эффект передачи сигналов (получение информации), как и в случае непрямой взаимности в дилемме заключенного (где соревнования между ОДИНАКОВЫМИ парными индивидами НЕ повторяются). Это моделирует реальность большинства нормальных социальных взаимодействий, не связанных с родственниками. Если в «Дилемме заключенного» не предусмотрена вероятностная мера репутации, может быть достигнута только прямая взаимность. Эта информация также поддерживает косвенную взаимность.

В качестве альтернативы агенты могут иметь доступ к произвольному сигналу, изначально не коррелированному со стратегией, но впоследствии коррелированному благодаря эволюционной динамике. Это эффект зеленой бороды (см. Ящерицы с боковыми пятнами выше) или эволюция этноцентризма у людей. В зависимости от игры это может привести к развитию сотрудничества или иррациональной вражды.

От молекулярного до многоклеточного уровня модель сигнальной игры с асимметрией информации между отправителем и получателем может быть подходящей, например, при привлечении партнера или эволюции машинного механизма трансляции из цепочек РНК.

Конечные популяции

Многие эволюционные игры были смоделированы для конечных популяций, чтобы увидеть, какой эффект это может иметь, например, в успехе смешанных стратегий.

Смотрите также

Примечания

использованная литература

дальнейшее чтение

  • Дэвис, Мортон; «Теория игр - нетехническое введение», Dover Books, ISBN  0-486-29672-5
  • Докинз, Ричард ; "Эгоистичный ген", Oxford University Press, ISBN  0-19-929114-4
  • Дугаткин и Рив; «Теория игр и поведение животных», Oxford University Press, ISBN  0-19-513790-6
  • Хофбауэр и Зигмунд; «Эволюционные игры и динамика населения», Cambridge University Press, ISBN  0-521-62570-X
  • Кон, Марек; «Причина всего», Фабер и Фабер, ISBN  0-571-22393-1
  • Sandholm, William H .; «Популяционные игры и эволюционная динамика», MIT Press, ISBN  0262195879
  • Сегерстрале, Уллика; «Оракул природы - жизнь и работа У. Д. Гамильтона», Oxford University Press, 2013, ISBN  978-0-19-860727-4
  • Зигмунд, Карл ; "Games of Life", Penguin Books, также Oxford University Press, 1993, ISBN  0198547838
  • Винсент и Браун; «Эволюционная теория игр, естественный отбор и дарвиновская динамика», Cambridge University Press, ISBN  0-521-84170-4

внешние ссылки