Машинное обучение встречается с теорией игр

Современные проблемы включают в себя стратегических агентов, частную информацию, неизвестную информацию, а также возможности изучения и взаимодействия с агентами и т. д.

Машинное обучение и теория игр хорошо изучены как отдельные проблемы. Интересные исследовательские вопросы возникают, когда мы пытаемся объединить их вместе.

В настоящее время мы рассматриваем два аспекта:

Теория игр:

Теория игр описывается как «изучение математических моделей конфликта и сотрудничества между разумными рациональными лицами, принимающими решения». В нашем стремлении понять обучающиеся машины мы приходим к математике, предназначенной для изучения взаимодействия разумных существ. В литературе по поведенческой теории игр разработано множество моделей для прогнозирования поведения человека в стратегических условиях путем включения когнитивных предубеждений и ограничений, полученных в результате наблюдения за игрой, и идей когнитивной психологии, поэтому нам нужна математическая основа, которая изучает поведение многих взаимодействующих сторон, которые имеют разные наборы информации.

Глубокое обучение:

В последние годы произошли значительные улучшения в области искусственного интеллекта, в частности, с помощью нейронных сетей для достижения более человеческих возможностей. Искусственные нейронные сети имитируют настоящие биологические нейронные сети, поскольку узлы информации связаны в направленную сеть с отправкой и получением сигналов. Там, где биологический мозг посылает сообщения клеткам тела, компьютеризированная нейронная сеть принимает входящую информацию, обычно набор больших данных, где она затем проходит через другой набор узлов. Однако процессы в этих узлах известны как скрытые слои, поскольку это этап вычислений, на котором мы не уверены в том, что происходит (на фото ниже). Используя методы машинного обучения, компьютер получает результат, который расширяет нейронную сеть и имитирует срабатывание биологической нейронной сети.

Достижениям в области искусственного интеллекта также способствуют сети, называемые состязательными сетями (например, используемые в GAN). В этих сетях используются передовые методы теории игр для глубокого изучения информации, благодаря чему компьютер может сам обучаться многим техникам и стратегиям вычислений, игр и т. д. обучаясь, игроки (компьютеры) могут формировать и разыгрывать стратегии, основываясь только на вашей личной информации и не зная, что знают другие игроки. В условиях несовершенной информационной игры компьютеры по-прежнему способны формировать равновесие Нэша и наилучшие ответы на другие стратегии. Первоначально состязательные сети использовали метод, называемый фиктивной игрой, его возможности ограничивались вычислением средней стратегии, которая сходится к равновесию Нэша в игре. Однако этот метод ограничен, поскольку он не может адаптироваться к собственным лучшим стратегиям.

В самой недавно принятой технике для игры в эти несовершенные игры используются нейронные сети. Нейронная фиктивная игра с самим собой описывается как когда каждый игрок состоит из своей собственной нейронной сети с возможностью определять стратегии, подкреплять и участвовать в контролируемом обучении, вместо того, чтобы полагаться исключительно на вычисления. Каждый раз, когда нейронная сеть проходит через набор данных, она играет в игру в соответствии с теорией игр.

В зависимости от исхода этой игры машина узнает об этом и учится действовать лучше на основе вероятностей + стратегий. и предыдущие экземпляры игры и других игроков. Это все более сложный способ глубокого обучения, но в то же время он делает огромные шаги к искусственному интеллекту и его способности различать стратегии со скоростью всестороннего обучения человека.

Эти достижения в значительной степени основаны на методах теории игр, изученных в классе, но идут еще дальше, чтобы предсказать больше реальных ситуаций, чем очень контролируемая среда дилеммы заключенного. Использование направленных нейронных сетей и теории игр прокладывает путь к революционному искусственному интеллекту.

Ссылки

https://www.researchgate.net/publication/282403687_Semantics_Representations_and_Grammars_for_Deep_Learning
https://arxiv.org/pdf/1603.01121.pdf
https://www.cs.ubc.ca /~jasonhar/GameNet-NIPS-2016.pdf