Как теория игр связана с машинным обучением?

Машинное обучение встречается с теорией игр

Современные проблемы включают в себя стратегических агентов, частную информацию, неизвестную информацию, а также возможности изучения и взаимодействия с агентами и т. д.

Машинное обучение и теория игр хорошо изучены как отдельные проблемы. Интересные исследовательские вопросы возникают, когда мы пытаемся объединить их вместе.

В настоящее время мы рассматриваем два аспекта:

Теория игр:

Теория игр описывается как «изучение математических моделей конфликта и сотрудничества между разумными рациональными лицами, принимающими решения». В нашем стремлении понять обучающиеся машины мы приходим к математике, предназначенной для изучения взаимодействия разумных существ. В литературе по поведенческой теории игр разработано множество моделей для прогнозирования поведения человека в стратегических условиях путем включения когнитивных предубеждений и ограничений, полученных в результате наблюдения за игрой, и идей когнитивной психологии, поэтому нам нужна математическая основа, которая изучает поведение многих взаимодействующих сторон, которые имеют разные наборы информации.

Глубокое обучение:

В последние годы произошли значительные улучшения в области искусственного интеллекта, в частности, с помощью нейронных сетей для достижения более человеческих возможностей. Искусственные нейронные сети имитируют настоящие биологические нейронные сети, поскольку узлы информации связаны в направленную сеть с отправкой и получением сигналов. Там, где биологический мозг посылает сообщения клеткам тела, компьютеризированная нейронная сеть принимает входящую информацию, обычно набор больших данных, где она затем проходит через другой набор узлов. Однако процессы в этих узлах известны как скрытые слои, поскольку это этап вычислений, на котором мы не уверены в том, что происходит (на фото ниже). Используя методы машинного обучения, компьютер получает результат, который расширяет нейронную сеть и имитирует срабатывание биологической нейронной сети.

Достижениям в области искусственного интеллекта также способствуют сети, называемые состязательными сетями (например, используемые в GAN). В этих сетях используются передовые методы теории игр для глубокого изучения информации, благодаря чему компьютер может сам обучаться многим техникам и стратегиям вычислений, игр и т. д. обучаясь, игроки (компьютеры) могут формировать и разыгрывать стратегии, основываясь только на вашей личной информации и не зная, что знают другие игроки. В условиях несовершенной информационной игры компьютеры по-прежнему способны формировать равновесие Нэша и наилучшие ответы на другие стратегии. Первоначально состязательные сети использовали метод, называемый фиктивной игрой, его возможности ограничивались вычислением средней стратегии, которая сходится к равновесию Нэша в игре. Однако этот метод ограничен, поскольку он не может адаптироваться к собственным лучшим стратегиям.

В самой недавно принятой технике для игры в эти несовершенные игры используются нейронные сети. Нейронная фиктивная игра с самим собой описывается как когда каждый игрок состоит из своей собственной нейронной сети с возможностью определять стратегии, подкреплять и участвовать в контролируемом обучении, вместо того, чтобы полагаться исключительно на вычисления. Каждый раз, когда нейронная сеть проходит через набор данных, она играет в игру в соответствии с теорией игр.

В зависимости от исхода этой игры машина узнает об этом и учится действовать лучше на основе вероятностей + стратегий. и предыдущие экземпляры игры и других игроков. Это все более сложный способ глубокого обучения, но в то же время он делает огромные шаги к искусственному интеллекту и его способности различать стратегии со скоростью всестороннего обучения человека.

Эти достижения в значительной степени основаны на методах теории игр, изученных в классе, но идут еще дальше, чтобы предсказать больше реальных ситуаций, чем очень контролируемая среда дилеммы заключенного. Использование направленных нейронных сетей и теории игр прокладывает путь к революционному искусственному интеллекту.

Ссылки

https://www.researchgate.net/publication/282403687_Semantics_Representations_and_Grammars_for_Deep_Learning
https://arxiv.org/pdf/1603.01121.pdf
https://www.cs.ubc.ca /~jasonhar/GameNet-NIPS-2016.pdf

Новые материалы

Реалити-шоу, которые стоит посмотреть (хотя бы 10 минут)

Настоящий парикмахер Флойд Конкурсанты должны пережить двадцать две недели восьмичасового рабочего дня в парикмахерской с самым медленным и монотонным парикмахером в Америке...

Небольшой трюк, чтобы лучше понять «это» в функциях стрелок

В стрелочных функциях this работает иначе, чем в обычных функциях. Стрелочные функции получают this из окружающей области (функциональной или глобальной). Давайте посмотрим на этот принцип..

5 встроенных инструментов Laravel, которые вы не захотите пропустить

Повышение производительности с помощью основных встроенных функций Laravel Laravel — это мощная PHP-инфраструктура для создания современных веб-приложений, которая поставляется с набором..

Переосмысление гламурной фотографии с помощью генеративного ИИ

Диффузоры + Abyss Orange Mix 2 + Google Colab В одной из прошлых жизней я немного баловался гламурной фотографией . Весь процесс концептуализации изображения, управления моделью и постобработки..

7 интерфейсных фреймворков, которые стоит попробовать

Мои лучшие пакеты NPM на 2022 год (с фрагментами кода!) Я не создавал веб-сайты на простом HTML с тех пор, как открыл для себя Node. Я начал с Pug, но с тех пор развился в более..

OpenAI Codex — Мои испытания и невзгоды

Я протестировал инструмент ИИ с пятью классическими задачами кодирования. В прошлом году OpenAI анонсировала Codex, модель эффективного программирования с помощью искусственного интеллекта..

Что происходит в голове HTML?

Каждый задает себе вопрос: а что это за информация в теге head html-документа в начале? Попробуем разобраться! Что такое тег head ? Тег head содержит информацию о документе — метаданные..

Метки

Machine Learning JavaScript Data Science Artificial Intelligence Software Development Web Development Python Coding Deep Learning AI React Software Engineering Nodejs Development Data Java Typescript NLP Computer Science Learning Front End Development Algorithms Tutorial Productivity Tech Angular ChatGPT Programming Languages CSS Javascript Development Python Programming React Native HTML Neural Networks Developer Science Cybersecurity Self Improvement