Наш следующий вызов против ИИ и для ИИ. Сможет ли он победить людей в обновленной игре Го?

Обратите внимание, что в следующей статье AI означает искусственный интеллект, а Goban — название доски в го.
В основном мы будем обсуждать игру в го. и задает вопросы о механизмах ИИ, которые использовались для создания AlphaGo, и даже больше о AlphaGo Zero, которая теперь превосходит AlphaGo (подробности см. в разделе Освоение игры в го без участия человека). AlphaGo будет означать как AlphaGo, так и AlphaGo Zero для более простого чтения.
Наконец, обратите внимание, что я не эксперт по искусственному интеллекту и не специалист по данным, поэтому не стесняйтесь делиться своими мыслями после прочтения 🙂

Введение

Искусственный интеллект наделал много шума в последние годы, и по мере того, как его использование распространяется в обществе, оно не может прекратиться. Видео с переворотами роботов, сериалы-антиутопии вроде «Черного зеркала» или статьи, объясняющие, что наши рабочие места с большой скоростью заменяются машинами, призваны передать и страх, и блаженство перед нашим технологическим прогрессом.

В 2016 году Ли Седол, 9-й дан в Го, настоящий мастер, был побежден AlphaGo, искусственным интеллектом Го, приобретенным Google (компания Deepmind).

Приближаясь к 10⁶⁰⁰ играбельным играм, игра Го настолько глубока и интуитивно понятна, что мы считали невозможным когда-нибудь создать движок, способный обыграть лучших игроков-людей. Для сравнения: во Вселенной было бы 10⁸⁰ атомов и 10¹²⁰ игр, в которые можно было бы играть в шахматы (см. Число Шеннона для более подробной информации).

Поражение Ли Седоля тронуло меня как игрока и человека. Эта игра настолько глубока, что она была частью последней, одержавшей верх над машинами. Ощущение, что игра «решена», усилило мое разочарование и заставило меня отказаться от формы эмбиентного фатализма в отношении ИИ, который будет доминировать над нами в каждой игре. С другой стороны, как разработчик и любитель компьютерных наук, я также был поражен, увидев, как эта область расширилась благодаря доступным вычислительным ресурсам. Мы должны помнить и убеждать себя в том, что именно люди, а не роботы создают тонкие механизмы искусственного интеллекта.

Рост мощи ИИ и его повсеместное использование ставит новые вопросы, касающиеся отличия человека в областях, в которых он соревнуется, и его будущего места в обществе. Чем мы логически отличаемся от ИИ и на какие параметры мы могли бы повлиять, чтобы вернуть себе господство над ним? Это вопрос изучения пределов человеческого интеллекта и возможностей машины.

Являются ли интуиция и воображение доблестью людей, а памятьвместимостьи вычислительная мощность — машинами?

I ) Вычисление против интуиции

Как снизить эффективность прогнозирующих вычислений в игре?
Как мы можем развивать интуицию и воображение в игре Го?

" Воображение важнее знаний. » Эйнштейн

Прежде чем идти дальше, вот полезная информация об игре:

В игре го края и углы — это области, где разыгрываются хорошо изученные и стандартизированные последовательности ходов, известные как дзёсэки. После тысячелетий игр как исследования, так и опыт позволили узнать, что некоторые последовательности ходов лучше других. Ходы близко к краям на самом деле называются «ориентированными на территорию», т. е. вы будете зарабатывать очки быстро и эффективно. Ходы ближе к центру доски называются ориентированными на влияние, поскольку они являются более интуитивными ходами или даже долгосрочными ставками. Хосеки — это пути, которые предлагают положительные результаты в балансе между подтвержденными очками и влияют на будущее игры.

Конкретные дзёсэки в игровых дебютах на углах и краях называются фусэки. Они позволяют максимизировать вероятность выигрыша с самого начала игры.

Начнем с механики ИИ:

В AlphaGo обучение с подкреплением, кажется, является основным преимуществом для освоения игры. Как мы видели, ИИ не может просчитать все возможные игры. Эта техника изобретательно используется, чтобы избежать неуместных ходов и обдумать те, которые принесут больше вознаграждения за победу. Он улучшает саму игру, выбирая лучшие основные движения и исследуя новые последовательности. Но, tabula rasa, какие могут быть первые быстрые победы и награды, которые позволили бы AlphaGo изучить свои первые паттерны?

За захват ходов можно получить быструю награду раньше, чем гобан будет заполнен. Легче захватить у края. Кроме того, награды можно получить на прилегающей территории за меньшее количество ходов по углам, чем где-либо еще. На фоне самовоспроизводящихся кадров кажется, что машина чувствует притяжение где-то так же, как гравитация притягивает нас к земле, где она размышляет с большим количеством наград: на углах и краях!
До тех пор, пока постепенно семена (камни) не отойдут от земли (края) и не создадут несколько фузеки (соответствующие открывающие ходы)? Робот растет и встает.

Эти изображения из AlphaGo показывают некоторый процесс обучения: ИИ сначала учится избегать неуместных движенийна углах камень находится непосредственно в опасном положении (камень 1 изображение 1), в то время как противник будет вознагражден, захватив камень. Позже (изображение 2) мы видим, что ИИ научился воспроизводить хорошие последовательности на поворотах, но, в конце концов, со временем даже сокращает их использование, чтобы предпочесть еще лучшие шаблоны.

«Угол — золото, сторона — серебро, центр — трава. » Иди поговорка

Прежде чем достичь детерминированной стадии игры, ходы предсказываются на основе вычислений вероятности, допускаемых конечными последовательностями ходов, которые обеспечивают наилучшие выигрышные вознаграждения. Детерминированные последовательности с меньшей глубиной основаны на ребрах, поэтому первыми изученными последовательностями являются Josekis. Края позволяют выделить детерминированные узоры, в то время как центр остается темной недетерминированной областью.

Обратите внимание, что гроссмейстеры, в том числе AlphaGo, в подавляющем большинстве играют свои первые ходы по точкам-звездочкам или «хоши» углов (черные точки на изображении).

Эти стратегические локации представляют собой эвристики, также известные как дебюты, которые складываются из многолетних игр, которые сводятся к известным и изученным последовательностям ходов (Хосекис, вы поняли) в уровень игры является самым высоким: все гобаны могут играть бесплатно!

Что, если эти традиции мешают нам открыть для себя другие стили игры? Как машина сможет уменьшить ширину игры, позволив ей выбирать ход, если мы больше не можем полагаться на такие последовательности, доступные по краям и углам?

Хосеки действительно являются преимуществом как для людей, так и для ИИ, но они заставляют ИИ действовать с еще более эффективными движениями, тогда как мы можем убрать Хосеки? Мне пришел радикальный, но все же серьезный ответ: давайте уберем из гобани углы и ребра!

II ) Бескрайний гобан

Итак.. как может выглядеть гобан без краев?

“ Нет пределов, это бесконечно?

Ну да… и нет. Тут может зависеть от того, как вы себе представляете форму вселенной 🙂. Но если мы хотим сделать игру приличной длины, чтобы мы могли пить чай во время игры, давайте учтем, что следует соблюдать официальную сетку го из 19x19 строк и столбцов. Итак, как удалить ребра и сохранить готовую сетку?

Соединим края гобана! Что мы получаем?

" Сфера?"

Почему нет! Но нельзя забывать, что игровое поле сетка во всех точках, иначе правила игры были бы недействительны!
Проверить, соблюдает ли Сфера состояние сетки в любой точке, нарисуем на ней сетку:

Сетка вроде работает.. кроме двух полюсов! Действительно, мы можем заметить, что в этих местах это уже не сетка, а множество линий, которые соединяются в одной уникальной точке. Вместо квадратов образуются треугольники.

Поэтому сфера не является возможной формой для гобана без краев.

Но с другой стороны, разве нет формы, в которой грани встречаются и играют в го?

Давайте попробуем последнюю вещь для нашей новой игровой доски. Если эту доску скрутить посередине (дома не сделать!), чтобы два противоположных края соединились, что получится?

Твердое тело вращения: цилиндр!

Да, теперь наша сетка действительна с двумя ребрами меньше, но есть еще два круговых ребра. Что, если мы повторим эксперимент, объединив на этот раз два оставшихся ребра, две окружности полученного Цилиндра?

BinGo! Теперь у нас есть Torus: какая революция!

Теперь у нас есть форма для игры в го без краев, и она трехмерная. Но хорошо, это не очень практично.

III ) Игровая доска

С этим желанием выйти из коллективного смирения перед машинами и открыть для себя игру Го с новым видением я реализовал платформу для игры в Го без углов и краев:

Ториго ! ➡ https://torigo.io

Как вы могли заметить, это конкатенация:

  • « Тор », форма, в которой возможна круговая сетка (математический пончик)
  • и « igo » — название го в Японии.

Как упоминалось ранее, играть на пончике непросто. Было бы лучше видеть всю доску и сцену игры, не переворачивая объект. Итак, вот приемы, которые я нашел, чтобы сделать Ториго играбельным:

Так же, как и в классическом Го, на 2-мерной доске отображается весь гобан, но теперь на концах есть продолжение пунктирных линий. Если играть с камнем на одном конце, на противоположном конце он будет казаться прозрачным, чтобы можно было увидеть его присутствие: так мы могли понять, где тор соединится в реальном мире.

Однако, поскольку больше нет ни углов, ни краев, нет и центра! Вот почему вы можете изменить ссылку и, таким образом, перспективу игры, нажимая на стрелки, чтобы постепенно сдвигать игровое поле. Вы можете щелкнуть и двигаться прямо по гобану так же, как перемещаетесь по виртуальной карте мира.

Во время игр приятно осознавать, что ты можешь смотреть на игру с другой точки зрения, чем наш оппонент.

IV ) Влияние на игру

Для новых игроков, поскольку эта игра еще не имеет веса истории, это может быть преимуществом в понимании игры Ториго и разработке совершенно новых способов игры. Я заметил, что выучить Ториго так же просто, как и Го. Несмотря на глубину, в эту игру очень просто играть по 2–3 правилам, но освоить ее сложно. Удаление ребер фактически удаляет почти одно правило.

Если вы заинтересованы в изучении го, также называемого игрой в окружение, вы можете сыграть в упрощенную версию игры: Capture Go, где цель состоит в том, чтобы быть первым тот, кто захватит 5 камней. Не стесняйтесь попробовать его как на торигобане, так и на классическом: Capture Bot 🤖

Для опытных игроков в го этот вариант может быть дополняющим с классическим го и даже перетасовывать карты с вашими противниками! Вы также можете задаться вопросом, сохраняются ли все правила и принципы. Тот факт, что сетка соблюдается во всех точках, сохраняет правила неизменными.

У нас может возникнуть вопрос: сохраняется ли shicho?

« Шичо », или лестница, представляет собой последовательность ходов, в которой игрок запирает камни противника так, чтобы, если он попытается убежать , он обязательно захватит свои камни, как только последовательность достигнет края. Работает ли последовательность на Ториго? Что ж, давайте ответим сами и встретимся в игре 🙂.

Для искусственного интеллекта:

Мы не можем отрицать, что эффективное создание территорий по направлению к центру на классическом гобане также должно быть частью изобретательности AlphaGo. Однако, что касается его лица 😅, мы можем предположить, что уменьшить широту игры с самого начала будет не так просто, и что применен улучшенный поиск по дереву (дажебез Монте Carlo развертывания в AlphaGo Zero), может быть не столь эффективным с таким новым гобаном: результат последовательностей останется столь же неопределенным, сколь и недетерминированным.
Также обратите внимание, что мы добавляем измерение и переходим от 2D-мира к 3D-гобану.

Не будет ли машина дезориентирована без системы отсчета и обдумывания ее «гравитации краев»? Сможет ли робот встать без земли? Появляется еще больше возможностей для соединения групп камней, влияющих на всю новую круглую доску: с самого начала возможны еще более важные ходы!

На классическом гобане нет смысла ставить свои первые камни по краям, потому что они могут быть захвачены напрямую и не будут формировать территории (3 вольности по краям, 2 по углам). В торигобане все выигрышные вероятности возможных ходов из сетки равномерно распределяются в начале игры:самый первый ход может быть где угодно, не влияя на игра.

Еще одна вещь, которую я хотел бы обсудить в процессе обучения AlphaGo Zero, это то, что авторы сказали, что ИИ открыл Шишо на удивление намного позже, чем великие принципы. Что ж, для меня это не стало неожиданностью, поскольку глубина этой последовательности может быть равна наибольшей диагонали гобана. На Ториго это может быть одним из первых принципов, которые ИИ должен обнаружить, и знаете что, диагональ шишо на торигобане в среднем всегда больше..!

В любом случае игрокам в го будет необходимо "отложить" классические стратегии при входе в это новое измерение. Игре Го тысячи лет, и она до сих пор остается загадочной. Но на Ториго многое еще предстоит понять и почти все сделать!

Игра в го позволила мне расширить и углубить концепции, весело провести время и даже задуматься о философских параллелях.

Я думаю, что игра на торигобане по-прежнему привносит что-то новое: необходимость полагаться на наши собственные камни, а не на известные пределы, переориентировать нашу собственную интуицию в этой великолепной стратегической игре.

Заключение

Основные цели этого размышления и реализации Torigo заключаются в следующем:
- бросить вызов исследователям ИИ и люди, чтобы противостоять друг другу в этом новом измерении;
- Позвольте новым игрокам открыть для себя го новым творческим способом, без каких-либо открытий!

Дополнительные вопросыостались:
➜ Будет ли это перетасовывать карты между игроками?
➜ Будут ли AlphaGo и Ли Седол снова играть и каков может быть исход Torigo?
➜ Может ли это быть новой и последней стратегической игрой, в которой человек остается непобежденным ИИ? На данный момент это так 😜

Не стесняйтесь поделиться своими мыслями в разделе комментариев или связаться со мной напрямую. Я был бы рад обсудить с вами и, кто знает, увидеть, как ИИ впервые попытается сыграть в Ториго!

Ну что, опять?
https://torigo.io

(Быстрая игра: Захвати бота 🤖)

Спасибо моим друзьям и семье за ​​их поддержку и приятные обсуждения, которые у нас были. Мы можем все еще спорить, но наверняка наши вопросы рано или поздно найдут ответы. Я бы не зашел так далеко без их критического взгляда и их доброты.

Поддержать проект: Patreon
Контакт: [email protected]