У Facebook наконец-то есть ответ на Google Alpha Go: робот-карточный игрок

  • 21-12-2020
  • комментариев

Карточная игра Hanabi предлагает сотрудничество между игроками и принятие решений на основе неполной информации. Маттиас Балк / картинный альянс через Getty Images

Четыре года назад DeepMind Technologies, тогда еще независимое подразделение Google по искусственному интеллекту (AI), ошеломило мир, когда его робот-шахматист AlphaGo победил лучших мировых игроков настольная игра Го - с большим отрывом.

Теперь большой технологический конкурент Google, Facebook, создал аналогичный ИИ, который собирается свергнуть игроков-людей в более сложной игре. В прошлую пятницу подразделение AI-гиганта социальных сетей объявило о крупном прорыве в обучении компьютеров игре в карточную игру Ханаби (что на японском означает «фейерверк»), которая требует сотрудничества между игроками и принятия решений на основе неполной информации.

СМОТРИ ТАКЖЕ: Технология телепатии - последнее научно-фантастическое чудо, появившееся в реальном мире

В игре «Ханаби» командам от двух до пяти игроков выдаются случайные карты разных цветов и чисел, обозначающие очки. . Каждый игрок может видеть карты других игроков, но не может видеть свои собственные. В результате им приходится угадывать карты, которые они держат, на основе подсказок товарищей по команде, одновременно давая подсказки другим о своих картах, и решать, сбросить ли определенную карту или сыграть. Цель состоит в том, чтобы каждая команда выложила карты на стол таким образом, чтобы в сумме получилось максимально возможное количество очков.

Когда каждый игрок сообщает информацию о картах других игроков, возможные ходы других игроков меняются . По оценкам Facebook, в каждой игре Ханаби может быть до 10 миллионов возможных рук.

«Эта способность выводить мысли, лежащие в основе чьего-либо поведения, называется теорией разума и является ключевым аспектом, который делает Ханаби одновременно увлекательным. - чтобы люди могли играть, а исследователи ИИ - учиться », - написали в отчете исследователи ИИ Facebook. «Эффективные игроки Ханаби, будь то люди или ИИ, должны разработать теорию разума, чтобы понять убеждения и намерения своих товарищей по команде и предсказать, как они будут интерпретировать свои действия и реагировать на них».

Обучать своих ботов понимать намеки от других ботов «товарищей по команде», Facebook использовал технику под названием «поиск по дереву Монте-Карло», ту же систему алгоритмов, что и DeepMind при разработке AlphaGo и его преемников.

Боты Facebook, которые играли в Ханаби для двух игроков получил средний балл 24,61 из максимально возможного 25 баллов. Facebook заявил, что эта технология может найти приложения во многих потребительских областях, включая виртуальных помощников и беспилотные автомобили.

«The «Причина, по которой мы заинтересованы в Hanabi, - это не игры», - сказал Science Times Адам Лерер, инженер Facebook AI Research. «Речь идет о том, как встроить эти возможности в системы искусственного интеллекта, такие как беспилотные автомобили или переговорные агенты, которым необходимо понимать психическое состояние других людей, с которыми они взаимодействуют своими действиями».

« Если вы думаете о беспилотных автомобилях, вы должны знать, как сообщить о своих действиях », - добавил он. «Есть элемент« теории разума », в котором вы должны рассуждать о мире, основываясь на том, что делают другие люди».

комментариев

Добавить комментарий