Искусственный интеллект OpenAI научился жульничать
Специалисты создали две нейросети, а потом научили их правилам игры, после чего заставили «сыграть в прятки» всего 500 миллионов раз. В результате наблюдений за методами игры, разработчики обнаружили, что боты не только начали разрабатывать и применять новые стратегии в ходе игры, но и научились противостоять методам другой команды.
Сначала прятавшиеся и искатели просто «бегали по окрестностям», но после 25 миллионов игр те, кто прятался, научились баррикадироваться внутри комнат при помощи коробок. Также они начали работать совместно, передавая коробки друг другу, чтобы загораживать входы быстрее. На 75-миллионной игре до искавших дошло, что именно происходит, после чего они начали преодолевать препятствия, отодвигая особые платформы и используя для обнаружения «спрятавшихся» внутри ботов.
Уже на 85 миллионах игровых сессий хитрые прятальщики научились передвигаться внутри вместе с платформами, выпадая из поля зрения ботов другой команды. Крыть искавшим было нечем.
«Как только одна команда начинает использовать новую стратегию, другая команда начинала предпринимать отчаянные попытки адаптироваться. Это действительно интересный аналог того, что происходило на Земле в ходе эволюции, когда мы постоянно вынуждены были соревноваться с другими видами», — прокомментировал игру в прятки программист Боуэн Бейкер из OpenAI.
Но развитие ботов не остановилось. В конце концов они начали использовать сбои, возникавшие в их «среде обитания». Ушлые ребята обнаружили, что блоки можно протолкнуть внутрь помещения под определённым углом. что вызывало сбой в работе программы, но навсегда убирало ненавистный блок с дороги. Хорошо, если они смогут использовать свой интеллект нам во благо, станут нам помогать в решении сложных задач. Надеемся, что после наблюдения за этими двумя командами жуликов, энтузиазма у разработчиков не поубавилось.
Фото: OpenAI
Технологии
Вячеслав Ларионов