Искусственный интеллект (ИИ) хорошо справляется со многими вещами — может генерировать не существовавшие ранее картинки, обыгрывать человека в покер и прогнозировать события, но воображение — фундаментальная способность человека — ему недоступно. Или только пока недоступно?
Если человек знает, что такое кошка, то ему не составит труда представить конкретную кошку с шерстью другого цвета, находящуюся в другом месте или лежащую в другой позе. Для нейросетей это долгое время было невозможно, даже если им удавалось распознать кошку после долгого обучения.
Чтобы раскрыть способность ИИ к воображению, исследователи придумали новый метод, позволяющий системам искусственного интеллекта определять, как должен выглядеть объект, даже если они никогда раньше не сталкивались ни с чем подобным.
«Мы были вдохновлены способностями человека к визуальному обобщению, чтобы попытаться смоделировать человеческое воображение в машинах», — делится Юнхао Ге из Университета Южной Калифорнии (USC).Как известно, люди могут разделить полученную информацию об объекте по атрибутам — например, форме, позе, положению, цвету. Затем — рекомбинировать их, чтобы представить новый предмет. В опубликованном исследовании учёных делается попытка смоделировать все то же самое, но с помощью нейронных сетей.
Ключевой здесь является экстраполяция — возможность использовать большой объем обучающих данных (например, множество изображений автомобилей), чтобы затем выйти за рамки того, что видит нейросеть, к тому, что она пока не видит, но потенциально может представить. Для ИИ это пока сложно, потому что его обычно учат выявлять определенные внешние закономерности, а не более абстрактные атрибуты.
То, что придумала команда авторов нового исследования, называется «обучением управляемой рассоединенной репрезентации». Оно использует подход, аналогичный подходу при создании дипфейков, когда различные части образца освобождаются от связи друг с другом. В случае дипфейков, например, мимика отделяется от черт лица.
Это значит, что если ИИ увидит красную машину и синий велосипед, он сможет представить синюю машину, даже если она не встречалась ему нигде до этого. Исследователи объединили это в структуру, которую они называют «групповым обучением с учителем».
Одним из основных нововведений в этой методике является обработка данных в группах, а не по отдельности, и построение семантических связей между ними в процессе. После этого ИИ может распознавать сходства и различия в образцах, которые он видит, используя эти знания для создания ранее не знакомых ему объектов.
Эти идеи не являются абсолютно новыми, но исследователи пошли дальше, сделав подход более гибким и совместимым с дополнительными типами данных. В будущем разработанная ими система обучения могла бы защитить ИИ от предвзятости, удалив этически спорные атрибуты — например, помогая создавать нейронные сети, которые не будут расистскими или сексистскими.
По словам исследователей, тот же подход может быть применен в области медицины и беспилотных автомобилей. Представьте: ИИ, который может «вообразить» новые лекарства или визуализировать новые дорожные ситуации, для которых он не был специально обучен в прошлом.
Фото: AFP-relaxnewsЭто новость от журнала ММ «Машины и механизмы». Не знаете такого? Приглашаем прямо сейчас познакомиться с этим удивительным журналом.