Игра в имитацию

Человечество побаивается роботов. Они быстрее, умнее, выносливее, способны взять под контроль слабых и беспомощных людей, отправить их в капсулы и править миром. Господству роботов над человеком посвящено больше фильмов, чем покорению Земли инопланетянами, – они кажутся более близкой угрозой. Ученые же считают, что роботы никогда не смогут обладать самостоятельным мышлением. Для определения их способности мыслить и существует тест Тьюринга.

2998 0 0

отправить по e-mail

atozofai.withgoogle.com

Скажите, вы играете в шахматы?

Что ты ешь на завтрак?

Расскажи о своей маме.

Выберите одно слово.

Пожертвовать одним взрослым, чтобы спасти двух детей, или двумя детьми, чтобы спасти пятерых взрослых?

Ты любил кого-нибудь?

В первой строчке сонета «Я с летним днем сравнить тебя готов» почему бы не использовать словосочетание «зимний день»?

Все это – примеры вопросов из теста Тьюринга. Это игра, в которой три действующих лица: человек, компьютер и следователь. Следователь задает вопросы игрокам, помеченным как X и Y. Задача машины – сделать так, чтобы ее приняли за человека на основании ответов. Задача человека – помочь следователю понять, кто есть кто. Например, вопрос о сонете Шекспира показался машине странным набором слов, и разницы между зимним и летним днем она, действительно, не уловила. Человек же ответил: «Ты что, смеешься, тогда не будет рифмы». Вопросы следователь выбирает сам. Есть специальные сайты, где пользователи придумывают оригинальные или результативные вопросы для теста.

В первоначальном варианте Тьюринга регулировалось еще и время ответов. Роботы тогда писали слишком медленно, и человека можно было отличить по скорости печати. Правило сохраняется и сейчас, но в наше время уже машина печатает несравнимо быстрее человека.

Алан Тьюринг, английский математик и криптограф, придумал этот тест в 1950 году и впервые описал в статье «Может ли машина мыслить?». Он считал сам вопрос бессмысленным и предложил другой: «Может ли машина имитировать мыслительный процесс?» Речь не о том, чтобы компьютер обрел собственный интеллект, а о том, что он может играть в имитацию привычного человеческого интеллекта. Тест Тьюринга, вопреки распространенному мнению, не определяет, что компьютер эволюционировал, он показывает только успешность имитации, поэтому в англоязычном научном сообществе тест чаще всего называют «игрой в имитацию». Сам Тьюринг писал:

«Я считаю, что примерно через пятьдесят лет можно будет программировать компьютеры с объемом памяти около 109 Гб и заставить их играть в имитационную игру так хорошо, что средний следователь не будет иметь более 70 % шансов сделать правильный выбор через пять минут допроса».

При этом тест Тьюринга уже успешно проходили роботы, и не один раз. Еще в 60-х это впервые удалось программе ELIZA. Детище Дзожефа Вейценбаума имитировало работу психотерапевта, которому позволено вести сеанс, отвечая вопросом на вопрос или задавая много уточняющих вопросов. ELIZA находила в вопросе ключевые слова и выдавала «врачебный» шаблон. Например, на фразу «Мне кажется, мой отец меня ненавидит», она отвечала: «Кто еще, как вам кажется, вас ненавидит?», а на вопрос «Кто ваш любимый композитор?» спрашивала в ответ: «А кто ваш любимый композитор?» Эксперименты с этим ботом не были «чистым» прохождением игры в имитацию: оппонентам ELIZA давали понять, что по ту сторону может быть реальный психотерапевт или человек, который просто мало понимает в мире. В принципе, сейчас далеких потомков Элизы можно встретить в лице Siri или Алисы. Siri, например, на вопрос «Кто твой любимый композитор?» отвечает: «Разве у меня есть? Надо поискать» или «Я точно не знаю», что, конечно, может быть похоже на ответ человека, но очень условно.

А. Цвет и проценты показывают относительную силу слова горизонтальной строки по отношению к слову вертикального столбца. Б. Ориентированный график, показывающий порядок важности слов, полученных из индивидуальных суждений. Направленная линия между двумя словами указывает на значительное согласие с тем, что первое слово было дано человеком, причем ширина линии показывает силу первого слова по отношению ко второму. Иллюстрация: Journal of Experimental Social Psychology, sciencedirect.com

Есть специальный конкурс – премия Лёбнера, на котором компьютерные программы проходят очень серьезный тест Тьюринга. AI Loebner много критикуют, потому что чаще всего победа в нем просто дает хорошую рекламу, а не подтверждает настоящие компьютерные достижения. Так, например, подвергается критике короткая продолжительность разговоров, низкая квалификация судей, лексика 12-летних детей. Стандартные вопросы у Лебнера: «Что быстрее – поезд или самолет?» и «Для чего используют молоток?» В 2019 году на конкурсе вообще отказались от «судей» и отдали результаты на откуп голосованию публики, убрав конкурентов-людей и оставив только соревнование машин. В 2019-м в конкурсе победил чат-бот Kuki, который уже становился победителем также в 2013, 2016, 2017 и 2018 годах. Kuki анализирует свойства предметов в вопросе и поэтому чаще всего дает адекватный и правильный ответ. Например, на вопрос «Можно ли съесть пилу?» он ответит «Нет», потому что найдет, что к слову «пила» установлено значение «металлический».

В 2018 году команда исследователей из Массачусетского технологического института предложила сокращенный тест Тьюринга. Они свели весь разговор к одному слову. Задача выглядела так: назови одно слово, чтобы доказать, что ты человек. Ученые набрали больше тысячи участников и опубликовали результаты в Journal of Experimental Social Psychology. Пять слов-победителей, которые называли чаще всего: любовь (134 человека), сострадание (33), человеческий (30), пожалуйста (25), милосердие (18). Затем экспериментаторы развернули весь процесс обратно – они предложили группе людей определить по выборке слов, человек перед ними или нет. И вторая группа посчитала самым эффективным словом для отсеивания роботов слово… «какашка». В принципе, понятно – юмор проще всего сигнализирует о наличии интеллекта.

Есть альтернативы тесту Тьюринга. Тест Маркуса (The Marcus Test) – что-то вроде задания «перескажи параграф» в школе: программа смотрит телешоу, а потом ее проверяют, как она его поняла. The Lovelace Test 2.0 «заставляет» ИИ анализировать искусство и давать ему оценку. Winograd Schema Challenge – викторина, в которой вопросы даются с вариантами ответов.

Иллюстрация: Tara Jacoby, io9.gizmodo.com

Некоторые считают, что тест Тьюринга шовинистический. Он предполагает, что мы можем оценивать интеллект, только соотнося его с нашим собственным. На деле же вполне способны существовать разумные существа, которые не могут поддерживать разговор в принципе или способны на это только между собой, не с нами. Но, поскольку машинные программы создаются человеком, совпадать они должны тоже с ним. Вряд ли кому-то будет интересно болтать с Siri дольше получаса. Когда мы до этого дойдем, мысленный Алан Тьюринг скажет: «Ну хорошо, машина может думать, игра в имитацию is over». А пока можно придумывать самые изощренные вопросы для тестов Тьюринга и экспериментировать с друзьями и чат-ботами.

Наш журнал ММ Поддержать ММ

Наука

Яна Титоренко

Машины и Механизмы

Статья опубликована в журнале «Машины и механизмы» (№189, июнь 2021).

Теги: Роботы, Искусственный интеллект

Всего 0 комментариев

Комментарии

Авторизуйтесь

Участвовать в дискуссии могут только зарегистрированные пользователи, после модерации.
Пожалуйста, войдите в свой аккаунт или зарегистрируйтесь.