Чтобы помочь компьютерам, ученые выяснят, как люди узнают друг друга по голосам

Чтобы помочь системам распознавания голоса лучше определять, кто и что говорит, ученые выясняют, как это делают сами люди.

1907 0 0

отправить по e-mail

Чтобы помочь компьютерам, ученые выяснят, как люди узнают друг друга по голосам

Люди могут узнавать других людей по их голосам без каких-либо проблем, чего не скажешь о программных системах распознавания голоса вроде «Алексы», «Сири» и «Алисы». Ученые решили изучить, как именно люди идентифицируют друг друга по голосам, чтобы сделать программные обеспечения распознавания голоса еще совершеннее. Их работа опубликована в Acoustical Society of America.

Например, у Facebook нет проблем с распознаванием лиц на фотографиях, даже если лицо представлено под разными углами или под разным освещением, но современные системы распознавания голоса намного более ограничены. Допустим, у вас сильный акцент штата Алабама – тогда «Алекса» может подумать, что вы говорите «трость» (cane), когда пытаетесь сказать «не могу» (can’t).

«Если мы сможем понять, как люди отличают слова говорящего, то, возможно, мы сможем научить этому искусственную систему», – говорит Нираж Шарма, психолог из Университета Карнеги-Меллон.

Шарма и его коллеги разработали эксперимент, в котором группа добровольцев прослушала аудиозаписи двух похожих голосов, говорящих по очереди, и должна была определить точный момент, когда один из говорящих сменил другого. Это позволило исследователям изучить взаимосвязь между определенными звуковыми характеристиками, временем реакции и частотой ложных срабатываний участников эксперимента. Затем они начали расшифровывать на что именно люди обращают внимание, чтобы определить момент смены говорящего.

В ближайших планах ученых проанализировать активность мозга людей, слушающих разные голоса, с помощью электроэнцефалографии или ЭЭГ, неинвазивного метода мониторинга активности мозга. Понимание этого поможет им переложить данные на программные обеспечения вроде «Сири» и «Алисы», чтобы они могли четче понимать голоса людей и что именно они говорят, вне зависимости от внешних факторов: акцента, громкости, тембра и так далее.

Наш журнал ММ Поддержать ММ

Технологии

Полина Агеева

Машины и Механизмы

Эту статью поддерживают: Борис Акулин

Теги:

Всего 0 комментариев

Комментарии

Авторизуйтесь

Участвовать в дискуссии могут только зарегистрированные пользователи, после модерации.
Пожалуйста, войдите в свой аккаунт или зарегистрируйтесь.