Совместный проект Западночешского Университета в Пльзене, пражского Карлова университета и двух частных компаний: CertiCon и SpeechTech – стартовал почти два года назад. Приложение
разработано для пациентов, потерявших голос из-за удаления гортани – типичной процедуры на поздних стадиях рака горла. Технология использует записи голоса пациента для создания синтетической речи, которую можно воспроизводить на их мобильных телефонах, планшетах или ноутбуках. В идеале пациенты должны записать более 10000 предложений, чтобы предоставить достаточно материала для создания своего синтетического голоса.
Один из пациентов, использующих приложение – Властимил Гулар с диагнозом рака горла
Но есть и недостатки: из-за процедуры лечения у пациентов обычно мало времени для записи. Да и после того, как жизнь переворачивается с ног на голову, запись предложений – последнее, что люди хотят сделать. Чтобы устранить эти трудности, ученые усовершенствовали приложение.
Ему необходимо меньшее количество предложений – в идеале 3500. Этот метод использует расширенные статистические модели, такие как искусственные нейронные сети. Используя речевые модели с определенными параметрами можно генерировать синтезированную речь.
Работа над приложением
Помимо чешского языка, ученые создали синтезированные образцы речи на английском, русском и словацком языках. Разработчики считают, что в будущем пациенты смогут использовать приложение для записи голоса прямо дома, используя специализированный веб-сайт.
Процесс записи предложений для будущего использования приложения