Машины и
я могу 
Все гениальное просто!
Машины и Механизмы
Все записи
текст

Самый большой словарь паронимов

Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — говорит соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена...

Самый большой словарь паронимов

Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — говорит соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена Большакова, представившая результаты работы на конференции по компьютерной лингвистике "Диалог".

До сих пор лингвисты составляли словари вручную, опираясь на языковое чутье. Елена Большакова и ее отец Игорь Большаков, независимый исследователь, впервые предложили формальный критерий паронимии, что дало им возможность составить словарь автоматически.

Исследователи определили паронимы как однокоренные слова одной части речи, имеющие определенные отличия в приставках и суффиксах — например, "добровольный" и "добровольческий". Степень различия слов, при которой они еще достаточно схожи, чтобы считаться паронимами, ученые нашли, анализируя самый большой печатный словарь паронимов русского языка, который содержит 1100 паронимических рядов из 2-7 слов.

В качестве материала для построения компьютерного словаря паронимов ученые использовали созданный ими же словарь однокоренных слов с 23 тысячами единиц. На основании введенных ими критериев, компьютер выбрал среди паронимов 192 тысячи слов, которые составили почти 22 тысячи статей словаря.

Ученые опробовали автоматический поиск ошибок при помощи словаря на отдельных примерах. Встретив в тексте пароним, компьютер обращается к статистике употребления его в разных контекстах. Если пароним оказался рядом с необычным "соседом", алгоритм предлагает варианты замены пары. Дальнейшая задача ученых — уточнить критерий паронимии и протестировать программу на текстах с настоящими ошибками.

Изобретения

Машины и Механизмы
Всего 0 комментариев
Комментарии

Рекомендуем

Актуальное
В Петербурге пройдёт хакатон по научно-популярной журналистике ScienceMedia В Петербурге пройдёт хакатон по научно-популярной журналистике ScienceMedia
Санкт-Петербург, Университет ИТМО 14-16 ноября 2019 года
Конкурс детских книг с иллюстрациями Конкурс детских книг с иллюстрациями
Весь мир Дедлайн – 14 февраля 2020 года
Экономический диктант Экономический диктант
Онлайн – весь мир, оффлайн – Россия 9 октября
Фотоконкурс «Наука о жизни» Фотоконкурс «Наука о жизни»
Весь мир Дедлайн – 31 января 2020 года
Международная академия аутоиммунитета Международная академия аутоиммунитета
Санкт-Петербург, СПбГУ 11 октября
Студенческая олимпиада по робототехнике Студенческая олимпиада по робототехнике
Санкт-Петербург, СПбПУ 26 октября
Географический диктант Географический диктант
Онлайн – весь мир, оффлайн – Россия 27 октября
Стипендия Chevening 2020/21 Стипендия Chevening 2020/21
Весь мир Дедлайн – 5 ноября
Петросити
Поэма здоровья
Биосфера
Бесконтактная примерка обуви
OK OK OK OK OK OK OK