я могу 
Все гениальное просто!
Машины и Механизмы
Все записи
текст

Самый большой словарь паронимов

Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — говорит соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена Большакова, представившая результаты работы на конференции по

Самый большой словарь паронимов

Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — говорит соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена Большакова, представившая результаты работы на конференции по компьютерной лингвистике "Диалог".

До сих пор лингвисты составляли словари вручную, опираясь на языковое чутье. Елена Большакова и ее отец Игорь Большаков, независимый исследователь, впервые предложили формальный критерий паронимии, что дало им возможность составить словарь автоматически.

Исследователи определили паронимы как однокоренные слова одной части речи, имеющие определенные отличия в приставках и суффиксах — например, "добровольный" и "добровольческий". Степень различия слов, при которой они еще достаточно схожи, чтобы считаться паронимами, ученые нашли, анализируя самый большой печатный словарь паронимов русского языка, который содержит 1100 паронимических рядов из 2-7 слов.

В качестве материала для построения компьютерного словаря паронимов ученые использовали созданный ими же словарь однокоренных слов с 23 тысячами единиц. На основании введенных ими критериев, компьютер выбрал среди паронимов 192 тысячи слов, которые составили почти 22 тысячи статей словаря.

Ученые опробовали автоматический поиск ошибок при помощи словаря на отдельных примерах. Встретив в тексте пароним, компьютер обращается к статистике употребления его в разных контекстах. Если пароним оказался рядом с необычным "соседом", алгоритм предлагает варианты замены пары. Дальнейшая задача ученых — уточнить критерий паронимии и протестировать программу на текстах с настоящими ошибками.

Технологии

Машины и Механизмы
Всего 0 комментариев
Комментарии

Рекомендуем

OK OK OK OK OK OK OK