Машины и
я могу 
Все гениальное просто!
Машины и Механизмы
Все записи
текст

Самый большой словарь паронимов

Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — говорит соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена...

Самый большой словарь паронимов

Российские компьютерные лингвисты смогли автоматически составить самый большой компьютерный словарь паронимов русского языка — слов, похожих по форме, но разных по значению.

Правильное употребление таких слов, как, например, "адресат" и "адресант", часто вызывает трудности. "У (нового) словаря есть как минимум два приложения — исправление ошибок в тексте и обучение правильному употреблению паронимов в разных контекстах", — говорит соавтор исследования, сотрудник факультета вычислительной математики и кибернетики МГУ Елена Большакова, представившая результаты работы на конференции по компьютерной лингвистике "Диалог".

До сих пор лингвисты составляли словари вручную, опираясь на языковое чутье. Елена Большакова и ее отец Игорь Большаков, независимый исследователь, впервые предложили формальный критерий паронимии, что дало им возможность составить словарь автоматически.

Исследователи определили паронимы как однокоренные слова одной части речи, имеющие определенные отличия в приставках и суффиксах — например, "добровольный" и "добровольческий". Степень различия слов, при которой они еще достаточно схожи, чтобы считаться паронимами, ученые нашли, анализируя самый большой печатный словарь паронимов русского языка, который содержит 1100 паронимических рядов из 2-7 слов.

В качестве материала для построения компьютерного словаря паронимов ученые использовали созданный ими же словарь однокоренных слов с 23 тысячами единиц. На основании введенных ими критериев, компьютер выбрал среди паронимов 192 тысячи слов, которые составили почти 22 тысячи статей словаря.

Ученые опробовали автоматический поиск ошибок при помощи словаря на отдельных примерах. Встретив в тексте пароним, компьютер обращается к статистике употребления его в разных контекстах. Если пароним оказался рядом с необычным "соседом", алгоритм предлагает варианты замены пары. Дальнейшая задача ученых — уточнить критерий паронимии и протестировать программу на текстах с настоящими ошибками.

Изобретения

Машины и Механизмы
Всего 0 комментариев
Комментарии

Рекомендуем

Научные события Петербурга:
Общая теория относительности: искусство познания Общая теория относительности: искусство познания
Образовательное пространство «Итальянская 16» Суббота, 24 августа 2019 года, 19:00–20:30
Вечерняя экскурсия по Пулковской обсерватории Вечерняя экскурсия по Пулковской обсерватории
Пулковское шоссе, д. 65, к. 1 23.08.2019
Петросити
Поэма здоровья
Биосфера
Бесконтактная примерка обуви
OK OK OK OK OK OK OK