14 апреля 2022

ПРО//ЧТЕНИЕ – разработка модели по поиску ошибок

В нашем корпоративном блоге на Habr.com опубликована новая статья, написанная исследователями компании Антиплагиат.

Руководитель команды NLP отдела исследований, Андрей Грабовой и разработчик-исследователь, Артём Чащин, поделились своими впечатлениями от участия во втором цикле конкурса ПРО//ЧТЕНИЕ и рассказали, как им удалось разработать модель по поиску ошибок в текстах.

Цель конкурса – сделать такой алгоритм, с помощью которого можно проверять любые тексты, например, сочинения в школах, и находить в них наличие или отсутствие ошибок.

Во втором цикле данного конкурса команда Антиплагиата вновь заняла призовое место и, конечно, примет участие в следующем конкурсном этапе.

Авторы написали большую статью о своих разработках в нашем корпоративном блоге на Habr.com и знакомят читателей с новыми подходами в области машинного обучения.

Как сделать так, чтобы «машина» находила ошибки в сочинениях на уровне экспертов ЕГЭ? Задача сложная, и, на первый взгляд, кажется невыполнимой, но не для исследователей компании Антиплагиат. Ведь не зря же основным интересом в компании является область обработки текстов.

О том, как научить робота выделять грамматические, речевые, логические, фактические, этические ошибки и искать смысловые блоки исследователи подробно описали на Habr.com.

И, кстати, саму статью проверила в итоге уже разработанная командой Антиплагиата модель по поиску ошибок. В самом конце приведён небольшой пример с алгоритмизированными правками.

Полную версию статьи можно прочитать в нашем корпоративном блоге на habr.com.

Приятного чтения!

Habr.com

образование

Поделиться публикацией