14 апреля 2022
ПРО//ЧТЕНИЕ – разработка модели по поиску ошибок
В нашем корпоративном блоге на Habr.com опубликована новая статья, написанная исследователями компании Антиплагиат.
Руководитель команды NLP отдела исследований, Андрей Грабовой и разработчик-исследователь, Артём Чащин, поделились своими впечатлениями от участия во втором цикле конкурса ПРО//ЧТЕНИЕ и рассказали, как им удалось разработать модель по поиску ошибок в текстах.
Цель конкурса – сделать такой алгоритм, с помощью которого можно проверять любые тексты, например, сочинения в школах, и находить в них наличие или отсутствие ошибок.
Во втором цикле данного конкурса команда Антиплагиата вновь заняла призовое место и, конечно, примет участие в следующем конкурсном этапе.
Авторы написали большую статью о своих разработках в нашем корпоративном блоге на Habr.com и знакомят читателей с новыми подходами в области машинного обучения.
Как сделать так, чтобы «машина» находила ошибки в сочинениях на уровне экспертов ЕГЭ? Задача сложная, и, на первый взгляд, кажется невыполнимой, но не для исследователей компании Антиплагиат. Ведь не зря же основным интересом в компании является область обработки текстов.
О том, как научить робота выделять грамматические, речевые, логические, фактические, этические ошибки и искать смысловые блоки исследователи подробно описали на Habr.com.
И, кстати, саму статью проверила в итоге уже разработанная командой Антиплагиата модель по поиску ошибок. В самом конце приведён небольшой пример с алгоритмизированными правками.
Полную версию статьи можно прочитать в нашем корпоративном блоге на habr.com.
Приятного чтения!