Мы используем cookies («куки») и подобные им технологии для того, чтобы у Вас сложилось наилучшее впечатление о работе нашего сайта. Если Вы продолжаете использовать наш сайт, это означает, что Вы согласны с использованием cookies. Для получения дополнительной информации, пожалуйста, ознакомьтесь с нашими Политиками

Реестр отечественного ПО При поддержке НТИ

17 декабря 2018

Антиплагиат и ФСИ создают совместный проект

В 2018 году компания Антиплагиат приняла участие в конкурсе «Развитие-НТИ» на реализацию планов мероприятий («дорожных карт») Национальной технологической инициативы (НТИ) «Нейронет» c проектом «Развитие технологии обнаружения переводных заимствований, основанной на методах анализа больших текстовых данных» (номер заявки НТИ-49378). По результатам конкурса Фонд содействия инновациям выделил грант на финансирование работ по данному проекту. При этом компания Антиплагиат также инвестирует собственные средства в реализацию этого проекта.

Команда Антиплагиата в течение последних нескольких лет успешно работает над созданием решений по поиску переводных заимствований. Наши исследования показывают, что переводные заимствования становятся все более популярным способом скрыть попытки некорректного использования чужого текста. Такой тип заимствований часто встречается в студенческих и диссертационных работах.

Следует отметить, что, в отличие от поиска заимствований в рамках одного языка, поиск переводных заимствований – это гораздо более сложная задача, для решения которой необходимо использовать множество научно-технических и кадровых ресурсов. И совсем недавно нам удалось выйти на новый уровень и при помощи Фонда содействия инновациям начать работу над расширением функционала поиска заимствований на иностранных языках.

В настоящий момент мы разрабатываем новую технологию детектирования текстов, содержащих переводные заимствования для пар языков английский-русский, русский-языки стран СНГ (казахский, украинский, белорусский, киргизский), английский-языки стран СНГ. Новая технология основана на рекуррентных сетях глубокого обучения (deep learning) – искусственных нейронных сетях особого вида, позволяющих представить фрагмент текста произвольной длины в векторном пространстве большой размерности. Подробнее узнать о том, каким образом мы ищем заимствования в текстах, можно узнать на нашем корпоративном блоге Habr.com.

Для справки: ФГБУ «Фонд содействия развитию малых форм предприятий в научно-технической сфере» (Фонд содействия инновациям) участвует в формировании перспективных отраслей, которые в течение следующих 20 лет могут стать основой национальной экономики, и помогает развивать научные проекты в данных направлениях.

Поделиться публикацией