4 декабря 2020
Антиплагиат найдет плагиат в изображениях!
Компания Антиплагиат выиграла грант на реализацию задачи по созданию поиска заимствований изображений! В рамках шестой очереди конкурсного отбора по конкурсу «Развитие-НТИ» компания Антиплагиат вместе с другими 96 компаниями получила пакет финансирования на реализацию заявленных проектов от Фонда содействия развитию малых форм предприятий в научно-технической сфере (Фонд содействия инновациям). Подробнее можно узнать здесь.
Не секрет, что Антиплагиат давно и успешно находит заимствования в текстах, о чем мы подробно рассказываем на нашем корпоративном блоге на портале Habr. Однако для борьбы с одним из самых популярных способов недобросовестного заимствования – заимствования изображений – мы разработаем решение, аналогов которому нет до сих пор в мире.
Дело в том, что плагиат изображений и плагиат текстов – это разные по своей специфике задачи. Авторы учебных и научных работ при попытке скрыть заимствования изображений ограничены в средствах, и чаще всего в ход идет комбинация следующих средств: сильное зашумление изображения, введение в изображение “ярких” посторонних неожиданных объектов, компрессия, перевод изображения в оттенки серого цвета (grayscale), изменение масштаба, зеркальное отображение и поворот. Эти методы весьма эффективны при работе с изображениями, и даже «натренированный» взгляд эксперта может с первого раза не признать изменение рисунка.
Компания Антиплагиат с помощью Фонда содействия инновациям разработает «Модуль поиска изображений в научных публикациях, находящихся в открытом доступе», который предоставит функционал поиска заимствованных изображений в анализируемой научной или учебной работе. Данный модуль предоставит пользователям системы «Антиплагиат» возможность автоматического поиска заимствованных изображений при проверке работы в системе «Антиплагиат».
Процесс выявления заимствованных изображений будет устроен следующим образом. После загрузки пользователем документа на анализ из него будут извлекаться изображения и, параллельно поиску текстовых заимствований, будет происходить процесс сравнения извлеченных изображений с созданной в рамках проекта библиотекой изображений. Данный процесс будет осуществляться с помощью специально разработанных алгоритмов, которые будут учитывать многие нюансы, связанные с обработкой изображений. После того как в библиотеке будет найден необходимый материал для сравнения, система будет выдавать результат в «Полном отчете». Таким образом, эксперт, проверяющий работу, увидит в «Полном отчете» по анализируемому документу информацию о заимствованных изображениях наравне с информацией о заимствованных текстовых блоках.