Недавно мы добавили в систему «Антиплагиат» новый параметр подозрительности — детектор дубликатов. Как и ожидалось, посыпались вопросы. В этом материале мы попробуем объяснить, зачем нужен новый функционал, так, чтобы, закончив чтение, вы подумали: «Ну да, нужная фича».
Что такое детектор дубликатов?
Детектор дубликатов выдаёт предупреждение о подозрительности, если проверяемый или очень похожий документ ранее проверялся в другой организации.
Предпосылки для внедрения функции
Довольно часто недобросовестные авторы отправляют одну и ту же рукопись в разные журналы. Это происходит по разным причинам, но чаще всего из-за стремления ускорить процесс публикации. Такой подход кажется более быстрым: отправив статью одновременно в несколько журналов, автор надеется, что хотя бы один из них её примет, вместо того чтобы ждать ответа от каждого по очереди.
Другая причина — это стремление авторов опубликовать один и тот же материал в нескольких журналах. Такое бывает, когда, например, научного сотрудника поощряют за количество публикаций — и он целенаправленно отправляет рукопись в несколько журналов, ожидая, что она будет опубликована везде, т. е. запускает веерную рассылку.
В своём докладе на конференции «Обнаружение заимствований — 2024» Юрий Чехович, президент компании Антиплагиат, рассказал об исследовании 2019 года, в котором мы искали дублированные публикации в электронной библиотеке eLIBRARY.RU. Всего взяли 3,8 млн публикаций. Оказалось, что 70 тыс. из них, то есть 4% от всего исследованного массива данных, не уникальны, а имеют «близнецов, потерянных при рождении» и отправленных в другие издания.
В 2023 году данные подобного исследования показали, что число таких случаев выросло ещё на 15 тысяч.
Почему дублированные публикации и веерная рассылка — это плохо?
- Иллюзия приращения знаний: одни и те же результаты публикуются несколько раз, создавая ложное увеличение научных достижений.
- Искажение наукометрических показателей: это приводит к манипуляциям с научными рейтингами, а также к недостоверности в системах премирования.
- Искажение метаанализа: одни и те же данные учитываются несколько раз, что снижает достоверность метаисследований.
- Юридические проблемы: нарушение авторских прав может привести к претензиям между журналами, если публикации происходят в разное время.
Как детектор дубликатов помогает решить проблему?
Ранее определить, что статья рассматривается к публикации сразу в нескольких журналах, было невозможно. Обычно это становилось известно только после публикации, что порой приводило к серьёзным проблемам. За публикацию неоригинальной статьи можно было получить иск от другого журнала или издателя за нарушение имущественных прав. В таких случаях необходимо было выяснить, в каком из журналов статья была выпущена первой и признана оригинальной, а где публикация следовала позже, являясь копией ранее опубликованной работы.
Теперь же, когда рукопись проходит проверку в нескольких журналах или научных организациях, система сигнализирует редактору о возможном дублировании на ранних этапах, ещё до того, как опубликуется материал. И здесь решение за издателем: если дублирование приемлемо, подозрительность можно снять, если нет — нужно поговорить с автором.
Детектор дубликатов помогает предотвратить появление одинаковых статей в научных журналах и минимизирует практику веерной рассылки. В свою очередь, это способствует повышению прозрачности и честности научных исследований в России, укрепляя научную репутацию страны на международной арене.
Выводы
Детектор дубликатов является необходимым инструментом для борьбы с неэтичными практиками в научной публикации. Он помогает повысить доверие к российским научным журналам, обеспечивая более честную и прозрачную научную среду. Внедрение этого функционала в систему «Антиплагиат» поддерживает высокие стандарты публикаций и научного обмена и, как следствие, становится важным шагом к улучшению состояния науки в России.
Что такое Антиплагиат?
Антиплагиат — это система автоматической проверки текстов на наличие заимствований. Она сравнивает текст с огромной базой данных, включая научные публикации, веб-страницы и другие источники, и выявляет совпадения. Система используется для оценки оригинальности студенческих работ, научных публикаций и других текстов. Результаты проверки помогают определить степень оригинальности текста и выявить возможные случаи плагиата.