11 мая 2023
Антиплагиат выявляет текст, созданный ChatGPT
В системе обнаружения текстовых заимствований «Антиплагиат» появился новый функционал – автоматическое выявление машинно-сгенерированных текстов. Новый функционал будет доступен всем пользователям платных версий системы с мая 2023 года.
Уникальный алгоритм, позволяющий автоматически выявлять и маркировать сгенерированные машиной фрагменты текста, является собственной разработкой компании Антиплагиат, созданной на основе многолетних исследований по обработке естественного языка (Natural language processing, NLP).
Новый функционал включен в стандартную лицензию проверки текстов на обнаружение заимствований. Система проверки анализирует текст на наличие фрагментов, предположительно созданных при использовании моделей глубокого обучения GPT2, GPT-3, ChatGPT. Детектор машинно-сгенерированных текстов обучен и протестирован на большом наборе данных, что минимизирует риск ложного срабатывания.
Теперь, если в проверяемом документе обнаружены сгенерированные фрагменты, система «Антиплагиат» выделяет их, а сам документ маркируется как «Подозрительный». Данные об обнаруженных фрагментах доступны в полном отчете о проверке документа, к ним легко перейти для ознакомления.
16 мая состоялся открытый вебинар, на котором разработчики ответили на вопросы пользователей. Запись вебинара можно посмотреть по ссылке.
«Нейронная сеть, создающая текст, всегда оставляет свои следы. В работе над определением сгенерированного текста разработчики компании Антиплагиат также использует алгоритмы искусственного интеллекта, естественно, обученные на задачи детектирования. Несмотря на все успехи ChatGPT или Jasper, их тексты все еще отличаются от написанных человеком», – прокомментировал исполнительный директор компании Антиплагиат, Юрий Викторович Чехович.