Целевая аудитория этой статьи – редакторы, преподаватели, научные руководители и все, кому приходится по долгу службы иметь дело с курсовыми, дипломными и другими учебными и научными текстами.
Представим ситуацию − студент сдал работу, вы прогоняете ее через систему «Антиплагиат» и она выдает большой восклицательный знак, предупреждая, что в работе есть подозрительный фрагмент текста, который возможно был написан с помощью сервисов искусственной генерации текста. Но… наверняка, к сожалению, знать нельзя. Такая отметка не дает прямых оснований отклонить работу или не допустить студента к защите. Она лишь уведомляет, что к тексту стоит присмотреться внимательнее, а окончательное решение остается за вами.
Рассказываем, как не оказаться «плохим парнем» в жизни честного студента и, что еще хуже, в своей собственной.
Алгоритм действий такой: при появлении пометки о наличии сгенерированного текста необходимо побеседовать со студентом, чтобы оценить, владеет ли он материалом, и провести дополнительный анализ текста. Уверены, что с беседой вы справитесь самостоятельно, а вот с анализом поможем мы.
Как система «Антиплагиат» распознает ИИ тексты
Немного о самом детекторе машинно сгенерированных текстов в системе «Антиплагиат». Он работает на основе алгоритмов искусственного интеллекта, обучен и протестирован на большом массиве данных. Это сводит к минимуму риск ложного срабатывания.Наша система обработала колоссальное количество текстов, чтобы научиться определять искусственно созданные фрагменты. В основе этой функции лежит ряд признаков, свойственных искусственно сгенерированным текстам. Невооруженным глазом эти признаки распознать невозможно, тем не менее у ИИ текстов есть и другие особенности, которые выдают их. И, если знать, что искать, их вполне можно распознать самостоятельно. Именно это мы и научим вас делать.
Теперь к главному, показываем на реальных примерах характерные признаки искусственно сгенерированных текстов
Искусственный интеллект пишет тексты, которые могут выглядеть очень правдоподобно, наукообразно и иметь высокий процент оригинальности. При этом, если вчитаться повнимательнее, можно найти признаки, которые выдадут искусственного создателя с головой.
1. Бессмысленные фразы:
- «Маркетинговые коммуникации представляют собой совокупность усилий компании по созданию благоприятных условий для успешной и прибыльной деятельности на рынке, посредством воздействия на ее внутреннюю и внешнюю среду».
- «В этом можно увидеть ряд основных принципов: цель, способ и способы достижения цели».
- «Введение диплома по анализу и совершенствования управления организацией, является важнейшим компонентом, который задает контекст и цель для всего исследования».
2. Искаженные словосочетания, термины или клише¹.
3. Странно написанные устоявшиеся определения. Это обычно говорит об использовании ИИ для перефразирования чужого текста.
4. Почти дословные повторы одной и той же мысли.
5. Фейковые ссылки или полное отсутствие ссылок на источники даже в тех случаях, когда из текста следует явная необходимость ссылок. Например: «многие исследователи пишут о…» или «существует ряд исследований…» и т.д.
6. Фактические ошибки, ложная информация, фейковые факты.
7. Фразы, которые проникли в текст из диалога с ботом:
- «Сгенерировать ответ заново»
- «Как большая языковая модель, я…»
- «На момент моего последнего обновления знаний в сентябре 2023 года…»³
Если в работе нашлось сразу несколько таких признаков, вероятнее всего ее написали с помощью генеративных сервисов. Да, неоспоримых доказательств привести нельзя, но в любом случае указанные признаки говорят о крайне низком качестве текста.
Такую работу вполне оправданно можно отклонить и отправить на доработку студенту по причине несоответствия требованиям вуза к ВКР.
Если же текст работы соответствует требованиям вуза, и студент демонстрирует полноценное владение материалом, то вы можете снять отметку о подозрительности вручную с соответствующим комментарием.
Более подробная техническая инструкция
_______________________________________
¹ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: https://arxiv.org/pdf/2107.06751
² Гольдман И.Я., Добробабенко Н.С. Практика рекламы. Десять уроков для советского бизнесмена: Учебник [Текст]. – Новосибирск: СП Интербук, 1991. – 73 с.
³ Guillaume Cabanac, Cyril Labbé, Alexander Magazinov Tortured phrases: A dubious writing style emerging in science Evidence of critical issues affecting established journals URL: arxiv.org/pdf/2107.06751