Как «Антиплагиат» определяет тексты от нейросети: можно ли обойти проверку?

Дарья Кабанова
Дарья Кабанова Дарья Кабанова
65
Специализация: Инвестиции, туризм, недвижимость, криптовалюты, авто, технологии
Задать вопрос
3 минуты чтения
Комментировать

Все мы иногда ленимся. Зачем тратить часы на написание текста, если можно подольше полежать с котами, пока нейросеть сделает за вас работу? Именно так рассуждают многие студенты, авторы контента и даже специалисты в бизнесе. Нейросети вроде ChatGPT стали настоящими помощниками: они пишут статьи, код и даже создают презентации. Но проблема в том, что такой подход уже не устраивает преподавателей, заказчиков и аудиторию. Сегодня каждый может сделать проверку на ИИ в системе «Антиплагиат». Алгоритмы анализируют и определяют, где текст написан человеком, а где — машиной. Мы разобрались, как работает «Антиплагиат», какие признаки выдают нейросеть и как обмануть проверку.

Антиплагиат и нейросеть. Фото: freepik.com

Принцип работы «Антиплагиата»  

Сервис «Антиплагиат» анализирует текст на уникальность, сравнивая его с огромной базой информации в интернете и научными статьями. В основе проверки два метода: шинглы и векторизация.

В основе поиска заимствований — шинглы, то есть не большие словосочетания. Чем больше ваши шинглы будут пересекаться с шинглами в другом тексте, тем выше шанс, что абзац или фрагмент не пройдёт проверку. По статистике, сервис проверяет таким образом только каждое третье слово.

На следующем этапе текст переводят в цифры (векторизация). Текст становится точками в многомерном пространстве. Если точки двух фрагментов близки — они похожи по смыслу. С помощью этого метода определяются перефразированные части текста и синонимы.

Пример: король-мужчина+женщина=королева.  Векторизация показывает, что разница между «король» и «мужчина» такая же, как между «королева» и «женщина».

Какие могут быть признаки сгенерированного текста?  

Относительно недавно система научилась распознавать сгенерированные нейросетью тексты. Как «Антиплагиат», так и ChatGPT берут информацию из интернета, поэтому не удивительно, что творение ИИ будет не очень уникальным по оценке системы.

В целом, при проверке любого текста, анализируется структура предложений, лексика и смысл. На каком-то из этих пунктов нейросеть точно ошибётся, и вот как:

  1. Структура текста. ИИ часто создают предложения с однотипной структурой. Например, одна и та же длина предложений или количество строк в абзаце. Нейросеть не следит и за вёрсткой: могут появляться одинокие строчки посередине текста.
  2. Частота слов. Некоторые слова и фразы повторяются в текстах. Это помогает «Антиплагиату» обнаружить паттерны. Конечно, этим грешим и мы, но нейросеть часто выдает очень ограниченный словарный запас. Что уж говорить про красивую стилистику и метафоры.

    Кстати, нейросеть ChatGPT ещё плохо обучена литературному и публицистическому стилю, но может хорошо написать научную работу.
  3. Семантика. Система проверяет смысл и связность общего текста, а также − отдельных блоков, чтобы выявить несоответствия. Иногда, при недостатке информации по теме, ИИ может добавлять «отсебятину» и выдавать несвязанные мысли.

Современные версии «Антиплагиата» лучше всего распознают модели, как GPT−4 и GPT−4o, GPT−4o mini.  и GPT-o1.

Если коротко, то написанный ИИ отличает:

  • однотипные предложения с похожей длинной и структурой;
  • логические и фактические ошибки;
  • текст слишком безэмоциональный и формальный;
  • повторение слов и фраз.

Как обмануть «Антиплагиат»  

Тарифы «Антиплагиата». Проверка на сгенерированный текст есть в пакете Full

Студенты и учёные уже на протяжении 10 лет пытаются обойти «Антиплагиат». Какие только методы они не придумывали: перевод с языка на язык, синонимы, вставка скрытых символов. Но всё это уже не работает, как раз благодаря обновлённым алгоритмом на основе шинглов.

Попытки обмануть систему на проверке нейротекста сводятся к самому простому — работа со стилистикой и смыслом:

  1. Используйте синонимы, рерайт и припишите структуру текста.
  2. Вставляйте части вашего текста, который вы написали вручную.
Для тех, кому слишком лень переписывать огромный объёмы текста, советуем   использовать специальные сервисы и сайты для рерайта. Например: stopdetect. supster. me и sinonimen.

Как повысить уникальность текста  

Чтобы ваш текст точно прошёл проверку на сгенерированный контент, нужно поработать с его уникальностью. Для этого хороши и предыдущие методы, которые можно использовать вместе с этими рекомендациями:

  1. Рерайт. Перескажите текст без подглядывания в источник информации.
  2. Добавляйте примеры и детали. Они сделают текст более оригинальным и «живым».
  3. Разбивайте длинные предложения. Это поможет убрать однотипность структуры.
  4. Используйте меньше цитат. Вставляйте авторский текст, если действительно нужно, в других случаях лучше написать своими словами.
  5. Используйте терминологию. Особенно, если это касается научных работ. Нейросети не всегда верно используют сложные слова, а о существовании некоторых вообще не знают. Это сделает текст более авторским, но понизит его уникальность.
  6. Добавляйте изображения. Таблицы, графики и цифры часто портят уникальность. Поместите их в текст как изображение.

Лучшие сервисы для повышения уникальности текста  

Если вы хотите быстро улучшить текст, обратите внимание на такие сайты:

  1. Text.ru. Сервис для проверки уникальности и редактирования текста.
  2. Content-Watch. Помогает определить, какие части текста требуют доработки.
  3. Stopdetect.supster.me. Специальный сайт, которые поможет «оживить» текст, написанный нейросетью.
Помните, что сервисы не бесплатные: у них есть лимиты проверок. Чтобы их обойти, вам нужно сменить свой IP-адрес или использовать режим «Инкогнито» в браузере.

Пусть иногда «Антиплагиат» действительно незаслуженно выделяет ваш текст сплошным красным цветом, но намного эффективнее и быстрее писать текст сразу своими словами. А там дело за малым: отредактировать стилистику и грамматику.

Поделитесь своим мнением:

0/2000