Как «Антиплагиат» определяет тексты от нейросети: можно ли обойти проверку?

27 декабря 2024 11:20

Дарья Кабанова

Все мы иногда ленимся. Зачем тратить часы на написание текста, если можно подольше полежать с котами, пока нейросеть сделает за вас работу? Именно так рассуждают многие студенты, авторы контента и даже специалисты в бизнесе. Нейросети вроде ChatGPT стали настоящими помощниками: они пишут статьи, код и даже создают презентации. Но проблема в том, что такой подход уже не устраивает преподавателей, заказчиков и аудиторию. Сегодня каждый может сделать проверку на ИИ в системе «Антиплагиат». Алгоритмы анализируют и определяют, где текст написан человеком, а где — машиной. Мы разобрались, как работает «Антиплагиат», какие признаки выдают нейросеть и как обмануть проверку.

Содержание статьи

Принцип работы «Антиплагиата»
Какие могут быть признаки сгенерированного текста?
Как обмануть «Антиплагиат»
Как повысить уникальность текста
Лучшие сервисы для повышения уникальности текста

_{Антиплагиат и нейросеть. Фото: freepik.com}

Принцип работы «Антиплагиата»

Сервис «Антиплагиат» анализирует текст на уникальность, сравнивая его с огромной базой информации в интернете и научными статьями. В основе проверки два метода: шинглы и векторизация.

В основе поиска заимствований — шинглы, то есть не большие словосочетания. Чем больше ваши шинглы будут пересекаться с шинглами в другом тексте, тем выше шанс, что абзац или фрагмент не пройдёт проверку. По статистике, сервис проверяет таким образом только каждое третье слово.

На следующем этапе текст переводят в цифры (векторизация). Текст становится точками в многомерном пространстве. Если точки двух фрагментов близки — они похожи по смыслу. С помощью этого метода определяются перефразированные части текста и синонимы.

Пример: король-мужчина+женщина=королева. Векторизация показывает, что разница между «король» и «мужчина» такая же, как между «королева» и «женщина».

Какие могут быть признаки сгенерированного текста?

Относительно недавно система научилась распознавать сгенерированные нейросетью тексты. Как «Антиплагиат», так и ChatGPT берут информацию из интернета, поэтому не удивительно, что творение ИИ будет не очень уникальным по оценке системы.

В целом, при проверке любого текста, анализируется структура предложений, лексика и смысл. На каком-то из этих пунктов нейросеть точно ошибётся, и вот как:

Структура текста. ИИ часто создают предложения с однотипной структурой. Например, одна и та же длина предложений или количество строк в абзаце. Нейросеть не следит и за вёрсткой: могут появляться одинокие строчки посередине текста.
Частота слов. Некоторые слова и фразы повторяются в текстах. Это помогает «Антиплагиату» обнаружить паттерны. Конечно, этим грешим и мы, но нейросеть часто выдает очень ограниченный словарный запас. Что уж говорить про красивую стилистику и метафоры.

Кстати, нейросеть ChatGPT ещё плохо обучена литературному и публицистическому стилю, но может хорошо написать научную работу.
Семантика. Система проверяет смысл и связность общего текста, а также − отдельных блоков, чтобы выявить несоответствия. Иногда, при недостатке информации по теме, ИИ может добавлять «отсебятину» и выдавать несвязанные мысли.

Современные версии «Антиплагиата» лучше всего распознают модели, как GPT−4 и GPT−4o, GPT−4o mini. и GPT-o1.

Если коротко, то написанный ИИ отличает:

однотипные предложения с похожей длинной и структурой;
логические и фактические ошибки;
текст слишком безэмоциональный и формальный;
повторение слов и фраз.

Как обмануть «Антиплагиат»

_{Тарифы «Антиплагиата». Проверка на сгенерированный текст есть в пакете Full}

Студенты и учёные уже на протяжении 10 лет пытаются обойти «Антиплагиат». Какие только методы они не придумывали: перевод с языка на язык, синонимы, вставка скрытых символов. Но всё это уже не работает, как раз благодаря обновлённым алгоритмом на основе шинглов.

Попытки обмануть систему на проверке нейротекста сводятся к самому простому — работа со стилистикой и смыслом:

Используйте синонимы, рерайт и припишите структуру текста.
Вставляйте части вашего текста, который вы написали вручную.

Для тех, кому слишком лень переписывать огромный объёмы текста, советуем использовать специальные сервисы и сайты для рерайта. Например: stopdetect. supster. me и sinonimen.

Как повысить уникальность текста

Чтобы ваш текст точно прошёл проверку на сгенерированный контент, нужно поработать с его уникальностью. Для этого хороши и предыдущие методы, которые можно использовать вместе с этими рекомендациями:

Рерайт. Перескажите текст без подглядывания в источник информации.
Добавляйте примеры и детали. Они сделают текст более оригинальным и «живым».
Разбивайте длинные предложения. Это поможет убрать однотипность структуры.
Используйте меньше цитат. Вставляйте авторский текст, если действительно нужно, в других случаях лучше написать своими словами.
Используйте терминологию. Особенно, если это касается научных работ. Нейросети не всегда верно используют сложные слова, а о существовании некоторых вообще не знают. Это сделает текст более авторским, но понизит его уникальность.
Добавляйте изображения. Таблицы, графики и цифры часто портят уникальность. Поместите их в текст как изображение.

Лучшие сервисы для повышения уникальности текста

Если вы хотите быстро улучшить текст, обратите внимание на такие сайты:

Text.ru. Сервис для проверки уникальности и редактирования текста.
Content-Watch. Помогает определить, какие части текста требуют доработки.
Stopdetect.supster.me. Специальный сайт, которые поможет «оживить» текст, написанный нейросетью.

Помните, что сервисы не бесплатные: у них есть лимиты проверок. Чтобы их обойти, вам нужно сменить свой IP-адрес или использовать режим «Инкогнито» в браузере.

Пусть иногда «Антиплагиат» действительно незаслуженно выделяет ваш текст сплошным красным цветом, но намного эффективнее и быстрее писать текст сразу своими словами. А там дело за малым: отредактировать стилистику и грамматику.

Теги: Искусственный интеллект Образование

Предыдущая статья:

Почему программисту нужно знать английский язык?

Следующая статья:

Зарплата программиста в России: сколько зарабатывают в IT