Все мы иногда ленимся. Зачем тратить часы на написание текста, если можно подольше полежать с котами, пока нейросеть сделает за вас работу? Именно так рассуждают многие студенты, авторы контента и даже специалисты в бизнесе. Нейросети вроде ChatGPT стали настоящими помощниками: они пишут статьи, код и даже создают презентации. Но проблема в том, что такой подход уже не устраивает преподавателей, заказчиков и аудиторию. Сегодня каждый может сделать проверку на ИИ в системе «Антиплагиат». Алгоритмы анализируют и определяют, где текст написан человеком, а где — машиной. Мы разобрались, как работает «Антиплагиат», какие признаки выдают нейросеть и как обмануть проверку.
Принцип работы «Антиплагиата»
Сервис «Антиплагиат» анализирует текст на уникальность, сравнивая его с огромной базой информации в интернете и научными статьями. В основе проверки два метода: шинглы и векторизация.
В основе поиска заимствований — шинглы, то есть не большие словосочетания. Чем больше ваши шинглы будут пересекаться с шинглами в другом тексте, тем выше шанс, что абзац или фрагмент не пройдёт проверку. По статистике, сервис проверяет таким образом только каждое третье слово.
На следующем этапе текст переводят в цифры (векторизация). Текст становится точками в многомерном пространстве. Если точки двух фрагментов близки — они похожи по смыслу. С помощью этого метода определяются перефразированные части текста и синонимы.
Какие могут быть признаки сгенерированного текста?
Относительно недавно система научилась распознавать сгенерированные нейросетью тексты. Как «Антиплагиат», так и ChatGPT берут информацию из интернета, поэтому не удивительно, что творение ИИ будет не очень уникальным по оценке системы.
В целом, при проверке любого текста, анализируется структура предложений, лексика и смысл. На каком-то из этих пунктов нейросеть точно ошибётся, и вот как:
- Структура текста. ИИ часто создают предложения с однотипной структурой. Например, одна и та же длина предложений или количество строк в абзаце. Нейросеть не следит и за вёрсткой: могут появляться одинокие строчки посередине текста.
- Частота слов. Некоторые слова и фразы повторяются в текстах. Это помогает «Антиплагиату» обнаружить паттерны. Конечно, этим грешим и мы, но нейросеть часто выдает очень ограниченный словарный запас. Что уж говорить про красивую стилистику и метафоры.Кстати, нейросеть ChatGPT ещё плохо обучена литературному и публицистическому стилю, но может хорошо написать научную работу.
- Семантика. Система проверяет смысл и связность общего текста, а также − отдельных блоков, чтобы выявить несоответствия. Иногда, при недостатке информации по теме, ИИ может добавлять «отсебятину» и выдавать несвязанные мысли.
Современные версии «Антиплагиата» лучше всего распознают модели, как GPT−4 и GPT−4o, GPT−4o mini. и GPT-o1.
Если коротко, то написанный ИИ отличает:
- однотипные предложения с похожей длинной и структурой;
- логические и фактические ошибки;
- текст слишком безэмоциональный и формальный;
- повторение слов и фраз.
Как обмануть «Антиплагиат»
Студенты и учёные уже на протяжении 10 лет пытаются обойти «Антиплагиат». Какие только методы они не придумывали: перевод с языка на язык, синонимы, вставка скрытых символов. Но всё это уже не работает, как раз благодаря обновлённым алгоритмом на основе шинглов.
Попытки обмануть систему на проверке нейротекста сводятся к самому простому — работа со стилистикой и смыслом:
- Используйте синонимы, рерайт и припишите структуру текста.
- Вставляйте части вашего текста, который вы написали вручную.
Как повысить уникальность текста
Чтобы ваш текст точно прошёл проверку на сгенерированный контент, нужно поработать с его уникальностью. Для этого хороши и предыдущие методы, которые можно использовать вместе с этими рекомендациями:
- Рерайт. Перескажите текст без подглядывания в источник информации.
- Добавляйте примеры и детали. Они сделают текст более оригинальным и «живым».
- Разбивайте длинные предложения. Это поможет убрать однотипность структуры.
- Используйте меньше цитат. Вставляйте авторский текст, если действительно нужно, в других случаях лучше написать своими словами.
- Используйте терминологию. Особенно, если это касается научных работ. Нейросети не всегда верно используют сложные слова, а о существовании некоторых вообще не знают. Это сделает текст более авторским, но понизит его уникальность.
- Добавляйте изображения. Таблицы, графики и цифры часто портят уникальность. Поместите их в текст как изображение.
Лучшие сервисы для повышения уникальности текста
Если вы хотите быстро улучшить текст, обратите внимание на такие сайты:
- Text.ru. Сервис для проверки уникальности и редактирования текста.
- Content-Watch. Помогает определить, какие части текста требуют доработки.
- Stopdetect.supster.me. Специальный сайт, которые поможет «оживить» текст, написанный нейросетью.
Пусть иногда «Антиплагиат» действительно незаслуженно выделяет ваш текст сплошным красным цветом, но намного эффективнее и быстрее писать текст сразу своими словами. А там дело за малым: отредактировать стилистику и грамматику.
Поделитесь своим мнением: