Все мы иногда ленимся. Зачем тратить часы на написание текста, если можно подольше полежать с котами, пока нейросеть сделает за вас работу? Именно так рассуждают многие студенты, авторы контента и даже специалисты в бизнесе. Нейросети вроде ChatGPT стали настоящими помощниками: они пишут статьи, код и даже создают презентации. Но проблема в том, что такой подход уже не устраивает преподавателей, заказчиков и аудиторию. Сегодня каждый может сделать проверку на ИИ в системе «Антиплагиат». Алгоритмы анализируют и определяют, где текст написан человеком, а где — машиной. Мы разобрались, как работает «Антиплагиат», какие признаки выдают нейросеть и как обмануть проверку.
Сервис «Антиплагиат» анализирует текст на уникальность, сравнивая его с огромной базой информации в интернете и научными статьями. В основе проверки два метода: шинглы и векторизация.
В основе поиска заимствований — шинглы, то есть не большие словосочетания. Чем больше ваши шинглы будут пересекаться с шинглами в другом тексте, тем выше шанс, что абзац или фрагмент не пройдёт проверку. По статистике, сервис проверяет таким образом только каждое третье слово.
На следующем этапе текст переводят в цифры (векторизация). Текст становится точками в многомерном пространстве. Если точки двух фрагментов близки — они похожи по смыслу. С помощью этого метода определяются перефразированные части текста и синонимы.
Относительно недавно система научилась распознавать сгенерированные нейросетью тексты. Как «Антиплагиат», так и ChatGPT берут информацию из интернета, поэтому не удивительно, что творение ИИ будет не очень уникальным по оценке системы.
В целом, при проверке любого текста, анализируется структура предложений, лексика и смысл. На каком-то из этих пунктов нейросеть точно ошибётся, и вот как:
Современные версии «Антиплагиата» лучше всего распознают модели, как GPT−4 и GPT−4o, GPT−4o mini. и GPT-o1.
Если коротко, то написанный ИИ отличает:
Студенты и учёные уже на протяжении 10 лет пытаются обойти «Антиплагиат». Какие только методы они не придумывали: перевод с языка на язык, синонимы, вставка скрытых символов. Но всё это уже не работает, как раз благодаря обновлённым алгоритмом на основе шинглов.
Попытки обмануть систему на проверке нейротекста сводятся к самому простому — работа со стилистикой и смыслом:
Чтобы ваш текст точно прошёл проверку на сгенерированный контент, нужно поработать с его уникальностью. Для этого хороши и предыдущие методы, которые можно использовать вместе с этими рекомендациями:
Если вы хотите быстро улучшить текст, обратите внимание на такие сайты:
Пусть иногда «Антиплагиат» действительно незаслуженно выделяет ваш текст сплошным красным цветом, но намного эффективнее и быстрее писать текст сразу своими словами. А там дело за малым: отредактировать стилистику и грамматику.