Новости и статьи

Как «Антиплагиат» определяет тексты от нейросети: можно ли обойти проверку?

0
0
Все мы иногда ленимся. Зачем тратить часы на написание текста, если можно подольше полежать с котами, пока нейросеть сделает за вас работу? Именно так рассуждают многие студенты, авторы контента и даже специалисты в бизнесе. Нейросети вроде ChatGPT стали настоящими помощниками: они пишут статьи, код и даже создают презентации. Но проблема в том, что такой подход уже не устраивает преподавателей, заказчиков и аудиторию. Сегодня каждый может сделать проверку на ИИ в системе «Антиплагиат». Алгоритмы анализируют и определяют, где текст написан человеком, а где — машиной. Мы разобрались, как работает «Антиплагиат», какие признаки выдают нейросеть и как обмануть проверку.
Содержание статьи
  • Принцип работы «Антиплагиата»  
  • Какие могут быть признаки сгенерированного текста?  
  • Как обмануть «Антиплагиат»  
  • Как повысить уникальность текста  
  • Лучшие сервисы для повышения уникальности текста  
  • Антиплагиат и нейросеть. Фото: freepik.com

    Принцип работы «Антиплагиата»  

    Сервис «Антиплагиат» анализирует текст на уникальность, сравнивая его с огромной базой информации в интернете и научными статьями. В основе проверки два метода: шинглы и векторизация.  

    В основе поиска заимствований — шинглы, то есть не большие словосочетания. Чем больше ваши шинглы будут пересекаться с шинглами в другом тексте, тем выше шанс, что абзац или фрагмент не пройдёт проверку. По статистике, сервис проверяет таким образом только каждое третье слово.

    На следующем этапе текст переводят в цифры (векторизация). Текст становится точками в многомерном пространстве. Если точки двух фрагментов близки — они похожи по смыслу. С помощью этого метода определяются перефразированные части текста и синонимы.  

    Пример: король-мужчина+женщина=королева.  Векторизация показывает, что разница между «король» и «мужчина» такая же, как между «королева» и «женщина».

    Какие могут быть признаки сгенерированного текста?  

    Относительно недавно система научилась распознавать сгенерированные нейросетью тексты. Как «Антиплагиат», так и ChatGPT берут информацию из интернета, поэтому не удивительно, что творение ИИ будет не очень уникальным по оценке системы. 

    В целом, при проверке любого текста, анализируется структура предложений, лексика и смысл. На каком-то из этих пунктов нейросеть точно ошибётся, и вот как: 

    1. Структура текста. ИИ часто создают предложения с однотипной структурой. Например, одна и та же длина предложений или количество строк в абзаце. Нейросеть не следит и за вёрсткой: могут появляться одинокие строчки посередине текста. 
    2. Частота слов. Некоторые слова и фразы повторяются в текстах. Это помогает «Антиплагиату» обнаружить паттерны. Конечно, этим грешим и мы, но нейросеть часто выдает очень ограниченный словарный запас. Что уж говорить про красивую стилистику и метафоры.

      Кстати, нейросеть ChatGPT ещё плохо обучена литературному и публицистическому стилю, но может хорошо написать научную работу.
    3. Семантика. Система проверяет смысл и связность общего текста, а также − отдельных блоков, чтобы выявить несоответствия. Иногда, при недостатке информации по теме, ИИ может добавлять «отсебятину» и выдавать несвязанные мысли. 

    Современные версии «Антиплагиата» лучше всего распознают модели, как GPT−4 и GPT−4o, GPT−4o mini.  и GPT-o1.

    Если коротко, то написанный ИИ отличает:

    • однотипные предложения с похожей длинной и структурой;
    • логические и фактические ошибки;
    • текст слишком безэмоциональный и формальный;
    • повторение слов и фраз.

    Как обмануть «Антиплагиат»  

    Тарифы «Антиплагиата». Проверка на сгенерированный текст есть в пакете Full

    Студенты и учёные уже на протяжении 10 лет пытаются обойти «Антиплагиат». Какие только методы они не придумывали: перевод с языка на язык, синонимы, вставка скрытых символов. Но всё это уже не работает, как раз благодаря обновлённым алгоритмом на основе шинглов. 

    Попытки обмануть систему на проверке нейротекста сводятся к самому простому — работа со стилистикой и смыслом:  

    1. Используйте синонимы, рерайт и припишите структуру текста. 
    2. Вставляйте части вашего текста, который вы написали вручную.  
    Для тех, кому слишком лень переписывать огромный объёмы текста, советуем   использовать специальные сервисы и сайты для рерайта. Например: stopdetect. supster. me и sinonimen.

    Как повысить уникальность текста  

    Чтобы ваш текст точно прошёл проверку на сгенерированный контент, нужно поработать с его уникальностью. Для этого хороши и предыдущие методы, которые можно использовать вместе с этими рекомендациями:  

    1. Рерайт. Перескажите текст без подглядывания в источник информации.   
    2. Добавляйте примеры и детали. Они сделают текст более оригинальным и «живым».  
    3. Разбивайте длинные предложения. Это поможет убрать однотипность структуры. 
    4. Используйте меньше цитат. Вставляйте авторский текст, если действительно нужно, в других случаях лучше написать своими словами. 
    5. Используйте терминологию. Особенно, если это касается научных работ. Нейросети не всегда верно используют сложные слова, а о существовании некоторых вообще не знают. Это сделает текст более авторским, но понизит его уникальность.
    6. Добавляйте изображения. Таблицы, графики и цифры часто портят уникальность. Поместите их в текст как изображение. 

    Лучшие сервисы для повышения уникальности текста  

    Если вы хотите быстро улучшить текст, обратите внимание на такие сайты:  

    1. Text.ru. Сервис для проверки уникальности и редактирования текста.  
    2. Content-Watch. Помогает определить, какие части текста требуют доработки.  
    3. Stopdetect.supster.me. Специальный сайт, которые поможет «оживить» текст, написанный нейросетью. 
    Помните, что сервисы не бесплатные: у них есть лимиты проверок. Чтобы их обойти, вам нужно сменить свой IP-адрес или использовать режим «Инкогнито» в браузере.

    Пусть иногда «Антиплагиат» действительно незаслуженно выделяет ваш текст сплошным красным цветом, но намного эффективнее и быстрее писать текст сразу своими словами. А там дело за малым: отредактировать стилистику и грамматику.

    0
    Поделиться

    Поделитесь своим мнением:

    0/2000