Технологии

В России создали продвинутый детектор сгенерированных текстов

Команда российских учёных из нескольких научных центров представила новый метод, позволяющий отличать сгенерированные тексты от написанных человеком, сообщили Тренды и Технологии.

Новая система распознает даже «скрытую» природу сгенерированного текста

Как разъяснили в МФТИ, большинство популярных сегодня детекторов выдают свой вердикт, не объясняя, как именно было принято решение, что не позволяет понять, почему система ошиблась и как избежать этого в будущем. Российским учёным удалось решить эту проблему, разбив алгоритм на отдельные блоки, отвечающие за обработку разных аспектов текста. Учёные проследили за тем, как большая языковая модель Gemma-2-2B генерировала тексты, и выявили признаки, по которым их алгоритм распознавал творчество ИИ — например, многословность в финансовых текстах и перегруженные синтаксические конструкции в научных.

Новый детектор позволяет определять происхождение текста даже в тех случаях, когда пользователь намеренно скрывает его природу — например, добавляет лишние пробелы, артикли или нестандартные символы.

ИСТОЧНИК: Тренды и Технологии

Зарегистрировано в Федеральной службе по надзору в сфере связи, информационных технологий и массовых коммуникаций. Свидетельство о регистрации СМИ Эл № ФС77-87197 выдано 22 апреля 2024 г. При цитировании материалов ИА Мосинфорбюро (МИБ РФ) ссылка на mibrf.ru обязательна. Отдельные публикации могут содержать информацию, не предназначенную для пользователей до 16 лет