Текстовые водяные знаки — это метод встраивания скрытой информации в текстовый контент для проверки его подлинности, происхождения или права собственности. [1] С появлением генеративных систем ИИ , использующих большие языковые модели (LLM), значительное внимание было уделено созданию водяных знаков для текста, сгенерированного ИИ . [2] Потенциальные приложения включают обнаружение фейковых новостей и академического мошенничества , а также исключение материалов, сгенерированных ИИ, из данных обучения LLM . [3] В LLM основное внимание уделяется лингвистическим подходам, которые включают выбор слов для формирования шаблонов в тексте, которые впоследствии могут быть идентифицированы. [1] Результаты первого зарегистрированного крупномасштабного публичного развертывания, испытания с использованием чат-бота Gemini от Google , появились в октябре 2024 года: пользователи в 20 миллионах ответов обнаружили, что текст с водяными знаками и без них имеет одинаковое качество. [3] Исследования в области текстовых водяных знаков начались в 1997 году. [1]