Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Учёные-компьютерщики из Наньянского технологического университета (NTU, Сингапур) нашли эффективный способ взлома чат-ботов с искусственным интеллектом (ИИ). Для этого они обучают ИИ-чат-бот созданию подсказок, которые позволяют обходить защиту других чат-ботов на базе ИИ.

Учёные разработали ИИ-чат-бот, который эффективно взламывает других ИИ-чат-ботов

Сингапурские исследователи использовали двойной метод взлома большой языковой модели (LLM), получивший название Masterkey. Во-первых, они провели реверс-инжиниринг того, как LLM выявляют вредоносные запросы и защищаются от них. Используя эту информацию, они научили LLM автоматически учиться и предлагать подсказки, которые позволяют обходить защиту других LLM. Таким образом можно создать LLM для взлома, которая сможет автоматически адаптироваться к новым условиям и создавать новые запросы для взлома после того, как разработчики внесут исправления в свои LLM.

После проведения серии тестов на LLM в качестве доказательства, что этот метод действительно представляет реальную угрозу, исследователи сразу же известили о выявленных проблемах провайдеров сервисов после успешного взлома их ИИ-моделей.

Читать также:
CD Projekt RED спрятала в аддоне «Кровь и вино» для The Witcher 3: Wild Hunt трагичную историю любви

Разработка учёных NTU должна помочь компаниям определить слабые стороны и ограничения своих ИИ-чат-ботов, чтобы принять меры по их защите от хакеров.

НОВОЕ НА САЙТЕ

МВФ ухудшил прогноз роста экономики еврозоны

Дзен Международный валютный фонд (МВФ) оценил рост экономики еврозоны в 2024 году в 0,8%, ухудшил прогноз роста в 2025 году до 1% и в 2026 году до 1,4%, следует из опубликованного отчета организации. По...

Молдавия перекладывает вину за энергокризис на Россию, заявила Гуцул

Дзен Глава Гагаузии Евгения Гуцул считает, что власти Молдавии перекладывают свою вину за энергокризис на Россию. В конце декабря "Газпром" сообщил, что с 1 января останавливает поставки газа в Молдавию из-за задолженности со стороны...

Дуров в суде пообещал улучшить модерацию в Telegram, сообщает Franceinfo

Дзен Основатель мессенджера Telegram Павел Дуров во время слушаний во французском суде по делу против него пообещал улучшить модерацию на платформе, сообщает в пятницу радиостанция Franceinfo со ссылкой на источники. Речь идет о первых...

Писториус назвал траты на оборону в два процента от ВВП недостаточными

Дзен Министр обороны Германии Борис Писториус заявил заявил о недостаточности военных расходов на уровне 2% от ВВП страны, которого НАТО требует от входящих в альянс государств. Посещая в пятницу верфь Thyssenkrupp Marine Systems в...

Шольц заявил, что хочет завершения конфликта на Украине в 2025 году

Дзен Канцлер Германии Олаф Шольц заявил, что желает, чтобы конфликт на Украине завершился уже в 2025 году. "Я желаю, чтобы это удалось уже в нынешнем году, возможно ли это - посмотрим", - заявил Шольц...