GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

Две независимые исследовательские компании протестировали только что выпущенную нейросеть GPT-5 и выявили критические уязвимости в её системе безопасности. NeuralTrust удалось взломать модель за один день, заставив её сгенерировать инструкцию по изготовлению зажигательной смеси в кустарных условиях. Компания SPLX, в свою очередь, обнаружила уязвимости к атакам с применением обфускации запросов.

GPT-5 взломали всего за 24 часа — ИИ выдал рецепты запрещённых веществ быстрее, чем GPT-4o

HUAWEI Pura 80 Ultra глазами фотографа

Обзор смартфона HUAWEI Pura 80 Ultra: зум, которому нет равных

Первый взгляд на смартфон HUAWEI Pura 80 Ultra

Пять причин полюбить HONOR 400

Обзор смартфона HONOR 400: реаниматор

HUAWEI nova Y73: самый недорогой смартфон с кремний-углеродной батареей

Обзор HUAWEI MatePad Pro 12.2’’ (2025): обновление планшета с лучшим экраном

Обзор смартфона HUAWEI nova Y63: еще раз в ту же реку

Обзор ноутбука HONOR MagicBook Pro 14 (FMB-P) на платформе Core Ultra второго поколения

Пять причин полюбить ноутбук HONOR MagicBook Pro 14

После того, как Grok-4 был взломан за два дня, GPT-5 был взломан теми же исследователями всего за 24 часа. Специалисты NeuralTrust использовали комбинацию собственной методики EchoChamber и техники сторителлинга (storytelling) — последовательного подталкивания ИИ к нужному ответу через рассказ захватывающих историй и серию уточняющих запросов, не содержащих явно запрещённых формулировок. В результате GPT-5, несмотря на встроенные защитные механизмы OpenAI, выдал детальное руководство по созданию кустарного оружия, сообщил портал SecurityWeek .

Читать также:
Он улетел и вернулся: на Земле нашли первый метеорит земного происхождения

Как пояснили в NeuralTrust, проблема заключается в том, что система безопасности GPT-5 анализирует каждый запрос по отдельности, но не учитывает кумулятивный эффект многоэтапного диалога. Атакующие постепенно закрепляют нужный контекст, встраивая ключевые слова в безобидные фразы, а затем мягко подводят модель к генерации опасного контента.

Команда SPLX провела собственное тестирование, успешно применив атаку StringJoin Obfuscation, при которой в текст вставляются определённые символы, маскируя вредоносный запрос. Например, после серии наводящих вопросов модель согласилась подробно описать процесс изготовления запрещённого вещества, несмотря на системный запрет. Кроме того, в ходе сравнительного анализа с GPT-4o специалисты SPLX пришли к выводу, что предыдущая модель оказалась более надёжной в плане устойчивости к подобным атакам.

NeuralTrust и SPLX призвали компании проявлять осторожность при использовании «сырой» версии GPT-5 в бизнес-среде, особенно в сфере согласования бизнеса, когда все подразделения предприятия используют скоординированные стратегии, процессы и ресурсы для достижения общих целей. «Сырую модель GPT-5 практически невозможно использовать в корпоративных приложениях «из коробки». Даже внутренний уровень подсказок OpenAI оставляет значительные пробелы, особенно в области бизнес-согласования», — заявили в SPLX.

НОВОЕ НА САЙТЕ

Европейские страны устали от конфликта на Украине, заявил Трамп

Дзен Европейские страны устали от конфликта на Украине и хотят вновь тратить деньги на себя, заявил президент США Дональд Трамп.«"Они устали от этого. Они хотят снова тратить деньги на свои страны", - сказал президент...

Спецоперация, 11 августа: ВС России освободили село Луначарское в ДНР

Дзен Подразделения российской группировки войск "Центр" освободили населённый пункт Луначарское в Донецкой Народной Республике, говорится в сводке Минобороны РФ, опубликованной в понедельник. Кроме того, "Центр" и другие группировки ВС РФ, участвующие в специальной военной...

Юристы Макрона собирали данные о журналистке Оуэнс, пишет FT

Дзен Частные детективы по заказу юристов президента Франции Эммануэля Макрона и его супруги Брижит собирали сведения из биографии американской журналистки Кэндис Оуэнс, на которую ранее президентская чета подала в суд, пишет в понедельник издание...

Аэропорт Калининграда принял первый рейс египетской авиакомпании Air Cairo

Дзен Аэропорт Калининграда "Храброво" принял первый рейс египетской компании Air Cairo, лоукостер будет совершать рейсы в Шарм-эш-Шейх два раза в неделю, сообщает пресс-служба авиагавани. «"11 августа в Международном аэропорту Калининград ("Храброво") мы встретили первый...

Глава РФПИ Дмитриев ответил на слова Каллас о российской агрессии

Дзен Конфликт решается с помощью диалога и сотрудничества, а те, кто придерживается "неудачных" подходов бывшего президента США Джо Байдена, обречен на провал, заявил глава Российского фонда прямых инвестиций (РФПИ) Кирилл Дмитриев в ответ на...