OpenAI обновила правила поведения для ИИ: нет подхалимству и избеганию деликатных тем

Компания OpenAI выпустила расширенную версию «Спецификации моделей» (Model Spec) — документа, определяющего поведение моделей искусственного интеллекта. Компания сделала его бесплатным для использования и изменения любым желающим.

OpenAI обновила правила поведения для ИИ: нет подхалимству и избеганию деликатных тем

Документ объёмом 63 страницы (предыдущая версия содержала всего 10 страниц) содержит рекомендации относительно того, как модели ИИ должны обрабатывать запросы и реагировать на устанавливаемые пользователями настройки. В нём подчёркиваются три основных принципа: настраиваемость, прозрачность и «интеллектуальная свобода» — последнее означает возможность для пользователя исследовать и обсуждать различные вопросы без произвольных ограничений. В документе упомянуты получившие наибольшую огласку инциденты, связанные с этикой ИИ и произошедшие за последний год.

В публикации корпоративного блога OpenAIприводится множество примеров запросов и надлежащих ответов, а также вариантов, нарушающих требования документа. Например, модели ИИ не должны воспроизводить защищённые авторским правом материалы или использоваться для обхода платного доступа. Модель не может поощрять членовредительство — в индустрии ИИ бывали и такие инциденты. Изменения коснулись также участия ИИ в обсуждении спорных тем: моделям следует не проявлять крайнюю осторожность, а «искать истину вместе» с пользователями, придерживаясь при этом строгих моральных позиций по таким вопросам, как дезинформация или причинение вреда. То есть ИИ должен предлагать обоснованный анализ, а не избегать обсуждения. OpenAI также пересмотрела свою позицию в отношении материалов для взрослых: компания изучает возможность разрешить некоторые их виды, но сохранить строгий запрет на явно противоправный контент.

Новые принципы позволяют ИИ преобразовывать материалы деликатного характера, но запрещают создавать их. Например, можно перевести текст, связанный с веществами в ограниченном обороте, с одного языка на другой; можно проявлять эмпатию, но без явно неискренних эмоций. Следует соблюдать границы, но при этом максимально повышать полезность ИИ. К этому, в той или иной мере, стремятся и другие разработчики ИИ, но не все готовы открыто это формулировать.

Читать также:
Злоумышленники стали чаще рассылать вредоносные архивы для угона аккаунтов

Особое внимание уделяется проблеме «подхалимства ИИ» — модели склонны демонстрировать покладистость, даже когда следовало бы возразить или выступить с критикой. ChatGPT должен давать одинаковые фактические ответы независимо от формулировки вопроса, честную обратную связь вместо пустых похвал — вести себя как вдумчивый коллега, а не стремиться угодить. Если пользователя интересует критика работы, ИИ должен предоставлять конструктивные замечания, а не утверждать, что всё идеально. Если же пользователь делает неверное утверждение, его следует вежливо исправить, а не подыгрывать ему.

В спецификации представлена чёткая «цепочка команд», определяющая приоритет инструкций: на первом месте — нормы OpenAI, за ними следуют рекомендации разработчиков, а затем предпочтения пользователей. Такая иерархия проясняет, какие аспекты ИИ можно изменять, а какие ограничения остаются неизменными. Документ распространяется под лицензией Creative Commons Zero (CC0), что фактически переводит его в общественное достояние: компании и исследователи в области ИИ могут свободно внедрять, изменять или дополнять эти рекомендации. OpenAI не обещает мгновенных изменений в поведении ChatGPT или других своих продуктов, но новые модели будут постепенно приводиться в соответствие с новыми нормами. Компания также публикует список контрольных запросов, используемых для проверки соответствия моделей рекомендациям.

НОВОЕ НА САЙТЕ

В Греции назвали провалом смещение фокуса ЕС с экономики на оборону

ДзенMaxTelegram Министр иностранных дел Греции Йоргос Герапетритис назвал "полным провалом" структуру ЕС, где царит идея, что процветание зависит не от экономики, а от обороны. "Я думаю, что чем больше происходит насильственных вмешательств, тем больше...

Азаров заявил об уничтожении большинства украинских националистов

ДзенMaxTelegram Большинство активных украинских националистов уничтожены в ходе военного конфликта с РФ, заявил в субботу бывший украинский премьер Николай Азаров. «"Мне представляется, что большинство тех, кто был главной движущей силой украинского национализма, их, может...

Орбан набросился на Туска из-за Украины

ДзенMaxTelegramВенгерский премьер-министр Виктор Орбан резко раскритиковал воинствующую политику польского коллеги Дональда Туска по вопросу Украины."Он стал одним из самых громких поджигателей войны в Европе, но его военная политика терпит неудачу: Украина лишается европейских денег,...

В США признали невозможность полной замены России на рынке газа в Европе

ДзенMaxTelegram Имеющаяся в Европе инфраструктура не позволяет США полностью заменить Россию на рынке газа, заявил министр внутренних дел США Дуг Бергам. "Мы можем удовлетворить все потребности Европы в газе и на 100% заменить российский...

Минобрнауки Украины выразил обеспокоенность оттоком преподавателей

ДзенMaxTelegram Массовый выезд с Украины вузовских преподавателей и студентов ставит под угрозу национальную безопасность, заявил украинский замминистра образования Николай Трофименко. "Многие преподаватели и студенты уехали в Европу. И вот всё это вращается вокруг высшего...