Anthropic представила Claude 4 — ИИ научился избегать «лазеек» и точнее выполнять сложные задания

Anthropic анонсировала выход двух новых ИИ-моделей — Claude Opus 4 и Claude Sonnet 4. Модели предназначены для решения сложных задач, написания кода и поиска в интернете. По словам компании, флагманская модель Opus 4 стала самой мощной в линейке, а также способна автономно работать до семи часов.

Anthropic представила Claude 4 — ИИ научился избегать «лазеек» и точнее выполнять сложные задания

Opus 4 и Sonnet 4, в отличие от предыдущих моделей, стали на 65 % менее склонны к использованию «лазеек» и упрощённых путей при выполнении заданий. Кроме того, они лучше сохраняют важную информацию при работе над долгосрочными задачами, особенно при наличии доступа к локальным файлам пользователя.

Разработчики также утверждают, что модель Opus 4 превзошла конкурентов по ряду параметров. Например, внутренние тесты показали, что она превзошла Google Gemini 2.5 Pro, OpenAI o3 reasoning и GPT-4.1 в задачах, связанных с программированием и использованием инструментов, таких как веб-поиск.

Версия Sonnet 4, ориентированная на общие задачи, пришла на смену выпущенной ранее версии Sonnet 3.7. Как подчёркивают в компании, новая модель отличается более точными ответами и улучшенными навыками логического мышления и написания кода. Среди новых функций можно отметить thinking summaries (сводки размышлений), которые позволяют кратко отображать ход рассуждений ИИ в понятной форме, а также запускается бета-версия функции extended thinking (расширенное мышление), дающая возможность переключать модели между режимами логического анализа и использования инструментов для повышения точности ответа.

Читать также:
Конец эпохи: Microsoft «похоронила» синий экран смерти в Windows 11

Обе модели Claude Opus 4 и Claude Sonnet 4 уже доступны через API Anthropic, платформу Amazon Bedrock и сервис Vertex AI от Google Cloud. Обе версии включены в платные подписки Claude, а Sonnet 4 также доступна бесплатно. Однако расширенные функции, включая расширенное размышление (extended thinking), доступны только платным подписчикам.

Кроме того, агентский командный интерфейс Claude Code, предназначенный для разработчиков и представленный ранее в ограниченном тестировании, теперь стал общедоступным. После предварительного релиза в феврале он уже доступен всем пользователям. Anthropic также объявила о планах выпускать обновления моделей почаще, чтобы соответствовать темпам развития конкурентов — OpenAI, Google и Meta✴.

НОВОЕ НА САЙТЕ

Франция создаст многоразовый космоплан, похожий на «Шаттл» — деньги на него уже нашли

Космопланы или космические самолёты, которые 40 лет назывались челноками или шаттлами, снова стали входить в моду, обещая в будущем создать конкуренцию многоразовым ракетам. Сегодня только две страны обладают подобными транспортными средствами — это США...

Роскомнадзор зарегистрировал почти 150 тысяч блогеров-десятитысячников

Роскомнадзор продолжает проводить регистрацию персональных страниц владельцев каналов с аудиторией более 10 тыс. подписчиков, пишет ТАСС. Согласно данным РКН, на текущий момент поступило 264 тыс. заявлений о регистрации персональных страниц владельцев каналов с аудиторией...

Использование ИИ превратилось из рекомендации в обязанность для менеджеров Microsoft

В Microsoft способность менеджеров в полной мере использовать ИИ-инструменты в своей работе стала важным показателем при оценке их эффективности, а применение ИИ — обязательным требованием, пишет Business Insider,. ...

Монополия Nvidia пошатнулась: OpenAI начала использовать чипы Google

OpenAI начала использовать ИИ-ускорители TPU компании Google для поддержки работы ИИ-чат-бота ChatGPT и связанных с ним сервисов. Это стало её первым значительным шагом в направлении отказа от исключительного использования чипов Nvidia в рамках стратегии...

Смартфоны в России подорожали на 10 %, а их продажи упали на 15–20 %

В России начали расти цены на смартфоны — в первом полугодии они увеличились на 10 %, в то время как их продажи сократились на 15–20 %, пишут «Известия» со ссылкой на данные аналитиков Mobile...