Меньше галлюцинаций и миллионный контекст: Anthropic представила Sonnet 4.6 и она уже доступна бесплатно в Claude

Anthropic обновила свою большую языковую модель Sonnet среднего уровня. В анонсе Sonnet 4.6 разработчики Anthropic подчеркнули улучшения в генерации программного кода, рассуждениях с длинным контекстом, выполнении инструкций и работе с компьютером. Новинка станет стандартной моделью для чат-бота Claude как для бесплатных пользователей, так и в платной подписке Pro.

Меньше галлюцинаций и миллионный контекст: Anthropic представила Sonnet 4.6 и она уже доступна бесплатно в Claude

Итоги 2025-го: ИИ-лихорадка, рыночные войны, конец эпохи Windows 10 и ещё 12 главных событий года

Обзор ноутбука TECNO MEGABOOK S14 (S14MM): OLED с HDR как новая норма

Обзор телевизора Sber SDX-43U4169

Обзор игрового QD-OLED WQHD-монитора Gigabyte AORUS FO27Q5P: на пределе возможностей

Обзор игрового 4K IPS-монитора Gigabyte M27UP: разнообразия ради

Итоги 2025 года: почему память стала роскошью и что будет дальше

Sonnet 4.6 предлагает контекстное окно размером 1 миллион токенов, что вдвое больше, чем было у предыдущей версии Sonnet. Anthropic описала новое контекстное окно как «достаточное для хранения целых кодовых баз, длинных контрактов или десятков исследовательских работ в одном запросе». В компании подчёркивают, что модель не только удерживает большой объём информации, но и эффективно работает с ним при построении логических цепочек.

По данным Anthropic, разработчики, тестировавшие Sonnet 4.6 в раннем доступе, в 70 % случаев предпочли её версии 4.5. Пользователи отмечали более аккуратную работу с контекстом кода, меньшее количество дублирования логики и более последовательное выполнение инструкций. Разработчики также сообщают о снижении числа «галлюцинаций» и ложных заявлений об успешном выполнении задачи.

Отдельное внимание уделено работе с компьютером без специализированных API. Модель взаимодействует с программами так же, как человек — через виртуальные клики мышью и ввод с клавиатуры. В бенчмарке OSWorld, который имитирует задачи в Chrome, LibreOffice и VS Code, свежая Sonnet 4.6 демонстрирует заметный прогресс по сравнению с предыдущими версиями. По словам представителей компании, в ряде сценариев — например, при работе со сложными таблицами или многошаговыми веб-формами — модель приближается к уровню человека. При этом Anthropic признаёт, что ИИ по-прежнему уступает наиболее опытным пользователям и что реальная работа с ПО сложнее лабораторных тестов.

Читать также:
Team Cherry подтвердила работу над DLC для Hollow Knight: Silksong и заинтриговала фанатов тизерами нового контента

Anthropic отмечает, что Sonnet 4.6 предоставляет значительно улучшенные навыки программирования по сравнению с предыдущей версией. В соответствующих бенчмарках новинка оказалась лучше Gemini 3 Pro, а также почти сравнялась с Opus 4.5. По словам бета-тестеров модели, особенно заметны улучшения в задачах фронтенд-разработки и финансового анализа. Также отмечается, что Sonnet 4.6 в ряде задач смогла обеспечить уровень производительности, для достижения которого прежде требовалось использовать модели класса Opus, в том числе в реальных офисных задачах.

Anthropic также раскрыла показатели на тесте ARC-AGI-2 — одном из наиболее сложных бенчмарков, оценивающих способность модели к абстрактному рассуждению и обобщению (навыков, характерных для человеческого интеллекта). Sonnet 4.6 достигла 60,4 % при высоком уровне «усилия мышления». Этот результат ставит Sonnet 4.6 выше большинства сопоставимых моделей, хотя он отстаёт от таких решений, как Opus 4.6, Gemini 3 Deep Think и одной из усовершенствованных версий GPT 5.2.

В конце отметим, что релиз Sonnet 4.6 состоялся всего через две недели после запуска Opus 4.6, а значит, обновлённая модель Haiku, вероятно, появится в ближайшие недели. Модель уже доступна в боте Claude и приложении, а также через API для сторонних сервисов. Стоимость в последнем случае остаётся на уровне Sonnet 4.5 — от $3 за миллион входных токенов и $15 за миллион выходных.

НОВОЕ НА САЙТЕ

Искусство приготовления говяжьего стейка: От выбора мяса до подачи

Стейк из говядины — это не просто кусок жареного мяса, это культовое блюдо, требующее уважения к продукту и понимания технологий. Правильно приготовленный стейк тает во рту, сохраняя насыщенный вкус и ароматные соки внутри. Однако...

Samsung снова стала лидером на мировом рынке телевизоров — двадцатый год подряд

Samsung Electronics сохранила за собой звание технологического лидера мирового рынка телевизоров благодаря развитию премиального сегмента. По данным исследовательского агентства Omdia, опубликованным на сайте Samsung, доля выручки производителя в глобальном масштабе составила 29,1 % по...

Apple представит ещё одно обновление MacBook Pro в 2026 году

Компания Apple представила на этой неделе обновлённые ноутбуки MacBook Pro 14 и 16, оснащённые недавно анонсированными процессорами M5 Pro и M5 Max и экранами Liquid Retina XDR. Новинки уже доступны для предзаказа и поступят...

К 2040 году Япония намерена контролировать до 30 % мирового рынка чипов для роботов и прочих ИИ-устройств

В восьмидесятые годы прошлого века Япония была лидером полупроводникового рынка, но в силу разного рода причин к настоящему времени растратила прежний потенциал, хотя и старается его восстановить. Новое правительство страны ставит перед ней цель...

YMTC представила PCIe 5.0 SSD с собственной памятью — PC550 со скоростью до 10,5 Гбайт/с

Китайская компания Yangtze Memory Technologies пополнила свою линейку потребительских SSD моделью PC550. Это первые накопители вендора формата M.2 с интерфейсом PCIe 5.0, которые позиционируются для использования в компьютерах для работы с искусственным интеллектом и...