OpenAI Deep Research показал рекордный результат в сложнейшем «Последнем экзамене человечества»

Менее двух недель назад эксперты в области искусственного интеллекта представили крайне сложный тест Humanity’s Last Exam, предназначенный для оценки передовых нейросетей. Список лидеров в этом испытании возглавили два проекта OpenAI: o3-mini и Deep Research.

OpenAI Deep Research показал рекордный результат в сложнейшем «Последнем экзамене человечества»

Бенчмарк, созданный экспертами со всего мира, содержит крайне сложные вопросы и задания на знания и рассуждения — даже некоторые люди не могут понять отдельные вопросы в нём, не говоря уже о том, чтобы дать на них ответ. Вскоре после своего выхода список лидеров на экзамене возглавила рассуждающая модель ИИ DeepSeek R1, давшая 9,4 % правильных ответов. Обогнать её смогли модели OpenAI o3-mini с результатом 10,5 % и o3-mini-high, набравшая 13 % — последняя действительно мощнее, но и работает она медленнее. Но более впечатляющим стал результат, который показал ИИ-агент OpenAI Deep Research — он набрал 26,6 %, с ходу побив тем самым предыдущий менее чем за 10 дней.

Читать также:
Nvidia представила видеокарты с 96 Гбайт GDDR7 — профессиональные RTX Pro Blackwell для серверов, ПК и ноутбуков

Сравнение не вполне корректное, потому что Deep Research имеет возможность производить поиск информации, а у традиционных моделей ИИ она отсутствует. И в случае Humanity’s Last Exam эта возможность имеет критическое значение, ведь некоторые из вопросов нацелены на проверку знаний. Тем не менее, системы ИИ постоянно улучшают свои результаты, и это заставляет задуматься, когда одна из них сдаст экзамен с высшим баллом. OpenAI Deep Research — чрезвычайно мощный инструмент, предназначенный для работы в качестве персонального аналитика. Он проводит исследования, составляет отчёты и готовит ответы, на которые у человека ушли бы несколько часов.

НОВОЕ НА САЙТЕ

«Они не хотели»: на Западе сделали неожиданное заявление о России

ДзенРусские никогда не хотели конфликта с Украиной и коллективным Западом, заявил профессор Хельсинкского университета Томас Малинен в соцсети X."Русские хотели стать частью Европы. Путешествовать, заниматься бизнесом, интегрироваться. Они никогда не хотели этой войны и...

«Решающий момент». В Европе забили тревогу из-за действий Трампа

ДзенЕвропейские страны находятся в трудном положении из-за тарифной политики президента США Дональда Трампа, пишет Bloomberg.Второй срок Трампа, посвященный началу нового "Золотого века" Америки, вероятно, станет решающим моментом в упадке Запада. У стран Европы нет...

В Лондоне шестерых болгар приговорили к срокам якобы за работу на Россию

Дзен Лондонский уголовный суд Олд-Бейли приговорил шестерых граждан Болгарии к тюремным срокам за якобы шпионаж в пользу России, сообщает полиция Лондона. "Группа из шести болгар, проживающих в Великобритании, была приговорена к тюремным срокам общей...

Источник рассказал о телефонном разговоре глав МИД Турции и Франции

Дзен Главы МИД Турции и Франции Хакан Фидан и Жан-Ноэль Барро обсудили по телефону усилия по прекращению конфликта на Украине, сообщил РИА Новости источник в турецком МИД. "Сегодня состоялся телефонный разговор министра иностранных...

«Мальчик для битья»: СМИ раскрыли коварный план ЕС

ДзенЕвропа убеждает Москву продолжать бои, чтобы раздувать у себя "российскую угрозу", а Украине предлагает быть мальчиком для битья, сообщил словацкий портал Slovo."Европейские "миротворцы" убеждают Москву продолжать бои: им нужно дальше поставлять Киеву оружие и...