OpenAI представила думающую языковую модель o1

Компания OpenAI представила новую языковую модель o1, обладающую способностью к рассуждению и логически решать задачи. В отличие от предыдущих моделей, o1 способна имитировать человеческий процесс мышления, разбивая сложные задачи на более простые шаги, анализируя разные подходы и исправляя собственные ошибки.

OpenAI представила думающую языковую модель o1

Большая языковая модель (LLM) o1 показала выдающиеся результаты в тестах и соревнованиях, сравнимые с результатами специалистов-людей. По программированию o1 заняла 49-е место на Международной олимпиаде по информатике (IOI) 2024 года и превзошла 89 % людей на платформе Codeforces. По математике o1 вошла в число 500 лучших студентов США на квалификационном этапе Американской математической олимпиады (AIME), продемонстрировав способность решать задачи, предназначенные для самых одарённых школьников, сообщает OpenAI на своём сайте.

В естественных науках модель превзошла результаты докторов и кандидатов наук в сложном тесте GPQA diamond, оценивающем знания в области химии, физики и биологии. «Это не означает, что o1 умнее любого кандидата наук, — поясняют разработчики. — Это говорит о том, что модель способна решать некоторые задачи на уровне высококвалифицированных специалистов».

Модель o1 также продемонстрировала превосходство над предыдущими моделями в различных тестах на интеллект и решение задач, включая MMMU и MMLU. По данным OpenAI, новая модель значительно превосходит предшествующую версию GPT-4o на большинстве задач, связанных с логическим мышлением. «Наши испытания показали, что o1 последовательно улучшает результаты с увеличением объёма ренфорсмент-обучения и времени, потраченного на размышления», — отмечают в компании. В частности, в тестах AIME модель o1 решила в среднем 83 % задач, тогда как результат GPT-4o — 13 %.

Читать также:
Tesla признана самой опасной маркой машин — в этом есть и заслуга Илона Маска

Модель о1 значительно меньше галлюцинирует, чем GPT-4o. Однако она медленнее и дороже. Кроме того o1 проигрывает GPT-4o в энциклопедических знаниях и не умеет обрабатывать веб-страницы, файлы и изображения. Кроме того, новая модель может манипулировать данными, подгоняя решение под результат.

Секрет успеха кроется в фундаментально новом алгоритме обучения — «цепочке мыслей». Модель может улучшать эту цепочку, обучаясь по методу «обучение с подкреплением», благодаря которому распознаёт и исправляет свои ошибки, разбивает сложные шаги на более простые и пробует разные подходы в решении задач. Эта методология значительно улучшает способность модели к рассуждению, которая «как и человек может длительное время размышлять перед тем, как ответить на сложный вопрос».

OpenAI уже выпустила предварительную версию модели o1-preview, доступную для использования в ChatGPT и для разработчиков через API. Компания признаёт, что предстоит ещё много работы, чтобы сделать o1 такой же простой в использовании, как и текущие модели. Также подчёркивается безопасность и этичность новой модели, так как её рассуждения можно контролировать, предотвращая потенциально нежелательное поведение. И прежде чем выпустить o1-preview для публичного использования, со стороны OpenAI были проведены тесты на безопасность.

Стоимость использования o1-preview составляет 15 долларов за 1 млн входных токенов и 60 долларов за 1 млн выходных токенов. Для сравнения, GPT-4o предлагает цену в $5 за 1 млн входных токенов и $15 за миллион выходных.

НОВОЕ НА САЙТЕ

«Скатертью дорога». На Западе резко отреагировали на слова Рютте о России

ДзенПользователи соцсети Х резко осудили генерального секретаря НАТО Марка Рютте за призыв переключиться на мышление военного времени и увеличить оборонный бюджет для противостояния России."НАТО должна перейти к миролюбивому мышлению. НАТО была создана, чтобы гарантировать...

На Западе раскрыли истинную цель существования НАТО

Дзен Целью существования Североатлантического альянса стало насыщение западного военно-промышленного комплекса, заявил экс-депутат Европарламента от Ирландии Мик Уоллес в социальной сети Х.«"НАТО продвигает не мир, а войну. Цель существования альянса — насыщение военно-промышленного комплекса", —...

Рогов посоветовал миссии МАГАТЭ заезжать на ЗАЭС только через Россию

Дзен Председатель комиссии Общественной палаты РФ по вопросам суверенитета, сопредседатель координационного совета по интеграции новых регионов Владимир Рогов заявил, что заезд миссии МАГАТЭ на ЗАЭС через Украину опасен. Ранее постоянный представитель РФ при международных...

Назначенный премьер Франции угрожал лишить фракцию Макрона поддержки

Дзен Назначенный премьер-министром Франции Франсуа Байру угрожал президенту Эммануэлю Макрону лишить его фракцию поддержки центристов в парламенте, если президент не назначит его премьером, о чем он сообщил в интервью изданию Tribune Dimanche. Как сообщил...

Украине придется пойти на территориальные уступки, заявил Пеллегрини

Дзен Украине придется пойти на территориальные уступки для урегулирования конфликта, считает президент Словакии Петер Пеллегрини. "Если вы говорите о мире, я думаю, что нужно быть реалистом, уже сегодня, наверное, никто в Европе из нормально...