Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

На этой неделе исследователи из лаборатории Sky Computing Lab Калифорнийского университета в Беркли запустили модель искусственного интеллекта Sky-T1-32B-Preview. Речь идёт о нейросети со способностью к рассуждениям, которая способна конкурировать с OpenAI o1 по ряду ключевых показателей.

Теперь каждый может обучить себе рассуждающий ИИ всего за $450 — открыт исходный код Sky-T1

По всей видимости, Sky-T1 является первой моделью с поддержкой рассуждений с открытым исходным кодом, что позволит воспроизвести её с нуля. Разработчики опубликовали набор данных, который использовался для обучения алгоритма, а также другие данные, необходимые для запуска ИИ-модели.

Одна из главных особенностей алгоритма в том, что для его обучения не требуются существенные затраты. «Примечательно, что Sky-T1-32B-Preview был обучен менее чем за $450», — написали разработчики в своём блоге. Таким образом, они наглядно продемонстрировали, что возможно создать ИИ-модель со способностью к рассуждения высокого уровня без существенных денежных вложений.

Ещё недавно стоимость обучения большой языковой модели с сопоставимыми характеристиками измерялась миллионами долларов. Существенно снизить затраты удалось за счёт использования синтетических данных, т.е. данных, сгенерированных другими нейросетями. К примеру, недавно выпущенный компанией Winter алгоритм Palmyra X 004 обучался на синтетических данных и обошёлся разработчикам в $700 тыс.

Читать также:
Cronos: The New Dawn не станет следующей Dead Space или Resident Evil 4 — критики вынесли вердикт новой игре от создателей ремейка Silent Hill 2

В отличие от многих ИИ-алгоритмов, модели с возможностью рассуждения эффективно проверяют факты, что позволяет им давать более точные ответы и реже ошибаться, вводя пользователей в заблуждение. Кроме того, моделям рассуждения обычно требуется больше времени на формирование ответа на запрос по сравнению с обычными ИИ-алгоритмами. Однако обычно рассуждающие модели являются более надёжными, особенно в таких областях, как физика, математика и естественные науки.

Согласно имеющимся данным, разработчики задействовали модель рассуждения Alibaba QwQ-32B-Preview для создания первоначального набора данных для обучения Sky-T1. Далее данные преобразовывались с помощью GPT-4o-mini от OpenAI в более точный формат. Процесс обучения Sky-T1 с 32 млрд параметров занял около 19 часов, для чего были задействованы 8 графических ускорителей Nvidia H100.

«В дальнейшем мы сосредоточимся на разработке более эффективных моделей, которые сохраняют высокую производительность рассуждений, а также на изучении передовых методов повышения эффективности и точности моделей во время тестирования. Следите за обновлениями, пока мы добиваемся прогресса в реализации этих интересных инициатив», — написали разработчики в своём блоге.

НОВОЕ НА САЙТЕ

«Северные потоки» подорвала команда с опытом работы, считает Патрушев

Дзен "Северные потоки" подорвала высококлассная команда диверсантов с большим опытом работы на значительных глубинах и в непростых условиях Балтийского моря, у Великобритании есть такие пловцы, заявил помощник президента России, председатель Морской коллегии РФ Николай...

Украинский дипломат раскрыл, зачем ЕС хочет отправить военных на Украину

Дзен Европа стремится задействовать свою армию на Украине, чтобы получить козырь перед президентом США Дональдом Трампом, так как предложить ей практически нечего, заявил постпред Украины при ООН, бывший посол страны в Бразилии Андрей Мельник....

США готовы к усилению санкций против России, заявил Бессент

Дзен Соединенные Штаты готовы к усилению санкционного давления на Россию, но хотели бы делать это вместе с европейскими странами, заявил глава минфина США Скотт Бессент."Мы готовы усилить давление на Россию, но нам необходимо, чтобы...

Позиция МАГАТЭ помогает Киеву атаковать ядерные объекты, считает Ульянов

Дзен Текущая позиция МАГАТЭ лишь способствует продолжению безрассудных нападений Украины на ядерные объекты, заявил постоянный представитель России при международных организациях в Вене Михаил Ульянов. По словам дипломата, Москва не полностью удовлетворена позицией Секретариата МАГАТЭ...

ЕС находится в состоянии распада, заявил Орбан

Дзен Евросоюз находится в состоянии распада, и если не будет радикальных изменений, следующий семилетний бюджет станет для сообщества последним, считает премьер-министр Венгрии Виктор Орбан."Я считаю, что Евросоюз сейчас вошел в состояние распада. И если...