«Новый DeepSeek-момент»: первый в мире полностью агентный смартфон показали в деле

Китай в очередной раз продемонстрировал стремительное развитие в области искусственного интеллекта. Пока весь остальной мир наблюдает за разрозненными ИИ-помощниками, функциями ИИ и редкими случаями взаимодействия приложений на смартфонах, ZTE и ByteDance разработали смартфон с интеграцией ИИ-агента на уровне операционной системы. Он управляет всеми функциями устройства так же, как человек.

«Новый DeepSeek-момент»: первый в мире полностью агентный смартфон показали в деле

Обзор планшета HONOR Pad V9: нейросети спешат на помощь

Наушники HUAWEI FreeBuds 6, которые понимают жесты

Пять главных фишек камеры HONOR Magic 7 Pro

Репортаж со стенда HONOR на выставке MWC 2025: передовые новинки и стратегические планы на будущее с ИИ

Hollow Knight: Silksong — песнь страданий и радостей. Рецензия

Обзор смартфона HONOR X9c Smart: прочность со скидкой

Лучший процессор за 20 тысяч рублей — сравнение и тесты

Смартфон HUAWEI Mate 70 Pro как выбор фотографа

Обзор смартфона HUAWEI Pura 80: удобный флагман с «Алисой»

Прототип смартфона ZTE Nubia M153 работает под управлением модифицированной версии Android, в которую интегрирован ИИ-агент ByteDance Doubao. Doubao — известная в Китае экосистема моделей ИИ общего назначения, которые используются в чат-ботах и рабочих приложениях. В случае ZTE Nubia M153 это не рядовой ИИ-помощник — агент полностью контролирует смартфон: видит пользовательский интерфейс, скачивает и запускает приложения, работает с их функциями, набирает текст, совершает звонки и выполняет многоэтапные задачи.

Пользователь может даже не знать, какие приложения могут требоваться для решения поставленных задач — ИИ управляет смартфоном так же, как это делает человек, а не приложение. В одном из примеров агент нашёл пользователю человека, готового постоять в очереди вместо него: нашёл и установил приложение местного сервиса, поставил задачу, заполнил необходимые поля в форме и вывел последний экран для подтверждения заказа. Сам пользователь до этого не знал, какое приложение могло бы решить эту задачу, и как его настроить. ИИ-агент сделал всё самостоятельно.

Прототип смартфона ZTE Nubia M153 работает на актуальном чипе Qualcomm Snapdragon 8 Elite Gen 5 с 16 Гбайт оперативной памяти. Анализ экранного интерфейса и функции управления реализуются локально при помощи ИИ на устройстве, а семантический анализ и более сложные операции осуществляются на удалённых облачных ресурсах. Такое распределение задач позволяет ИИ работать быстро и обеспечивать сохранность конфиденциальных данных — паролей и платёжной информации.

Читать также:
Новый хоррор Кодзимы «сотрёт границы между играми и фильмами» — первый тизер OD

Приложениями на основе этой модели ByteDance Doubao в Китае пользуются более 175 млн человек. Она основана на разрежённой архитектуре «смеси экспертов» и является мультимодальной, то есть работает с текстом и изображениями. В одном из примеров ИИ на смартфоне опознал по фото станцию замены аккумуляторов для электромобилей NIO и пояснил принцип её работы.

Более впечатляющей демонстрацией стало бронирование номера в гостинице: пользователь сделал снимок входа в неё и изъявил намерение забронировать номер. Doubao в облаке интерпретировал семантику: определил гостиницу; понял, что необходим номер на сегодня и уточнил политику в отношении домашних животных. Обученная ZTE нейросеть Nebula-GUI с 7 млрд параметров проделала непосредственные операции: открыла приложение для бронирования, указала в нём даты, выбрала оптимальные цены, уточнила политику в отношении домашних животных и проинформировала пользователя о ней. Бесперебойную работу определяет двухслойная архитектура: Doubao планирует, а Nebula-GUI выполняет.

https://twitter.com/TaylorOgan/status/1996539031421940124?ref_src=twsrc%5Etfw" rel="nofollow" target="_blank

Ещё одна демонстрация — заказ роботакси. Doubao получила данные спутникового геопозиционирования, произвёл поиск местных приложений для заказа поездок, чтобы определить оператора, который обслуживает конкретный маршрут. Nebula-GUI запустила приложение Baidu Apollo, выбрала пункты посадки и назначения и подтвердила поездку. Пользователь прямо во время поездки попросил изменить место высадки — ИИ распознал активную поездку в Apollo, открыл нужный экран, поменял конечную точку, подтвердил её на смартфона и в самом роботакси. Когда пользователь забыл, какой номер телефона был привязан к его учётной записи в приложении, ИИ нашёл эти данные и назвал последние четыре цифры — их нужно было ввести для доступа в машину.

Последним крупным примером стал заказ еды — в данном случае двух напитков в сервисе Meituan, предлагающем доставку дронами. ИИ сделал заказ к ближайшему автоматизированному пункту выдачи, и когда система Meituan сделала подтверждающий звонок, Doubao ответила от имени пользователя и поговорила с ботом Meituan. Два бота успешно договорились без какого-либо участия человека. Параллельно пользователь во время прогулки включал смартфон как инструмент для оценки окружающей обстановки, задавал вопросы о заведениях и людях, которые встречались по пути.

Таким образом, прототип смартфона получил возможность в полной мере управлять собственным графическим интерфейсом, и помогала ему в этом мощная мультимодальная модель с логическим мышлением. Человеку больше не нужно понимать особенности работы с приложениями — достаточно сказать смартфону, что требуется в результате. Ни один производитель смартфонов пока не демонстрировал подобных возможностей. Нет ясности, выйдет ли подобное устройство на рынок, но прототип показал, как смартфоны с ИИ-агентами могут изменить жизнь современного человека.

Показавшего смартфон в деле глава хэдж-фонда Snow Bull Capital Тейлор Орган (Taylor Ogan) устройство очень впечатлило и он назвал его появление потенциальным новым «моментом DeepSeek», подразумевая, что появление новинки всколыхнёт индустрию, как это сделала нашумевшая китайская ИИ-модель.

НОВОЕ НА САЙТЕ

Sony передала контроль над телевизионным бизнесом Bravia китайской TCL

Sony и TCL подписали необязывающее соглашение, в рамках которого будет создано совместное предприятие на базе активов японской компании по производству телевизионного оборудования, сообщил The Verge. Сообщается, что у TCL будет 51 % акций нового...

Россия заняла 119-е место в мире по проникновению ИИ — ниже Беларуси и Нигера, но выше Армении и Зимбабве

Microsoft опубликовала доклад, посвящённый вопросу распространения технологий искусственного интеллекта по всему миру. За минувшие полгода мировое население стало активнее пользоваться новыми технологиями. Некоторые страны добились особого успеха благодаря стройной государственной политике. Одним из наиболее...

Ветеран Microsoft наконец объяснил, почему зажатая клавиша Shift ускоряла перезагрузку Windows 95

Рэймонд Чен (Raymond Chen) из Microsoft рассказал, почему зажатая и удерживаемая клавиша Shift при перезагрузке помогала системе Windows 95 запускаться быстрее, чем это было бы при полной перезагрузке компьютера. ...

Игра на 10 миллиардов рублей: в Минцифры рассказали, на какую поддержку могут рассчитывать разработчики российского аналога Call of Duty

Издание «Газета.Ru» со ссылкой на Министерство цифрового развития (Минцифры) рассказало, на что могут претендовать разработчики российского аналога популярной серии военных шутеров Call of Duty от Activision. Итоги 2025-го: ИИ-лихорадка,...

Написание кандидатской диссертации: пошаговое руководство

Кандидатская диссертация — это научная работа, подтверждающая способность автора самостоятельно проводить исследования и вносить вклад в развитие науки. Она является обязательным этапом для получения учёной степени кандидата наук в России и странах СНГ. Конечно...