Сборка AI
Редакция проекта
Редакция проекта
27 фев. в 12:14
49
Новость

Gemini теперь умеет автоматизировать многошаговые задачи на Android

Обсудить
Gemini теперь умеет автоматизировать многошаговые задачи на Android

В среду Google Inc. представила серию обновлений Gemini для Android. Главное нововведение — возможность поручить искусственному интеллекту выполнение многошаговых задач, например, вызвать такси через Uber или заказать доставку еды. Помимо этого, выходят и другие обновления Gemini: обнаружение мошеннических звонков на новых устройствах, а также обновленная функция Circle to Search: теперь достаточно обвести интересующую область на экране, чтобы распознать в ней не один, а все объекты.

По словам Google, автоматизации позволяют пользователям фактически переложить свой список дел на Gemini. Впрочем, на практике круг задач, с которыми Gemini справляется, пока ограничен.

Функция находится в бета-версии и на старте будет работать лишь с отдельными приложениями из категорий доставки еды и продуктов, а также заказа поездок.

Поначалу функция будет доступна в приложении Gemini на отдельных устройствах: Pixel 10, Pixel 10 Pro и линейке Samsung Galaxy S26. Географически — пока только в США и Корее.

Автоматизации на базе ИИ, разумеется, могут срабатывать неверно, поэтому в Google предусмотрели ряд защитных механизмов. Запустить автоматизацию нельзя без явной команды владельца устройства. В процессе выполнения можно наблюдать за ходом задачи в реальном времени и остановить её, если что-то пошло не так. Кроме того, автоматизации выполняются в изолированном виртуальном окне — защищенной среде на телефоне, где доступен лишь ограниченный набор приложений, а не все данные устройства.

Функция вписывается в набирающий силу тренд: использование ИИ для автоматизации повседневных задач. Так, ChatGPT позволяет создавать задания, которые выполняются по расписанию или в заданное время, а также предлагает ИИ-агента, способного выполнять различные действия на компьютере: работать с календарем, создавать презентации, запускать код. У Anthropic есть Cowork — инструмент, который делает возможности Claude доступными для нетехнических пользователей, позволяя автоматизировать повседневную работу с файлами и задачами. А инструмент OpenClaw недавно стал вирусным благодаря умению справляться с повседневными задачами: отправка писем, ведение календаря, онлайн-регистрация на рейсы и многое другое.

Ещё одно обновление — расширение функции обнаружения мошеннических звонков (Scam Detection) на устройства серии Samsung Galaxy S26 в США. Ранее она была доступна только на телефонах Pixel в США, Австралии, Канаде, Индии, Ирландии и Великобритании. Кроме того, локальная модель Gemini, работающая непосредственно на устройстве без обращения к облаку, теперь умеет распознавать мошеннические SMS — пока на Pixel 10 в США, Канаде и Великобритании, а в ближайшее время и на Galaxy S26.

Наконец, функция Circle to Search — поиск обведением объектов на экране — теперь распознает не один объект, а всё, что видно на экране. Например, можно найти информацию о каждом предмете одежды и аксессуаре в понравившемся образе или узнать больше сразу о нескольких объектах и связанной с ними тематике.

Google последовательно развивает возможности Gemini в Android-экосистеме, выпуская улучшения как для операционной системы в целом, так и отдельно для своего флагмана Google Pixel через регулярные пакеты обновлений Pixel Drops. Тем временем Apple испытывает трудности с выпуском полноценного набора ИИ-функций, включая обновленную Siri на базе искусственного интеллекта: её запуск недавно снова был отложен на вторую половину года.

Источник:TechCrunch

Пока нет комментариев. Будьте первым!