Обзор Gemini Spark: новый ИИ-агент от Google — прорыв или избыточность?
Как главный редактор, я проработал ваш текст. Статья написана качественно, но в ней есть несколько стилистических проблем: избыточное использование англицизмов (кальки с английского), повторы слов и некоторая тяжеловесность конструкций.
Я провел «чистку» текста: заменил «searched интернет» на нормальный русский язык, убрал тавтологию в абзацах про Personal Intelligence и сделал переходы между мыслями более плавными.
Вот отредактированная версия:
***
**Gemini Spark: новый ИИ-агент от Google — прорыв или избыточность?**
Gemini Spark — это очередная попытка Google превратить ИИ-агентов в действительно полезный инструмент. Позиционируемый как персональный помощник, доступный 24/7, он способен просматривать веб-страницы, работать с вашими данными в сервисах Google и выполнять задачи в фоновом режиме с минимальным участием пользователя. Потратив некоторое время на тесты, я обнаружил, что Spark воплощает это видение эффективнее любого другого ИИ-агента, который я пробовал до сих пор. Однако, несмотря на впечатляющие возможности, он сталкивается с теми же проблемами надежности, что и конкуренты, а многие его ключевые функции дублируют возможности самого Gemini. Рассказываю обо всем, что нужно знать, прежде чем решать, стоит ли Spark вашего внимания.
Доступ к Gemini Spark можно получить через приложение или сайт Gemini, но на данный момент он требует подписки AI Ultra (99 долларов в месяц). Впрочем, я ожидаю, что со временем Spark станет доступен и в более дешевых тарифных планах — по аналогии с тем, как это произошло с моделью генерации видео Veo 3.
По сути, Spark — это версия следующего поколения Project Mariner, первой серьезной попытки Google создать полноценного ИИ-агента, проект которой был закрыт в начале этого года. Как и предшественник, Spark может управлять браузером, но теперь он имеет глубокий доступ к данным пользователя в экосистеме Google, умеет выполнять повторяющиеся задачи и интегрироваться со сторонними сервисами. Если Project Mariner был лишь концептом (proof-of-concept), то Spark — уже полноценный продукт, пусть и в стадии бета-тестирования.
Взаимодействие со Spark происходит через промпты, как и в стандартном чат-боте Gemini. Для максимальной эффективности пользователю необходимо разрешить агенту просмотр веб-страниц и подключение к сервисам Google (например, Документам и Gmail). Если это кажется вторжением в частную жизнь, то так оно и есть. Но если вы уже пользуетесь Gemini, доступ к данным у системы и так есть. Spark, по крайней мере, не ухудшает ситуацию.
Функция «Персональный интеллект» (Personal Intelligence) извлекает релевантную информацию из сервисов Google — например, из писем в Gmail или истории просмотров на YouTube, чтобы точнее отвечать на запросы. К примеру, если спросить Gemini, какое видео посмотреть следующим, Personal Intelligence проанализирует ваши предпочтения и сформирует рекомендации. Если оставить в стороне вопросы конфиденциальности, эта функция в целом работает согласно заявленному.
Personal Intelligence служит фундаментом Spark и дает ему преимущество перед конкурентами. Когда я попросил Spark «найти вакансии, подходящие под мой опыт», он автоматически заглянул в мою почту, нашел резюме, изучил предыдущие заявки и на основе этого поиска предоставил список актуальных позиций. Для сравнения: при аналогичном запросе к ChatGPT Agent мне пришлось бы уточнять критерии поиска, вручную загружать резюме и предоставлять дополнительные детали.
Как и ожидалось, потенциал Spark напрямую зависит от объема информации, которую вы храните на серверах Google. Если данные для задачи есть в экосистеме компании, Spark, скорее всего, найдет и эффективно использует их.
Помимо Personal Intelligence, Spark хорошо справляется и с ролью стандартного агента. Например, я попросил его создать таблицу с десятью последними персонажами игры Warframe, указав необходимые компоненты для их создания и места получения деталей. Spark с легкостью справился с задачей, предоставив аккуратный документ в Google Таблицах. Многие другие ИИ-агенты, которых я тестировал на этой задаче, потерпели неудачу.
За работу Spark отвечает сверхбыстрая модель Gemini 3.5 Flash, что решает одну из главных проблем современных агентов — скорость. Spark все еще не выполняет большинство задач быстрее, чем человек, но он работает достаточно оперативно, чтобы его можно было с комфортом оставить в фоновом режиме. Так, поиск подходящей работы занял у него около пяти минут.
Тем не менее, в системе встречаются ошибки. Мне нравится поручать ИИ-агентам поиск рецепта и добавление ингредиентов в корзину Instacart. В случае со Spark, при попытке входа в аккаунт, агент сообщил, что доступ к странице заблокирован, и не смог добавить товары. Также Spark периодически испытывал трудности при работе с Amazon. Проблема с Instacart особенно показательна, так как агент должен иметь доступ к сервису напрямую через подключенное приложение.
Кроме того, Spark не может преодолеть фундаментальные ограничения ИИ-моделей. Например, несколько рекомендованных им вакансий уже были неактивны. С этой проблемой вы столкнетесь и в ChatGPT, и в обычном Gemini — Spark не приносит колоссального скачка в «интеллекте». Чтобы получить наилучшие результаты, по-прежнему придется использовать промпт-инжиниринг и уточняющие запросы.
Однако больше всего меня беспокоит то, насколько функционал Spark пересекается с возможностями обычного Gemini.
Я упоминал поиск работы, создание таблиц и корзину Instacart. Но ведь я могу попросить стандартный Gemini сделать то же самое: добавить товары в корзину (через ту же интеграцию), найти вакансии (если прикрепить резюме к промпту) или использовать функцию глубокого исследования (deep research) для сбора данных в таблицу.
Даже возможности, которые Google выделяет в обзоре Spark, не выглядят уникальными. Google заявляет, что Spark может сканировать почтовый ящик и предоставлять краткий отчет по расписанию, но AI Inbox в Gmail делает нечто подобное по запросу. Функция создания руководства по стилю ответов в письмах (help me write) уже существует в Gmail. Автоматическое отслеживание стажировок, которое демонстрирует Google, скоро появится в обычном Поиске.
Более того, Personal Intelligence изначально была функцией Gemini. Способность автоматически подтягивать информацию из разных уголков вселенной Google — это то, что Gemini делает и сейчас. Если дать обычному Gemini тот же запрос, что и Spark, он также найдет мое резюме через Personal Intelligence и подберет работу.
Отдельный интерфейс Spark лишь подчеркивает эту неуклюжесть. Я бы предпочел использовать стандартное окно Gemini, чтобы система сама делегировала задачи Spark, когда это необходимо. Тогда агент казался бы органичным дополнением, а не избыточной функцией.
Я не столкнулся с критическими сбоями и остался впечатлен тем, насколько качественно Spark работает по сравнению с другими агентами. Тем не менее, почти всё, что он делает, можно реализовать в Gemini, не переплачивая за подписку AI Ultra. Хорошая новость в том, что Spark, вероятно, скоро станет доступен в более дешевых (или даже бесплатных) тарифах. Я планирую вернуться к нему после полноценного релиза и надеюсь, что к тому времени Google сможет четче дифференцировать этого агента от основного чат-бота.

Добавить комментарий