2026/05/19,Google I/O 2026 主舞台上,Sundar Pichai 在介紹完 Gemini 3.5 之後,秀出一段 demo——demo 結束時他說了一句話:「你的筆電合上後,Gemini Spark 還在替你工作。」
這就是 Gemini Spark:一個 24 小時跑在 Google Cloud 上的個人 AI 代理。它不在你的手機裡、不在你的筆電裡,而是住在雲端的虛擬機上,根據你給它的任務和規則,持續做事。你下班、睡覺、開會,它都還在跑。
很多人看到這則新聞,第一反應是「又一個 AI 助理啊」。但這次不一樣。Spark 不是把 ChatGPT 介面包成一個 app,也不是把 Gemini 多塞幾個外掛——它是 AI 從「對話模式」走向「員工模式」的第一個面向大眾、有訂閱方案、有實際工作能力的產品。
這篇從前後對比拆解 Spark 帶來的範式轉移:以前的 AI 助理為什麼總是讓你失望、Spark 改了什麼設計、以及這個轉變對「個人生產力」這件事意味著什麼。
以前的 AI 助理:對話模式的天花板
過去兩年你用過 ChatGPT、用過 Claude、用過 Gemini Advanced,多多少少覺得「有點用,但不到我想像的程度」。這個落差不是模型不夠強——GPT-4o、Claude Sonnet 4.6、Gemini 3.1 Pro 都已經夠聰明。落差在互動模式本身。
過去的 AI 助理是「對話模式」:你開一個視窗、打一個問題、它回答、視窗關掉。下次再開一個新視窗、它不記得上次的事、你重新講一遍背景、它再回一次。整個流程是同步的、device-bound 的、沒有狀態的。
這個模式有幾個結構性的限制。第一,它要你主動發問——AI 不會自己跳出來告訴你「你信箱裡有一封學校截止日明天到的通知」。第二,它做不了長時間任務——你不能說「監控我的信箱兩週,有任何客戶投訴的關鍵字就整理成日報傳給我」,因為視窗關了它就停了。第三,它沒有真正的工作能力——它能寫一封 email 給你看,但要送出、要排程、要跟你的日曆對齊、要 follow-up,這些都還是你要自己動手。
結果就是:你用 AI 加速了單一動作(寫一封信、整理一段筆記、debug 一段程式),但你的整體工作流還是手動接力——AI 寫,你貼上,你按送出,你追進度,你提醒自己跟進。AI 變成了一個更聰明的 word processor,沒變成一個會做事的同事。
OpenAI 的 ChatGPT Agent、Anthropic 的 Claude Cowork 已經在嘗試突破這個天花板——讓 AI 在背景跑、能操作瀏覽器、能執行多步驟任務。但它們大多還是「session-bound」:你開一個任務、它跑、它停。沒有真正的「持續存在感」。
Spark 改了這件事。
Spark 的設計:員工模式三個關鍵
Spark 的官方定位是「24/7 personal agent」——24 小時、雲端、個人代理。這三個詞拆開來看,背後是三個工程選擇。
選擇一:在 Google Cloud VM 上跑,不在你的 device 上跑。
過去你以為「個人 AI 助理」應該是裝在你手機或筆電裡的 app。Spark 反向思考——它住在 Google Cloud 上的虛擬機裡,你的 device 只是控制介面。這個設計直接解決了「我闔上筆電它就停」的問題:你的 device 開不開機完全不影響 Spark 的執行。它在雲端,你不在的時候它照跑。
這也是為什麼 Spark 一定要訂閱——cloud VM 是真實的算力成本,Google 必須把這個成本攤到月費上。AI Ultra $100/月,就是 Spark 的入場券。
選擇二:跟 Workspace 深度綁定,不跟「open web」糾纏。
OpenAI 的 ChatGPT Agent 想做的事是「會用瀏覽器、會操作任何網站」——一個 web 操作員。這個方向野心很大,但也很容易撞牆:每個網站的介面不一樣、登入流程不一樣、隨時改版,AI 很容易卡住。
Spark 走相反路:把整合範圍鎖在 Google 自家生態 + 少數高價值第三方。Gmail、Google Docs、Google Slides 是第一手原生整合,背後是 API 級的串接,不是用瀏覽器演操作。第三方目前只接 Canva、OpenTable、Instacart 這幾家——範圍小,但每一條都穩。對日常生產力來說,「能在 Gmail 裡可靠運作」遠比「會操作任何網站但偶爾出錯」更有用。
這個取捨會在未來幾個月看出對錯。但 Google 的賭注很清楚:個人用戶 80% 的數位生活已經在 Gmail/Docs/Slides 裡,把這 80% 跑得很穩、再慢慢加第三方,比一開始就追求 100% 覆蓋更實際。
選擇三:recurring trigger + 教學新技能,從一次性任務變成可累積能力。
Spark 允許你設定 recurring task(重複任務):每天早上 8 點整理新的客戶 email 寄個摘要、每週一報告上週訂閱費用變化、每個月底盤點所有待處理事項。這聽起來很像 Zapier 或 IFTTT,但差別在於——Spark 的每一步不是寫死的規則,是 LLM 在執行。你可以說「整理客戶 email 的時候,把抱怨產品品質的優先標出來」,Spark 就會用語意理解去判斷,而不是用關鍵字過濾。
更進一步,Spark 支援「教學新技能」——你可以用自然語言教它一個新流程,下次它自己會做。這個能力以前只在企業級 RPA 工具或工程師的 agent framework 裡看到,現在被打包進一個月費 $100 的個人訂閱裡。
背後的 Antigravity:Google 把企業 agent 框架下放給個人
Spark 不是一個獨立產品,它是跑在 Google 的 Antigravity agent framework 上。Antigravity 是 Google 為了企業級 agent 開發的底層架構——agent identity、agent registry、agent gateway、agent observability,這些原本是給 Gemini Enterprise Agent Platform 用的治理層。
Spark 把同一套底層下放給個人用戶——你不用設定 agent identity,但平台後面知道是「你」的 agent;你不用配 access control,但 Spark 不會去碰你沒授權的服務。Google 用同一套架構服務 enterprise 和 consumer,這代表幾件事:
- R&D 投資 leverage 最大化——一套架構撐 B2B 和 B2C 兩條產品線,邊際成本攤平
- 企業客戶會被間接訓練——員工在家用 Spark 用上癮,回到公司會問「為什麼我們不用 Gemini Enterprise」
- Antigravity 變成 de facto agent 標準的可能性大幅提高——當開發者在企業跟個人兩端都遇到同一套 API,學習曲線就會被收斂到 Google 的設計上
這跟 Apple 當年用 iPhone(消費端)來餵 Mac(生產端)、然後反過來用 Mac 的開發環境鎖住 iOS 開發者的策略是同一個邏輯。Google 過去十年在 Android 上沒能完美執行這個 loop,這次用 AI agent 重做一次。
一個有感場景:個人 CFO 用 Spark 跑月結
講設計理念太抽象,看一個具體 use case 比較有感。假設你是一個自由工作者或一人公司的負責人,每個月要花半天時間做「月結」——整理上個月所有的開銷收據、檢查信用卡帳單有沒有奇怪的訂閱、把該報的稅金額算出來、給會計師寄一份月度摘要。
用過去的 AI 助理,這件事的流程大概是:你打開 ChatGPT,貼進帳單截圖(一張一張),請它分類、列總和、找出異常。每個月你重複這個流程,AI 不記得上個月的 baseline,也不會自己跳出來說「這個月你的訂閱費比上個月多了 $30」。
用 Spark 的流程是:你設一次 recurring 任務「每月 1 號自動整理上個月的所有訊息和帳單,比對前三個月的 baseline,找出異常的訂閱或費用,整理成 Google Doc 寄給我和我的會計師」。設定完之後,每個月 1 號你的 inbox 會自然出現一份摘要——Spark 自己抓 Gmail 裡的帳單、自己對歷史資料、自己寫 Doc、自己寄出。你不需要記得這件事。
這個差別不是「省了多少時間」,是「一件事從你的待辦清單上消失了」。當你不需要記得這件事、不需要每月騰半天時間、不需要追自己進度,這件事就不再是你心智負擔的一部分。這才是 AI agent 真正的價值——不是做得更快,是讓你不用做。
個人生產力的範式轉移
過去 30 年,個人生產力工具的演化大致是:紙筆 → Word/Excel → 雲端協作(Google Docs / Notion) → AI 對話助理(ChatGPT 加速單一動作)。每一代都讓「做事」更快,但要做的事還是你自己一件一件去做。
Spark 代表的轉移是——把「執行」這一步從你身上拆走。你變成「設定意圖」和「審核結果」的角色,中間的動作交給雲端代理。這個邏輯如果走通,個人生產力的瓶頸從「我有沒有時間」變成「我有沒有想清楚要交辦什麼」。
當然,這個轉移不會一夜發生。Spark 第一版只開放 trusted testers,下週才會 beta 給 AI Ultra 訂戶。能不能跑得穩、第三方整合能不能擴大、$100/月對個人用戶值不值得,這些問題都要市場驗證。但方向已經很清楚——Google、Anthropic、OpenAI 三家都在朝同一個方向跑,差別只在誰先把它做到讓一般人覺得「好用」的程度。
下一篇我們會具體比較 Gemini Spark、Anthropic Claude Cowork、OpenAI ChatGPT Agent 三家的定位差異——它們表面上做同一件事,但底層的賭注完全不同。看完你就知道,為什麼這三家不會擠在同一條賽道,而會分流出三種不同的個人 AI 員工形態。品得網絡持續觀察 AI Agent 的商業化進程,明天 5/21 早上,第二篇上線。
常見問題
Gemini Spark 是什麼?
Gemini Spark 是 Google 在 2026/05/19 I/O 大會推出的個人 AI 代理。它跑在 Google Cloud 的虛擬機上,能 24 小時持續執行任務,即使你的手機或筆電關機也照常運作。底層是 Gemini 3.5 模型加上 Google Antigravity agent 框架。
Gemini Spark 多少錢?怎麼訂閱?
Gemini Spark 包含在 Google AI Ultra 訂閱方案裡,月費 100 美元。目前先開放給 trusted testers,預計下週起對美國 AI Ultra 訂戶開放 beta。
Gemini Spark 跟一般的 Gemini 或 ChatGPT 有什麼不同?
一般 AI 助理是「對話模式」——你問它答、視窗關掉就結束。Gemini Spark 是「員工模式」——能持續在背景跑長時間任務、主動執行 recurring 工作流、可以教它新技能。它不只回答問題,還會自己動手把事情做完。
Gemini Spark 能整合哪些應用?
第一手原生整合 Gmail、Google Docs、Google Slides、Calendar 等 Google Workspace 服務;第三方目前支援 Canva、OpenTable、Instacart。它走 API 級整合,不是用瀏覽器模擬操作,所以在這些服務裡運作較穩定。
Gemini Spark 適合誰用?
最適合重度使用 Gmail、Google Docs 的個人用戶、自由工作者、一人公司負責人,且願意每月付 100 美元換取 AI 代理日常瑣事(對帳、行程協調、信箱監控等)。重度 Microsoft 365 或台灣 LINE 生態的用戶適配度較低。
延伸閱讀
這波 agentic 轉變不只發生在個人端——企業級 AI Agent 平台也在同步重構。延伸閱讀我們先前的分析:Vertex AI 變成 Gemini Enterprise——Google 整併代表 AI Agent 商業化進入新階段。
