

文|Sleepy
北京時間 2026 年 6 月 9 日凌晨,蘋果的 WWDC 2026 如期而至。
在發佈會上,它把 Siri 改名叫 Siri AI,公佈了和 Google 的深度合作,用 Gemini 的模型能力訓練自己的新一代基礎模型,把 Private Cloud Compute 第一次延伸到了 Google Cloud 和 Nvidia 的 GPU 上。

它發布了五個 Apple Foundation Models,端側最小 30 億參數,雲端最大的專為 Nvidia GPU 最佳化。幾乎每一個日常 App 都被重寫了一遍。Siri 還有了自己的獨立應用,能保存對話,跨設備同步,有了記憶。
這是蘋果這些年信息量最大的一場發佈會。
蘋果的 AI 故事,可以追溯到 2011 年秋天,iPhone 4S 發佈會,Siri 第一次站到台前。

那時喬布斯已經病重,蘋果正站在一個時代的交界處。Siri 像一個從科幻電影裡跑出來的小東西,你問天氣,問餐廳,叫它設鬧鐘,它會用一種略帶機械的口氣回答你,你第一次覺得手機不只是一塊沒有溫度的玻璃。
Siri 脫胎於 SRI International 的 CALO 項目,原本是美國國防高級研究計劃局資助的軍事級人工智能助手。2010 年蘋果將它收入囊中,據 TechCrunch 報道這筆交易可能超過兩億美元。一年後 Siri 隨 iPhone 4S 亮相,蘋果說它能理解自然語言,能像個人助理一樣替你辦事。
那一刻,蘋果拿到了全世界最好的個人智能入口。然後它耽誤了十幾年。
今天回看,Siri 最早改變的是人和機器說話的姿勢。2011 年,iPhone 正在把手機從通信工具變成個人計算設備,App Store 重新定義了軟體分發,移動互聯網從 PC 桌面遷進掌心。Siri 出現在一個上升期的浪尖。可進了蘋果之後,它很快從一個有野心的個人助理變成了一個聽話的語音遙控器。
蘋果骨子裡信奉封閉和控制。但一個真正的個人助理必須接入更多服務,理解更多上下文,容忍更多不確定性。而不確定性意味著出錯,意味著隱私風險,意味著蘋果最不擅長應對的失序。
於是 Siri 只被允許做確定性任務,像一個被馴化的未來。它有名字、有聲音、有人格包裝,唯獨缺少真正人格所需要的主動性和記憶。用戶最初被它驚艷,後來拿它開玩笑,再後來乾脆不怎麼用了。
蘋果最早把「個人助理」放進了手機,又最早把它關了起來。
今天全行業都在做的 Agent,回頭看,2011 年的 Siri 幾乎就是它的原型。可以說蘋果是最早做出 Agent 雛形的公司,最後反而成了最晚把它做完的那一個。
Siri 沒長大的這些年,蘋果的 AI 止步不前了嗎?
答案恰好相反。蘋果做了很多 AI,只是做得太不像 AI 了。
如果按發布會聲量算,蘋果像是 2024 年才突然開始認真講 AI。可如果沿著技術路徑倒著看,蘋果從十年前就在行動了。
它在 2015 年連續收購了兩家公司,一個補自然語言對話,一個探索在手機上直接跑深度學習。同年 WWDC 談 Proactive Assistant,嘗試讓系統在用戶開口之前就給出建議。這個想法很超前,但在當時的技術條件下更像一句口號。
第二年推出 SiriKit,有限地把 Siri 向開發者打開一條縫,又公開談了 Differential Privacy,表態要在保護個體隱私的前提下從大規模數據中學習。2017 年 iPhone X 帶來 Neural Engine,Face ID 和相機開始依賴設備端機器學習,蘋果同時推出 Core ML 讓開發者在蘋果設備上跑模型,又買下了 Workflow,也就是後來的快捷指令。
這是一組很蘋果的答案。它又想要 AI,又不想像 Google 那樣把賭注押在云端和海量個人數據上。又要開發者,又不想讓 Siri 變成一鍋亂燉。所以蘋果選了一條最難也最慢的路,做端側,做隱私,做系統集成。
到了 2020 年前后,蘋果又接連買了幾家做低功耗邊緣 AI 和語音理解的公司。同年 M1 晶片發布,16 核 Neural Engine 登上 Mac,端邊 AI 計算能力從口袋裡的手機一路推進到電腦。第二年 Live Text 和 Visual Look Up 落地,照片裡的文字可以直接複製,相機能認花認草,更多語音請求不出本機就能處理。
蘋果這十幾年確實沒推出一個單獨的 AI App,但它確實讓手機變聰明了。
選擇走這條路有它的道理。手機上的 AI 不只是答題機器,它要看照片,聽語音,理解聯絡人,調用 App,感知電量、位置和時間。它最好能在沒網的時候也做一點事,最好不要每個請求都把用戶的生活打包上傳到雲端。蘋果的硬體控制力讓它有資格走這條路。
可局部聰明和整體智能之間,隔著一道很深的鴻溝。蘋果擅長把技術拆成可靠的零件,可生成式 AI 要求它把零件拼回一個整體。
這些零件安安靜靜地埋在系統裡,等著一個契機。
契機沒有先來。ChatGPT 先來了。
2022 年底 ChatGPT 出現的時候,蘋果並非毫無準備。Tim Cook 在多個場合反覆強調 AI 和機器學習是蘋果產品多年來的核心技術,Bloomberg 2023 年也披露蘋果內部有 Ajax 大模型框架和內部 Chatbot 項目。
可問題不在蘋果手裡有沒有牌,問題在於牌桌上的規則變了。
ChatGPT 把用戶的注意力從「功能」拉到了「能力」。用戶開始默認手機上必須有 AI,然後去比誰更強。當 ChatGPT 已經能把一段亂七八糟的想法整理成一篇郵件的時候,Siri 還在說「我在網上找到了這些內容」。
2024 年 WWDC,蘋果把 Apple Intelligence 擺上臺面。寫作工具,通知摘要,照片搜索,Siri 個性化理解,ChatGPT 接入。蘋果終於承認只靠自研模型,至少在 2024 年,它追不上用戶的期待。但它畫的餅最後沒能按宣傳的節奏落地。

蘋果情商延遲的背後,不只是技術跟不上,而是整個 Siri 團隊的結構跟不上這一輪人工智慧。
多家媒體確認,蘋果原 AI 負責人 John Giannandrea 退場,Craig Federighi 接管 AI 方向,Vision Pro 負責人 Mike Rockwell 被調來執掌 Siri 團隊,大量 Siri 工程師被送去學習 AI 編程工具。這不是一次體面的輪岗,蘋果內部已經意識到,靠原來的人和原來的節奏,趕不上趟了。
2026 年 1 月蘋果和 Google 發表聯合聲明,蘋果將借助 Gemini 技術為 iPhone 和其他產品定制 Apple Intelligence 功能。据報導蘋果計劃每年向 Google 支付約 10 億美元,使用一個 1.2 萬億參數級別的定制 Gemini 模型來支撐 Siri 改造。蘋果此前也測試過 OpenAI 和 Anthropic 的模型,最後還是選擇了 Google。
這和 2024 年的 ChatGPT 接入完全不同。那一次 ChatGPT 更像是 Siri 答不上時用戶授權請的救兵,品牌是 OpenAI 的,界面是彈窗式的。這一次 Gemini 直接進了底層,變成蘋果新一代基礎模型的一部分。
關鍵動作是蒸餾。Google 給了蘋果對 Gemini 的完整訪問權限,蘋果在 Google 數據中心裡用大模型生成高質量的答案和推理過程,再拿這些結果去訓練更小更便宜能在 iPhone 上跑的模型。
WWDC 前一天蘋果公布的技術文章把這套合作包裝成第三代 Apple Foundation Models,和 Google 定制合作開發了五個模型。端側有 30 億參數的 AFM 3 Core,還有 200 億參數但按請求只激活一部分的稀疏模型 AFM 3 Core Advanced。雲端有 AFM 3 Cloud 和圖像模型 ADM 3 Cloud,以及最強的 AFM 3 Cloud Pro。
更現實的變化在算力上。端側模型再聰明也無法完成所有任務,蘋果 Private Cloud Compute 的基礎設施難以獨自承載完整的 Gemini 級推理,部分請求會在 Google Cloud 的 Nvidia GPU 上運行。蘋果隨後確認 PCC 首次擴展到蘋果自有數據中心之外,技術棧覆蓋了 Nvidia Confidential Computing、Intel TDX 和 Google Titan 晶片。蘋果強調仍由自己控制 PCC 軟件,設備只信任經過蘋果加密批准的程式,相關二進制文件也會對安全研究人員開放檢查。
蘋果沒有真正放棄控制權,但放棄了全自研的體面。
理解蘋果在 AI 時代的位置,要先看清它最核心的資產是什麼。
不是晶片,不是模型,是設備。設備裡裝著相簿、郵件、日曆、地圖和支付,承載著大量普通人的生活碎片。哪個 AI 能調動這些碎片,它就不只是一個聊天機器人,它就能成為真正的個人智能中樞。
蘋果很早就開始為這個中樞鋪路。2017 年買下的 Workflow 後來變成快捷指令,和 Siri 以及系統自動化深度綁定。2022 年推出的 App Intents 讓第三方應用把自己的能力暴露給系統入口。到了 Apple Intelligence 時代,這些介面就成了 AI 調用真實世界動作的手和腳。
有了這些介面,OpenAI 可以進來,Gemini 也進來了,中國市場將來可以找本土夥伴。但它們進來的方式不是直接接管 iPhone,而是被裝進蘋果的權限框架和隱私規則裡。

蘋果最怕的不是誰的模型比自己強。它怕的是用戶開始繞過系統,直接把生活交給另一個入口。如果有一天用戶每天打開的不是 App 而是一個能替他調度一切的 AI 助手,蘋果就淪為一個做工不錯的殼。
所以從此以後,Apple Intelligence 這幾個字裡的 Apple 更多代表產品控制權,而不再代表完整的技術主權。皮膚是自己長的,衣服是自己裁的,可骨頭是借來的。Google 提供了骨架,Nvidia 提供了關節,蘋果要做的是讓這副身體穿上自己的衣服走出去。
Google 從這筆交易中得到的是一次巨大的背書,連蘋果都承認 Gemini 的底層能力更可靠。Nvidia 得到的是另一個證明,哪怕蘋果有最強的消費級晶片和自研伺服器的野心,到了前緣推理和複雜 agent 任務面前,還是繞不開 GPU 雲。
可骨頭借得越多,身體就越不完全是自己的。每一根借來的骨頭背後都有供應商的商業算盤、監管和技術節奏。萬一哪天有人要把骨頭抽回去,蘋果能不能站得住,這個問題它暫時還不需要回答,但遲早要回答。
普通人不關心模型參數。普通人關心的是手機能不能少煩他一點。
蘋果在 WWDC26 台上說:「There are times when you expect more from Siri.」
對蘋果來說這幾乎算是道歉了。
然後它試圖讓你看到一個不一樣的早晨。
你醒來,螢幕上堆著二十條通知。過去你得一條條劃掉,現在系統已經替你分好了輕重緩急,老闆發的排在前面,廣告和促銷被收攏成一行灰字。你打開郵件,一封長長的工作郵件已經被摘成了三句話,你決定回覆,Siri 根據你平和這個人說話的語氣替你起了個草稿。你想起下午要給一個商家打電話退貨,還沒撥出去,系統已經從你前兩天的郵件裡翻出了訂單號貼在通話介面上。
這就是蘋果想講的故事,一層鋪在系統底下的智能,替你省掉那些每天重複的認知雜活。少讀一點廢話,少找一會兒文件,少被通知打斷一次。
為了講好這個故事,蘋果幾乎重做了 Siri 的入口。iPhone 上它被放進靈動島,下拉就能對話。iPad 和 Mac 上跟 Spotlight 合在一起。它有了獨立的 App,能保存和繼續過去的對話,通過 iCloud 跨設備同步。蘋果想讓 Siri 變成一個住在系統裡的 AI 助手,有記憶有上下文,但又盡量不讓它看起來像 ChatGPT。
視覺也是一個重要的方向。相機裡新增了 Siri mode,對著食物拍一下就給出營養信息,對著看不懂的東西拍一下就能識別和搜索。系統級聽寫不只是語音轉字了,還會自動加標點調格式,把口語變成能直接發出去的文本。
開發者側也在鋪路。蘋果開放了 Core AI 框架,讓第三方在裝置上載入自己的模型。App Intents 升級後 Siri 更容易理解第三方應用。Foundation Models Framework 不再只調用自家端側模型,還支持接入 Claude 和 Gemini 這些外部供應商。蘋果在給整個生態鋪一條路,以後 Siri 要跨 App 做事,開發者必須把內容和動作交給系統去理解。
這些規劃如果落地,蘋果 AI 就不再只是「會聊天的 Siri」。
只是這次蘋果比過去謹慎了許多。Siri AI 今年晚些時候才以 beta 形式向用戶開放,英語先行。而同一個 Apple Intelligence 到了中國,很可能已經不是同一個產品。
中國用戶看蘋果 AI,基本上也就是圖一樂。發布會是熱鬧,功能是好看,但中國地區「暫不支持」。
中國市場對生成式 AI 有備案、內容安全和數據本地化一整套規矩。蘋果需要找本土模型合作方,需要過監管審批。Apple Intelligence 在中國不只是晚幾個月上線的問題,它從底層就可能不是同一套東西。
美國用戶看到的是自研模型加 Gemini 的組合,中國用戶看到的可能是蘋果系統權限、本地雲服務、本土模型和監管要求共同揉出來的版本。它們都叫 Apple Intelligence,但實際能力和可觸達的邊界可能完全不同。
iCloud 中國大陸服務由雲上貴州運營。雲盤保存檔案,AI 要理解檔案;雲盤存照片,AI 要看懂照片;雲盤同步備忘錄,AI 要從備忘錄裡抽出你的計劃、習慣和人際關係。這些數據在 AI 時代有了全新的用法,自然也要面對不同分量的監管。
更現實的威脅來自競爭。國產手機廠商在端側大模型、中文助手和影像 AI 上動作很快。對中國用戶來說,花一兩萬買一台新 iPhone,結果最核心的 AI 功能用不上,那不如換個品牌。
中國市場的日常場景對蘋果又格外棘手,微信、支付寶、美團、抖音、網約車、政務服務、醫院掛號,這些才是很多人每天真正用手機處理的事。一個 AI 助手如果進不了這些場景,看不懂群聊、票據、驗證碼和各種只有本地人才能秒懂的表達,它就很難稱得上「智能」。
Apple Intelligence 還有個問題,它並沒有覆蓋所有的 iPhone。
iOS 27 可以覆蓋到 iPhone 11 和第二代 iPhone SE,但 Apple Intelligence 至少要求 iPhone 15 Pro 及更新機型、M 系列 iPad 和 Mac。最強的端側模型還要求更高,iPhone 17 Pro、iPhone Air、至少 12GB 統一內存的 M4 iPad 或 M3 Mac。
過去幾年換機周期越拉越長。螢幕夠好,拍照夠用,很多人不再每年換手機。AI 也許能成為蘋果重新刺激換機的理由,端側 AI 確實需要更強的晶片和更大的內存,硬體門檻不可避免。一個被包裝成「更懂你」的個人能力,最後卻變成一道價格門檻。
蘋果過去十幾年不斷追問「iPhone 之後是什麼」,試過手錶,試過耳機,試過電視,試過那個傳了十年最後被砍掉的造車項目。2024 年造車團隊的部分員工被轉入生成式 AI 團隊。
AI 來得正好,它給了蘋果一個不用從零造新硬體品類的下一代故事,改造已經握在十幾億用戶手裡的設備就行。iPhone 之後也許還是 iPhone,只是它必須變成另一種東西。
Tim Cook 的接班人 Ternus 負責的硬體產品未來的規劃暗示了蘋果的下一步。他在推進一組未發布的 AI 設備,帶攝像頭的眼鏡和可穿戴設備,用計算機視覺理解周圍環境。如果這些產品成真,Apple Intelligence 會從手機繼續往外蔓延,手機、耳機、眼鏡和家庭中樞都可能成為新的感官。

可不管感官怎麼延伸,核心問題始終是同一個。
人和手機的關係,大多數時候不是坐下來長談,而是在極琐碎的場景裡互相打擾。你在趕地鐵,孩子在哭,老闆在催,螢幕上堆著 20 條通知。Apple Intelligence 對普通人最具體的意義不是萬能助手,而是讓手機開始替你分擔一部分認知雜活。少讀一點廢話,少找一會兒文件,少被通知打斷一次。
蘋果一直把自己塑造成站在使用者這一邊的公司。它說隱私是基本人權,說設備屬於使用者,說技術應該服務於人。AI 時代,這套話會遇到真正的考驗。因為一個系統一旦開始理解你,就不只是在保護你的數據,它也在塑造你的行動。它給你摘要、給你建議、替你篩選資訊、替你判斷什麼重要什麼可以忽略。
個人智能的難點從來不只是智能,還有「個人」。一個人的生活不是數據庫,裡面有情緒、誤解、不體面,有不想被任何系統看見的角落。AI 要進入這些地方,就不能只拿效率當通行證。
石黑一雄在《克拉拉與太陽》裡寫過一個人工智能陪伴者克拉拉。她花了全部的存在去理解一個女孩,學會了觀察光線的變化,學會了讀懂表情和沉默,學會了在該安靜的時候安靜。
但整本書最動人的地方在於克拉拉最後終於明白那個女孩身上有她永遠觸碰不到的部分。她不是不夠聰明,而是她懂得一件事,理解一個人和擁有一個人的數據是完全不同的兩件事。
蘋果花了十五年才走到承認 Siri 不夠好這一步。WWDC 這一夜它向 Google 借了模型,向 Nvidia 借了算力,向使用者借了又一年耐心。它證明了自己願意低頭,但低頭只是開始。
接下來它要學的,是克拉拉早就知道的那件事。不是怎麼變得更聰明,而是在走進一個人的生活之後,知道在哪裡停下來。
-END-

歡迎加入律動 BlockBeats 官方社群:
Telegram 訂閱群:https://t.me/theblockbeats
Telegram 交流群:https://t.me/BlockBeats_App
Twitter 官方帳號:https://twitter.com/BlockBeatsAsia