
在多年对自有基础设施投入不足之后,苹果可能会进一步加深对谷歌云服务的依赖。
今年 1 月,苹果宣布将在其产品中使用谷歌 Gemini 大模型,这相当于承认这家 iPhone 制造商过去几年在 AI 领域已无法独立竞争。而这笔交易也暴露了苹果的另一块短板 —— 云计算,并再次选择依靠外部公司来弥补。
如今,苹果有可能进一步加深对谷歌的云依赖。据两位知情人士透露,应苹果要求,谷歌已研究在其数据中心内部部署服务器,用于运行即将推出的新版 Siri 数字助手。该版 Siri 将由 Gemini 驱动,同时遵守苹果的隐私标准。苹果目前已在在线存储、内部 AI 模型训练等服务上依赖谷歌云。
过去,苹果曾表示,会将用户的复杂 AI 请求发送至一套名为 ** 私有云计算(Private Cloud Compute)** 的苹果自有系统,该系统运行在搭载苹果定制芯片的服务器上(简单 AI 请求则在设备端处理)。
多年来,苹果一直立志实现云计算自给自足。公司多位高管曾试图搭建内部基础设施,以减少对谷歌、亚马逊云科技等云服务商的依赖。
但据十几位苹果前高管和工程师称,这些云项目过去屡屡受阻,原因是苹果财务高管将云计算视为令人头疼的成本中心,而非战略重点。他们表示,苹果不愿对自有基础设施大举投入,已导致云领域人才持续流失。
近几年,外界越来越质疑苹果在数据中心投入上远少于同行,苹果则向投资者辩称,其 “混合式” 基础设施策略 —— 即结合公有云服务与苹果自有基础设施 —— 效果良好。
苹果在云计算上的困境,与其在 AI 领域的磕磕绊绊并行且高度相关。过去一年,苹果迟迟未能按时推出 AI 驱动的新版 Siri,已上线的 AI 功能也反响平平。
前员工透露,反映出这种困境的是,苹果私有云计算的平均利用率仅 10%。部分用于 AI 云的服务器甚至仍在仓库里,尚未上架安装。不过,如果苹果宣称今年推出的新版 Siri 大获成功,其 AI 算力需求可能会急剧飙升—— 这也能解释苹果为何与谷歌洽谈托管 Siri 一事。
苹果在云计算上依赖谷歌,与其一贯坚持掌控产品核心组件的理念形成鲜明反差。苹果以自主设计硬件、软件、芯片等核心部件著称,以此获得产品竞争优势。
与此同时,苹果也以吝啬闻名,尤其在数据中心这类需要巨额前期资本开支的项目上。近年来,Meta、微软、谷歌、亚马逊等公司为适配 AI 爆发式增长,纷纷投入史上更大规模的数据中心建设,而苹果基本置身事外。
相反,苹果财务高层更倾向于从外部云服务商租用 AI 算力与服务。诚然,正如 OpenAI 和 Anthropic 所证明的,自建数据中心并非成为 AI 领导者的必要条件。但如果云服务商未来提价,过度依赖外部公司可能会让苹果后悔,届时或将被迫自建更多服务器。
前苹果云工程师认为,更核心的问题在于:苹果文化依然围绕卖设备展开,设备销售占其营收绝大部分。即便音乐、App Store 等服务业务收入不断增长(这些服务要么跑在苹果自有云上,要么租在第三方服务器上),这一点也没有改变。
苹果内部混乱的后端基础设施进一步加剧了困境。公司内部多个部门各自使用独立服务器或不同云服务,与谷歌等大型科技公司统一算力池的模式形成对比。
“苹果和谷歌的工程文化截然不同,” 曾参与下一代 Siri 研发、并于去年 12 月离职的伊戈尔・纳韦尔纽克说,他此前在谷歌基础设施部门工作超过十年。
“谷歌大部分系统是中心化的,所有人用同一台超算;而在苹果,技术选择是孤岛化的。”
严控成本
苹果的云问题可以追溯到几十年前。
2003 年 iTunes 音乐商店上线后,苹果开始扩大小型数据中心规模,以支撑数字音乐销售的爆发式增长。
随着苹果在线业务扩张,其系统变得杂乱无章。例如,2008 年推出的个性化歌单功能 iTunes Genius,搭建在与 iTunes 主体完全独立的技术和服务器上 —— 原因是苹果希望对用户音乐库分析数据做匿名化处理。
大约在同一时期,苹果开始越来越依赖公有云服务。这一当时还很新颖的概念由亚马逊云科技开创,即把大型数据中心租给企业客户。AWS 曾是苹果 2011 年推出的 iCloud 存储服务的早期在线存储提供商。
但当苹果推出 iCloud 照片备份功能时,海量 iPhone 用户拍照带来的公有云存储成本高得难以承受。为省钱,苹果开始自建服务器用于 iCloud 照片备份。此举还带来意外效果:据一位参与该项目的前苹果高管称,当苹果告知 AWS 自己的计划后,亚马逊直接将云服务费砍半。苹果此后一直采用自建服务器 + 云服务商混合模式。
到 2013 年,苹果财务部门对公有云和自有服务器双双飙升的成本感到不满,开始质问服务团队是否充分利用了公司已有的内部基础设施。
前工程师称,这些团队之间缺乏协调,导致基础设施重复建设、大量算力闲置。例如,iTunes 服务器有空闲容量,其他苹果团队却无法使用。
2013 年,苹果指派当时的工程总监帕特里克・盖茨,负责将分散的服务器整合成所有团队都能使用的公共资源池。他牵头成立了新部门平台基础设施工程部,效仿亚马逊、谷歌的现代云体系搭建共享算力。
ACDC 项目
但盖茨难以推动公司各部门使用这一中心化平台,并于 2018 年离职。2019 年,曾任 Twitter 工程副总裁、微软云早期负责人的迈克・艾伯特接手剩余团队,继续推进该项目。
艾伯特试图在苹果内部植入更偏云化的文化。2021 年,他在内部发起基础设施峰会,鼓励全公司协作共建共享基础设施。
他还推动了多项新计划,最知名的是ACDC 项目—— 将苹果芯片技术用到自有数据中心服务器上。项目全称 “Apple chips in data center”,初衷是让运行苹果在线服务的数据中心,达到与设备端同样严格的隐私标准。
据《The Information》此前报道,他还提议苹果未来可考虑向外部开发者出租服务器,类似亚马逊、谷歌的公有云模式。该项目前负责人称,苹果芯片主管约翰尼・斯鲁吉是强力支持者,认为这是向企业客户出售自研芯片的机会。
但团队前员工表示,由于财务部门反对,艾伯特的多个项目推进困难。财务部认为,现有服务器利用率太低,不愿再投钱自建云服务,他们相信依赖外部云厂商能更好控制成本。
2023 年,艾伯特离开苹果加入通用汽车。他的离职很快引发苹果云团队人才流失,许多他招入的员工也陆续追随他去了这家车企。
转向谷歌云
2022 年底 ChatGPT 3.5 的问世,对整个科技行业是颠覆性时刻,也彻底改变了苹果对 AI 和云的思路。
在 ChatGPT 出现之前,苹果对 Siri 的优先目标是尽可能在设备端运行,而非云端,以更好保护用户隐私。ChatGPT 展示了巨型云端大模型的潜力后,苹果意识到不能再固守旧模式,必须更多借助云端算力。
但问题来了:苹果内部 AI 基础设施已开始老化。2023 年,公司开始淘汰数据中心里大量老旧且故障频发的英伟达芯片 —— 这件事多年前就该做,却一直被搁置。苹果需要用更适配最新 AI 的新款芯片替换旧芯片。
在财务部门推动下,苹果选择主要依靠外部云服务商推进 AI 计划,就像之前处理存储等服务一样。长期云服务商 AWS 成为苹果 AI 转型的首个重要合作伙伴,苹果也是亚马逊自研 AI 芯片 Inferentia 和 Trainium2 的早期客户。
与谷歌合作则更为曲折。多年来,出于隐私顾虑,苹果禁止 AI 工程师使用谷歌云。Siri 处理大量用户个人身份信息,苹果不愿承担数据外泄风险。苹果软件负责人克雷格・费德里吉 —— 实际上也是苹果隐私 “沙皇”—— 曾多次否决使用谷歌云提供 AI 算力。
但 2023 年,谷歌对安全系统进行升级,满足了苹果的隐私要求。苹果迅速开始采用谷歌云满足 AI 需求,包括使用谷歌定制芯片张量处理单元(TPU)—— 苹果测算,其运行成本远低于英伟达同类芯片。
私有云
苹果需要向外界证明自己在认真对待 AI。ChatGPT 的爆发式增长,迫使谷歌、亚马逊等几乎所有科技巨头都推出更智能、对话式的 AI 产品。2024 年苹果全球开发者大会上,苹果终于出手,宣布推出Apple Intelligence—— 一套基于生成式模型的 AI 工具集。
苹果指派此前由艾伯特牵头的 ACDC 项目团队支援 Apple Intelligence 上线。尽管该项目最初并非聚焦 AI,团队还是紧急搭建了代号Thimble的 ** 私有云计算(Private Cloud Compute)** 系统,为下一代 AI 产品提供更私密的算力支持。
参与该项目的前员工称,尽管苹果在 2024 年 6 月与 Apple Intelligence 一同宣布了私有云计算,但该系统当时尚未真正可用,进度滞后六个月(最终于 2024 年底上线)。
随后几个月,苹果陆续上线 AI 写作、通知摘要等 Apple Intelligence 功能,但公众和科技媒体普遍感到失望。对苹果而言,更大的问题是:彻底重构、更具对话能力的新版 Siri 迟迟无法推出。
苹果与谷歌洽谈 Siri 托管事宜,可能表明苹果希望为今年晚些时候新版 Siri 上线后设备端 AI 流量暴增做好准备。
谈判背后的另一个原因可能是:私有云计算在苹果自有数据中心里表现不佳。前员工称,其 AI 服务器的软件更新耗时远高于普通服务器。此外,苹果云工程师和 AI 员工透露,私有云计算服务器上的苹果芯片并非为 AI 设计,难以流畅运行谷歌 Gemini 这类大模型。