
昨天,当 OpenAI 作念智高手机的具体规格与供应链爆料发布时,我第一响应不是「他们要作念手机了」,而是「OpenAI 最终也不得不踏出这一步」,同期思起两周前 Richard Ho 在 Stanford 那场疏浚。
Richard Ho 是 OpenAI 的硬件讲求东说念主,从 Google 作念 TPU 出来。

Richard Ho |图片来源:Synopsys
那场在 IEEE 里面组织的疏浚上,他莫得讲过一次「手机」这个词。但把昨天的新闻和他其时说过的话放在一说念看,整条旅途其实依然被讲得很明晰——仅仅其时莫得一个具体的产物形态来锚定它。
OpenAI 作念手机这件事,在外界看来像一次跨界。但顺着 Richard Ho 那场疏浚的逻辑往下推,你会发现这是一条早就铺好的路。
毕竟对于扫数模子厂商来讲,手机皆仅仅绝顶之一,不是最先。
01
模子的下一次「跃迁」,出生自硬件
那场疏浚的中枢,是对于 OpenAI 为什么必须我方作念硬件。
Richard Ho 反复强调的一句话是:「简直的戒指不再仅仅模子,而是算力、能耗、老本、延迟,是通盘系统。」
听起来像一句等闲的时刻评释。但放在 OpenAI 的位置上,这句话的重量实足不一样——它意味着这家公司依然不把我地契纯动作一家模子公司。
GPU 是为通用并行诡计遐想,在保举系统、传统的并行任务,跑得很好。
但濒临今上帝流的 Transformer、agent、长高下文推理,其实依然偏离了 GPU 当初的遐想假定。尤其是 agent——多轮、无间引申、跨任务协同,通盘系统层的低效会被放大许多倍。Richard Ho 其时的原话是:「GPU 把咱们带到了今天,但它并不是为这种(AI 负载任务)而遐想的。」
这句话背后的含义其实是:链接依赖 NVIDIA 所设定好的硬件旅途,OpenAI 历久没主见把模子推到下一个量级。不是说 GPU 不成用,而是说在能耗、老本、后果这些维度上,OpenAI 无法一直被迫地收受外部的硬件节律。
是以这件事的骨子从一驱动就不是「OpenAI 干预芯片/硬件行业」,而是 OpenAI 思再行拿回 AI 运行的底层戒指权。
要是只看媒体报说念,你会认为 OpenAI 在作念的事情是「拼装一台手机」偶而更深远一些的「自研一颗 AI 芯片」。但 Richard Ho 我方领路得很径直:「咱们不是在作念一颗芯片,而是在作念一个系统。」
这个「系统」包括芯片、机架、鸠集、电力、散热、数据中心——和 Google 当年作念 TPU 的旅途很像,但更强调端到端的戒指。
程度的部分有点出乎我料思。Richard Ho 说团队是从零搭起来的,但「两年时辰依然从空缺走到 tape-out(芯片遐想完成请托流片分娩)」,而且依然有芯片在简直 workload 中跑了——他挑升强调这不是纸面上的数据,而是「依然在简直环境里 work 的东西」。
两年从零到 tape-out 是个什么意见?传统芯片公司从架构到流片,五到七年很平常。Google TPU 第一代用了苟简三年,而且是有 Jeff Dean 这种基础行径大牛背书、又有 Google 里面圆善的工程协同体系作维持。OpenAI 能作念到两年——背后只然而两件事:要么是从 TPU、Apple、Google 等公司挖了广泛依然锻练的硬件团队(这是事实),要么是 Broadcom 这类互助方在底层 IP 上提供了很是大的维持(这也部分是事实)。
但更值得说的是 OpenAI 和硬件供应商之间的关系领域。
「他们会参与 IP、physical design、packaging。」Richard Ho 谈到 Broadcom 时说得很克制,紧接着补了一句——「他们并不看到圆善的架构。」他还专门讲明,「许多时候他们只看到一部分,但看不到举座是怎样拼起来的。」
这句话其实傲气了 OpenAI 自身的一个判断:架构层和工程层是两件事,前者必须实足持在我方手里。Broadcom 提供的是模块和制造才略,系统级的遐想逻辑——也便是「这颗芯片到底要怎样和模子配合」这件事——必须留在里面——就像苹果作念硬件的逻辑一样。
Richard Ho 提到,外界看到的模子是几个月发布一次,但里面其实是一条知道的 pipeline——「咱们能看到接下来 6 到 9 个月模子会怎样变」。
这句话才是整段最要津的。它意味着 OpenAI 的硬件团队不是在为今天的模子遐想芯片,而是在为还没出现的模子「缱绻」遐想。
具体到细节上,米兰体育官方网站这种「上前看」会影响许多决定:模子对内存压力的变化会径直决定 HBM 应该用 8-high、12-high 如故 16-high;鸠集带宽要扩到几许;新的 compression algorithm 出现会不会篡改数据流的体式;inference 和 training 的比例正在快速变化(推理负载越来越重),这对硬件的条目又是另一套。
Richard Ho 把这少量总结成一句话:
「你必须为模子将要去的标的遐想硬件,而不是为今天的模子。」
这便是 OpenAI 的芯片和 NVIDIA、AMD 的压根不同之处——它不是一颗对外售售的通用 GPU,而是高度贴合 OpenAI 自身模子旅途的、险些一双一定制的系统。从这个角度看,OpenAI 作念芯片更像 Google 作念 TPU,而不是像 NVIDIA 作念 H100。
但即便如斯,硬件优化的天花板远莫得到。Richard Ho 反对「晶体管起首变慢,是以芯片红利完满」这个结论。他的判断是:单颗芯片如实在变慢,但通盘系统层面还远远莫得被优化好。memory hierarchy、networking、data movement——这些大瓶颈皆没解。他举的例子很具体:当今高速 copper 互联在高带宽下只可维持苟简 2 米的距离,这对数据中心布局口舌常大的戒指。
简单说一句:OpenAI 在作念的事情不是把一颗芯片作念得更快,而是把通盘 AI 诡计系统再行优化一遍。
手机这件事,是这个系统的最末端。
02
「手机不是为 agent 遐想的」
回得手机。
Richard Ho 在那场疏浚上有一句话,今天回头看险些便是 OpenAI 作念手机的全部原理——「手机不是为 agent 遐想的」。
「今天的手机交互是 app-based、session-based 的,你通达一个 app,作念一件事,关掉。但 agent 需要的是无间存在、无间引申、跨任务协同。一个简直的 agent 不会等你通达它再驱动职责,它会在后台一直长入你的现象、调遣你的任务、跟其他 agent 通讯。」
这种交互范式,径直等同于在说:今天的 iOS 和 Android 皆不是为它遐想的。
这便是为什么 OpenAI 必须我方作念。Richard Ho 的判断是「畴昔不是 cloud-only,也不是 edge-only,而是两者联接」——个东说念主高下文、狡饰数据、低延迟交互必须在建造端,复杂推理留在云霄。要是一个 agent 思随时拿到用户的「当下现象」,它必须在操作系统层有圆善权限。

现存手机系统在夸口 AI 时间原生用户需求眼前有自然的短板 | 图片来源:io
这件事在 iOS 和 Android 上很难干净地作念——不是时刻问题,乐鱼体育是利益问题。Apple 不会把系统级权限实足开放给一个第三方 agent,Google 也不会。
亦然从这个角度,旧年 OpenAI 收购 Jony Ive 团队揣测的公司(io)的逻辑就明晰了。Richard Ho 说,作念端侧个东说念主建造这部单干作「是咫尺最有深嗜的一块」——因为这是第一次把基础行径和耗尽电子建造简直接在一说念。
这其实是 OpenAI 通盘硬件政策里最有思象力的部分,亦然最危境的部分。有思象力是因为它在作念 Apple 当年没作念的事:用 AI agent 把操作系统重写一遍。危境是因为耗尽电子是另一套游戏律例——产物节律、供应链、零卖、品牌——不是从云霄工程师团队里能长出来的才略。
但 io 的存在惩处了一部分问题。Jony Ive 不是来作念芯片偶而操作系统的,他是来作念硬件形态和工业遐想的——这底本便是 Apple 这些年从 OpenAI 手里能局促保住的终末一块地。
03
不是扫数 AI 公司皆在作念并吞件事
耗尽电子的难度有多大,看夙昔两年其他 AI 公司在硬件上的尝试就明晰了。
每一家皆思用 AI 再行界说某个硬件形态。但每一家走的旅途不一样,末端也很不一样。
最早的是 Rabbit R1。
2024 年头的 CES 上,吕骋拿出那台橙色小盒子,喊出「干翻扫数 App」——用 LAM(大动作模子)替代手机里 App 的交互神色,一句话订外卖、打车、订机票。其时激发的存眷度堪比「AI 时间的 iPhone 时刻」,开售两周卖出 5 万台。

Rabbit R1 是首批 AI 硬件中为数未几「口碑回转」的产物|图片来源:Rabbit
但首批用户体验出来之后,事情翻得很快。先是被斥地者阐发是套壳安卓——Rabbit OS 本质上是 AOSP 的修改版,APK 不错径直装到 Pixel 6a 上跑。LAM 被发现依赖 OpenAI 的 API。续航 4 小时,订一次外卖要试十几次。
Rabbit 失败的简直原因不是产物性量,而是旅途——它只作念了硬件壳子,没碰底层。芯片是联发科 Helio P35(初学手机水平),系统是套壳 Android,模子靠第三方 API。这种作念法的天花板很显着:你作念的事情,一个手机 App 皆能作念,而且作念得更好。
Meta 选了一条实足不同的路。
Meta 的判断是不挑战手机这个形态,让 AI 借眼镜这个依然存在的硬件形态干预日常。Ray-Ban Meta 作念对了三件事:找 EssilorLuxottica(雷一又母公司)作念互助方,让眼镜转头眼镜本人——前锋、轻、闲隙;把 AI 作念成「附加项」,299 好意思元起售;不彊求每个用户皆用 AI,先把一副好眼镜卖出去,AI 是 bonus。
末端是 Ray-Ban Meta 卖出迥殊 200 万副,Meta 一家拿下大家智能眼镜阛阓 75% 以上的份额。
但这条路的领域也明晰——Meta 惩处的是「AI 怎样干预日常」这个问题,不是「AI 怎样再行界说诡计」这个问题。眼镜仅仅一个加了录像头和麦克风的进口,它不会替代手机,也没计议替代。
阿里千问基本上是 Meta 旅途的中国版块。本年 2 月 MWC 发布、3 月 G1 系列发售(国补得手价 1997 元起)、4 月 S1 上市(国补得手价 3499 元),节律很快。逻辑也透露:千问 App 依然作念到超 3 亿月活、8000 万 DAU,眼镜是把 AI 助手才略从手机延长到日常佩带形态——支付宝、高德、淘宝、飞猪一整套阿里生态皆接进来,用户对眼镜说「点外卖」「打车」「翻译」就能就业。芯片是高通骁龙 AR1,系统在 Android 之上,模子用千问。
千问眼镜骨子上是一次生态延长,不是底层重构。它的上风是阿里生态弥散厚,眼镜成为阿里 AI 服务的一个新进口。
把这三条路放在一说念看,再对比 OpenAI——你会发现 OpenAI 是唯独一家在作念「全栈再行界说」的公司:
Rabbit 思绕过 App 但没动操作系统,末端是空中楼阁;Meta 遴荐不挑战手机,让眼镜作念繁芜,作念对了爆款但天花板便是繁芜;千问奴隶 Meta 的形态遴荐,把眼镜作念成 AI 服务的延前途口;而 OpenAI——从芯片、基础行径、动力、操作系统、建造一齐买通。
这是另一个量级的事。
04
简直的护城河,不在模子层
那场疏浚的终末,Richard Ho 还给了一句对畴昔方法的判断:
「(模子公司)不再是在芯片层赢,而是在系统层赢。」
这句话的深嗜是,畴昔的 AI 竞争不仅仅模子才略的竞争,而是整套系统才略的竞争——相似的功耗下能提供几许诡计、能服务几许用户、延迟能压到多低。这种系统级的上风,单靠模子本人是没法替代的。
放在 OpenAI 的位置上看,这是一种很是自洽的逻辑:模子团队在 GPT、o 系列、agent 这些方进取往前推,但一朝推到某个体量,模子本人的起首就要被基础行径的瓶颈戒指住。是以 OpenAI 必须从模子公司造成基础行径公司——再造成建造公司。
这亦然为什么 Richard Ho 在被问到畴昔算力鸿沟时,给出的数字是 20GW。把 OpenAI、Oracle、SoftBank 等互助方的计议加起来,畴昔需要的算力苟简很是于十几到二十个核电站的发电量。
这个数字第一次听到的时候我没响应过来。20GW 依然不是数据中心能惩处的问题——它是国度电网和动力政策的问题。Richard Ho 我方也说,「当你驱动谈这种鸿沟,就必须谈电力,甚而是国度安全」。
把这件事和「OpenAI 作念手机」放在一说念看,武艺看明晰通盘图景:一边是国度级别的动力基础行径,一边是用户兜里的一台建造,中间是一整套自研的芯片、系统、操作系统。OpenAI 思作念的,是把这两头连起来。
把扫数的点串起来——模子、基础行径、自研芯片、动力、edge device、操作系统——会发现 OpenAI 作念手机不是一个单点有计议,而是这条旅途当然长出来的末端。
手机仅仅第一个被外界看见的形态。但简直的变化是更下面的那一层:诡计范式正在从 app 为中心,转向 agent 为中心。
一朝默许进口造成 agent,今天的建造、芯片、操作系统,皆会被再行界说一次。
这一次再行界说里乐鱼,OpenAI 不再仅仅一家作念模子的公司。
环球体育官网登录入口
备案号: