17岁解锁iPhone,18年后挑战英伟达,AMD主动送芯片

17岁解锁iPhone,18年后挑战英伟达,AMD主动送芯片

2025年3月,George Hotz在个人博客上发了一篇文章,标题只有两个词:AMD YOLO,意思是「不留一丝退路,全押AMD」。

Hotz在文中写道:AMD正在寄送我们要的两台MI300X(AMD顶级数据中心AI加速卡),已在路上。

MI300X是AMD押注AI算力的旗舰产品,平时是云厂商和大模型公司排队抢的货。现在却要寄到tiny corp:一家当时连办公室都谈不上、靠GitHub和Discord运转的小公司。

而这个包裹的收件人,江湖人称geohot——George Hotz。

geohot这个名字第一次为人所知,是2007年的一段视频。当时17岁的他,第一次解锁了一部iPhone。

2007年,17岁的George Hotz对着摄像头展示全球第一部解锁的iPhone,那段视频播放量近两百万,让geohot这个名字传遍黑客圈。

后来他又因破解索尼PS3被告上法庭。而这一次,他想干一件更大的事:从软件侧,撬动英伟达的CUDA护城河。

「CUDA是生态,不是护城河」

「CUDA是生态,不是护城河」。

Hotz在博客中毫不客气的说,CUDA(英伟达的GPU计算平台)并非人们想象的那种护城河,它只是一个早期生态。

他在博客里放了一张推特截图。早在2025年1月,他就把AMD寄芯片这件事称作一次「文化测试」:看AMD到底愿不愿意投入软件。

到了3月这篇博客,他给出了结论:AMD通过了测试。他相信AMD不会放弃软件,而如果是这样,英伟达就完全没有理由比AMD贵16倍。

意思是说:当时英伟达的市值大约是AMD的16倍,两家公司的硬件其实没差那么远。AMD甚至在RDNA4架构上做出了双倍吞吐的Tensor Core,而英伟达在自家卡上人为砍掉了一半。

那16倍的差距从哪来?Hotz的答案是软件。更准确地说,是软件的复杂度,以及由复杂度长出来的生态锁定。

开发者习惯了CUDA,工具链围着CUDA转,于是AMD的硬件再好也没人愿意碰。卡住AMD的从来不是芯片,是没有一套能打的软件栈。

当然,这是Hotz的判断,并非AMD官方的结论。

他也不只是嘴上说说,还自掏25万美元买入AMD,公开看多,押注五年。他在博客里写:

要么英伟达被严重高估,要么AMD被严重低估。

Hotz写下这段话是2025年3月,英伟达市值约为AMD的16倍。

到2026年5月,英伟达市值约5.2万亿美元,AMD约7600亿美元,差距收窄到了7倍上下。这一年里,AMD股价在AI数据中心需求的推动下大幅上涨,涨幅远超英伟达。

当然这并不能证明Hotz是对的。AMD的重估,主要来自它自己的GPU出货和财报,但市场情绪的方向,确实也印证了Hotz的判断:那16倍的差距,没有想象中那么稳固。

从解锁iPhone到挑战算力霸权

一个从未造过芯片的程序员,凭什么敢挑战英伟达?故事要从他17岁那年说起。

2007年夏天,苹果发布初代iPhone,与AT&T独家绑定。17岁的Hotz是T-Mobile用户,他想要iPhone,又不想换运营商,于是决定把这部手机拆开。

据《纽约客》记述,他用螺丝刀拧开后盖,找到那块限制运营商的基带处理器,焊上一根导线,给它灌入电压,扰乱它的代码。第二天早上,他对着摄像头宣布:这是全世界第一部解锁的iPhone。

那段视频带来近两百万次播放,让他成为当时全球最知名的黑客。两年后他转向索尼PS3,破解了号称坚不可摧的游戏主机,随后被索尼起诉,最终和解。

2011年,索尼就PS3破解起诉George Hotz,案件最终以庭外和解收场,Hotz接受永久禁令、承诺不再碰索尼产品。

Hotz对黑客有一个简单的定义:黑客之于电脑,如同水管工之于管道。

他的方法论十几年没变过:在一个封闭系统里,找到那个能跟你「对话」的部件,再想办法让它听话。

两万行代码,重写一整套AMD栈

iPhone和PS3证明了Hotz的能力。

但要撬动CUDA,光靠一个人不够,得有一套真东西,这就是tinygrad。它是Hotz主导的开源深度学习栈。

事实上,Hotz对「打破封闭系统」的执念,早就从消费电子延伸到了产业。2015年他创办自动驾驶公司comma.ai,几乎独自在车库里改装出一套能跑高速公路的自驾系统,对标的是特斯拉。

如今comma.ai仍在运营,它的开源驾驶模型openpilot,跑的正是tinygrad。

官方GitHub把它描述成一个端到端的系统:从张量库、自动微分、IR(中间表示)与编译器,到即时编译、图执行,再到训练所需的优化器和数据加载组件,一整套都在里面。

tinygrad官方GitHub仓库。Hotz主导的开源深度学习栈,支持CUDA、AMD、METAL等多个后端。https://github.com/tinygrad/tinygrad

这套系统的最大特点在于「极简」。

tinygrad已经支持CUDA、AMD、METAL、QCOM、WEBGPU等多个后端。别家适配一款新硬件,要啃一整套庞杂的指令集;tinygrad只要新硬件能跑通大约25种最基础的运算,加减乘除这一类,就能接入。

但Hotz真正投入的主战场,是AMD这条线。

据技术媒体Phoronix报道,2025年1月,tiny corp已经写出了自己的驱动、运行时、库和模拟器。当时这套AMD栈大约12000行代码,只差一个RDNA3 assembler(汇编器)就「完全自主」。

到了3月,Hotz在博客中宣布tiny corp已经有了一套从硬件到PyTorch层的完整AMD栈,唯一的例外是LLVM编译器框架。

他还补充道:开发者甚至不用学tinygrad的写法,照旧用熟悉的PyTorch代码就行,底层会自动换成这套AMD栈。

12000行还只是2025年1月那一版AMD栈的体量。tinygrad整个项目一直在长,到v0.13.0已是22853行,Hotz自己在2025年末给的数字是不含测试18935行。

但无论12000还是18000,放进行业坐标里都是惊人的对比。

一个能驱动GPU、能跑通训练的软件栈,对手动辄是几百万行。用Hotz的话说,tinygrad比它们小1000倍。

这意味着,CUDA的复杂度,并非建立在物理定律之上。它可以被一支小团队,用极简思路重写一遍,这正是Hotz笃信的事。

Tinybox,把一台算力机器摆上货架

如果故事到这里就结束,tinygrad还只是GitHub上的一个项目,但Hotz的野心不止于代码。

tiny corp正式在卖一台叫Tinybox的计算机。官网上挂着red、green、pro、exa几个型号,配置、价格、发货信息全都公开列出,下单付款后一周内发货。

tiny corp正式在售的tinybox。

Tinybox曾在MLPerf Training 4.0基准测试里,对标过价格高出约10倍的机器。据Hotz在2025年末的博客里透露,这条计算机销售线一年带来约200万美元营收,他拿这笔钱反过来养着整个tiny corp的研发。

同一篇博客里,Hotz还提到,他们和AMD签了一份合同,要用MI350X去跑Llama 405B的MLPerf训练,而这份合同的谈判过程,基本是在Twitter上公开进行的。

tiny corp把自己的使命写成一句话:commoditize the petaflop(把petaflop商品化)。

petaflop是算力单位,指每秒一千万亿次(10的15次方)浮点运算,是衡量超级计算机、AI算力的常用单位。

Hotz想要做的,是把每秒千万亿次浮点运算商品化,让所有人都能用上AI。

当算力可以像消费电子一样标价、下单、一周发货,「算力稀缺」的叙事,就可能要松动了。

一条新路线

Hotz故事的意义,不在于「一个黑客单挑英伟达、终结CUDA」这样的爆点。CUDA今天依然是绝大多数开发者的默认选项。

真正重要的,是Hotz赌的那个假设:AI软件栈的复杂度可以被压缩到极小。一旦它被证明成立,英伟达靠CUDA撑起的那部分估值,可能就得重算。

而这场赌局,也早已不是Hotz一个人的事。他在2025年末那篇《五年tinygrad》里写道:第一行代码提交于2020年10月,五年过去,公司现在有6个人,许多人已经投入了数年。

在Hotz看来,AMD的硬件问题不大,关键在软件。这是创业者的判断,不是AMD的官方表态。英伟达那16倍的市值溢价里,有多少是硬件,有多少是那堵正在被人一行行拆解的软件墙?

Hotz给自己的25万美元押注定了一个期限:五年后再回来看。

这笔赌注会被记成一个黑客的狂想,还是一条路线的起点,现在还没人知道。但算力护城河的厚度,已经有人开始用代码重新丈量了。

参考资料:

https://x.com/heyrimsha/status/2058870147964874796?s=20%20

https://geohot.github.io/blog/jekyll/update/2025/03/08/AMD-YOLO.html

https://tinygrad.org/%20https://github.com/tinygrad/tinygrad%20

https://www.phoronix.com/news/Tiny-Sovereign-Stack-AMD-Close

本文来自微信公众号“新智元”,作者:ASI启示录,36氪经授权发布。

来源:36氪

免责声明:含第三方意见,不构成财务建议

分享至
X
Telegram
WeChat
QQ
Link
推荐阅读

戴尔股价年内涨幅达 230%,Seeking Alpha 探讨估值是否过高

24 分钟前
戴尔股价年内涨幅达 230%,Seeking Alpha 探讨估值是否过高

博通与Ciena指引不及预期致科技股下挫,博通股价暴跌13%

29 分钟前
博通与Ciena指引不及预期致科技股下挫,博通股价暴跌13%

谷歌实验室推出实验性应用 Dreambeans,整合 Gmail 等数据生成个性化故事

32 分钟前
谷歌实验室推出实验性应用 Dreambeans,整合 Gmail 等数据生成个性化故事

苹果新版 Siri 或借助谷歌云端的 Nvidia Blackwell B200 GPU 运行

35 分钟前
苹果新版 Siri 或借助谷歌云端的 Nvidia Blackwell B200 GPU 运行

Anthropic Claude Mythos 技术预览版遭未授权访问,安全基础设施成 AI 防御关键

41 分钟前
Anthropic Claude Mythos 技术预览版遭未授权访问,安全基础设施成 AI 防御关键

英伟达开源 5500 亿参数 Nemotron 3 Ultra 模型,采用 Mamba-Transformer 混合 MoE 架构

46 分钟前
英伟达开源 5500 亿参数 Nemotron 3 Ultra 模型,采用 Mamba-Transformer 混合 MoE 架构

Snap 收购增强现实公司 Illumix 以强化 AR 技术布局

2 小时前
Snap 收购增强现实公司 Illumix 以强化 AR 技术布局