“AI军火商”英伟达是如何炼成的

news/2024/10/3 17:10:58/文章来源:中华网

“AI军火商”英伟达是如何炼成的

我渴望活下去的意志，超过几乎所有人想要杀死我的意志。——黄仁勋

“这不是演唱会，你们是来参加开发者大会的！”今日凌晨4点，黄仁勋出场时，现场爆发出巨大的欢呼声

当地时间2024年3月18日，黄仁勋在英伟达GTC大会发表主题演讲。

“通用计算已经失去动力，现在我们需要更大的模型，我们需要更大的GPU，更需要将GPU堆叠在一起”，黄仁勋在英伟达 GTC 大会上说道。大模型参数量正在呈指数级增长，此前 OpenAI 最大的模型已经有 1.8T 参数，需要吞吐数十亿 token。即使是一块 PetaFLOP 级的 GPU，训练这样大的模型也需要 1000 年才能完成。“AI军火商”英伟达是如何炼成的？

全球的科技公司争抢H100芯片的势头于2023年年末开始有所减弱，但新一代“强心剂”已来。英伟达推出新一代的AI芯片“Blackwell”，“这是块非常非常大的GPU”。英伟达在发布会上表示，相较于之前的 H100 芯片，GB200 超级芯片可以为大语言模型（LLM）推理负载提供 30 倍的性能提升，并将成本和能耗降低 25 倍。

Blackwell的发布意味着，近8年来，AI算力增长了一千倍

人们已经发现：将深度学习应用到许多领域的科技公司，几乎每一个都是在英伟达的平台上构建的。一位华尔街分析师对此表示：“人工智能领域正在进行一场战争，而英伟达是唯一的军火商”。华尔街的追捧在2023年-2024之间上升到极致。短短八九个月，英伟达的市值从万亿美元飙升到两万亿美元。目前，英伟达已经成为全球市值第三大的公司，仅次于微软和苹果。“AI军火商”英伟达是如何炼成的？

不过，这家看似新锐的科技公司，已经走过了30年历程，几经浮沉。

目前，英伟达的产品仍然处于供不应求状态。在此背景下，英伟达毛利率拉至60%左右。在连年寻找新技术突破的大额支出之下，任何一家科技公司，想要保持这样的成绩单，都是难能可贵的。

GPU，英伟达的代名词

故事要从20世纪90年代说起。

当时，硅谷已有人提出，可以通过声卡、网卡这些功能指定的芯片，来降低 CPU（中央处理器）的工作负载。所以同理，做一张专门控制电脑图像输出的芯片，即显卡（Graphic Card），也是自然而然的。例如索尼在 1994 年年底推出的游戏机 PlayStation 就运用了显卡。

但显卡的技术路径，在当时有很多，英伟达找到的切入点是通过并行计算，实现3D图形加速，特别在游戏领域上进行应用。

1999年，英伟达推出了一款名为GeForce的显卡。

这款被冠以“全球首款GPU”的图形处理器，采用了220纳米制造工艺，如今英伟达H100所使用的制造工艺已到了4纳米。

GeForce最大的亮点是“并行计算”，即把一个复杂的任务拆分成小计算，然后同时处理它们。这与中央处理器 CPU（central processing unit）有着显著不同，在标准的计算机架构中，CPU 一次能处理一个问题。如果说把通用的CPU比作一辆货车，一次运送一个大包裹到一个目的地；那么GeForce则像是在一组摩托车车队，可以同时运送多个小包裹到多个目的地。

彼时，研究GPU的公司，不只英伟达一家，但英伟达成功做到了将自己与“GPU发明者”这个标签深度绑定。

当时，英伟达市场营销负责人 Dan Vivoli 用 “graphics processing unit”（图形处理器）的概念来推广自家的芯片。相比英特尔靠 CPU 来叱咤芯片市场，英伟达需要营销 GPU 来为自己杀出一条血路。只是 Dan Vivoli 认为，英伟达强调自己的 GPU 发明者的身份后，“我们能成为行业领导者”，他完全没有想到，GPU将在很长一段时间内成为英伟达的代名词，并且在十多年后，成功掀起人工智能行业的风暴。

英伟达死磕“晦涩角落”

时间回到1999年，GeForce显卡很受市场欢迎。当时有一款名为Quake的视频游戏，就是应用这款显卡通过并行计算渲染画面——用榴弹射击怪物。PC玩家为了赢得游戏，升级时都会购买新的GeForce显卡。

后来，英伟达启动超级计算平台CUDA的开发。黄仁勋希望，CUDA 能在每一张 GeForce 显卡运行。CUDA 最终于 2006 年发布，但在当时，英伟达完全没有打动世界，“人们仿佛完全不需要它”，反而因为打造领先于时代的“超级计算”系统，英伟达的利润受到大幅削减，华尔街为此嘘声一片。

一档风靡硅谷的热门播客《Acquired》的主持人 Ben Gilbert 对此评价：“他们当时瞄准的不是一个大市场，而是一个学术和科学计算的晦涩角落，但他们为此花了数十亿美元”。

到2008年底，叠加金融危机影响，英伟达股价已下跌7成。

来自外界的声音并未太过影响黄仁勋。刚转学到美国时，黄仁勋进入了一所“特殊学校”，“每个学生都抽烟，我觉得我是学校里唯一没有口袋刀的男孩”，校园霸凌也很普遍，黄仁勋每天都会被叫做中国佬。这段经历教会了黄仁勋在复杂、多变环境中如何寻求资源、“存活”下来：“没有心理辅导员可以倾诉，你只能变得坚强，然后继续前行”。彼时，黄仁勋通过教数学、带着同学们树林探险等方式跟当地的同学打成了一片。

况且，黄仁勋仍然对 CUDA 充满信心。他曾分享了这样一段故事：台湾大学物理教授 Ting-Wai Chiu 的办公室地板上，堆满了 GeForce 盒子，办公室开着普通风扇对其进行冷却——Ting-Wai Chiu 为了模拟大爆炸后物质的演化，依靠 GeForce 和 CUDA，建立了一个自制的超级计算机。

但是，像 Ting-Wai Chiu 这样的人并不是大多数，CUDA 的下载量在 2009 年达到峰值后，连续三年下降。董事会担心英伟达持续低迷的股价，会给激进的股东分裂公司的机会。

那么，推广CUDA成为眼下必须做的事。

英伟达首先选择了高校路线——从全球顶级研究机构和大学合作，用CUDA赋能科研，“从下一代进行普及和培养”。时至今日，在硅谷的普通聚会上，你能发现：许多刚毕业于美国高校、供职于大型科技公司的工程师们都学过CUDA。

此外，英伟达还尝试在各行各业中寻找CUDA的应用场景，他们尝试在股票交易、石油勘探、分子生物等领域有所作为。甚至为推广 CUDA，英伟达还与通用磨坊（General Mills）签订协议，模拟冷冻披萨的热物理学过程。

不过，英伟达并未在人工智能领域考虑太多，当时似乎市场需求不大。

游戏显卡商成AI军火商

那么问题来了，为什么负责提升游戏画质的显卡，会突然成为AI行业的重要基础硬件？要知道，直到2022财年，游戏都是英伟达无可置疑的第一大业务。

我们依然要将故事时间回拨，回到二十一世纪初。彼时，人工智能还是一个边缘学科。该学科在图像识别和语音识别方面有所进展，但也时断时续。

在当时，“神经网络”（一种受人脑结构启发来解决问题的计算结构）普遍被认为是过时的、不起作用的。但仍有一些研究团队在这一领域尝试，多伦多大学的教授 Geoffrey Hinton 就是其中之一。

2009年，Hinton的团队利用英伟达的CUDA平台训练了一个神经网络模型，用来识别人类语音，结果出奇的好。他在同年晚些的一次会议上展示了这些成果，然后Hinton发了一封邮件联系英伟达，“看，我刚刚告诉一千名机器学习研究人员他们应该去买英伟达的卡。你们能免费给我寄一张吗？”，英伟达的回答是“不行”。

不过即便没有要到免费的显卡，Hinton 还是鼓励学生使用 CUDA。2012 年，他的学生 Alex Krizhevsky 和 Ilya Sutskever（后者是 OpenAI 的创始人之一），开始在英伟达的 CUDA 平台上训练一个视觉识别神经网络。因为预算有限，他们只在亚马逊上买了两张 GeForce 卡。短短一周，Alex 就向其投喂了数百万张图像。“他的卧室里两个 GPU 飞速运转”，Hinton 说，“实际上，他父母支付了相当可观的电费”。

Krizhevsky和Sutskever对这些显卡的能力感到吃惊。在同年早些时候，谷歌的研究人员训练了一个识别猫视频的神经网络，这需要大约一万六千个CPU。Krizhevsky 和 Sutskever 只用了两张 GeForce 卡就取得了世界级的成果。Sutskever 对此表示：“GPU 的出现，就像奇迹”。

Krizhevsky和Sutskever将他们训练出的神经网络命名为AlexNet。这一模型在年度ImageNet视觉识别竞赛中大放异彩，以至于比赛组织方怀疑是否存在作弊行为。

这是一个伟大时刻，范式转变了。Krizhevsky在其对AlexNet架构的9页描述中指出：与CPU比，专用的GPU可以将神经网络的训练速度提高100倍。

至此，黄仁勋完全调转了公司方向。2023年的一篇文章透露，他在一个周五晚上发送邮件，称“一切都将转向深度学习，我们不再是一家图形公司”，到下周一早上，英伟达已经成了一家名副其实的人工智能公司。

与此同时，黄仁勋找到英伟达最优秀的AI研究员Catanzaro，让其想象现在英伟达的八千员工全数在停车场，Catanzaro可以挑任何人加入自己的团队。

后来，人工智能领域开始涌入风投资金。人们很快发现：将深度学习应用到许多领域的初创公司，几乎每一个都是在英伟达的平台上构建的。

2016年，英伟达向OpenAI的一个研究小组交付了第一台专用的人工智能超级计算机DGX-1。黄仁勋本人亲自将这台计算机送到了OpenAI的办公室，当时的董事长埃隆·马斯克用开箱刀打开了包裹。

英伟达向OpenAI交付了第一台专用的人工智能超级计算机。

而后，OpenAI 通过英伟达的超级计算机训练出了风靡全球的 ChatGPT。英伟达后续更新的硬件产品 DGX H100 遭到市场疯抢，供不应求。

从芯片供应商到平台供应商

今天凌晨的这场发布会上，黄仁勋还有一句话值得留意：“Blackwell不仅是一款芯片，也是一个平台的名称。”

如何理解平台这个词？类似于之前Geforce显卡和CUDA超级计算平台的搭配，英伟达在此次推出的也是一整个打包方案，英伟达逐渐转型成类似微软或苹果的平台提供商，其他公司可以在这个平台上构建软件。

黄仁勋在发布会上，用了相当多的时间，介绍了英伟达提供的若干个企业级生成式AI微服务，并表示“公司们可以借助这些服务制作应用程序，而且拥有其知识产权的完全所有权和控制权”。

而英伟达从芯片供应商转向平台供应商的背后，其实和英伟达的竞争对手有关，甚至许多旧日客户也变成了对手。“AI军火商”英伟达是如何炼成的？

首先，一些人工智能平台如微软、谷歌、Meta等，出于规模和成本的考虑，正在考虑自己开发芯片。例如谷歌研发的TPU已经更新到第五代，这款芯片为机器学习量身定制，其推理性能提升2.5倍，成本降低50%。

再比如微软于 2013 年 11 月推出两款芯片（Azure Maia 100 人工智能加速器和 Azure Cobalt 100 中央处理器），针对人工智能、生成式人工智能和云计算进行了优化，将在人工智能图形处理部分与英伟达直接竞争。

而这些公司，正是英伟达一直以来的主要GPU芯片客户。

其次，一些英伟达的老对手也在发力AI芯片。AMD于2023年12月，推出AI芯片MI300X，正式与英伟达叫板。与英伟达的H100相比，这款芯片在多个维度有1.3倍甚至2倍的数据提升，Meta、微软、甲骨文等公司也已下单。

除了老对手外，由于美国政府的技术出口禁令，促使中国在人工智能芯片方面走向自力更生，华为已成为英伟达又一个值得注意的对手。在英伟达最新的年报里，这样描述了它眼中的竞争对手。

眼下，黄仁勋已经成为硅谷任职时间最长的CEO之一，30岁创立英伟达，30年创业历程，他要么为“食物”奔走，要么想办法不被吃掉。

他也不知道自己还能再干多久。黄仁勋选择用一个戏谑的笑话结束了这个问题：

“可能30年后，我变成了机器人，那我还能继续30年”。“AI军火商”英伟达是如何炼成的？

责任编辑：卢其龙 CN070

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rllx.cn/Lemj/5819.gov.cn

如若内容造成侵权/违法违规/事实不符，请联系一条长河网进行投诉反馈邮箱:809451989@qq.com，一经查实，立即删除！

“AI军火商”英伟达是如何炼成的

相关文章

博主：张子宇入选U18女篮集训名单年仅16岁身高已超姚明

惠英红刘浩存隔代亲，一段彼此温暖救赎的隔辈“双向奔赴”即将动人上演

东风公司东风院名誉董事长吕卫东被查

陕西安康：徐家沟现云海景观

初中生遇害案班主任：他们4人关系很好，不存在霸凌

网红韩安冉入住杭州2000万大平层现任老公开心出镜

最新全球流量Top50出炉，AI应用大洗牌近半数产品掉队！

春分将至，“吃3菜添安康”，分别指哪3菜？

中国大级别第一人刘策远征日本挑战K-1金腰带！

“春分一碗汤，不劳郎中帮”，春分“一碗汤”指啥汤？

瑞幸咖啡线下点单存价差记者实测：一杯差价超5元

山东济宁，出警后消防员席地而坐大口干饭

县以下恢复“政社合一”体制现实吗？

国足艾克森晒身穿国足球衣照：我回来了

轮流扫厕所，不住别墅租房……“不炫富”的金融圈，快被自己穷笑了

黄金该咋买？专家：买黄金该出手时就出手

国产伟哥2023年销售近13亿被曝毛利率高达91.76%

韩剧又出爆款！“都教授”演豪门赘婿，看完我想说：这剧真上头

员工在500人工作群骂老总畜生，被判群内道歉赔偿1000元

刘亦菲时尚芭莎封面造型和周冬雨撞了，这算不算时尚事故