第 6 章

十分钟的决定：让 CUDA 免费

12 分钟阅读·5,442 字

选中任意文字即可高亮/记笔记

本章聚焦黄仁勋那个关键的、仅用十分钟做出的决定——把英伟达的并行计算平台 CUDA 向开发者开放并免费提供。正是这个抉择，让英伟达从游戏图形领域的领头羊，蜕变为人工智能革命的基石。本章梳理了这一决定如何推动 CUDA 在高校、初创公司和大企业中迅速普及，以及英伟达把整套 AI 软件栈免费送出的更宏大战略，如何让自家硬件变得不可或缺。章末则把黄仁勋那种不知疲倦、以执行为驱动的领导力，定格为英伟达崛起背后更深层的引擎。

黄仁勋大约只用十分钟就做出了让 CUDA 开放且免费的决定，扫除了可能限制普及的资金门槛。
把平台免费开放，使英伟达 GPU 成为深度学习和人工智能的默认选择，让整整一代 AI 工作都建立在英伟达硬件之上。
2012 年由英伟达 GPU 驱动的 AlexNet 在 ImageNet 上夺冠，验证了深度学习的实力，并加速了以英伟达为核心的 AI 热潮。
通过把 TensorRT、cuDNN、RAPIDS 等软件开源，英伟达既让自家硬件保持不可或缺，又把整个市场做大，而非陷入零和博弈。
战略之下，是黄仁勋以执行为驱动的文化，即所谓的“英伟达之道”：扁平的组织结构、超过 60 名直接下属、用白板而非幻灯片、以及“没有执行，再好的想法也一文不值”的信念。

有些商业决策需要数月的筹划、分析和无休止的辩论；另一些则在转瞬之间做出，影响却延续数十年。对英伟达联合创始人兼首席执行官黄仁勋来说，这样的时刻出现在他做出一个仅用十分钟的决定之际——这个决定最终把英伟达从一家领先的图形公司，转变为人工智能革命的中流砥柱。那个决定就是：把英伟达革命性的 AI 与 GPU 计算平台 CUDA，向开发者开放并免费提供。

在 21 世纪初，英伟达主要以在游戏图形领域的统治地位而闻名。GPU 几乎只被用来渲染电子游戏画面，尽管它们已被证明是强大的计算工具，却在很大程度上仍局限于娱乐世界。然而，黄仁勋和他的团队看到了另一种可能。他们相信 GPU 的用途远不止图形渲染；具体来说，它们可以驱动复杂的科学计算、深度学习模型和 AI 研究。

这促成了 CUDA（Compute Unified Device Architecture，统一计算设备架构）的诞生——一个并行计算平台和 API，让开发者能够调用 GPU 的庞大处理能力，去完成游戏之外的各种任务。这个平台具有开创性，但它面临一个关键挑战：普及。开发者真的会用它吗？在英伟达内部，领导团队就是否应当对使用 CUDA 收费展开了辩论。一些高管担心，把如此强大的工具免费送出，意味着会损失可观的收入。另一些人则认为，如果 CUDA 仍是一个专有、封闭的系统，它可能很难赢得广泛采用。他们担心，如果英伟达把平台锁死，开发者可能干脆无视它，转而寻找替代方案。

在一场利害攸关的会议上，讨论愈演愈烈。有的高管想收取授权费，有的想做订阅模式。各方提出论点，抛出反驳，表达顾虑。随后，在听完双方意见后，黄仁勋仅用十分钟便做出了决定。“去做，”他说，“免费提供。”凭这三个字，黄仁勋永远改变了英伟达的发展轨迹。通过让 CUDA 开放且易于获取，他确保了全世界的开发者、研究人员和 AI 科学家都能毫无资金门槛地使用英伟达的硬件。这个决定让英伟达的 GPU 成为深度学习和人工智能的首选平台。

CUDA 一旦免费开放，开发者便纷纷涌入。高校开始把它纳入 AI 研究，数据科学家用它来训练复杂的神经网络，企业也意识到自己可以借助英伟达 GPU 去做从自动驾驶汽车到药物研发的一切。通过降低准入门槛，黄仁勋实际上确保了整整一代 AI 先驱都会在英伟达的平台上构建自己的技术。

时机再好不过。2012 年，一个名为 AlexNet 的突破性 AI 模型，借助英伟达 GPU 赢得了 ImageNet 竞赛，证明深度学习能够胜过传统的机器学习方法。从那一刻起，AI 热潮加速涌来，而英伟达正处在这一切的中心。

时间快进到今天，英伟达的估值已超过万亿美元。从 OpenAI 到特斯拉，全世界的 AI 公司都依赖英伟达的技术。让 CUDA 免费的决定，不仅催生了一个繁荣的开发者生态，更巩固了英伟达在 AI 与高性能计算领域的统治地位。如果没有 CUDA 的广泛普及，AI 革命的走向也许会大不相同。回顾这一决定，黄仁勋后来说道：“有时候，取胜的最佳方式就是把东西送出去。只要你为创新搭好地基，人们自然会来。”这是一场豪赌，是一次冒险，但归根结底，它是一个改变一切的十分钟决定。

黄仁勋向来以能比别人更早看到未来而著称。他不只是顺应趋势，而是创造趋势。在一个专有技术常被像国家机密般严加看守的行业里，黄仁勋采取了截然不同的做法。他没有把英伟达的 AI 软件栈据为己有，而是决定免费送出——这一前所未有的举动，最终牢牢确立了英伟达在人工智能领域的统治地位。

在 AI 发展的早期，许多公司都专注于构建封闭的生态系统，让自己的软件保持专有，并限制他人接触自家技术。逻辑很简单：控制工具，就能控制市场。但黄仁勋看到了另一条路。他明白，要让 AI 充分发挥潜力，就需要大规模的协作。全世界的开发者、研究人员和工程师必须能够在已有成果之上继续构建，而不是从零开始。如果英伟达把自己的 AI 软件开源，就会开创一种新范式——在这种范式下，创新被加速，而英伟达成为 AI 的默认基础设施。

这个决定并非没有风险。当时，凭借支持 CUDA 的 GPU，英伟达已是 AI 硬件领域的领头羊。把 AI 软件免费开放，意味着竞争对手也能用上同样强大的工具。但黄仁勋并不担心传统意义上的竞争。他玩的不是零和游戏，而是要把整个赛场做大。通过送出软件，英伟达确保了自家硬件依旧不可或缺。毕竟，一套强大的 AI 软件套件如果在英伟达 GPU 上跑得最好，那它对谁最有利呢？

英伟达的 AI 软件栈包括用于深度学习推理的 TensorRTTensorRT英伟达 AI 软件栈中的一个框架，用于优化并加速深度学习推理。、用于神经网络加速的 cuDNNcuDNN英伟达 AI 软件栈中的一个库，用于加速神经网络计算。，以及用于数据科学的 RAPIDSRAPIDS英伟达软件栈中的一套开源软件库，旨在加速 GPU 上的数据科学工作负载。。这些工具大幅缩短了 AI 模型训练和部署所需的时间。通过把它们开源，黄仁勋确保了全世界的开发者会把自己的 AI 工作负载标准化到英伟达的平台之上。这是一项着眼长远的战略，目标是让英伟达在 AI 生态系统中变得不可或缺。

这个决定带来的最大影响之一，就是加速了 AI 创新。研究人员再也不必为能否用上昂贵的专有软件而发愁。初创公司无需巨额的前期投入就能借助英伟达的技术，从而把精力放在突破本身、而非基础设施上。高校和研究机构也开始用英伟达的软件栈来培养下一代 AI 工程师，进一步把这家公司钉在了 AI 革命的核心位置。

这一战略还帮助英伟达与各行各业的公司建立了深厚关系。AI 已不再只关乎学术界或初创公司，而是被融入从医疗、金融到自动驾驶汽车的方方面面。英伟达的软件成为大企业 AI 研究的支柱，包括做自动驾驶汽车的特斯拉、做云端 AI 的谷歌，以及为 ChatGPT 这类模型服务的 OpenAI。就连 AMD、英特尔这样的竞争对手也不得不采用英伟达的标准，原因很简单：这个生态系统强大到无法忽视。

等到 AI 在 2020 年代真正爆发时，英伟达早已领先数年。把 AI 软件栈开源的举动，不仅让强大的 AI 工具实现了普及，也确保了英伟达的硬件依旧是高性能计算的黄金标准。黄仁勋非但不惧怕被模仿，反而欣然接受，因为他知道，英伟达软件被广泛采用，意味着对其 GPU 的需求会更加旺盛。黄仁勋免费送出英伟达 AI 软件的决定，并非单纯出于慷慨；这是一招经过精心计算、重塑了整个行业的棋。它确保了英伟达将处在 AI 演进的中心——不仅是作为硬件供应商，更是作为生态系统的构建者。当其他公司还在追逐短期利益时，黄仁勋打的是长远的牌，并由此为英伟达赢得了未来数十年作为人工智能基石的地位。

黄仁勋从来不做半途而废的事。如果说有一种品质比其他任何品质都更能定义他在英伟达的领导力，那就是他对执行近乎偏执的专注。在硅谷，点子多如牛毛，但正是执行，把真正具有变革意义的公司，与那些始终停留在“潜力”阶段的公司区分开来。对黄仁勋而言，执行不仅意味着把事情做完，更意味着在正确的时间、用正确的人、以正确的方式把事情做对。他的理念简单却深刻：没有执行，再好的想法也一文不值。

从英伟达创立之初，黄仁勋就明白，伟大的想法是必要的，却远远不够。真正重要的是把这些想法转化为实实在在的产品、服务和市场统治力的能力。他对执行的严苛纪律并非后天习得，而是他本性中固有的东西。早年作为一名工程师，在美国超威半导体公司（AMD）和 LSI Logic 一路打拼时，黄仁勋震惊地发现，有那么多前途光明的项目，竟因缺乏纪律和贯彻到底的能力而失败。他注意到，许多工程师尽管才华横溢，却满足于概念上的精彩，而非实际的落地实现。这一发现塑造了他的理念：卓越不只关乎智力，更关乎不懈的坚持、迭代与交付。

1993 年，当他与柯蒂斯·普里姆、克里斯·马拉乔斯基共同创办英伟达时，公司没有任何失败的余地。他们要对抗的是英特尔这样的巨头——后者拥有海量资源、深厚的行业人脉，以及把任何初创公司烧到破产的财力。英伟达唯一的优势就是速度和执行。如果他们不能率先把创新推向市场，就将无足轻重。

黄仁勋的领导造就了后来被称为“英伟达之道”的东西——一种以极致的责任担当和绝不容忍低效为核心的精神气质。英伟达的文化不允许出现那种困扰大公司的迟缓、官僚的决策流程。相反，黄仁勋建立了一种扁平的组织结构，让最好的想法能够迅速脱颖而出，让执行无需层层审批就能启动。他最激进的做法之一，体现在对直接下属和一对一会议的态度上——更确切地说，是对后者的摒弃。与那些只保留少数直接下属、依赖层层管理逐级传递的传统 CEO 不同，黄仁勋选择拥有超过 60 名直接下属。原因就在于速度。他想第一手获取信息，即时做出决策，确保没有多余的官僚环节拖慢英伟达的脚步。

此外，英伟达的会议是围绕白板演绎和实时解决问题来组织的，而不是冗长的 PowerPoint 演示。想法被要求当场画出来、当场辩论，逼着员工随机应变、向执行推进，而不是迷失在纸上谈兵的讨论里。白板成了英伟达文化的象征：一切都可以迭代、打磨，必要时还可以擦掉重来。这里容不下半点自满。

英伟达以执行为驱动的文化，最鲜明的例子之一便是 GeForce 256 的研发——这是世界上第一款图形处理器（GPU）。当 GPU 的概念最初被提出时，英伟达还是一家苦苦挣扎、试图在被财力更雄厚的对手主导的领域中立足的年轻公司。大多数公司可能要花上数年才能开发出这项技术并推向市场，但黄仁勋拒绝让英伟达落入那样的陷阱。相反，他设定了激进的时间表，把团队逼到他们自以为不可能达到的极限之外。

打造尖端图形芯片的第一次尝试——NV1——曾以失败告终。这是黄仁勋永远铭记的一课。面对重大失败，英伟达没有退缩或放慢脚步，反而在执行上加倍发力，确保每一个错误都被当作学习的机会，而非倒退的借口。黄仁勋推行每周一次的执行评审，要求工程师们如实汇报取得了哪些进展、遇到了哪些障碍、又是如何应对的。这里容不下任何借口：要么有进展，要么没有。正是这种对执行近乎偏执的专注，让英伟达得以在 1999 年推出 GeForce 256，彻底革新了图形行业，并把英伟达牢牢钉在市场领导者的位置上。

黄仁勋关于执行的理念，并不适合胆小的人。他对员工的要求比大多数领导者都高——并非因为他想严苛待人，而是因为他相信真正的卓越需要耐受力。他的箴言很明确：卓越，就是承受痛苦的能力。对黄仁勋来说，执行不是更卖力地干活，而是更聪明、更快速地干活。英伟达的工程师们常常回忆，黄仁勋会不打招呼就出现在他们的工位旁，提出刁钻的问题，并期待立刻得到深思熟虑的回答。如果一个问题已被发现却尚未解决，他就要求对方拿出清晰的行动计划来攻克它。“如果你说不出打算怎么解决，”他常说，“那就说明你还没把这个问题想透。”

当英伟达在 2010 年代踏上 AI 革命之路时，这种对执行的执着专注变得愈发关键。黄仁勋远在行业大多数人之前，就预见了 GPU 在人工智能中的角色，但仅有远见还不够。英伟达必须比任何人都执行得更快；他们得在世界意识到自己需要 AI 计算生态系统之前，就把它建起来。

黄仁勋的执行理念也是有代价的。英伟达不是一个轻松的工作场所。如此高强度的期望，意味着那些没准备好拿出最佳状态的人很快就会发现自己格格不入。人员流动率很高，员工要么在高压下脱颖而出，要么被燃尽淘汰。但那些留下来并拥抱“英伟达之道”的人，往往会发现自己脱胎换骨。黄仁勋的方式孕育出一种精英文化——在这里，工程、AI 和计算领域最杰出的头脑齐聚一堂，共同拓展可能的边界。一位英伟达高管说得最为贴切：“跟黄仁勋共事，就像跟着奥运教练训练。过程折磨人，但只要你挺过来，出来时就是世界级水准。”

随着英伟达把统治版图从游戏拓展到 AI，黄仁勋关于执行的原则始终未变。当别的公司还在争论 AI 计算的未来时，英伟达已经在把它建出来。他们开发了 CUDA——那个成为深度学习基石的并行计算平台。他们打造 AI 超级计算机，投资自动驾驶汽车技术，并向数据中心、机器人和医疗 AI 拓展。一路走来，执行始终是决定性的区别所在。当黄仁勋看到 AI 即将爆发时，英伟达不只是投资 AI 芯片，而是构建了一整套 AI 计算生态系统——从硬件到软件，再到研究协作。这正是黄仁勋理念的精髓：任何人都能预测趋势，但只有极少数人能执行得足够快，从而主宰这些趋势。

如今，英伟达是全世界最有价值的科技公司之一，而它的崛起可以直接追溯到黄仁勋那种不知疲倦、以执行为驱动的领导力。对黄仁勋而言，成功的关键不在于拥有最好的点子，而在于比任何人都执行得更好、更快、更精准。他对执行毫不妥协的坚持，把英伟达从一家苦苦挣扎的初创公司，变成了一家改变世界的科技巨头。而对于那些想追随他脚步的人，他只有一个简单的教诲：没有执行，再好的想法也一文不值。把你做出来的东西拿给我看。

检验一下

本章共 3 道题