
人工智能革命的引擎是什么?算法,还是数据?5月20日,在国大120周年杰出讲座上,英伟达首席科学家William Dally给出了一个出人意料的答案:硬件。
AI革命,只差一个“点火器”
在这场题为“通过计算创新塑造未来”的讲座中,这位计算机科学界的泰斗向现场约180名国大师生、校友及公众抛出了一个颠覆性观点。他指出,深度学习的核心算法早在1980年代就已基本成型,而训练AI所需的海量数据,到2010年前后也已不是难事。
万事俱备,只欠东风。Dally博士形容,算法和数据就像空气中弥漫的燃料,一直在等待一个火花来引爆。这个火花,就是足够强大的计算能力。
而最终点燃革命的,是一种最初为电子游戏设计的芯片——图形处理器(GPU)。正是Dally博士在并行计算和高性能互连领域的开创性工作,为这场硬件引爆的革命奠定了基石。
你可以把数据和算法想象成空气中弥漫的燃料,它们一直在等待一个火花来点燃自己,从而真正引爆这场人工智能革命。 算力,暴增千万倍的秘密
决定性的火花在2012年迸发。当时,里程碑式的AlexNet模型仅用两块英伟达GPU训练,就取得了惊人成果。自此,训练顶尖AI模型所需的算力,疯狂增长了约1000万倍。
需求倒逼创新。在同一时期,单个英伟达GPU的性能也提升了约5000倍。正如国大校长陈永财教授在开场致辞中所说,当模型越来越庞大,其背后的硬件基础设施,已变得和模型本身的思想同样重要。
陈校长进一步指出,前沿AI模型面临着巨大的协调难题:如何让成千上万个处理器高效协同。他强调,Dally博士在高性能互连领域的贡献,正是实现这种大规模系统协调的关键。
更少能耗,更多算力
如何用更少的能量做更多的事?Dally博士用一个生动的例子解释了AI的能耗挑战:当你问大语言模型“苹果是水果吗?”,它每生成一个词,都要把整个模型的知识库(可能包含数万亿参数)重新读取一遍,计算量堪称天文数字。
英伟达的工程师们想出了一招:给数据“减负”。计算机用比特串(0和1)表示数字,比特越多,精度越高,能耗也越大。考虑到AI模型对精度要求不像传统计算那么严苛,英伟达将GPU使用的比特数从32位一路降到16位、8位,乃至4位。每降一半,能效就能提升约四倍。
为了在不牺牲准确性的前提下继续提升效率,一种名为“稀疏性”(sparsity)的技术应运而生。系统能自动识别并跳过无意义的“0”值计算,这相当于让GPU在同样能耗下,将有效工作量翻倍。自2020年的安培(Ampere)架构起,这项技术已成为英伟达GPU的标配。
硬件的下一站:协同作战
单个GPU的性能已今非昔比,但面对顶尖AI模型的需求,仍是杯水车薪。如今,AI的训练任务必须被分配到成千上万个GPU上协同处理,这对芯片间的连接速度和可靠性提出了极高要求。
Dally博士介绍,英伟达的NVLink技术,能让单个机柜内的GPU以每秒约1.8TB的惊人速度交换数据,确保这支“算力大军”能够步调一致。
当然,他也强调,硬件的进步离不开软件的匹配。计算领域的未来,终究是一个软硬件协同进化的故事。
📌 要点总结
✦ AI革命的关键“点火器”是GPU,它为早已存在的算法和数据提供了引爆所需的强大算力。
✦ 自2012年以来,为满足增长千万倍的算力需求,英伟达通过降低数据精度、引入稀疏计算等技术,大幅提升了GPU的能效。
✦ 未来的AI发展依赖大规模GPU集群,而NVLink等高速互联技术是确保上万个处理器协同作战的核心。
这场国大前沿讲座,你爱了吗?























