
人工智慧革命的引擎是什麼?算法,還是數據?5月20日,在國大120周年傑出講座上,英偉達首席科學家William Dally給出了一個出人意料的答案:硬體。
AI革命,只差一個「點火器」
在這場題為「通過計算創新塑造未來」的講座中,這位計算機科學界的泰斗向現場約180名國大師生、校友及公眾拋出了一個顛覆性觀點。他指出,深度學習的核心算法早在1980年代就已基本成型,而訓練AI所需的海量數據,到2010年前後也已不是難事。
萬事俱備,只欠東風。Dally博士形容,算法和數據就像空氣中瀰漫的燃料,一直在等待一個火花來引爆。這個火花,就是足夠強大的計算能力。
而最終點燃革命的,是一種最初為電子遊戲設計的晶片——圖形處理器(GPU)。正是Dally博士在並行計算和高性能互連領域的開創性工作,為這場硬體引爆的革命奠定了基石。
你可以把數據和算法想像成空氣中瀰漫的燃料,它們一直在等待一個火花來點燃自己,從而真正引爆這場人工智慧革命。 算力,暴增千萬倍的秘密
決定性的火花在2012年迸發。當時,里程碑式的AlexNet模型僅用兩塊英偉達GPU訓練,就取得了驚人成果。自此,訓練頂尖AI模型所需的算力,瘋狂增長了約1000萬倍。
需求倒逼創新。在同一時期,單個英偉達GPU的性能也提升了約5000倍。正如國大校長陳永財教授在開場致辭中所說,當模型越來越龐大,其背後的硬體基礎設施,已變得和模型本身的思想同樣重要。
陳校長進一步指出,前沿AI模型面臨著巨大的協調難題:如何讓成千上萬個處理器高效協同。他強調,Dally博士在高性能互連領域的貢獻,正是實現這種大規模系統協調的關鍵。
更少能耗,更多算力
如何用更少的能量做更多的事?Dally博士用一個生動的例子解釋了AI的能耗挑戰:當你問大語言模型「蘋果是水果嗎?」,它每生成一個詞,都要把整個模型的知識庫(可能包含數萬億參數)重新讀取一遍,計算量堪稱天文數字。
英偉達的工程師們想出了一招:給數據「減負」。計算機用比特串(0和1)表示數字,比特越多,精度越高,能耗也越大。考慮到AI模型對精度要求不像傳統計算那麼嚴苛,英偉達將GPU使用的比特數從32位一路降到16位、8位,乃至4位。每降一半,能效就能提升約四倍。
為了在不犧牲準確性的前提下繼續提升效率,一種名為「稀疏性」(sparsity)的技術應運而生。系統能自動識別並跳過無意義的「0」值計算,這相當於讓GPU在同樣能耗下,將有效工作量翻倍。自2020年的安培(Ampere)架構起,這項技術已成為英偉達GPU的標配。
硬體的下一站:協同作戰
單個GPU的性能已今非昔比,但面對頂尖AI模型的需求,仍是杯水車薪。如今,AI的訓練任務必須被分配到成千上萬個GPU上協同處理,這對晶片間的連接速度和可靠性提出了極高要求。
Dally博士介紹,英偉達的NVLink技術,能讓單個機櫃內的GPU以每秒約1.8TB的驚人速度交換數據,確保這支「算力大軍」能夠步調一致。
當然,他也強調,硬體的進步離不開軟體的匹配。計算領域的未來,終究是一個軟硬體協同進化的故事。
📌 要點總結
✦ AI革命的關鍵「點火器」是GPU,它為早已存在的算法和數據提供了引爆所需的強大算力。
✦ 自2012年以來,為滿足增長千萬倍的算力需求,英偉達通過降低數據精度、引入稀疏計算等技術,大幅提升了GPU的能效。
✦ 未來的AI發展依賴大規模GPU集群,而NVLink等高速互聯技術是確保上萬個處理器協同作戰的核心。
這場國大前沿講座,你愛了嗎?























