獨孤求敗,金庸《神雕俠侶》小說中的經(jīng)典人物,其墓前刻曰,縱橫江湖三十馀載,殺盡仇寇,敗盡英雄,天下更無敵手,無可奈何,惟隱居深谷,以雕為友。 嗚呼!生平求一敵手而不可得,誠寂寥難堪也。
而在大洋彼岸的美國,1993年成立的英偉達也是通過三十年時間,成了AI芯片領(lǐng)域的獨孤求敗。
(資料圖片)
美股5月25日,英偉達股價飆升,截止收盤英偉達漲24.37%,市值創(chuàng)下歷史新高。截至當(dāng)天美股收盤,英偉達市值上漲超過1800億美元,目前市值為9393億美元,——僅僅是這增長的部分就已經(jīng)大約相當(dāng)于1個AMD(1938億美元市值)、1.5個英特爾(1143億美元市值)。
至于原因,無它,需求大增爾。英偉達Q2的業(yè)績指引成為該公司有史以來最高的季度營收,超過華爾街預(yù)期的53.2%。其中數(shù)據(jù)中心營收創(chuàng)下歷史新高,英偉達將此歸因于GPU,由于云計算平臺與大型科技公司競相部署AI芯片,GPU需求水漲船高。
掌門人黃仁勛獨創(chuàng)黃氏定律,奠定顯卡江湖地位
正如羅馬不是一天建成的一般,英偉達的江湖地位自然也不是憑空得來,那么英偉達是如何取得現(xiàn)在的地位呢?
要回答這個問題,黃仁勛是繞不開的核心人物。
黃仁勛,祖籍浙江,1963年出生于臺灣。9 歲時,他和哥哥被父母送到了美國;16歲就考上了俄勒岡州立大學(xué)學(xué)習(xí)電子工程。隨后他在斯坦福取得了碩士學(xué)位。畢業(yè)之后,黃仁勛先后在AMD以及LSI Logic工作過,并取得了豐富的技術(shù)經(jīng)驗。
1993年,到了而立之年的黃仁勛因?qū)ζ拮拥某兄Z,成立英偉達。兩年后便推出了第一款產(chǎn)品nv1,雖然nv1集成了很多功能,但工程師們經(jīng)常會犯的一個毛病是:做出一些宏大的設(shè)計,引起技術(shù)圈的陣陣驚嘆,但未必能讓市場掏錢——“NV1”正是這樣一出驕傲的悲情劇。
之后黃仁勛看準了圖形顯示芯片賽道,并堅信終有一天PC會成為享受游戲和多媒體的消費級設(shè)備(在當(dāng)時PC主要作為生產(chǎn)力設(shè)備而非消費級設(shè)備)。
時間到了1999年,這一年對英偉達是極其特殊的一年。在這一年英偉達不僅成功上市,到了八月份英偉達發(fā)布了全球首款GPU(Graphics Processing Unit,即“圖形處理器”)——那款極具里程碑意義的GeForce256。
GeForce256的出現(xiàn),直接改變了業(yè)內(nèi)的競爭格局。因為之前用高端CPU+顯卡才能完成的工作,如今只需用便宜點的CPU+GeForce256便能完成,而且流暢度還更好。
花更少的錢辦同樣的事,還更具效率,這么具有革命性的事情,就這樣被英偉達做到了。得益于這番優(yōu)異表現(xiàn),2000年三月份,英偉達成功拿到了微軟首款XBOX游戲機的圖形處理器訂單。
但誰知道這時候的英偉達飄了,給的報價太高兩者鬧翻了,微軟轉(zhuǎn)身就把訂單送給了對頭ATI,直接讓英偉達的股價狂跌到2.64美元。
通過這件事,黃仁勛意識到必須打造自己的差異化競爭優(yōu)勢。在2000年英偉達推出了黃氏定律,即業(yè)界的摩爾定律是每18個月推出新品,性能翻一番;而英偉達會投入三倍人力做同一件事,6個月就推出新品。用速度搶生意。
英偉達通過這一戰(zhàn)略逐漸把AMD的市場占有率壓縮在了20%以下,一舉坐穩(wěn)了顯卡之王的位置。
無心插柳柳成蔭,GPU成了AI天生的鏟子
如果說英偉達坐穩(wěn)顯卡地位靠的是卷死同行的黃氏定律,那么成為AI芯片的霸主則多多少少有運氣的成分和時代的垂青。
其實很多經(jīng)典的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)早在20世紀下半葉就已經(jīng)被提出,但因為缺乏訓(xùn)練它們的計算硬件,很多研究只能“紙上談兵”,發(fā)展長期停滯。
GPU誕生之初也想不到自己會同AI的算力需求如此契合。打從一開始,GPU就不是為訓(xùn)練神經(jīng)網(wǎng)絡(luò)所生,而是圖像。更具體點說,是為了將CPU從圖像顯示的苦力活中解放出來而生。
轉(zhuǎn)折點出現(xiàn)了在2012年。這一年,全球人工智能和機器學(xué)習(xí)權(quán)威、華人科學(xué)家吳恩達領(lǐng)銜谷歌大腦,從1000萬張圖片中,成功識別出一只貓,震驚業(yè)界。
但這個結(jié)果背后是耗資100萬美元,集結(jié)1000臺電腦、16000個CPU的投入,這使他不得不思考有沒有一種更快、更省錢的方法?
他想到了英偉達(NVIDIA)。四年前,他首開先河,用英偉達的圖形處理芯片(GPU)代替英特爾的CPU,構(gòu)建了一個深度學(xué)習(xí)模型。這一次,他想再賭一把。結(jié)果出乎意料,他只用16臺電腦、64個GPU就搞定了同樣的事情。
這個足以讓吳恩達感到興奮的結(jié)果,也將GPU推上了關(guān)注的焦點。之后,深度學(xué)習(xí)大神Hinton及其弟子帶著卷積神經(jīng)網(wǎng)絡(luò)AlexNet又擊敗了谷歌貓。而這個需要1400萬張圖片、總計262千萬億次浮點運算訓(xùn)練的神經(jīng)網(wǎng)絡(luò),一個星期的訓(xùn)練過程中僅用了四顆英偉達Geforce GTX 580。
這徹底震驚了業(yè)界,也奠定了英偉達GPU在AI深度學(xué)習(xí)領(lǐng)域的霸主地位。
AI深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)選擇了GPU
那么為什么GPU比CPU更適合AI深度學(xué)習(xí)訓(xùn)練呢?
這是因為深度學(xué)習(xí)的訓(xùn)練過程是對每個輸入值根據(jù)神經(jīng)網(wǎng)絡(luò)每層的函數(shù)和參數(shù)進行分層運算,最終得到一個輸出值,跟圖形渲染一樣都需要大量的矩陣運算——這恰巧就是GPU最擅長的東西。
CPU 通常有 4 個、8 個或 16 個強力 ALU 核心(arithmetic logic unit,算術(shù)邏輯單元),適合做復(fù)雜的通用串行任務(wù)。GPU 是圖形計算的重要元件,主要用來處理與圖形圖像相關(guān)的數(shù)據(jù);與CPU 不同的是,GPU 有數(shù)百甚至數(shù)千個簡單 ALU 核心,單個 ALU 處理能力相比 CPU 的更弱,但能夠?qū)崿F(xiàn)多個 ALU 并行計算,適合做簡單特定的并行任務(wù)。
因此,對于復(fù)雜的單個計算任務(wù)來說,CPU 的執(zhí)行效率更高,通用性更強;而對于圖形圖像這種矩陣式多像素點的簡單計算,更適合用 GPU 來處理,但通用性較弱。
打個比方,訓(xùn)練神經(jīng)網(wǎng)絡(luò)就相當(dāng)于調(diào)黑盒子上的旋鈕,調(diào)旋鈕是通過數(shù)學(xué)的算法調(diào)的,這些旋鈕動輒幾十億個,需要大量的計算。
傳統(tǒng)電腦用的是CPU,用CPU去調(diào)旋鈕相當(dāng)于調(diào)完第一個再調(diào)第二個,一個一個按順序來,雖然CPU速度很快,但神經(jīng)網(wǎng)絡(luò)的旋鈕實在太多了,連CPU都招架不住了,這時候GPU的優(yōu)勢就出現(xiàn)了。
GPU和CPU不一樣的地方是它一次可以同時調(diào)成千上萬個旋鈕,原來CPU幾年才能調(diào)完的活GPU幾天就干完了。
如果將CPU比作保時捷,GPU就是巨無霸卡車。前者雖然在速度上秒殺,后者卻能輕松裝載幾十噸貨物。這種巨大的差別,令GPU原本令人詬病的散熱問題也顯得不值一提。
今年震動全球科技界的ChatGPT,就是依靠了超過萬枚的英偉達高端GPU——單枚售價超過1萬美元的A100/H100高性能芯片,所構(gòu)建的史上規(guī)模最大的AI算力集群。
英偉達的A100有多強勁,在2003年的科幻電影 《終結(jié)者3》里,那個差點毀滅人類的超級計算機“天網(wǎng)”,算力為60 TFLOPS(也就是每秒6萬億次浮點計算),今天英偉達最先進的數(shù)據(jù)中心GPU H100,在特定精度下,算力已經(jīng)達到了67 TFLOPS。
機會永遠是留給有準備的人的
其實做GPU芯片的也不是英偉達一家,那么為什么當(dāng)AI餡餅砸來時,英偉達能吃到最大的那一口呢?
原因其實很簡單,機會往往是留給有準備的人的。
就像大家很容易遺忘在iPhone發(fā)布前,蘋果已經(jīng)在電腦上做了十幾年操作系統(tǒng)一樣,AI芯片公司們也在忘記英偉達是一家顯卡供應(yīng)商的同時,它還一直在不斷打磨另一個殺器——CUDA。
除了GPU芯片設(shè)計能力,英偉達最寶貴的財富,是基于CUDA模型,孵化了大量的開發(fā)者和軟件生態(tài)。
這就如Android和iOS一樣,遇到挑戰(zhàn)者根本不怕,因為即便后來系統(tǒng)做得再好,但是沒有生態(tài)也是白搭。
英偉達發(fā)布CUDA后,先后推出居里、特斯拉、費米、開普勒、麥克斯韋、帕斯卡、伏特、圖靈、安培、赫柏等一些列架構(gòu),用以支撐Graphics和Computing這兩大場景。
做生態(tài)系統(tǒng),逐步解決GPU與AI場景不匹配的問題,包括功耗、內(nèi)存、帶寬瓶頸等等。
這就是為什么,同樣做芯片,英偉達的市值是英特爾的好幾倍,這背后的邏輯是游戲、加密貨幣、云計算以及AI大模型,都離不開它的產(chǎn)品。
形勢一片大好,英偉達仍有隱憂
現(xiàn)在的英偉達就仿佛是第一個爬到山頂?shù)娜?,放眼望去,幾無對手。但就此說英偉達已經(jīng)高枕無憂還為時尚早。
首先是競爭對手們正在奮起直追,每一個暴利行業(yè)都會引來一群嗜血的鯊魚,GPU行業(yè)自然也不例外。
在2022年的投資者會議上,英特爾首次公布了自研超算卡Ponte Vecchio(還沒有大規(guī)模商用)的性能參數(shù)。按照英特爾官方說法,該產(chǎn)品的性能領(lǐng)先英偉達的王牌產(chǎn)品7nm 安培卡皇A 100至少160%,被不少媒體冠以“芯片怪獸”的稱號。
即便相對冷靜克制的AMD和不在戰(zhàn)場中心的高通,在場外搶人大戰(zhàn)中也不乏戲份。
AMD從英偉達挖來高級技術(shù)市場經(jīng)理Sean Pelletier;高通的子公司高通技術(shù)則在去年年初高價收購前蘋果SoC首席架構(gòu)師和ARM資深工程師Gerard Williams的初創(chuàng)公司NUVIA,連帶NUVIA旗下一眾有蘋果、英特爾工作經(jīng)歷的資深研發(fā)人員全部收歸麾下。
整體看幾個巨頭在不斷挖人、擴張的過程中,早已模糊了原始邊界,切入對方腹地:英特爾要全力攻克獨立顯卡市場,英偉達開始發(fā)力做CPU,AMD和高通在GPU這條賽道上也已經(jīng)越走越深入。
如果說行業(yè)內(nèi)的其他巨頭發(fā)力GPU還在預(yù)期之內(nèi),那么谷歌和微軟加入這場競賽可能是更大的挑戰(zhàn)。畢竟谷歌和微軟是最前沿的應(yīng)用端。粗略統(tǒng)計,微軟、谷歌、亞馬遜這3家公司已經(jīng)推出或計劃發(fā)布8款服務(wù)器和AI芯片。
其中,谷歌于四月初首次公布了AI超算的細節(jié)——TPU v4性能相較v3提升10倍,比A100快1.7倍,同時功耗少1.9倍。和H100對打的芯片,也已經(jīng)在研發(fā)中,它并非沒有勝出的機會。
并且,當(dāng)一個行業(yè)里出現(xiàn)一個絕對霸主時,剩下的玩家往往會聯(lián)合起來抗衡。畢竟敵人的敵人就是朋友,這句話在半導(dǎo)體芯片產(chǎn)業(yè)的威力正在顯現(xiàn)。過去幾十年的“死對頭”英特爾和AMD此前宣布合作,組隊對抗更大的對手:英偉達。
其次是作為英偉達靈魂人物的黃仁勛已經(jīng)60歲,能否找到合適的跑第二棒的人依然還是個問號。
最后也是最大的問題就是如何不斷的革自己的命。
孔夫子說三十而立,英偉達通過三十年時間已經(jīng)儼然成為了顯卡和AI芯片領(lǐng)域的龐然大物,但商場是一個逆水行舟不進則退的地方,即便目前英偉達的H100(H100算力水平是A100的九倍)還沒有出現(xiàn)可堪一戰(zhàn)的對手,但對于英偉達而言,如何讓自己永遠領(lǐng)先是一個需要一直回答的問題。
這恰如成名已久的江湖絕頂高手,拔劍四顧,發(fā)現(xiàn)最大的對手不是別人,正是自己。
參考資料:
【1】 《家族·人物 | 英偉達創(chuàng)始人黃仁勛:十年臥薪嘗膽終迎來春天》,華商韜略
【2】 《英偉達 (NVIDIA) 崛起的傳奇歷程——從顯卡霸主到AI王者》,真義科技
【3】 《英偉達的前世今生》,考拉湯員,雪球
【4】 《英偉達帝國的一道裂縫》,何律衡/戴老板 遠川研究院
【5】 《暴漲1.3萬億!老黃笑哈哈,谷歌要偷家》,萬連山 格隆匯投資學(xué)苑
推薦閱讀
關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接
咕嚕網(wǎng) 93dn.com 版權(quán)所有,未經(jīng)書面授權(quán)禁止使用
Copyright©2008-2023 By All Rights Reserved 皖I(lǐng)CP備2022009963號-10
聯(lián)系我們: 39 60 29 14 2@qq.com