人們越來越看好人工智能的前景及其潛在的爆發(fā)力,而能否發(fā)展出具有超高運算能力且符合市場的芯片成為人工智能平臺的關(guān)鍵一役。由此,2016年成為芯片企業(yè)和互聯(lián)網(wǎng)巨頭們在芯片領(lǐng)域全面展開部署的一年。而在這其中,英偉達(dá)保持著絕對的領(lǐng)先地位。但隨著包括谷歌、臉書、微軟、亞馬遜以及百度在內(nèi)的巨頭相繼加入決戰(zhàn),人工智能領(lǐng)域未來的格局如何,仍然待解。
在2016年,所有人都看到了人工智能的前景和其潛在的爆發(fā)力,但不管是AlphaGo還是自動駕駛汽車,要想使得任何精妙算法得以實現(xiàn),其基礎(chǔ)是硬件的運算能力:也就是說,能否發(fā)展出超高運算能力又符合市場需求的芯片成為了人工智能平臺的關(guān)鍵一役。
因此,毫無疑問,2016年也成為了芯片企業(yè)和互聯(lián)網(wǎng)巨頭們在芯片領(lǐng)域全面展開部署的一年:先有CPU芯片巨頭因特爾年內(nèi)三次大手筆收購人工智能和GPU領(lǐng)域企業(yè);后有谷歌宣布開發(fā)自己的處理系統(tǒng),而蘋果、微軟、臉書和亞馬遜也都紛紛加入。
而在這其中,領(lǐng)跑者英偉達(dá)(Nvidia)因其在人工智能領(lǐng)域的優(yōu)勢使其成為了資本市場的絕對寵兒:在過去的一年中,曾經(jīng)以游戲芯片見長的Nvidia股價從十幾年的穩(wěn)居30美元迅速飆升至120美元。
就當(dāng)資本市場都在猶豫是否人工智能風(fēng)口使得英偉達(dá)股價虛高時,2月10日,英偉達(dá)發(fā)布2016年第四季度的財報顯示,其營收同比增長55%,凈利潤達(dá)到了6.55億美元,同比增長216%。
“正當(dāng)Intel、微軟等巨頭投資人工智能為基礎(chǔ)的芯片技術(shù)時,英偉達(dá)已經(jīng)以Q4財報顯示,這家已經(jīng)在人工智能領(lǐng)域投資將近12年的芯片企業(yè)已經(jīng)開始就此收獲可觀的盈利。”資深技術(shù)評論家Therese Poletti在其財報發(fā)布后指出。
研究機(jī)構(gòu)Tractica LLC估計,由于深度學(xué)習(xí)項目產(chǎn)生的硬件花費將從2015年的4360萬美元,上升到2024年的41億美元,而企業(yè)的相關(guān)軟件花費將同期從1.09億美元上升到100億美元。
正是這一龐大的市場吸引著谷歌、臉書、微軟、亞馬遜以及百度在內(nèi)的巨頭相繼宣布企業(yè)向人工智能領(lǐng)域的技術(shù)轉(zhuǎn)向。“在人工智能相關(guān)技術(shù)上,目前英偉達(dá)仍然保持著絕對的領(lǐng)先,但隨著包括谷歌在內(nèi)的TPU等技術(shù)不斷推向市場,未來的AI硬件格局仍然待解!币晃徊槐憔呙臍W洲資深從業(yè)人員向21世紀(jì)經(jīng)濟(jì)報道表示。
英偉達(dá)在GPU領(lǐng)域顯著領(lǐng)先
根據(jù)英偉達(dá)最新公布的年報,其最主要的業(yè)務(wù)領(lǐng)域均出現(xiàn)了兩位數(shù)以上的增長。除了其一直占有領(lǐng)先優(yōu)勢的游戲業(yè)務(wù)增長之外,其更多的漲幅事實上來自于數(shù)據(jù)中心業(yè)務(wù)和自動駕駛兩大全新業(yè)務(wù)板塊。
年報數(shù)據(jù)顯示,數(shù)據(jù)中心業(yè)務(wù)有138%的增長,而自動駕駛有52%的增長。
“事實上,這是整個英偉達(dá)財報里最具有說明力的內(nèi)容,因為數(shù)據(jù)業(yè)務(wù)和自動駕駛的增長根本上是人工智能和深度學(xué)習(xí)的發(fā)展所激發(fā)的!币晃幻绹嬎銠C(jī)硬件分析師向21世紀(jì)經(jīng)濟(jì)報道表示。
在目前的深度學(xué)習(xí)領(lǐng)域,把神經(jīng)網(wǎng)絡(luò)投入實際應(yīng)用要經(jīng)歷兩個階段:首先是訓(xùn)練,其次是執(zhí)行。從目前的環(huán)境來看,訓(xùn)練階段非常需要處理大量數(shù)據(jù)的GPU(圖形處理器,下同),也就是以游戲和高度圖形化的應(yīng)用做圖像渲染起家的英偉達(dá)領(lǐng)先的領(lǐng)域;而在轉(zhuǎn)型階段則需要處理復(fù)雜程序的CPU,也就是微軟十幾年來領(lǐng)先的領(lǐng)域。
“英偉達(dá)目前的成功事實上代表了GPU的成功,它正是最早的GPU領(lǐng)先者之一!鄙鲜鲂袠I(yè)分析師表示。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)尤其是幾百上千層的神經(jīng)網(wǎng)絡(luò),對高性能計算需求非常高,而GPU對處理復(fù)雜運算擁有天然的優(yōu)勢:它有出色的并行矩陣計算能力,對于神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和分類都可以提供顯著的加速效果。
舉個例子,研究員不用一開始就人工定義一個人臉,而是可以將幾百萬個人臉的圖像展示出來,讓計算機(jī)自己定義人臉應(yīng)該是什么樣子的。學(xué)習(xí)這樣的例子時,GPU可以比傳統(tǒng)處理器更加快速,大大加快了訓(xùn)練過程。
因此,搭載GPU的超級計算機(jī)已經(jīng)成為訓(xùn)練各種深度神經(jīng)網(wǎng)絡(luò)的不二選擇,比如Google大腦早期就是使用Nvidia的GPU做深度學(xué)習(xí)。“我們正在搭建一款帶有跟蹤功能的攝像裝置,因此需要找到最適合的芯片,GPU是我們的首選!睔W盟AR初創(chuàng)企業(yè)Quine CEO Gunleik Groven在今年一月的CES(國際消費電子展)現(xiàn)場向本報記者表示。
目前,谷歌、Facebook、微軟、Twitter和百度等互聯(lián)網(wǎng)巨頭,都在使用這種叫做GPU的芯片,讓服務(wù)器學(xué)習(xí)海量的照片、視頻、聲音文檔,以及社交媒體上的信息,來改善搜索和自動化照片標(biāo)記等各種各樣的軟件功能。一些汽車制造商也在利用這項技術(shù),開發(fā)可以感知周圍環(huán)境、避開危險區(qū)域的無人駕駛汽車。
除了在GPU和圖形計算領(lǐng)域長期領(lǐng)先,英偉達(dá)也是最早一批在人工智能領(lǐng)域進(jìn)行投資的科技公司。2008年,當(dāng)時在斯坦福做研究的吳恩達(dá)發(fā)表了一篇用GPU上的CUDA進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練的論文。2012年“深度學(xué)習(xí)三巨頭”之一Geoff Hilton的學(xué)生Alex Krizhevsky用英偉達(dá)的GeForce顯卡在ImageNet中將圖像識別準(zhǔn)確率大幅提升,這也是英偉達(dá)CEO黃仁勛時常提到的英偉達(dá)注重深度學(xué)習(xí)的開端。
有報告顯示,世界上目前約有3000多家AI初創(chuàng)公司,大部分都采用了Nvidia提供的硬件平臺。
“深度學(xué)習(xí)被證明是非常有效的!秉S仁勛在季報2月10日的發(fā)布會中表示。在列舉目前GPU計算平臺正在人工智能、云計算、游戲和自動駕駛領(lǐng)域快速展開應(yīng)用的同時,黃仁勛表示,在未來數(shù)年間,深度學(xué)習(xí)將會成為計算機(jī)計算的一種基礎(chǔ)性的核心工具。
AMD和Intel巨頭的AI演變
投資者和芯片制造商關(guān)注著所有互聯(lián)網(wǎng)巨頭的一舉一動。僅僅以英偉達(dá)的數(shù)據(jù)中心業(yè)務(wù)為例,在很長一段時間以來,該公司一直為谷歌提供數(shù)據(jù)服務(wù)。
英偉達(dá)并非GPU的唯一領(lǐng)先者,巨頭Intel和AMD都在這一領(lǐng)域有著不同的優(yōu)勢。
2016年11月,Intel公司發(fā)布了一個叫做Nervana的AI處理器,他們宣稱會在明年年中測試這個原型。如果一切進(jìn)展順利,Nervana芯片的最終形態(tài)會在2017年底面世。這個芯片名稱基于Intel早前購買的一個叫做Nervana的公司。按照Intel的人所說,這家公司是世界上第一家專門為AI打造芯片的公司。
Intel公司披露了一些關(guān)于這個芯片的一些細(xì)節(jié),按照他們所說,這個項目代碼為“Lake Crest”,將會用到Nervana Engine 和Neon DNN相關(guān)軟件。這款芯片可以加速各類神經(jīng)網(wǎng)絡(luò),例如谷歌TensorFlow框架。
芯片由所謂的“處理集群”陣列構(gòu)成,處理被稱作“活動點”的簡化數(shù)學(xué)運算。相對于浮點運算,這種方法所需的數(shù)據(jù)量更少,因此帶來了10倍的性能提升。
Lake Crest利用私有的數(shù)據(jù)連接創(chuàng)造了規(guī)模更大、速度更快的集群,其拓?fù)浣Y(jié)構(gòu)為圓環(huán)形或其他形式。這幫助用戶創(chuàng)造更大、更多元化的神經(jīng)網(wǎng)絡(luò)模型。這一數(shù)據(jù)連接中包含12個100Gbps的雙向連接,其物理層基于28G的串并轉(zhuǎn)換。
TPU與FPGA可能的逆襲
在上述芯片巨頭進(jìn)行GPU領(lǐng)域的提升之外,有更多的企業(yè)在試圖引發(fā)一輪全面的顛覆。其代表為谷歌在2016年宣布將獨立開發(fā)一種名為TPU的全新的處理系統(tǒng)。
TPU是專門為機(jī)器學(xué)習(xí)應(yīng)用而設(shè)計的專用芯片。通過降低芯片的計算精度,減少實現(xiàn)每個計算操作所需的晶體管數(shù)量,從而能讓芯片的每秒運行的操作個數(shù)更高,這樣經(jīng)過精細(xì)調(diào)優(yōu)的機(jī)器學(xué)習(xí)模型就能在芯片上運行得更快,進(jìn)而更快地讓用戶得到更智能的結(jié)果。Google將TPU加速器芯片嵌入電路板中,利用已有的硬盤PCI-E接口接入數(shù)據(jù)中心服務(wù)器中。
據(jù)Google 資深副總裁Urs Holzle 透露,當(dāng)前Google TPU、GPU 并用,這種情況仍會維持一段時間,但他表示,GPU 可執(zhí)行繪圖運算工作,用途多元;TPU 屬于ASIC,也就是專為特定用途設(shè)計的特殊規(guī)格邏輯IC,由于只執(zhí)行單一工作,速度更快,但缺點是成本較高。
除了上述提到的谷歌,微軟也在使用一種叫做現(xiàn)場可變編程門陣列(FPGA)的新型處理器。
據(jù)介紹,這個FPGA 目前已支持微軟Bing,未來它們將會驅(qū)動基于深度神經(jīng)網(wǎng)絡(luò)——以人類大腦結(jié)構(gòu)為基礎(chǔ)建模的人工智能——的新搜索算法,在執(zhí)行這個人工智能的幾個命令時,速度比普通芯片快上幾個數(shù)量級。有了它,你的計算機(jī)屏幕只會空屏23毫秒而不是4秒。
在第三代原型中,芯片位于每個服務(wù)器的邊緣,直接插入到網(wǎng)絡(luò),但仍舊創(chuàng)造任何機(jī)器都可接入的FPGA池。這開始看起來是Office 365可用的東西了。最終,Project Catapult準(zhǔn)備好上線了。另外,Catapult硬件的成本只占了服務(wù)器中所有其它的配件總成本的30%,需要的運轉(zhuǎn)能量也只有不到10%,但其處理速度卻是原來的2倍。
此外,有一些公司,例如Nervada和Movidius,模擬GPU的平行模式,但是專注于更快速地移動數(shù)據(jù),省略圖像所需要的功能。其他公司,包括使用了被稱為“True North”的芯片的IBM公司,開發(fā)了由神經(jīng)元、突觸等其他大腦特征所啟發(fā)的芯片設(shè)計。
由于深度學(xué)習(xí)和人工智能未來的巨大前景,各大巨頭都在盡量爭取技術(shù)上的優(yōu)勢。如果這其中的某家公司,如谷歌,用一種新型芯片替換掉現(xiàn)有芯片,這基本上就相當(dāng)于顛覆了整個芯片行業(yè)。
“不管是英偉達(dá)、Intel還是谷歌或是百度,都在尋找一種未來人工智能能夠廣泛應(yīng)用的基礎(chǔ)!盩herese Poletti表示。
而也有很多人持有與谷歌副總裁Urs Holzle 同樣的觀點,認(rèn)為在人工智能的遙遠(yuǎn)未來,GPU沒有代替CPU,而TPU也不會取代GPU,芯片市場將出現(xiàn)更大的需求和繁榮。