芯片,目前在我國是一個高熱度話題。尤其是在貿易戰之后,每天有大量的報道充斥在我們周圍:一邊是我國芯片陷入“缺芯少魂”的絕境,一邊又是我國AI芯片“趕超歐美”的欣喜。這些在對立面的報道大大增加了人們的疑惑,到底誰說的對,我國芯片行業目前真實的狀態究竟是怎樣?
其實,這兩種看似對立的聲音都是正確的,都是我國芯片行業目前真實的現狀。只是有些人混淆了傳統芯片與AI芯片的概念。
傳統芯片,指的是中央處理器(CPU),它是一塊超大規模的集成電路,是一臺計算機的運算核心(Core)和控制核心(Control Unit)。它的功能主要是解釋計算機指令以及處理計算機軟件中的數據。
在傳統芯片領域,美國一家獨大,占全球市場份額的60%以上。美國的英特爾、AMD、高通、博通、英偉達等都是全球頂尖的芯片制造商。在這一方面,中國的確落后于美國,并且在短時間內極難追趕。“缺芯少魂”的說法也由此而來。
但在AI芯片領域,卻呈現出一副截然不同的畫面。
AI芯片并非廣義的芯片
AI芯片并不是真正意義上的芯片,從某種意義上來說,能實現AI加速功能的半導體器件都可以被稱為“AI芯片”。它可以被封裝成芯片的形態,也可以被制成板卡的形態,所以AI芯片也被稱為AI加速器或計算卡,是專門用于處理人工智能應用中的大量計算任務的模塊(其他非計算任務仍由CPU負責)。
圖:CPU的內部結構及工作原理 來源:百度百科
如圖所示,以往CPU負責整個系統的基本計算和運行。但當整個系統都需要使用人工智能這項功能時,就需要消耗大量的算力。如果這時候仍由CPU的運算單元來提供算力,可能就會出現因為算力不足而“死機”的情況。
AI芯片就是為了完成這些額外計算任務而誕生的。
目前,根據芯片的架構,以及通用性和計算性能的差異,我們通常把AI芯片分為:GPU 、ASIC、FPGA、類腦芯片四大類。
GPU采用的是單指令、多數據處理結構,主要處理圖像領域運算加速的任務。但GPU無法單獨工作,必須由CPU進行控制調用才能工作。CPU可單獨作用,處理復雜的邏輯運算和不同的數據類型,但當需要大量地處理類型統一的數據時,則可調用GPU進行并行計算。
ASIC芯片是供專門應用的集成電路芯片技術,在集成電路界被認為是一種為專門目的而設計的專用AI芯片。除了不能擴展以外,在功耗、可靠性、體積等方面都有優勢,尤其在高性能、低功耗的移動端。
FPGA,即現場可編程門陣列。它是專用集成電路(ASIC)領域中的一種半定制電路,既解決了定制電路不足的問題,又克服了原有可編程器件門電路數有限的缺點,適用于多指令,單數據流的分析,常用于預測階段,如云端。FPGA是用硬件實現軟件算法,因此在實現復雜算法方面有一定的難度,缺點是價格比較高。
由于人腦結構精密且復雜,芯片想要模仿人腦的工作模式并不容易,所以目前類腦芯片只有個別傳統芯片巨頭在從事相關研發工作。
國產崛起,拉開戰爭序幕
縱觀全球AI芯片格局,老牌芯片公司依然占據主導地位,但中國企業正在迅猛向前。
2018年,市場研究和咨詢公司Compass Intelligence發布了年度全球AI芯片公司排名報告。根據報告顯示,英偉達排名第一,英特爾、IBM、Google、蘋果、AMD、ARM、高通、三星、恩智浦等公司位列2-10名。在Top24的榜單排行中,已有六家中國公司入圍。分別是:第12位華為(海思)、第14位聯發科(MediaTek)、第20位瑞芯微(Rockchip)排名第20位、第21位芯原(Verisilcon)、第23位寒武紀(Cambricon)排名第23位、第24位地平線(Horizon)。
由于CUDA開發平臺的普及和較早研發GPU,英偉達的GPU是目前應用最廣的通用AI硬件計算平臺,它也牢牢地占據了榜單的第一名。
除了英偉達,其他老牌的芯片巨頭也沒“閑”著,特別是英特爾。通過收購Altera,英特爾獲得了基于FPGA的AI方案,這讓英特爾得以躋身行業第一梯隊。
雖然中國企業暫時排名較后,但崛起的可能性無限。
如果從使用場景來看,AI芯片主要可分為兩類:一個是在數據中心部署的云端,一個是在消費者端部署的終端。其中,云端主要以訓練(Training)任務為主,終端以推理(Inference)任務為主。
訓練任務即用大量標記過的數據來“訓練”相應的系統,使之可以適應特定的功能。例如給系統海量的“人臉”的圖片,系統會通過訓練記住每張“人臉”的特點、細節、差異。
推理任務即用訓練好的系統來完成任務。接上面的例子,就是你將一張圖給之前訓練過的系統,之后系統就會自動分辨出特定的“人臉”。
訓練和推理在目前大多數的AI系統中,是相對獨立的過程,兩者對計算能力的要求也不盡相同。
完成訓練任務,需要極高的計算性能,需要較高的精度,需要能處理海量的數據,需要有一定的通用性,以便完成各種各樣的學習任務。所以擁有大量原始數據的中國芯片廠家,將會在此脫穎而出。
相對來說,推理任務對性能的要求并不高,對精度要求也要更低,在特定的場景下,對通用性要求也低,能完成特定任務即可。但因為推理的結果直接提供給終端用戶,所以用戶體驗方面的優化更為重要。這也給了大量注重用戶體驗的中國企業新的超越機會。
在今年8月的人工智能大會上,華為的麒麟810、麒麟910、昇騰310、昇騰910;地平線“征程/旭日”系列、依圖的“求索”;阿里旗下玄鐵910、銳虎賁T710等AI芯片紛紛嶄露頭角。此外Thinkforce、翱捷和芯馳等后起之秀也在摩拳擦掌。
AI芯片的戰爭才剛剛開始。