寒武紀科技(Cambricon)是中科院計算所孵化的一家獨角獸公司,2016年推出的寒武紀1A處理器(Cambricon-1A)是世界首款商用深度學習專用處理器,面向智能手機、安防監控、可穿戴設備、無人機和智能駕駛等各類終端設備。
華為官方在Twitter也發布了一張海報,上面寫著一句話:“AI不止是語音助手”,預示華為下一代自研的處理器將擺脫束縛,實現更多人機交互的可能性。余承東認為:“人工智能時代的來臨,意味著移動互聯網進入到智慧互聯網時代,用戶入口將有由從傳統的APP,向智慧助理+API入口發展。未來的智能手機將成為真正的智慧手機,到2025年超過90%的智能終端用戶將從個性化、智慧化的智能個人助理服務中獲益?!?/span>
全球智能芯片領域“搶占賽道”白熱化
而放眼全球,科技巨頭對于智能芯片追逐和布局已經到了白熱化的地步:
1. 人工智能顯卡芯片總龍頭英偉達股價2年8倍,繼續領漲美國科技股;
2. 2016年7月20日,軟銀宣布將以243億英鎊(約合320億美元),43%的溢價收購移動端芯片總龍頭ARM,英國芯片設計公司ARM;
3. 2016年9月,英特爾收購視覺芯片公司Movidius;
4. 2017年3月,英特爾宣布以153億美元收購以色列無人駕駛Mobileye;
5.谷歌自主研發人工智能數據中心芯片TPU,搭載AlphaGo應用,橫掃人類圍棋界
“芯片”是站在整個電子產業鏈最頂端的行業,在英特爾芯片壟斷PC時代、ARM芯片稱霸移動互聯網時代的歷史進程中,芯片永遠都是作為產業鏈最上游,是行業先導指標。核心芯片決定一個計算時代的基礎架構!當今谷歌、微軟、IBM、Facebook、英偉達等IT巨頭之所以紛紛投巨資加速人工智能核心芯片的研發,都是意圖從源頭上掌控核心芯片架構,取得人工智能計算時代的主導權。未來3-5年,隨著人工智能定制芯片的突破,所有行業都將實現人工智能化!屆時,智能化市場之規模和容量將數十倍于現今的移動互聯網市場。
在PC時代處于霸主地位的X86架構和移動互聯網時代壟斷全行業的ARM架構的發展歷程表明,核心芯片決定了一個新的計算平臺的基礎架構和發展生態,新的計算時代來臨之時往往是新興企業彎道超車的絕佳機遇,目前使用的GPU、FPGA均非人工智能定制芯片,天然存在局限性,人工智能專用芯片對于IT巨頭和初創企業是同一起跑線的藍海。
目前以深度學習為代表的人工智能新計算需求,主要采用 GPU、FPGA,AISC定制化芯片等已有適合并行計算的通用芯片來實現加速。
三種主流人工智能芯片方向:GPU, FPGA,AISC定制
GPU:以英偉達為主導的GPU芯片,作為圖像處理器,設計初衷是為了應對圖像處理中需要大規模并行計算。因此,其在應用于深度學習算法時,存在應用過程中無法充分發揮并行計算優勢,硬件結構固定不具備可編程性,運行深度學習算法能效遠低于 FPGA。
FPGA:即現場可編輯門陣列,是一種新型的可編程邏輯器件。其設計初衷是為了實現半定制芯片的功能,即硬件結構可根據需要實時配臵靈活改變。目前的FPGA 市場由 Xilinx 和 Altera主導,兩者共同占有 85%的市場份額,其中Altera 在 2015 年被 intel 以 167 億美元收購(此交易為 intel 有史以來涉及金額最大的一次收購案例),另一家Xilinx 則選擇與 IBM 進行深度合作,背后都體現了 FPGA 在人工智能時代的重要地位。
對于機器學習算法的性能和功耗的角度來說:FPGA 可以開發出為機器學習算法專用的架構,但是 FPGA 本身的峰值性能較 GPU 要差很多。
FPGA 實現的機器學習加速器在架構上可以根據特定應用優化所以比 GPU 有優勢,但是 GPU 的運行速度(>1GHz) 相比 FPGA 有優勢 (~200MHz)。所以,對于平均性能,看的就是 FPGA 加速器架構上的優勢是否能彌補運行速度上的劣勢。
AISC定制:ASIC是指依產品需求不同而定制化的特殊規格集成電路,由特定使用者要求和特定電子系統的需要而設計、制造。以谷歌TPU為代表的AISC定制化芯片(包括4個芯片能夠提供180TFLOPs浮點運算的計算能力)就是一種最大化性能需求和成本能耗平衡的重要手段。
打個形象的比方,我們設計一款人工智能芯片就像設計一個某種功能的房子,那么我們有三種選擇:
1. 買一個已有的比較通用的房子,然后改變內部的軟件設施來讓這個房子達到我們需要的功能,優點是對于用戶代價小,但肯定沒法達到性能最大化,這就對應了通用型GPU芯片;
2. 買一個半成品的房子,我們可以隨時改變房子里面的各個房間格局,優點是相對第一種房子性能肯定會更貼近我們需求,而且也保證了一定靈活性,如果需求有改變,可以隨時再改變內部房間格局,這對應了FPGA芯片;
3. 完全一塊磚一塊磚按自己需求重新搭建一個房子,這種肯定性能上最能貼近我們的需求,但是一次性投入太大,如果不是確定性需求需要冒風險,這就對應ASIC芯片。
所以我們可以不難理解為什么大部分創業公司都會采用英偉達GPU這類生態成熟的通用芯片,為什么在人工智能算法沒有最終成熟需要不斷改進時FPGA會出現在一些應用領域,而谷歌這類財大氣粗自己需求量很大的公司自己用ASIC的TPU。