麒麟970的出現(xiàn),將人工智能手機的熱度推到了一個高潮。如今,HUAWEI Mate10都發(fā)布小半年了,大家對于其人工智能的體驗印象大多是“然并卵”,確實,人工智能在手機上的應用落地依然有很長的路要走,但不可否認,這是接下來幾年重點發(fā)展的方向。對于人工智能,很多人被其各種玄乎其神的名詞所吸引,大家的印象中,人腦和電腦有著本質(zhì)的區(qū)別,怎么能夠相互聯(lián)系在一起呢?其實揭開面紗,真相并不神秘。今天這里就以麒麟970處理器為例,從硬件基礎、軟件方法、應用方向三個方面對其進行淺顯的解讀:
一、硬件基礎
硬件基礎自然就是人工智能芯片,我們都知道任何計算機都有一個CPU,它負責所有的計算。而且摩爾定律告訴我們,CPU的性能每過18個月就會翻一番。具體來說,CPU的性能的提升主要在于兩方面,一個是芯片的密度,我們常說的14nm,20nm指的就是這個。另一個是主頻的提高。當前最先進的手機處理器是10nm,下一代是7nm的工藝。密度和主頻的提高都是有極限的,而且這個極限已經(jīng)到來。
于是,英特爾想到了一個辦法,那就是一個處理器多個核心。雙核、四核甚至當前的8核開始出現(xiàn)。為了照顧散熱,單個核心的性能有所降低,但增加了核心,多任務處理的效率就會大大提高。但同樣的,核心數(shù)同樣不能無限制的提高,那樣的話散熱和體積會非?植馈Sミ_接過英特爾的大旗,首先想到,CPU的核心是為了照顧各種復雜運算,內(nèi)部有太多的空間是控制器,如果把這些占據(jù)空間的控制單元給拿到,只做單純的批量計算,也就是從以前解方程,變成了A1+B1、A2+B2...這類的計算。這樣一來,單個核心的復雜程度大大降低,GPU由此誕生,這種計算也被叫做向量計算。我們會發(fā)現(xiàn)GPU的核心一般都能夠達到100到200個,這就是精簡所帶來的。
對于GPU的印象,很多人都來自玩大型游戲,也就是這種處理器特別擅長處理圖像。按照這一個思路,谷歌想到,能不能進一步的精簡呢?批量計算還是太過繁瑣,如果每次計算都只是分析不同數(shù)據(jù)的不同之處,相同的運算都省去了,于是為阿法狗獨家定制的TPU誕生了,T的單詞是Tensor,意思是張量。這種TPU的核心數(shù)驚人的達到了百萬級,而且因為處理單元的簡單批量,功耗相比GPU下降也是非常明顯的,所以特別適合大數(shù)據(jù)和人工智能的分析處理。麒麟970中的NPU也是同樣的道理,只是叫法不同而已。從上圖中的架構(gòu)也可以看到這種核心數(shù)大與小的關系。
所以我們看到麒麟970的介紹頁面,會著重強調(diào)能效比,所謂能效比就是進行對簡單的張量計算所消耗的能量,這一點NPU相比CPU的提升是幾十倍的提升。同時,還會強調(diào)進行識別圖片的速度,因為NPU擅長做張量計算,識別圖片它只是找差異點,對它而言,圖片是沒有意義的。針對復雜運算的CPU來處理這樣的工作就真的是殺雞用牛刀了。
二、軟件方法
有了硬件基礎只是有了一張能夠畫畫的白紙,具體怎么去畫還是需要用數(shù)據(jù)對機器進行訓練。也就是機器學習,機器學習的方法有很多,主要分為三種,無監(jiān)督的學習、有監(jiān)督的學習和強化學習。如果給很多雜亂無章的數(shù)據(jù),讓機器自己摸索出規(guī)律,不進行任何人為干預,這就是無監(jiān)督的學習,顯然這種學習方法是非常緩慢的。有監(jiān)督的學習就是在給定的數(shù)據(jù)上,有人為的篩選過程,這種學習大大提高了效率,但也有弊端,那就是相對計算機而言,這種經(jīng)過篩選的數(shù)據(jù)太有限了,也就是說進步太慢了。
強化學習則是,讓機器人自己嘗試走,然后人來判斷是否正確,也就是說在無監(jiān)督的基礎上,加入了一個反饋系統(tǒng)來控制方向。這樣一來,既避免了數(shù)據(jù)的匱乏,而且機器人學習的方向能夠把握。所謂的算法,其實就是通過數(shù)據(jù)找出一條能夠最大程度上接近理想答案的函數(shù)曲線而已。所以,數(shù)據(jù)的維度越多,數(shù)據(jù)量越大,機器判斷得就更加準確,總結(jié)下來就是越用越好用。這與手機的需求是高度契合的。
三、應用方向
有了硬件基礎,有了軟件的算法,還需要具體的應用。當前而言,iPhoneX的一個主要應用是人臉識別,越用越精準。而HUAWEI Mate10一個有特點的應用是拍照識物,就是在拍照前對拍照的對象進行一個判斷,然后根據(jù)判斷自動對相機進行相應的參數(shù)調(diào)整。大家之所以覺得然并卵,最主要的就是這些應用更像是可有可無的玩具,它無法真正的擊中我們的痛點。所以,這里華為是最早搭建好平臺的廠商,那么,以后的應用會有怎樣期待呢?
我覺得可以有這么幾點想象。現(xiàn)在的所謂的算法都是根據(jù)較為單一的數(shù)據(jù)進行判斷和推送,其實還是以前根據(jù)使用痕跡的思路,反而容易形成信息孤島,因為信息的單一無法讓機器產(chǎn)生更加靈活的判斷。比如,我們都聽過一個經(jīng)典的故事,超市將啤酒和尿不濕放在一起,因為買啤酒的大多都是有孩子的男人。以前這樣的判斷需要根據(jù)經(jīng)驗,以后交給計算機就可以了。也就是說,以后的手機會比你自己更加懂你。
當然,在享受便利的同時,我們也在交出隱私,也在交出選擇的權利。以后而言,信息會越來越多的掌握在大企業(yè)的手里,出于自身利益的考慮,它就可以讓你只看到對他有利的消息。當然,這都還比較遙遠,現(xiàn)在擔心還有點太早。