Google Brain團隊成員邱中鎮來臺揭露Google如何用深度學習技術,分析億級資料的秘密。Google創下6成市占的Android Jelly Bean版中,令人眼睛一亮的聰明語音辨識功能背後的關鍵技術,正是Google Brain團隊的研究成果之一 在6月16日的早上不到10點,一群臺大資工系的師生興奮地等著演講開始,連撰寫出暢銷機器學習教科書的臺大資工系教授林軒田都頗為期待地坐在講臺前。
「我穿著這件T-Shirt,就是要說我在Google Brain團隊工作。」Google Brain軟體工程師邱中鎮用平穩但帶著驕傲的口氣告訴在場師生。
Google Brain是一個Google X秘密實驗室的計畫,以打造出媲美人工智慧的人工大腦為初始目的所發起的一個先進研究計畫。創下6成市占的Android Jelly Bean版中,令人眼睛一亮的聰明語音辨識功能背後的關鍵技術,正是Google Brain的研究成果之一。這是一個專門研究如何讓Google服務更聰明的團隊。
邱中鎮表示,Google Brain是Google內主要使用深度學習(Deep Learning)技術的研發團隊。
深度學習是機器學習領域中的其中一支,Google Brain不只用深度學習來改善產品,「甚至還想要發展出一個深度學習的通用平臺,來支援Google其他任何部門的服務。」他說。
類神經網路的研究已背離研究人腦神經的初衷 早在2011年,大資料技術MapReduce發明人Jeff Dean、腦神經專家Greg Corrado以及後來離開Google在百度擔任首席科學家的吳恩達三人共同創辦了Google Brain計畫,一開始的目的是研究人類的腦神經,希望用來幫助發展運算技術。
但是因為人類對於腦的了解目前還過於不足,許多得到的結論無法用在實際的人工智慧技術上,因此現在的機器學習研究有許多甚至是背離腦神經研究的,Google Brain因此轉而專注研究機器學習。
例如在今年Google I/O中剛發表的Google Photos智慧相簿,能夠自動分類使用者的大量照片,使用者就算沒有事先下關鍵字,也能透過關鍵字搜尋來找出需要私人照片,不用擔心照片太多需要整理的問題。這個功能也正來自Google Brain團隊的成研究果。
但這功能不是Google突然無中生有的新技術,在2014年時,Google就在全球知名的電腦視覺辨識比賽ILSVRC(ImageNet Large Scale Visual Recognition Challenge),以系統GoogLeNet取得照片內容辨識的冠軍。GoogLeNet使用了22層類神經網路,680萬個加權連結值(Weight),訓練的樣本照片高達上億張。
最終訓練出來的模型可以在複雜的照片中辨識出上萬種物體,例如在一個紙袋中辨識出四顆橘子與香蕉,或是在一張自助洗衣店的圖片中,辨識出3臺洗衣機和鏡子中拍照人的倒影,連一張有匹跳耀中的馬以及背上的騎師也能清楚辨識。
而GoogLeNet不只具有單一物體辨識的能力,也能綜合出抽象的概念,像是個盤子中裝有沙拉、水果以及蛋的照片,另一張有著中式圓桌,桌上擺放碗筷以及菜餚的照片,都會被GoogLeNet辨識為餐點(Meal)。不過電腦不及人腦,還是會有很多辨識的錯誤,像是會把香蕉蛞蝓誤認為蛇,或是把被遮蔽的驢子辨識成狗等。
GoogLeNet的錯誤率是所有參加者中最低的,只有6.66%,雖然還不及人類同樣受過照片樣本訓練的錯誤率5.1%,但已是很大的進步。
深度學習就是一種類神經網路 「深度學習就是一種類神經網路,只是被研究人員重新貼上標籤,希望喚起大家的注意,類神經網路的發展已經跟過去不一樣了。」邱中鎮說,2015年全球最頂尖的電腦視覺研討會CVPR有超過70%的研究都與深度學習有關。而Google Brain團隊目前也招募到了50多位成員,其中不乏優秀的研究人員,像是全球類神經網路的指標性研究人物Geoffrey Hinton也在其中。
邱中鎮說:「深度學習的本質就是很多小的數學元件組合成一個複雜模型,複雜的模型可以用來解複雜的問題。」
閱讀全文
沒有留言:
張貼留言