Beauty: Google Brain團隊成員披露谷歌服務比對手更聰明的關鍵

		每週二出刊.2015.07.14
	Smart Business

本期目錄

簡介/舊報明細

•Google Brain團隊成員披露谷歌服務比對手更聰明的關鍵
•威朋靠機器學習讓每日42億次廣告推薦快又準
•2千萬首歌想聽哪一首？Kkbox運用機器學習隨時告訴你
•搶先美國，日本小型無人機法案出爐！首相官邸等周圍30 ...
•Google又有新專利，讓你能用手指拍照

優惠訊息

．　8/11見證台灣開源雲歷史 – OpenStack Day Taiwan 2015
．　租虛擬主機架站，再附信箱
．　日日新軟體、時時有更新，登入再下載、小當家通知你！

特別報導

Google Brain團隊成員披露谷歌服務比對手更聰明的關鍵

Google Brain團隊成員邱中鎮來臺揭露Google如何用深度學習技術，分析億級資料的秘密。Google創下6成市占的Android Jelly Bean版中，令人眼睛一亮的聰明語音辨識功能背後的關鍵技術，正是Google Brain團隊的研究成果之一

在6月16日的早上不到10點，一群臺大資工系的師生興奮地等著演講開始，連撰寫出暢銷機器學習教科書的臺大資工系教授林軒田都頗為期待地坐在講臺前。

「我穿著這件T-Shirt，就是要說我在Google Brain團隊工作。」Google Brain軟體工程師邱中鎮用平穩但帶著驕傲的口氣告訴在場師生。

Google Brain是一個Google X秘密實驗室的計畫，以打造出媲美人工智慧的人工大腦為初始目的所發起的一個先進研究計畫。創下6成市占的Android Jelly Bean版中，令人眼睛一亮的聰明語音辨識功能背後的關鍵技術，正是Google Brain的研究成果之一。這是一個專門研究如何讓Google服務更聰明的團隊。

邱中鎮表示，Google Brain是Google內主要使用深度學習（Deep Learning）技術的研發團隊。

深度學習是機器學習領域中的其中一支，Google Brain不只用深度學習來改善產品，「甚至還想要發展出一個深度學習的通用平臺，來支援Google其他任何部門的服務。」他說。

類神經網路的研究已背離研究人腦神經的初衷

早在2011年，大資料技術MapReduce發明人Jeff Dean、腦神經專家Greg Corrado以及後來離開Google在百度擔任首席科學家的吳恩達三人共同創辦了Google Brain計畫，一開始的目的是研究人類的腦神經，希望用來幫助發展運算技術。

但是因為人類對於腦的了解目前還過於不足，許多得到的結論無法用在實際的人工智慧技術上，因此現在的機器學習研究有許多甚至是背離腦神經研究的，Google Brain因此轉而專注研究機器學習。

例如在今年Google I/O中剛發表的Google Photos智慧相簿，能夠自動分類使用者的大量照片，使用者就算沒有事先下關鍵字，也能透過關鍵字搜尋來找出需要私人照片，不用擔心照片太多需要整理的問題。這個功能也正來自Google Brain團隊的成研究果。

但這功能不是Google突然無中生有的新技術，在2014年時，Google就在全球知名的電腦視覺辨識比賽ILSVRC（ImageNet Large Scale Visual Recognition Challenge），以系統GoogLeNet取得照片內容辨識的冠軍。GoogLeNet使用了22層類神經網路，680萬個加權連結值（Weight），訓練的樣本照片高達上億張。

最終訓練出來的模型可以在複雜的照片中辨識出上萬種物體，例如在一個紙袋中辨識出四顆橘子與香蕉，或是在一張自助洗衣店的圖片中，辨識出3臺洗衣機和鏡子中拍照人的倒影，連一張有匹跳耀中的馬以及背上的騎師也能清楚辨識。

而GoogLeNet不只具有單一物體辨識的能力，也能綜合出抽象的概念，像是個盤子中裝有沙拉、水果以及蛋的照片，另一張有著中式圓桌，桌上擺放碗筷以及菜餚的照片，都會被GoogLeNet辨識為餐點（Meal）。不過電腦不及人腦，還是會有很多辨識的錯誤，像是會把香蕉蛞蝓誤認為蛇，或是把被遮蔽的驢子辨識成狗等。

GoogLeNet的錯誤率是所有參加者中最低的，只有6.66％，雖然還不及人類同樣受過照片樣本訓練的錯誤率5.1%，但已是很大的進步。

深度學習就是一種類神經網路

「深度學習就是一種類神經網路，只是被研究人員重新貼上標籤，希望喚起大家的注意，類神經網路的發展已經跟過去不一樣了。」邱中鎮說，2015年全球最頂尖的電腦視覺研討會CVPR有超過70％的研究都與深度學習有關。而Google Brain團隊目前也招募到了50多位成員，其中不乏優秀的研究人員，像是全球類神經網路的指標性研究人物Geoffrey Hinton也在其中。

邱中鎮說：「深度學習的本質就是很多小的數學元件組合成一個複雜模型，複雜的模型可以用來解複雜的問題。」

　閱讀全文

威朋靠機器學習讓每日42億次廣告推薦快又準

威朋每日需處理42億次廣告請求，每一次的廣告推薦都要在0.1秒內完成，為求精準又須考慮使用者的屬性以及行為等諸多要素，成了一大難題，解決問題的關鍵就是機器學習

該推薦什麼廣告給下午3點正在使用手機的上班族呢？當這位上班族打開App或是瀏覽網頁含有廣告板位時，威朋便會接到廣告請求，在綜合使用者、廣告主以及內部的資料後，決定出多少價錢以標下這個板位，並投放什麼樣的廣告給這位上班族。威朋在亞洲覆蓋4.5億不重複使用者，每日需處理42億次廣告請求，每一次的廣告推薦都要在0.1秒內完成，除了快還要準，關鍵就是機器學習！

行動廣告即時競價（RTB，Real-Time Bidding）的生態系中有非常多的角色，各自負責不一樣的工作，雖然臺灣即時競價的生態系較為單純，但是要能讓行動裝置使用者看到廣告，過程也是需要有不同的角色互相支援。行動裝置使用者所看到的廣告，其板位由廣告供應方平臺（SSP，Supply Side Platform）擁有，廣告供應方平臺會傳送廣告流量請求給像是威朋的廣告需求方平臺（DSP，Demand Side Platform），並由各廣告需求方平臺出價標下該板位，取得廣告主廣告曝光的機會。

對於威朋來說，最理想的情況是用最低的價格競標到廣告板位，推送使用者最想看的廣告，並把使用者的點擊轉換（Conversion）成App下載或是資料填寫等，以達到廣告主期待的目標。廣告推薦是由許多複雜小問題組成的複雜大問題，除了需要知道廣告受眾的屬性與所處情境外，還包括什麼廣告是當下使用者最想看到的，或是這個板位究竟出價多少錢才划算，整個過程有許多需要權衡的環節。

這些問題必須借助資料科學之力來解決，威朋組織了約10位工程師投入機器學習的研究以及開發。威朋研究開發部軟體工程師廖耘說，訓練機器學習模型的資料來自廣告板位以及廣告主。當使用者透過App或是瀏覽網頁看到廣告板位，廣告板位便會發送廣告流量請求給威朋，這項請求包含了廣告供應方平臺與廣告需求方平臺資訊交換的協定，其中資訊包含板位大小、裝置型號、裝置ID、位置以及使用者個人資訊等，而在廣告主的資料方面，包含廣告的內容、標籤、風格與類別等資料。

威朋根據這些資料，以事先訓練好的模型預測出廣告板位價格以及內容並回傳，廣告供應方平臺則利用廣告需求方平臺提供的資訊做最後廣告板位顯示的決定，廖耘表示，機器學習在預測的步驟很快，而且因為他們必須在收到請求的50毫秒內給出回應，因此也不會做太複雜的運算。

用非監督式機器學習找出廣告受眾族群

機器學習分為非監督式與監督式，威朋研究開發部數據工程師陳嘉宏表示，兩者威朋都有使用。利用非監督式機器學習善於分群的特性，將從廣告供應平臺收集來的歷史紀錄做群體分析，根據樣本的多項特徵與屬性，找出這些樣本中存在的7種類型，並由人解讀後分別命名為白領商務族、熟齡樂活族、小資樂購族、完美時尚族、活力校園族、美麗媽媽族以及娛樂玩咖族。而且不只要對廣告受眾屬性分析，還要能夠猜出廣告受眾正在做什麼，藉由分析這些收集到數億筆的歷史資料，找出是哪些人正在做哪些事，建立出完整的情境（Scenario）用於投放廣告的決策。

威朋主要將監督式的機器學習用於即時的廣告決策。陳嘉宏認為，機器學習最困難的部分就在於樣本資料的彙整。一筆樣本廣告推薦系統的訓練樣本是一個數十個欄位的數學向量，其中包含來自廣告供應方平臺、廣告主以及威朋內部分析的情境資料，再以廣告受眾是否點擊廣告作為標籤，標記樣本廣告被點擊的情況。

而困難之處，陳嘉宏說，除了要先使用特別的演算法計算收集來的資料，找出與點擊率相關的屬性，才能擺進樣本中之外，還要處理許多空值資料以及假資料。

廖耘也表示，他們所處理的資料是不停流動的，新的資料會不斷進來而舊的資料會被排除，為了訓練出最適合當下的模型，需要不停更新訓練模型的樣本，但偶而會因為特殊的社會事件而收集到偏頗的樣本，這時候也要將這些極端值資料移除，以避免影響模型預測的精準度。

現在威朋廣告推薦的機器學習演算法使用的是Mutual Information，用以計算樣本中每一個特徵與標籤間的相關性。當待預測的資料進來時，跟模型比對每一個屬性的加權分數，以線性轉換的方式綜合所有特徵的計算出一個價錢，而這個價錢就是當下威朋想要用以競標該次廣告板位的價格。

廖耘說，無法一開始就算出一個最好的模型，但是隨著樣本資料的更新，訓練出來的模型將是最適合當下的。預測模型會因為應用的不同而採用不一樣的更新策略，而威朋其中一種更新策略是，新累積固定筆數的資料後，就拿一段時間的資料重新訓練模型，例如每新增500筆資料，就取近2天的資料重新訓練預測模型。

為機器學習量身打造大量資料處理引擎

威朋用8臺伺服器組成的運算叢集來計算出這些機器學習的模型，同時訓練多個應用在不同國家以及活動的模型。

　閱讀全文

2千萬首歌想聽哪一首？Kkbox運用機器學習隨時告訴你

隨時找出使用者想聽的歌，才能黏住使用者願意留下來聽歌，單靠人工還不夠，Kkbox依靠機器學習技術即時修正推薦模式，給你現在就會想聽的歌

想聽歌但是又不知道該聽什麼？Kkbox推薦你可能有興趣的歌曲！推薦功能背後正是使用機器學習技術，Kkbox技術長蔡怡仁說，早從3年前就開始用機器學習技術來了解使用者的聽歌喜好，並做為歌曲推薦的依據，而這已成為他們提高使用者黏著度的關鍵技術之一。

不只有推薦音樂給使用者的功能有使用機器學習，連Kkbox內部部門也會使用，像是當編輯沒有編輯歌曲清單的靈感時，便能由電腦推薦某些屬性或是主題的歌曲，提供更多元的編輯素材。另外，還有歌曲情緒判斷也有用上機器學習，為了要更精準的推薦歌曲給使用者，因此Kkbox必須了解音樂庫中的2,000萬首歌曲，這包括歌曲所能營造出的氣氛，而這項任務全由人工進行太過費時，因此也需要善用機器學習，以提高分類效率。蔡怡仁說，雖然這些服務都用上了機器學習技術，也會根據規則自動產生出結果，但是這些結果無法直接使用，要符合使用者胃口，最終還是要加上人為介入調整。

機器學習加上人的判斷才是最佳解

以機器學習技術判斷歌曲所能營造的情緒為例，歌曲同樣要經過特徵擷取的過程。在進入機器學習演算法階段之前，需要先用程式分析每首歌的節拍、音調以及節奏等特徵，並把這些特徵轉為數學向量形式的樣本，並由專家對這些樣本下標籤，標記樣本對應歌曲所代表的情緒，並由機器學習演算法找出向量中每個屬性與情緒的關聯度。

因此只要根據訓練出來的歌曲情緒分析模型，比對節拍、音調以及節奏等特徵，電腦就能判斷出歌曲的情緒。但蔡怡仁說，由於判斷歌曲情緒是一個困難的任務，甚至連專家判讀都有機會犯錯更何況是電腦。像是電腦常把悲傷的歌誤判成快樂的，因次他們會有專家負責檢查這些由電腦所做出的判斷，經重新判讀並修正樣本後，再重新將這些樣本輸入機器學習演算法中重新訓練，經過一次一次這樣的樣本修正後，電腦判斷的精確度才會越來越準。

蔡怡仁認為，機器學習是要來解決大量資料分類以及即時推薦的問題。

　閱讀全文

新聞

搶先美國，日本小型無人機法案出爐！首相官邸等周圍300公尺禁飛

日本眾議院於今年7月9日通過小型無人機飛行監管法案。在日本重要設施，如首相官邸、國會、皇居與核電廠等的外圍300公尺周圍上空，禁止飛行小型無人機，違法者將處一年以下徒刑，或50萬日元罰款

近年小型無人機應用蓬勃發展之際，也引發安全問題，如不知名的飛行器突然降落在日本首相官邸與美國白宮，為了要規範相關秩序，日本眾議院於今年7月9日通過小型無人機飛行監管法案。在日本重要設施，如首相官邸等的外圍300公尺周圍上空，禁止飛行小型無人機。

此法案日本自民黨、公民黨、維新黨與次時代黨共同表決通過，法案納入日本《航空法》現行法律，規定重要設施，如首相官邸、國會、皇居與核電廠等，外圍300公尺周圍上空為小型無人機禁飛範圍，違法者將處一年以下徒刑，或50萬日元罰款。

今年4月底，日本首相官邸的屋頂上出現一架小型無人機，而此機的直徑約50釐米，裝有小型照相機等，且螺旋槳上端，印有核輻射標誌，因此引起社會高度注意，成為安全警衛方面的一大課題。

受此事件影響，日本政府於今年4月24日在首相官邸首次召開相關會議，著手制定相關法規。

　閱讀全文

Google又有新專利，讓你能用手指拍照

Google申請了一項用手指手勢來拍照的技術專利，搭配特殊頭戴式裝置，只需雙手手指框住要拍的範圍，就能拍下照片

Google於7月7日註冊手指拍照專利技術，有別於以往傳統按快門方式，可直接用手指捕捉實景，被手指框住的實景將透過裝置自動處理成照片，即完成一次拍照。

由Google所發明的拍照新技術，可用來嵌入頭戴式裝置HMD（Head-mountable device），透過鏡頭自動感應手勢，來偵測手指所比畫出的拍照實體範圍框，來拍攝手指比畫範圍內的實景。

手指拍照運作先後程序，首先，當電源啟動，裝置會自動聚焦人的頭部，而後分析感應實景資訊，並偵測拍攝者所比畫的手勢。拍照完成前，裝置可能來回一次或多次去感應手指所筆畫出的框。最後，頭戴式裝置即可捕捉影像，達成拍照目的。

當拍照完成後，HMD裝置可處理已成形的照片，包括裁切功能、白色色調平衡調整功能及曝光調節功能。

另外，關於不同手勢的拍照，具有不同拍照效果。

　閱讀全文

Facebook變更CPC廣告計價方式，按讚或評論不計費

過去CPC的計算方式包含「參與點擊」與「連結點擊」。「參與點擊」包括按讚、分享、評論及繼續閱讀等，「連結點擊」則涵蓋連至其他網站、採取實際行動、安裝程式、點擊以觀賞影片，以及點擊Canvas程式等，新的CPC只計算使用者的連結點擊，不再計算參與點擊，但也拉高了CPC價格

Facebook於本周更新該站的點擊計價（Cost per Click，CPC）廣告的計費方式，只計算使用者連至其他網站或安裝程式的點擊，而不計算使用者按讚、評論或分享的次數。

Facebook表示，廣告主在該站下廣告的用意通常有某些商業目的，像是促進廣告主網站的流量或是推廣程式，因此，Facebook即日起將變更該站的CPC定義，未來幾周該站的Ads Manager廣告管理工具與Power Editor大量廣告部署工具即會採用此一新的定義。

過去Facebook的CPC計算方式包含「參與點擊」（engagement clicks）與「連結點擊」（link clicks），「參與點擊」包括按讚、分享、評論及繼續閱讀等，「連結點擊」則涵蓋連至其他網站、採取實際行動、安裝程式、點擊以觀賞影片，以及點擊Canvas程式等，新的CPC只計算使用者的連結點擊，不再計算參與點擊。

Facebook指出，此一新的定義讓CPC的計算更符合廣告主的競標目的，並讓廣告主得以最佳化各種行銷活動。

　閱讀全文

15名資安專家群起反對美英政府的加密通訊存取特權

美英立法與執法機構近來不斷呼籲應授權政府存取包含加密資訊在內的權利，以打擊危及公眾安全的犯罪事件，但資訊專家們認為此舉將帶來許多重大問題，會讓網路更不安全，讓系統更加複雜，恐帶來難以挽回的災難

就在美國參議院司法委員會即將在7/8展開一場有關大眾安全與隱私之間如何取得平衡的公聽會之前夕，15位頗負盛名的密碼學家與電腦科學家共同發表了一份長達33頁的白皮書，指稱允許政府存取所有的數據與通訊是不安全的，無異於將鑰匙擺放在門墊下。

此事源自於美國及英國的立法與執法機構不斷在呼籲應該要重新設計網路系統以確保政府能存取各種資訊，包含加密資訊在內，並宣稱加密技術的普及與精進將會妨礙政府調查能力。

本周的公聽會邀請了美國政府官員、美國聯邦調查局（FBI）、資安專家及法律專家等人參與，主題為「Going Dark: Encryption, Technology, and the Balance Between Public Safety and Privacy」，討論的是加密及技術與大眾安全及隱私之間的平衡，但雙方在展開之前即公開過招。

　閱讀全文

前期文章

全部歷史文章

出刊日期	出刊主題

2015-07-07	燦坤全國300多家門市全面導入B...

2015-06-30	2千倍軟體交付速度的破壞性變...

2015-06-23	車王整併IT系統架構有一套，貫...

2015-06-16	微軟打造的企業會議神器84吋超...