2015年7月13日 星期一

威朋靠機器學習讓每日42億次廣告推薦快又準

 
每週二∼六出刊.2015.07.14
 
本 期 目 錄 簡介/舊報明細
威朋靠機器學習讓每日42億次廣告推薦快又準
臺灣OpenStack技術大會8月登場,基金會創辦人首度來臺 ...
企業發展行動化應用,仍有很大成長空間

優惠訊息

. 8/11見證台灣開源雲歷史 – OpenStack Day Taiwan 2015
. 租虛擬主機架站,再附信箱
. 日日新軟體、時時有更新,登入再下載、小當家通知你!

專題報導 

威朋靠機器學習讓每日42億次廣告推薦快又準

威朋每日需處理42億次廣告請求,每一次的廣告推薦都要在0.1秒內完成,為求精準又須考慮使用者的屬性以及行為等諸多要素,成了一大難題,解決問題的關鍵就是機器學習



該推薦什麼廣告給下午3點正在使用手機的上班族呢?當這位上班族打開App或是瀏覽網頁含有廣告板位時,威朋便會接到廣告請求,在綜合使用者、廣告主以及內部的資料後,決定出多少價錢以標下這個板位,並投放什麼樣的廣告給這位上班族。威朋在亞洲覆蓋4.5億不重複使用者,每日需處理42億次廣告請求,每一次的廣告推薦都要在0.1秒內完成,除了快還要準,關鍵就是機器學習!

行動廣告即時競價(RTB,Real-Time Bidding)的生態系中有非常多的角色,各自負責不一樣的工作,雖然臺灣即時競價的生態系較為單純,但是要能讓行動裝置使用者看到廣告,過程也是需要有不同的角色互相支援。行動裝置使用者所看到的廣告,其板位由廣告供應方平臺(SSP,Supply Side Platform)擁有,廣告供應方平臺會傳送廣告流量請求給像是威朋的廣告需求方平臺(DSP,Demand Side Platform),並由各廣告需求方平臺出價標下該板位,取得廣告主廣告曝光的機會。

對於威朋來說,最理想的情況是用最低的價格競標到廣告板位,推送使用者最想看的廣告,並把使用者的點擊轉換(Conversion)成App下載或是資料填寫等,以達到廣告主期待的目標。廣告推薦是由許多複雜小問題組成的複雜大問題,除了需要知道廣告受眾的屬性與所處情境外,還包括什麼廣告是當下使用者最想看到的,或是這個板位究竟出價多少錢才划算,整個過程有許多需要權衡的環節。

這些問題必須借助資料科學之力來解決,威朋組織了約10位工程師投入機器學習的研究以及開發。威朋研究開發部軟體工程師廖耘說,訓練 機器學習模型的資料來自廣告板位以及廣告主。當使用者透過App或是瀏覽網頁看到廣告板位,廣告板位便會發送廣告流量請求給威朋,這項請求包含了廣告供應方平臺與廣告需求方平臺資訊交換的協定,其中資訊包含板位大小、裝置型號、裝置ID、位置以及使用者個人資訊等,而在廣告主的資料方面,包含廣告的內容、標籤、風格與類別等資料。

威朋根據這些資料,以事先訓練好的模型預測出廣告板位價格以及內容並回傳,廣告供應方平臺則利用廣告需求方平臺提供的資訊做最後廣告板位顯示的決定,廖耘表示,機器學習在預測的步驟很快,而且因為他們必須在收到請求的50毫秒內給出回應,因此也不會做太複雜的運算。

用非監督式機器學習找出廣告受眾族群

機器學習分為非監督式與監督式,威朋研究開發部數據工程師陳嘉宏表示,兩者威朋都有使用。利用非監督式機器學習善於分群的特性,將從廣告供應平臺收集來的歷史紀錄做群體分析,根據樣本的多項特徵與屬性,找出這些樣本中存在的7種類型,並由人解讀後分別命名為白領商務族、熟齡樂活族、小資樂購族、完美時尚族、活力校園族、美麗媽媽族以及娛樂玩咖族。而且不只要對廣告受眾屬性分析,還要能夠猜出廣告受眾正在做什麼,藉由分析這些收集到數億筆的歷史資料,找出是哪些人正在做哪些事,建立出完整的情境(Scenario)用於投放廣告的決策。

威朋主要將監督式的機器學習用於即時的廣告決策。陳嘉宏認為,機器學習最困難的部分就在於樣本資料的彙整。一筆樣本廣告推薦系統的訓練樣本是一個數十個欄位的數學向量,其中包含來自廣告供應方平臺、廣告主以及威朋內部分析的情境資料,再以廣告受眾是否點擊廣告作為標籤,標記樣本廣告被點擊的情況。

而困難之處,陳嘉宏說,除了要先使用特別的演算法計算收集來的資料,找出與點擊率相關的屬性,才能擺進樣本中之外,還要處理許多空值資料以及假資料。

廖耘也表示,他們所處理的資料是不停流動的,新的資料會不斷進來而舊的資料會被排除,為了訓練出最適合當下的模型,需要不停更新訓練模型的樣本,但偶而會因為特殊的社會事件而收集到偏頗的樣本,這時候也要將這些極端值資料移除,以避免影響模型預測的精準度。

現在威朋廣告推薦的機器學習演算法使用的是Mutual Information,用以計算樣本中每一個特徵與標籤間的相關性。當待預測的資料進來時,跟模型比對每一個屬性的加權分數,以線性轉換的方式綜合所有特徵的計算出一個價錢,而這個價錢就是當下威朋想要用以競標該次廣告板位的價格。

廖耘說,無法一開始就算出一個最好的模型,但是隨著樣本資料的更新,訓練出來的模型將是最適合當下的。預測模型會因為應用的不同而採用不一樣的更新策略,而威朋其中一種更新策略是,新累積固定筆數的資料後,就拿一段時間的資料重新訓練模型,例如每新增500筆資料,就取近2天的資料重新訓練預測模型。

為機器學習量身打造大量資料處理引擎

威朋用8臺伺服器組成的運算叢集來計算出這些機器學習的模型,同時訓練多個應用在不同國家以及活動的模型。

 閱讀全文
 
 
臺灣OpenStack技術大會8月登場,基金會創辦人首度來臺開講

臺灣在8月11日將舉辦第二次OpenStack技術大會(OpenStack Taiwan Day 2015),OpenStack基金會創辦人,現任營運長Mark Collier將親自到臺灣參加此盛會。這次規模更大,分享的講者橫跨日本、中國、印度與臺灣四地,其中包括OpenStack核心開發者及日本雅虎

臺灣要於8月11日舉辦第二次OpenStack技術大會(OpenStack Taiwan Day 2015),今年OpenStack基金會創辦人,現任營運長Mark Collier將首度到臺灣開講。分享的講者橫跨日本、中國、印度與臺灣四地,其中OpenStack核心開發者將介紹OpenStack最新技術趨勢,另外,日本雅虎也會分享使用OpenStack的經驗。OpenStack技術大會總召姜昱有說明,Mark Collier首次來臺代表著OpenStack基金會對臺灣市場的重視程度,也是基金會官方肯定臺灣社群發展的成果。

Mark Collier將以「Welcome to the OpenStack Powered Planet」為題,介紹OpenStack對於全球的影響及發展。另外,兩位Keynote講者分別為OpenStack程式碼個人貢獻度排名前三名、寫了超過五千行程式碼的Monty Taylor及日本Yahoo網路營運總部基礎建設技術分部部長伊藤拓矢。

 閱讀全文
專欄 

企業發展行動化應用,仍有很大成長空間

文╱iThome電腦報主編李宗翰

雲端服務應用的日益多元,但這幾年之所以蓬勃發展,跟人手一臺的智慧型手機、平板電腦,關係相當密切,這也是我們這次在製作封面故事時,眼見IBM這樣的系統大廠對「雲」提出非常多元的發展策略時,赫然發現他們提出「行動優先」這句口號的真正意涵,因為在實際的企業環境當中,目前所能取得或發展行動應用還很有限。

無獨有偶,其他廠商也在差不多時間內提出了類似的訴求。起初各家的著眼點都很相近,但發展至今,面貌已經有所不同。

以另一家軟體大廠Oracle來說,他們在2014年提出了企業行動化應用優先的策略。該公司副總裁暨資訊長Mark Sunday,以及曾在Motorla長期擔任技術長、如今是Oracle行動策略產品管理部門副總裁Suhas Uliyar,就展開對談,號召企業應設計本身的行動優先戰略,並以此來擴大商機。

而在產品技術上,Oracle主推Oracle Mobile Application Framework,目的是協助企業加速開發App;在這之上,有Oracle Mobile Suite,它包含MAF,以及可整合應用程式的Oracle Service Bus、應用程式伺服器Weblogic Server,而安全機制的部分,這裡涵蓋了單一登入整合Access Management,與可實施強制控管政策的API Gateway──若要更進階的行動安全防護功能,還可延伸使用另一套軟體Oracle Mobile Security Suite。

而在雲端服務的行動應用整合方面,Oracle過往能透過原本的行動化應用軟體平臺支援,今年6月有了重大突破,該公司正式推出名為Mobile Cloud Service(MCS)的PaaS平臺,希望能提供MBaaS(Mobile Backend as a Service)行動應用後端平臺服務,並提供簡易的工具,協助分析與探勘資料MBaaS服務用量。而且,MCS所針對的使用者類型更廣,不只是App與後端服務的開發者、系統管理者,也包含企業的行動業務負責人、架構師。

還有一家IT大廠也提到行動優先策略──微軟。該公司在2014年新任的執行長Satya Nadella,在到職五十多天後,對外宣布了「Mobile First, Cloud First(行動優先,雲端至上)」的策略,推出了Office for iPad的App、Enterprise Mobility Suite(EMS)的雲端服務。

 閱讀全文
前期文章 全部歷史文章
出刊日期 出刊主題
2015-07-11 【王建興】iOS神人應徵工作之...
2015-07-10 可挑起WAN端流量大樑的4G路由...
2015-07-09 Pivotal大資料應用軟體套餐推...
2015-07-08 Splunk修正OpenSSL漏洞,提供...
我要訂閱這份報紙 我要取消這份報紙 訂報說明
.本電子報內容由 iThome online 提供
PChome ePaper 電子報版權所有,關於電子報發送有任何疑問,請聯絡 客服中心
廣告刊登消費者保護兒童網路安全關於PChome徵人
網路家庭版權所有、轉載必究 Copyrightc PChome Online

沒有留言:

張貼留言

您或許對這些文章有興趣: