您現在的位(wèi)置是:首頁 > 企(qǐ)業推廣 > 常(cháng)見(jiàn)問題

OCPC在線廣告計費及定向方式簡析

2021-06-17 08:52:47作者:企業好幫手 人已圍觀

簡介在線廣告投放是對於實時性和響應率有極高要求的推薦營銷類應用場景,其多種lookalike算法思想對於銀行的推薦營銷類產品有極強的借鑒意義。...

  隨著互聯網的誕生與發展,在線廣(guǎng)告(gào)也應運而生,這是一種以各類互聯網產品為媒介向潛在(zài)消費者傳遞營銷信息的新型廣告形式。

  目前主流的在線廣告媒(méi)體主要包(bāo)括:傳統網站(zhàn)、搜索引擎、視頻(pín)網站以及社交媒體等。

  與基於電視、報紙(zhǐ)為載體的傳統廣告相比,在線廣告的優勢在於可以實(shí)時精準記錄廣告(gào)曝光、產品點擊、下載、購買等實際數據,從而能夠有效結合新興的大數據和機器學習技術完成廣告的智能付費和精準營銷。

  本文中,筆者將總結目前主流(liú)在(zài)線廣告的(de)業務投放流程,並(bìng)介紹(shào)幾種主流的在(zài)線廣告計費模式CPT、CPM、CPC、CPA以及近年出現的智能計(jì)費(fèi)模式(shì)OCPM、OCPC、OCPA。在智能計費模(mó)式下,係(xì)統(tǒng)將協助廣告主通過實時預估每一次點擊的轉化率並基(jī)於競爭環境(jìng)智(zhì)能出(chū)價,強化高轉化(huà)率流(liú)量(liàng)獲取,弱(ruò)化(huà)低轉化率流量展現。

  最後,本文將重點(diǎn)介紹提升廣告效果的兩種主(zhǔ)流定(dìng)向(xiàng)方式(shì)以及目前適(shì)用於解決不同場景下用戶定向問題的4種(zhǒng)Lookalike方法。

一、在線廣告係統(tǒng)投放業務流(liú)程簡介

  不同的媒體都有著適用於自家形式(shì)的廣告投放曆程,但一般至少包含以下流程:

  下麵將詳細介紹以上流程:

1.廣告投放計劃(huá)設置

  廣告(gào)主一般通過媒體提(tí)供的客戶(hù)係統創建自己(jǐ)的廣告投放計劃,投放計劃中一般至少包含:

  預算計劃,如每天的最大消費上限、預算消耗速率等(děng)。

  定向計劃(廣告投放客群選擇),如使用標(biāo)簽直接篩選,如指定地域、性(xìng)別、年齡段、職(zhí)業等進行投放,實力(lì)較強的媒體(或依托第三方科技)可能會提供基(jī)於lookalike算法(fǎ)等新興技術的智能化定向投放方式。

  計費方式,廣告主可結合自(zì)己的營銷目標和實際情況從CPT、CPM、CPC、CPA中(zhōng)選擇最適(shì)合自己的計費方式,實力較強的媒體一般還(hái)提供智能化的OCPM、OCPC、OCPA等計費模(mó)式以供廣告主進行選擇。

2.廣告競價隊(duì)列篩選(xuǎn)

  當用戶產生(shēng)媒體的瀏覽行為(如搜索網站)時,網站除了展示自然(rán)內容,還要展示廣告內容。

  例如,當用戶搜索“新型肺炎病毒”後(hòu),係統會(huì)先判斷當前用戶是否可以投放廣告,如客戶未達到係統規(guī)定客戶每天廣(guǎng)告瀏覽上限(過多的廣告會影(yǐng)響用戶體(tǐ)驗,網站會在收(shōu)益和用戶體驗之間權衡),係統才會進入後續流程。

  接(jiē)下來,廣告投放(fàng)引擎會通過廣告位(wèi)管(guǎn)理模塊判斷當(dāng)前頁麵可以(yǐ)展現什麽類型的廣告,然(rán)後(hòu)從已經完成廣告投放計劃設置的廣告中篩選符合(hé)展現條件(jiàn)的廣告,並將所有符合條件的合法廣(guǎng)告放到一起,產生一個合法廣告隊列。

  例如,如果某個(gè)廣告預算消耗(hào)完了,或者(zhě)廣告內(nèi)容與客戶搜索的內容差異較(jiào)大,將無法進入合法廣告隊列(liè)。

  此外,對(duì)於設置了定向客(kè)群投放的廣告,如果瀏覽用(yòng)戶不滿足篩選條件,則將該廣告從(cóng)廣告隊(duì)列剔除;對於采用Lookalike相關定向算法的(de)廣告,係(xì)統通過前期訓練的模型對瀏覽用戶進行點擊率、轉化率的預估,過低的(de)廣告將會從廣告隊列刪除。

3.廣告競價隊列排序

  一(yī)般來說,處於(yú)競價(jià)隊列中的廣告既能滿足媒(méi)體用戶的需求,也能滿足廣告主的需求,但由(yóu)於瀏覽用戶的廣告位m有限,而競價隊列中的候選廣告數n一般較(jiào)多(m

  現存的競(jìng)價機製主要有三種:廣義第一價格(GFP)、廣義(yì)第二價格(GSP)和VCG。

  GFP機製的缺點主要在於廣(guǎng)告(gào)主(zhǔ)需要不斷地調整出價才可能達到最優(yōu),係統整體(tǐ)收益也會因此而變得不穩定,另一方麵,VCG雖然通過激勵兼容(講真話)的機製取得(dé)全局均衡效果,但計算較為複雜。

  因此目前主流的媒體主要采用GSP來實現競價模型,並且實際中(zhōng)都會對GSP做各(gè)種調整。

  GFP、GSP競價模型的設計都是以提升媒(méi)體廣告收益的為目的的,在(zài)單次的(de)競價中一種常用的標準是(shì)通過量化競價隊列中不同廣告本次(cì)投放後的預期展(zhǎn)示費用排序標準。

  此時,不同計費模式下的廣告可以通過計算可能為媒體帶(dài)來的收益期望來進行統計量化排序。如CPC計費模式(shì)下,廣告主為媒體帶來的收益可預估為:

  rank=Bid_cpc*eCTR

  其中,Bid_cpc為客戶的CPC出價,eCTR為係統預估的該廣告點擊率,而在CPA計費模式下(xià),收益將被預估為(wéi):

  rank=Bid_cpa*eCTR*eCVR

  其中(zhōng),Bid_cpa為客戶的CPA出價,eCVR係統預估的(de)該廣告轉化率。

  廣告引擎將根據係統(tǒng)計算出的預期收益對競價隊列中的廣(guǎng)告進行排序,進而從(cóng)m個廣告中挑選出能為自己帶(dài)來最高收益的n個廣告進行(háng)投放。

  值得一提(tí)的是(shì),在廣告位資源有限、廣告主預算有限,不同廣告投放條件也不同(tóng)的情況下,傳統的(de)競價機製隻能保證媒體在單(dān)次的(de)廣告投(tóu)放中預期收益最(zuì)高,但如果知道了一天的所有流量信息,往往可以找到收益更大的方式(局部最優->全局(jú)最優)。

  如何優化廣告係統的在線匹配策略,提升係統總體收益,還值得(dé)深入研究。

4.廣告展示與(yǔ)結算

  從競價(jià)隊列中確定好要展示的廣告後,展現端會根據排(pái)序結果展示廣告(一般排名(míng)越高的展示位(wèi)置越(yuè)好)。

  如果用(yòng)戶點擊了廣告,廣告係統會自動記錄點擊日誌,這些日誌可以作為(wéi)廣告係統中各類(lèi)算法優化的數(shù)據(jù)源。

  同時,相關數據也(yě)會經過統計分析後展示給廣告主,讓他們(men)能夠看到自己廣告的展示信息、點擊信息、轉化情況。這些日誌(一般會實施A/B測試),也是各(gè)類算法(fǎ)評估效果好壞的重要依據,並可根據展示效(xiào)果逐步優化改(gǎi)進。

  最後,平台會根(gēn)據廣告主選擇(zé)的計費方式對投放廣告成功的廣告主進行扣費,扣費前一般會經過反作弊係統的過濾(主要是惡意點擊)。

二、在線廣告計費模式的發展

  與(yǔ)傳統的電視、報紙不同,在線廣告的(de)媒體一般會提供給廣告主多種不同類型的候選計費(fèi)模式,這些計費模(mó)式都是互聯網規模和技術發展到一(yī)定階段的產物,下麵按照出現順序介紹一下目前主流計費模式:

1.CPT/CPM

  互聯(lián)網早期(qī),由(yóu)於用戶對新鮮事物的好奇,在線廣告的點擊率一度高(gāo)達40%(Templeton and Brad,2008),產品的轉化率也能達到一個廣告主比較滿意的水平。

  由於效果良好,廣告主願意接受(shòu)類似於傳統媒體(如(rú)電視、報紙等)提供的按投放時間(CPT)、按展現次數(CPM)進行(háng)計費的(de)方式(shì)。

2. CPC

  隨著互聯網的普及和發展,在線廣(guǎng)告也(yě)變得(dé)越來越多,用戶不再好奇,隨(suí)之而來的是在線廣(guǎng)告點(diǎn)擊率(CTR)、轉化率(CVR)的大幅下滑,廣告主開始深入思考廣告和企業營收之(zhī)間的關係、廣告實際效果如何(hé)精(jīng)確衡(héng)量。

  與此同時,隨著對用戶行為的深入分析,廣告係(xì)統的設(shè)計人員發現不點擊廣告A的用戶,可能點擊廣告B,這說明(míng)不同用戶對廣告的(de)點擊偏好不(bú)同。

  如果能根據用戶的喜好,隻投放給他們可能會點擊的廣告(gào),那麽同一時段內,流量可以同(tóng)時售賣給(gěi)多個(gè)廣告主,不僅可以保持整體的廣告效果,係統也增加了收益。

  於是,在網站(zhàn)和廣告主協(xié)商後,按(àn)用戶點擊次數計費(CPC)的模式應運而生。在CPC模式下,網站可以將(jiāng)流量賣給更多的廣告主,而廣告主也(yě)樂於為更直接的效果付費,雙(shuāng)方均更願意接(jiē)受這樣(yàng)的模(mó)式。

3. CPA

  CPT、CPM、CPC模(mó)式下,廣告主通過估算每次點擊(jī)的費用(eCPC),可以靈(líng)活選擇性價比最高的廣告產品。

  但越來越多廣告主對廣告位的競爭(zhēng)導致eCPC逐漸升高,且用戶的(de)點(diǎn)擊行為和廣告主關心的最終轉化仍存(cún)在一定距離(lí),廣告主尤其是對短期實際ROI(投資回報率)如GMV(成交總(zǒng)額)等(děng)提升更加敏感的(de)小型廣告主(zhǔ)開始(shǐ)更(gèng)關注廣告對最終轉化(huà)的(de)影響。

  在此情況下,部分媒體推(tuī)出了按用戶實際轉化數(CPA)計費的新模(mó)式以豐富(fù)不同廣告(gào)主的(de)選擇(zé)。

4.OCPM/OCPC/OCP

  CPM模式(shì)下,廣告主會(huì)擔心投放後CPR和CTR不高,即錢花了,沒點(diǎn)擊或沒(méi)轉化;CPC模式下,廣(guǎng)告主會擔心投放後CTR不高,即錢花了卻沒轉化,所以很多廣告主都希望媒(méi)體能按照CPA模(mó)式進行計費。

  但媒體方的顧慮在於,廣告效果如(rú)CPR、CTR等不僅取決於媒體方流量質量還取決(jué)於廣告主自身(shēn)產品、廣告、落地頁(yè)等多方產品的(de)質量,采用CPA等於擔保(bǎo)了(le)廣告主的廣告效(xiào)果,對於媒體而言風險較高,因此市(shì)場上大部分媒體僅願(yuàn)意考慮對少數優(yōu)質產品提(tí)供CPA的計費方式。

  當CPM、CPC和CPA分別無法滿足廣告主和媒體方時,OCPM、OCPC(OCPA)應運而生。

  OCPM、OCPC(OCPA)的本質還(hái)是按照CPM/CPC方式計費,但其采用更科(kē)學(xué)的轉(zhuǎn)化率預估機(jī)製,在廣告主費用一定的情況下,強化高預期轉化率的流量占比,降低預期轉化率的流量占比。

  因此,OCPM、OCPC(OCPA)更像是一(yī)種以優化廣(guǎng)告主廣告效果為目標(biāo)的智能化出價策略。

4.1OCPC下的廣告投放

  目前主流的OCPC模式主要包含兩個廣(guǎng)告投放(fàng)階段:

  第一階段:數據積累(lèi)。

  第一(yī)階段(duàn)和傳統(tǒng)的CPC模式沒差別,廣告主需自行設置合理的CPC出價,在獲取一定的轉(zhuǎn)化樣本後即進入二階(jiē)段(樣本用於係統進行轉化率預估模型的優化訓練)。

  部分媒體也支持直接(jiē)跳過第一階段進入第二階段,其缺點在於直接跳過第一階段(或(huò)一階段積累樣本過少(shǎo))可能會影響轉化率(lǜ)預估模型的精(jīng)準度。

  第二階段:智能投放。

  根據eCVR進行智能投放(fàng),以轉化成本為優化方向,幫助廣告主提高廣告轉化效果,此階(jiē)段廣告主可設置合理的CPA範圍作為OCPC二階段的優化目標(biāo)。

4.2 OCPC作用原理和(hé)優勢

  下麵我(wǒ)們通過媒體不同(tóng)模(mó)式下的實際計費(fèi)方式和廣告位競爭排序值理解OCPC的原(yuán)理和(hé)優勢:

  GFP、GSP競價模式下,媒體(tǐ)在廣告滿足基本條(tiáo)件(jiàn)的前提下(xià)(如廣告不能涉嫌欺詐、影響用戶體驗(yàn)、eCVR過低等),從最大化收益的角度出發,主要的參(cān)考指標是eCPM(每次展示的(de)期望收益)。

  例如,廣告主選擇傳統的CPC模(mó)式計費,其(qí)eCPM = eCTR * CPC,而在OCPC二階段中由於eCPM被(bèi)調整為eCTR * eCVR * 目標CPA。因此,在目標CPA一定的(de)前提下,廣告主可以提升(shēng)自己在高eCVR流量中的(de)eCPM值,提升競價排(pái)名。

  直觀感(gǎn)受就是二階段的OCPC理解就是通過智能預估轉化率,幫助廣告(gào)主針對適(shì)合自己的廣告位(高eCVR),動態提高CPC = eCVR*預期CPA,強化了高轉化率流量(liàng)的(de)曝光(guāng)占比。

  例如,廣告主A和B設置的目標CPA均為(wéi)100元;在OCPC二(èr)階段模式下,係統計算出某廣(guǎng)告位A和B的預估點擊率(lǜ)eCTR_A、eCTR_B分別為0.1、0.2,預估轉化率eCVR_A、eCVR_B分別為0.1、0.3,那麽係統計算出的A和B的排序水平分別為(wéi):

  Rank_A = eCTR_A*eCVR_A*100 = 1

  Rank_B = eCTR_B*eCVR_B*100 = 6

  此時,B勝出,且係統將此次廣告的價格實時(shí)調(diào)整為:

  CPC_A = eCVR_A*100 = 1

  CPC_B = eCVR_B*100 = 3

  上(shàng)述分析說明OCPC模式下,係(xì)統通過動態調整CPC價(jià)格,在CPA不變的前提下,增加了高預期轉化率廣告的曝光機會,實現(xiàn)流量增值。

4.3 OCPC和CPC/CPA比較

  OCPC和CPC的實(shí)際計費方式都是按(àn)照點擊計費,OCPC的一階段與CPC完全相同,區別在於(yú)OCPC的第二階段,係統會根據廣(guǎng)告主設定CPA目(mù)標動態調整CPC出價,其通過智(zhì)能算法出價替代了傳統CPC計費(fèi)模式下人(rén)工調整CPC出價的工作。

  OCPC和CPA的區別在於兩者使用的計費方式不同,在OCPC第二(èr)階段,廣告主設置的(de)目標CPA僅作為係統的優化目標,實際的計費方式(shì)仍(réng)采用CPC。

4.4OCPM/OCPC(OCPA)比較

  OCPM、OCPC還是OCPA一定程(chéng)度均(jun1)為媒體和廣告主博弈的產物,都是通過廣告主設置目(mù)標CPA後由(yóu)係統完成出價策略的智能優化,它們(men)在評估、排序以及(jí)定價邏輯上基本一致的,差(chà)別在於實際的計費(fèi)方式。

  OCPM和OCPC的區別在於實際計費模式是用(yòng)CPM還是CPC;而OCPC和OCPA幾乎完全一致,均采(cǎi)用CPC方式計費,筆(bǐ)者猜測(cè)隻是不同媒體按照實際計費(fèi)模(mó)式或優化目標(biāo)的不同命(mìng)名方式而已。

三、在線廣告定向方式

1. 兩種定向方(fāng)式

  在線廣告定向投放的方式主要有兩種:內容定向和用戶定向。

  內容定(dìng)向主要是對(duì)廣告位的內容進行選擇,如在搜索媒體中常見的關(guān)鍵詞匹配模式下,廣告主可指定一組希望投標的關鍵字來定位其廣告。

  如果關鍵字(zì)出現在合適(shì)的上下文中(搜索查(chá)詢或頁麵內容),該廣告才會進入廣告位競價隊列。該模式的缺點在於廣告主可能很難枚舉它想(xiǎng)要投(tóu)標的(de)整個關鍵字集(jí)。

  為緩解此問題,許多廣告平台推出了寬泛的關(guān)鍵詞匹配模(mó)式(shì),該模式下,廣告(gào)商提供的每個關鍵詞都被擴展到一個更大的關鍵詞(cí)集合,如關鍵字“自行車(chē)修理”可以擴展成近似的關鍵字 “修車”和(hé)“修理我的自行車”。

  用戶定向模式下,廣告主可通(tōng)過特征篩選用戶。這(zhè)些特(tè)征可以顯式地指定,也(yě)可以從用戶的行為(wéi)中推斷。

  傳統的特征篩(shāi)選主要依賴於廣告主在(zài)了解自(zì)身產品的基礎上通過業務經驗結合一定的數據分析後找出(chū)合適的篩選標簽(qiān),如年齡、時段、地理位置等。

  這種方式的缺點在於對廣(guǎng)告主業務經驗的要求(qiú)較高(新產品往往較為缺乏),且往往篩選出來(lái)的人群規模不易控製(zhì),需要不斷嚐試;另一方麵,與(yǔ)關鍵字廣告一樣,列出所有目標(biāo)用戶特征對於廣告主來(lái)說是極(jí)其困難的。

  為解決此問題,一些廣告平台提供了智能化的篩選方(fāng)式(shì),廣告(gào)主可以(yǐ)通過給定一批種(zhǒng)子客戶來(lái)告訴係統自己想(xiǎng)要將廣告投給什麽(me)樣的人。

2.Lookalike算法

  Lookalike是優化解決用戶定向問題的一係列方法集合,Lookalike通過各類數據分析(xī)、數據挖掘和機器學習技術,減少用戶定向對於廣告主業務經驗的依賴,實現廣告目標客群的精準定(dìng)位。Lookalike主要有四類:

  基(jī)於多方(fāng)計算平台的數據分(fèn)析

  基於相似度量化的Lookalike算法

  基於(yú)響應率預測的Lookalike算法

  基於社區擴散的Lookalike算法(fǎ)

2.1基(jī)於多方安全計算平台的數據分(fèn)析

  嚴格來說,該(gāi)方(fāng)法不能稱(chēng)之為(wéi)一種Lookalike算法,其和依賴於廣告主自(zì)身業務經驗或者數據(jù)分析(xī)確定目標客群方式的差別主要在於其數據(jù)標簽和(hé)維度的豐富程度上。

  廣告平台可以基於多方安全(quán)計算平台在保障數據隱私安全的前提下從多(duō)個外部數據源擴展可用的數據標簽範圍。

  通過更加豐(fēng)富的數據和標簽維度,提供Lookalike技(jì)術服務的公司往往可以(yǐ)提供比廣告主自身更加豐富合理的目標客群標簽信息。

  另外,該模(mó)式下的多維數據標簽均可以作為其他類型Lookalike算法的(de)輸入。

2.2 基於相似度量(liàng)化的Lookalike算法

  基(jī)於相似度量化的Lookalike算法,主要通過將用戶向量化表(biǎo)示後構建相似度量化模型完成任(rèn)一用戶與種(zhǒng)子客群之間的相似度計算。

  2.2.1 用戶的向量化(huà)表示

  進行相似度量化計算的前提是(shì)客戶的向量化表示,包括word2vec、doc2vec、node2vec等(děng)技術都可以用於對(duì)於客戶不同類型數據(jù)的轉化,主要的數據類型包括:

  屬性類數據:如年齡(líng)、性別、學曆、職(zhí)業等基本數據;在處理類似(sì)於學曆、職業等多分(fèn)類數據的時候,一種可行的方法是進行(háng)one-hot處理,部(bù)分(fèn)類別(bié)較多的變(biàn)量可能會衍生出過多的0-1變量,此時(shí)可以考慮將該(gāi)變量中的不同類別命名當成單詞處理,這(zhè)樣即可以使用word2vec技術完成該分類變量的向量化(huà)表示。

  社交類數據:在微博等強社交型媒體中社交類數據一般較(jiào)為豐富,其對(duì)用戶相似(sì)性的影響較大;目(mù)前(qián)基於圖數據的挖掘(jué)技術主要包括(kuò)兩類:基於客戶圖特征的挖掘,如距離、中(zhōng)心性等圖指標;另一種是基於隨機遊走條件(jiàn)下的node2vec方式挖掘,其核心思想是使用(yòng)隨機遊走模型抽樣出大量(liàng)的節點序列,之後利用類似於word2vec中(zhōng)使用的skip2gram算法(fǎ)完成圖節點的向量化表示。

  文本類數據:短語或者詞匯類(lèi)數據采用目前成熟的word2vec即可以完成詞向量的轉(zhuǎn)化;對於一段(duàn)話這(zhè)種,文本的向量化可以通過word2vec算法結合(hé)詞的重要性量化(huà)算法(fǎ)tf-idf完成,或者直接采用doc2vec完成,doc2vec算法的優勢在於考(kǎo)慮到了語序信息對文本的影(yǐng)響。

  2.2.2相似度量化模型構建

  主流的相似度量化模型(xíng)主要包含三個步驟(zhòu):不同特征的相似度計算、用戶間的相似度計(jì)算、用戶與種子客群的(de)相似度計算。

  特(tè)征的相似度計算以用戶特征的向量化表示為前提,可用如餘弦相似度公(gōng)式進行計算,之後可以(yǐ)進行用戶間的(de)相似度計算。

  假設(shè)和分別(bié)代表某個種子客戶和某個候選用(yòng)戶的向量化表示,兩者之間的相似度可(kě)以量化(huà)為:

  其中,為各個(gè)指標的相似度(可用如餘弦相似度公(gōng)式進(jìn)行計算),為不同特征的相似度權重。

  考慮到不同(tóng)特(tè)征和客戶相(xiàng)似度的(de)相(xiàng)關性不同(tóng),因此我們需(xū)要預先訓練出不同向量在相似度計算中的權重。

  例如,我們(men)將曆史上經常在同一廣告中響應的客戶作為正樣本,將很少或基本不在同一廣告中響應的客戶作為負樣本,通(tōng)過構建LR模型進行不同(tóng)指標(biāo)的相似度權重訓練。

  另外,不同的機器學習方法如RF、GBDT、DNN、FM等也可以用於不(bú)同數據條件下用戶間相似度模型的比較訓練(liàn)。

  種子客群往往有多個種(zhǒng)子(zǐ)節(jiē)點,因此需(xū)要結合候選節點與各(gè)個種子節點(diǎn)的相(xiàng)似度結果共(gòng)同量化其(qí)與種子客群的相似度。

  可以取(qǔ)候選節點與種子(zǐ)客(kè)群中客戶的最(zuì)高、最低或是平均相(xiàng)似(sì)度作為最終的相似(sì)度結果,或者取候選客戶與種子客戶中相似度最高/最低的N個值平均作為最後的相(xiàng)似度結果。

  顯然,N取決於種子客群的差異性和規模,差異性較大(dà)的種(zhǒng)子(zǐ)客群可能由幾類不同的客群(qún)構成,此時較小的N值(zhí)可能可以取得一個比較好的(de)模型效果。

  2.2.3相似度量(liàng)化模型的優缺點

  相較(jiào)於傳統的客戶畫像方式,基於相似度量化的(de)Lookalike算法(fǎ)通過訓練不同特征相似度(dù)權重的(de)方式(shì)充分利用了所有特征的信(xìn)息,其本質上是應(yīng)用了客戶(hù)對於曆史廣告的響應數據進行遷移訓練。

  基於相似性量(liàng)化的(de)Lookalike算法很容易在用戶客群規模較小時方便快捷的實現(xiàn),難點在於當用戶規模急(jí)速擴大後,計算用戶間的成對相似性不是一項簡單的任務。

  例如,對於M個種子客戶N個候選客戶以及K個特征的場景,使用(yòng)訓練好的相似(sì)度模型進行相似性計算的(de)時間複雜度為(wéi)O(MNK),這在大規模的實時應用場景中需要極強的(de)算力支持。

  在相似度計算中,將用戶視為點,相似度(dù)視為邊,進而構造出一張user-2-user的全(quán)局圖,能夠極(jí)大程度上加速發現相似用戶的速度(dù)。

  然而,天下沒有免費的午餐,構建這張(zhāng)全(quán)局圖的時間複雜(zá)度為O(NNK)。

  為解決此問題MiniHash+LSH是一種(zhǒng)近似計(jì)算的優化方案,該方案下,相似度(dù)高的能以(yǐ)較高的概率映射至不同的桶中,因此隻需在每個桶中(zhōng)構建user-2-user的子圖即可實現高相似度目(mù)標客群的查找,時間複雜度可優化為(wéi)O(CnnK),C為桶(tǒng)數,n為一個(gè)桶的客戶數。

2.3基於響應率(lǜ)預測(cè)的Lookalike算法

  基於相似度量化(huà)的Lookalike算法通過確定用戶不同屬相似度的(de)占比權重(chóng)完成相關的相似度(dù)量化(huà),權重訓練依(yī)賴於用戶在曆史中各類產品或廣告的表(biǎo)現進行構建,其缺點在於未考(kǎo)慮不同類型的產品,同一特征占有的相(xiàng)似度權重(chóng)是不同的。

  比如(rú)對於電子類(lèi)產品,客戶性(xìng)別、愛好等應占有較高比例,而(ér)教育、培訓類產品可能對客戶的職業、學曆特征較為敏感。

  因此,通(tōng)過定義正樣本的種(zhǒng)子客戶,以及從候選客戶中抽樣出一定比例的負樣本,通過LR、RF、GBDT、DNN等機器學習對於不同的廣告構建自(zì)己的響應率模型是一種較為理想的解決方案。

  相比較於相似度模型,響應率(lǜ)模(mó)型的優點(diǎn)主要包括:

  可以加入構(gòu)建LSTM子模型的方式完成對於不方便向量化表示的時序類(lèi)信息進行挖掘。

  針對不同的數據類(lèi)型可以有更多(duō)的數據處理方法提供選擇(zé)以最(zuì)大化的保留原始數據的信(xìn)息含量,如使(shǐ)用lightGBM可直接訓(xùn)練分類變量。

  機器學習的本質是將種子的信息抽象到一定的(de)公(gōng)式或者表達上(shàng),在模型訓練完成後進行候選客戶的響應(yīng)率(lǜ)預(yù)測時,相比(bǐ)於相似(sì)度量化(huà)中的O(MNK),其時間複雜度可降至O(NK),代價(jià)就是對於不同廣告主的種子客戶需要訓練不同過的機器學(xué)習模(mó)型,這就要求係統在模型精度和時間複(fù)雜度方麵作出權衡。

  響應率(lǜ)預測(cè)方式的缺點(diǎn):

  機器學習(xí)的訓(xùn)練效果對於(yú)種(zhǒng)子客群的(de)規模大小較為敏感,過小的種子客(kè)群(qún)訓練(liàn)出來的(de)模型容易過擬合;過大的種子客群往往包含了幾類客(kè)群,也需要通過分群的(de)方式提高模型精度。

  當頻繁有(yǒu)新的客戶加入(rù)種子客群時(shí),為保(bǎo)證模(mó)型效果,需(xū)要加入(rù)新的(de)正樣本持續優化訓練模型,資源開(kāi)銷較(jiào)大;解決方案包括采用(yòng)基於GBDT類算法的增量學習方式。

  響應率模型的構建對於(yú)種(zhǒng)子客群的規模有一定要求,因(yīn)此必定存在一個(gè)種子客戶(hù)不足時的冷啟動過(guò)程,而相似度量化模(mó)型可通過借鑒曆史上其他廣告的客戶表現來完成相似度量化,對種子客群規模的要求大大降低。

  一種合理的優化方式是通過遷移學習的(de)方式,利用同類廣告已(yǐ)構建的模型來完成客戶的初始化定向,在種子(zǐ)客戶增多的過程(chéng)中,逐漸調整優化模型;

  另一種克服冷啟動的方式可以在(zài)無種子客戶(hù)(=0)時,通(tōng)過內容匹配或者(zhě)基於業務經驗的客戶匹配方式(shì)完成廣告投放(fàng),當種子(zǐ)客戶較少不滿足(zú)建模條件(如(rú)<100)時,通過相似度模型找到類似客戶完成(chéng)投放(fàng),在規模一般(如100-1000)時考慮將相似度和響應率模型結合的方式篩選出候選節點,並隨著種子客群(qún)增大逐漸提(tí)高響應率結果對客戶的評價權重,最終(如>1000)完全依賴響應率模型的預(yù)測結(jié)果。

2.4基於社區擴散(sàn)的Lookalike算法

  相較於傳統的媒體,社交類廣告不但應考慮候選節點自身(shēn)的(de)自(zì)身對於(yú)廣告的響應率,還應該考慮的節點協助進行二次社交傳播的可(kě)能性,即節點的(de)社交價值。

  相(xiàng)比較於其他類型的廣告,社(shè)交類廣告的最主要特點是具有互動和傳播(bō)屬性,因此相比於傳統的搜索、視頻類(lèi)媒體,社交類媒體中,用戶關(guān)係類數據是一類獨有的數據。

  相較於前麵方(fāng)法中(zhōng)側重(chóng)於找到(dào)與種子客戶(hù)中相(xiàng)似的人,社交類媒體中可以利用社交數據(jù)尋找種(zhǒng)子客戶占比較(jiào)高的社區來完成目標投放。

  另外(wài),由於社交類媒體的廣告效果不僅僅停留在投放期的即時互動上,好的社交廣告(gào)會引發大眾的傳播效應,從而大幅提升社交類廣告的作用。

  因此,社交類(lèi)廣告在投放時,廣告主不但要考慮候選客戶自(zì)身的響應概率,還(hái)應該考慮(lǜ)候選客戶在(zài)網路社區中的口(kǒu)碑和影響力,高(gāo)影響力的候選客戶有助於廣告主的產品在短時(shí)間內形成“病毒傳播”,從而擴散到世(shì)界上的每一個角落。

  一種可行性的(de)方案是通過圖(tú)數據庫(kù)構建用戶的關係網絡後,通過如Louvain或標簽傳(chuán)播等社區發現算法完成社區劃分,從中找出種子客(kè)戶濃度較高的的社(shè)區,之後通過如Pagerank等中心性算法量化節點(diǎn)在社區中的影響力,最終結(jié)合相似(sì)性和傳染能力(如中心度)兩方麵綜合篩選出優質的候選(xuǎn)節點。

3.不同定向方式的效果評價

  在線廣告(gào)定向方式的核心目標均在於在提升廣告主的投資回報率(ROI),因此(cǐ)大部分定向方案可以(yǐ)通過A/Btesing比較不同方案下對於廣告主關心的各類指標(如點擊次數、轉化次數)來比(bǐ)較方案的優劣。

  值得(dé)一提的是,社交類廣告(gào)的效果往(wǎng)往不僅隻局(jú)限在廣告(gào)目標客戶的點擊和轉化等(děng)直接結果,它有一(yī)個重要的特(tè)點是可以互動和二次傳播,如何衡量該(gāi)類廣告(gào)不同方案下的廣告投放效果值得研(yán)究。

專業(yè)名詞(cí)解讀:

  CPT(Cost Per Time):照展示時長收費

  CPM(Cost Per Mile): 按展現次數收費(fèi)

  CPC(Cost Per Click): 按點擊次數收費

  CPA(Cost Per Action): 按轉化(huà)收費,不同產品的轉化目標不同(tóng)

  OCPM(Optimized Cost Per Mile): 以(yǐ)目標轉化(huà)為目標的展(zhǎn)示出價

  OCPC(Optimized Cost Per Click):以目標轉化為目標的點擊出(chū)價

  OCPA(Optimized Cost Per Action):以目標轉化為目標的點(diǎn)擊出價

  CVR(Click Value Rate):轉化率=轉化量/點擊量

  CTR(Click Through Rate):點擊率=點擊量/展(zhǎn)現量

  eCPM(evalsuate Cost Per Mile):每次展示的期望收益(針對媒體(tǐ))

  eCVR(evalsuate Click Value Rate): 預估轉化率

  eCTR(evalsuate Click Through Rate): 預估點擊率

  ROI(Return On Investment):投資回報率或者投資利潤率

  GMV(Gross Merchandise Volum): 主要是指網站的成交金額(é)

  GFP(Generalized First Price):廣義第一價(jià)格競價機製

  GSP(Generalized Second Price): 廣義第二價格競價機製

  VCG(Vickrey-Clarke-Groves):一種以三個人名命名的競價機製

Tags:OCPC   在線廣告計費

站點信(xìn)息

  • 文章統計:33676篇文章
  • 文章總點擊數:62294
  • 聯係電話:16651465902 桂經理
  • 微信號:掃描二維碼,獲取優惠
'); })(); 久久久久久 一区丨日韩中文字幕在线免费观看丨美国一级天天操夜夜操丨人人色人人干丨伊人干88综合网丨99精品国产免费观看视频 99精品国产免费观看丨久久不卡高清一区丨日日干