導讀:本文將分享LTV 模型在用戶增長上的應用和搭建,主要介紹:
什么是 LTV?
LTV 可以解決什么問題?
什么時候需要什么樣的 LTV 預估?
如何實現(xiàn)設備粒度的LTV 預估?
LTV 如何應用?如何撬動更大的價值?
01什么是LTV
在傳統(tǒng)的經(jīng)濟學、市場學當中,LTV經(jīng)常會被應用的場景是:在一個超市中去分析來這個超市的人的整體的LTV,即LTV=Average Value of Sale *Number of Transactions * Retention Time Period,然后再做一個宏觀的數(shù)據(jù)統(tǒng)計和預測。
在互聯(lián)網(wǎng)的應用環(huán)境下,通常把LTV拆解為兩項:一個是LT(Life Time),一個是 ARPU(Average Revenue Per User)。通常在用戶生命周期的概念規(guī)范下,LT(Life Time)代表用戶在生命周期內(nèi)的活躍天數(shù);ARPU(Average Revenue Per User)是指用戶每次活躍時產(chǎn)生的價值;即LTV=LT(Life Time)*ARPU(Average Revenue Per User)。
02
LTV可以解決什么問題?
1. 用戶增長中的生命周期
用戶增長中的生命周期分為以下五個階段:
第一個階段是潛在用戶階段,即用戶還沒有成為你站內(nèi)的用戶;第二個階段,用戶成為你的站內(nèi)用戶,是一個新增用戶;第三個階段新增用戶可能會活躍,就會成為一個活躍用戶,一個活躍用戶有可能繼續(xù)活躍,也有可能流失:第四個階段,當用戶流失掉的時候,就是一個已流失的用戶;第五個階段,流失用戶形成一個用戶增長池,可以再去拉回用戶來提升整體的DAU。
2. LTV應用于增長的生命周期管理
LTV 模型可應用于增長的生命周期管理的五個階段。
(1)對于潛在用戶,可以通過一些站外的數(shù)據(jù)或者一些媒體側(cè)的增長的數(shù)據(jù),去預估潛在的用戶或者潛在的設備的LTV價值的高低;此時使用的粒度比較粗,例如地域、男女等粗粒度的畫像特征。
(2)對于新增用戶,可以去構(gòu)建其畫像特征和行為特征等,來預估用戶在本次生命周期內(nèi)的 LT 和ARUP。
(3)對于活躍用戶,數(shù)據(jù)充足,體量大,可根據(jù)近 N 天的各種特征等去預測用戶在本次生命周期內(nèi)的LT和ARPU;活躍用戶的數(shù)據(jù)可以做到一個日粒度的更新,對應的LTV價值預估可經(jīng)常刷新。
(4)當活躍用戶流失之后,進入到流失用戶池,需要預估用戶的潛在回流LTV價值,篩選出潛在回流LTV價值高的用戶。
(5)對于回流用戶,其LTV價值的分析跟新增用戶比較類似,即根據(jù)該用戶在本次回流的前 N 天的各種特征等去預測該用戶在本次生命周期的 LT 和ARPU。
3. 增長策略在生命周期的應用
LTV預測在增長策略中如何應用?還是從生命周期的五個階段依次拆解。
第一個階段是潛在用戶階段,如果知道潛在用戶的LTV價值,在買量時,就可以進行相應的調(diào)價:高價值的用戶出高價,低價值用戶出低價;從而可實現(xiàn)ROI優(yōu)化的目標。
第二個階段是新增用戶階段,當用戶來到站內(nèi)之后,可根據(jù)其前幾天的表現(xiàn)去調(diào)整其對應的LTV價值預估,可以用于復盤該新增用戶的增長策略做得好不好,也就是說當用戶來到站內(nèi)以后,經(jīng)過一些時間行為的積累,預估其在本次生命周期的LTV價值,去衡量這次買量的效果好不好。比如說你花了5塊錢買了一個用戶,通過該用戶前幾天的一些表現(xiàn),預估該用戶在本次生命周期能夠產(chǎn)生比如10塊錢的收益,那么這次買量就是成功的、劃算的。
第三個階段是活躍用戶階段,可以每天刷新活躍用戶在本次生命周期的LTV價值,但此時也需要去關(guān)注和衡量一個用戶的長期價值。在用戶增長策略和方法中,經(jīng)常會發(fā)push拉活。比如用戶因為發(fā)push來到站內(nèi),那短期內(nèi)對DAU有增長,但同時預估其長期的價值,可以知道這一次的促活能帶來的長期價值是什么;這就衍生了白盒化分析的一些應用,后面會有涉及。
第四個階段是流失用戶階段,首先在用戶流失之前,如果一直刷新活躍用戶的LTV價值預測,識別出LTV價值的下降趨勢,可以進行流失預警;對于已流失的用戶,可以根據(jù)其潛在的LTV價值高低,然后拉回,和拉新的邏輯比較像,即在拉回策略上的一個優(yōu)化。
第五個階段是對于回流用戶的LTV預估,和新增用戶的LTV預估比較類似,就是根據(jù)拉回用戶的前幾天的站內(nèi)表現(xiàn),去回顧看一下這一次把這個用戶買回來,或者說是用一些策略吸引回來的,效率如何。
03
什么時候需要什么樣的LTV預估
到底需不需要一個LTV預估?在什么場景下要怎么樣進行LTV預估?如何決策,和公司的發(fā)展策略、業(yè)務具體的應用場景都是息息相關(guān)的,有很強的邏輯性,我們從以下四個維度進行分析。
第一個維度是顆粒度,即需要對哪個顆粒度進行LTV價值預估。
顆粒度,首先包括大盤,是今天活躍的所有設備,還是整體存量用戶庫;然后包括某一個cohort,一個cohort是指特定編碼的用戶群或設備群,比如今天的新增設備可以是一個cohort,或者今天新增從某一個渠道買來的一批用戶也是一個cohort,可以對某一個cohort進行LTV價值預估;最后包括設備/用戶,是LTV價值預估的終極模態(tài)。如果能夠差異化地預估每一個設備的LTV,應用場景就非常的廣泛,可以把LTV價值預估聚合到任何維度,但是如果顆粒度越細的話,建模難度、誤差等就會越高;顆粒度太粗又無法滿足業(yè)務需求,因此一定要結(jié)合具體的業(yè)務應用場景,去決定一個合適的顆粒度。
第二個維度是時效性,是指每一次做出預估的時候需要等待一個什么樣的周期才能預估出來本次生命周期的LTV,比如預估一年內(nèi)的LTV,等的時間越久,其實就越接近真實值,但要是等得太久的話,那業(yè)務不如再等兩天看真實值就算了,所以這里存在取舍,對于時效性要求越快的話,預估肯定是越不穩(wěn)以及越不準,但是越慢的的話,業(yè)務又不能滿足需求;因此還是需要要結(jié)合業(yè)務的應用場景去決定時效性。
第三個維度是準確性。
為什么準確性是一個決定維度?比如LTV預估一個全量的值,如果真實值是100,要估100才對,估98、95都不對,這樣的標準太嚴格,因此在準確性上需要有一定的取舍。尤其是在做設備粒度的LTV預估時,有一些模型的效果是序會更準,比如A、B兩個設備,預估出來A設備比B設備的價值要高,但具體的準確數(shù)值,可能估得不一定準;有一些模型的估值更準,比如聚合在某一個cohort上,這個估值的min會比較小,但序就不太準了。更深入來分析,則可能需要在一個數(shù)據(jù)分布和建模選擇上進行取舍,當然需要結(jié)合具體業(yè)務需求去分析,如果評估實驗組和參照組的差值,那序準更重要,可以獲取設備之間誰大誰小的關(guān)系;如果是渠道買量等,就需要獲取某cohort、應用或者設備的LTV價值,比如花了5塊錢買量,最終是不是產(chǎn)生了10塊錢還是15塊錢收益,那需要預估的LTV價值準;要根據(jù)應用場景的不同做一定的取舍。
最后一個維度是用戶生命周期定義。
在傳統(tǒng)的市場學中,用戶生命周期是指用戶的壽命周期,就是完完整整的生命周期,buy until you die。但是在我們的業(yè)務應用場景中,用戶生命周期會定義一個數(shù)字,有可能是一個月、一年,也有可能十年;具體是多長時間會通過以下幾個因素進行分析決定。
(1)公司的發(fā)展階段
如果公司發(fā)展到了比較成熟且穩(wěn)定的階段,則要關(guān)注用戶的長期價值;如果在飛快發(fā)展的階段,歷史值都不太具有參考性,建模的穩(wěn)定性以及對于未來的預估的能力也不足;因此要根據(jù)公司發(fā)展階段來決定生命周期的長短。
(2)宏觀經(jīng)濟地域環(huán)境
當去預估一個設備或者一個渠道的價值時,如果看的比較長久一些,要考慮設備多久換一次機,和換機時間是否能夠匹配上,其實也是buy until you die的邏輯,這個時候捕捉的就是設備的生命長度;具體需要看多長時間的周期就要根據(jù)宏觀的經(jīng)濟環(huán)境去決策。
(3)歷史數(shù)據(jù)積累
和第一點類似,不贅述。
(4)應用場景
在某些應用場景下是否需要和某些指標對齊,那么也會影響用戶生命周期定義。
下面介紹幾個常規(guī)的LTV預估模型。
第一個模型是歷史值擬合。
針對某一個cohort或大盤,根據(jù)整個cohort或大盤的真實留存數(shù)據(jù),去擬合一個曲線y=a*ln(x)+b,預估出a和b的值,從而可以預估后續(xù)日期的LTV價值。
該模型的好處是應用比較簡單,簡單清晰。弊端是穩(wěn)定性差,比如有一些激勵政策或前七天有促活,擬合出來的曲線就會有偏差,不是一個符合真實情況的成立函數(shù);也有可能中間有一些活動帶來的一些尖刺spike,就會直接帶偏未來的預測,需要等的時間比較久,通常等30天、60天都有可能,預測才能真的穩(wěn)定下來。
第二個模型是Probabilistic Model。
該模型將LTV拆解為LT和ARPU,當去看某個cohort或者大盤時,假設這些指標都是某種分布,然后根據(jù)歷史數(shù)據(jù)預估該分布的參數(shù),從而來預估未來的LTV,通常用于看大盤比較多。
最后一個模型是通過DNN或Machine Learning建模去構(gòu)建特征,包括用戶近N天畫像特征、行為特征、消費特征、生產(chǎn)特征等,所有和業(yè)務、產(chǎn)品相關(guān)的維度,對用戶本次生命周期的LT和ARPU分別進行預估。
下面從常理上剖析一下該模型。通過此類模型預估的LT和ARPU,實際上都面臨一個問題:大部分的用戶可能活躍一天或者花 10 塊錢就走了,有一部分用戶就花特別多的錢,但可能在尾部又出現(xiàn)一個spike,即20%的用戶貢獻80%的收入,這樣的分布建模的難度比較高,比如用平常的MAE當loss的話,就不太容易能夠把這些極端的情況都捕捉到,可能會受比較奇怪的分布的影響,沒有辦法學到稀疏的地方。Google預估LTV的一個方法是沒有拆LT和ARPU,采用zero inflated log normal 模型直接預估一個用戶的LTV,具體可參考這篇文章:《Wang, X., Liu, T., and Miao,J. (2019), A deep probabil- istic model for customer lifetime value prediction, Available from: https://arxiv.org/abs/1912.07753》快手電商與增長模型團隊也創(chuàng)立了獨特的產(chǎn)業(yè)級LTV建模方法,通過引入Order Dependency Monotonic Network (ODMN)來針對時間跨度與LTV的有序依賴性建模,大幅提升模型表現(xiàn),同時使用基于分治法思路的Multi Distribution Multi Experts (MDME) 模塊式學習,解決了LTV數(shù)據(jù)分布稀疏對建模的困難。詳見
04
如何實現(xiàn)設備粒度的LTV預估
如何實現(xiàn)設備粒度的LTV預估,總結(jié)下來就是數(shù)據(jù)和模型這兩塊。
數(shù)據(jù)基建是一個金字塔型階梯式的數(shù)據(jù)積累。
最底層是DAU的特征積累,即對DAU各種特征做數(shù)倉建設,對LTV的用途做模塊化管理,比如把生產(chǎn)側(cè)的某種指標聚到一塊,實時地更新特征庫。
第二層是對不同cohort的模型圈選人群,其中cohort是指人群等,比如需要做設備粒度的LTV預估時,預估模型需要圈選人群,該人群可能是MAU、DAU等,根據(jù)圈選出來的人群決定畫像和時效性。
第三層是聚集所有的特征,去得到訓練/預測集等,就決定了特征的復雜性、模型的復雜性、訓練更新頻率等。
第四層是線上的多維實時數(shù)據(jù)源,偏維度項、偏實時的數(shù)據(jù),即在模型預測或訓練時才加進來的一些比較簡單的數(shù)據(jù)。最頂層最終預測輸出,預估的LTV價值。
模型基建分為三塊。
第一塊是只用一個模型框架承接整個探測數(shù)據(jù)、特征處理、訓練、預測,結(jié)果評估等完整流程,即該模型框架需要可以支持完整流程,并且有很強的拓展性,有一定的復用性。
第二塊是內(nèi)部有工具去部署任務、管理機器資源等,無論是用airflow,還是內(nèi)部自研的工具。
最后一塊是日常監(jiān)控,包括預測異常監(jiān)控、模型準確率監(jiān)控、特征變化監(jiān)控,比如監(jiān)控是否準時產(chǎn)出、特征變化等,監(jiān)控特征是不是從某個時候開始偏移了,整個分布都變了,則對應模型不再適用,因此都要從各個維度,比如預測的結(jié)果、模型的準確性,還有特征等都要做監(jiān)控。
05
LTV如何應用?如何撬動更大的價值?
最后介紹一下LTV如何應用以及如何撬動更大的價值。前面講過的白盒化和此相關(guān),通過模型可以榨取出白盒化的一些產(chǎn)品洞見。
對新增用戶進行建模時,可以做畫像切片,篩選出高價值的用戶,然后針對性地做一些買量策略;也可以預測時序上的變化,預估真實的LTV是怎么樣變化的,也可以預測具體的特征是怎么樣的變化及其正、負相關(guān)性等,因此可以對整體的產(chǎn)品策略有一定的指導。
對活躍用戶進行建模時,可以評估日常促活的一些策略的長期價值,也可以分析該模型重要的特征,從而做一些產(chǎn)品策略的指導。如果知道決定活躍用戶預測重要的特征有哪些,可以對產(chǎn)品整體有宏觀的理解,并且從這些特征出發(fā),可以做更多的事情。比如相關(guān)特征涉及兩個產(chǎn)品線的一些重要指標,這兩個產(chǎn)品相互沖突和競爭,此消彼長,就可以知道哪個指標對用戶的長期價值更重要,也可以知道該如何看待兩個產(chǎn)品的重要指標,以及如何衡量其重要性。
還可以通過分析LTV預測的變化,得到生命周期變化的預警。比如長期觀測一個用戶的LTV 預估的變化,可以找出LTV漲跌趨勢,無論是漲還是跌,都可以映射到高活躍、中活躍和低活躍中,就可以獲得活躍用戶活躍度扭轉(zhuǎn)的預警。
對回流用戶進行建模時,和新增用戶類似,對于回流的用戶可以做策略優(yōu)化。比如通過做用戶畫像切片,可以知道已流失的用戶或拉回的用戶中哪些用戶的價值更高,然后針對性地優(yōu)化拉回策略。
今天的分享就到這里,謝謝大家。
來源:井冬萍 DataFunSummit
以上是關(guān)于用戶增長師的相關(guān)信息,以供大家查看了解。想要了解更多用戶增長師信息,第一時間了解用戶增長師相關(guān)資訊,敬請關(guān)注唯學網(wǎng)用戶增長師欄目,如有任何疑問也可在線留言,小編會為您在第一時間解答!