? 作為用戶獲取的一方,用戶的流失會直接影響我們的工作有效性和產品的長線增長,關心客戶流失情況是我們不可忽視的一個環節,可以利用業務知識,數據分析和機器學習建立產品的流失預測模型,幫助產品提高客戶的長期留存。 ?
? 會想到這個話題主要是因為突然想到很久之前的一次產品會議片段,:PM不斷地強調用戶盤子無法擴大是因為新用戶留存不行,但實際上我們的新用戶次留是提高了的,我們UA表示是因為流失率高了,老板問UA,流失率不就是留存嗎? ? 后面其實想一想,三方的立場上來說,說法都沒錯,但是問題在于,初期留存和長期留存的區別。 ? 關于產品的用戶留存換一個例子講,就和HR為公司招新的道理差不多,對于員工離職有一個百度可查的【232原則】,也就是經過眾多的公司的分析比較,發現員工離職較為集中有三個時間段,即入職的第2周、三個月試用期屆滿及在公司工作了2年的老員工。在入職后2周就辭職,多半是因為入職后相應的薪資福利等細節與應聘時招聘人員介紹的有差異;3個月的時候通常是工作內容和企業文化的適應程度;2年的老員工通常是更希望在自己目前的工作崗位上能夠實現一個突破,能夠得到學習新知識新技能的機會,升職或者工作輪換如果達不到可能就走了。 ? 所以其實不同離職周期一定程度上也能看出不同的離職原因。對比到產品上,用戶在次日離開不再登陸和用戶在7日,30日甚至更長周期離開不再登陸的原因不見得是完全一樣的,想要更加細致的分析清楚原因,留下用戶,就需要我們考慮建立產品的流失預測模型,機遇模型預測給出的分析幫助改善我們可能沒有發現的流失因素,優化用戶的體驗流程,進一步提高用戶長期留存的概率。 ?
?
首先需要根據業務明確定義流失的定義,不同業務對流失用戶的定義可能是不同的,最好是從公司業務層面擬定一個標準。對以下問題進行一個系統化的梳理: A.?確定想留下的用戶是哪些,對于應用類產品,最好是可以通過歷史行為預估用戶的生命周期價值,過濾掉負價值和無盈利的用戶,對于有效用戶進行分析是基礎。 B.?流失事件指的是什么,由于不同產品的特點不同,游戲用戶可能是長時間未登陸的,也可能是長期未進行付費的,是需要根據產品中用戶的行為特點來進行確定的。 C.?流失之前的用戶行為事件可能會有哪些,最好對于用戶流失之前的用戶行為事件進行分類和細節分析,也是對用戶流程的一個框架性分析。 D.?預測窗口周期,根據產品的優化速度和用戶的流失速度制定一個合適的周期,如果周期太短,就沒有足夠的時間對問題數據進行優化,如果周期太長,得到的結果可能會過于模糊,所以根據優化速度和用戶流失定義給出一個發現問題并解決問題的反饋周期,幫助我們后期更好的去使用預測模型。 E.?流失原因可能有哪些 需要先根據業務確認流失原因。從長遠來看,所有的用戶最后都會流失,流失的原因可以是主觀的也可以是客觀的,先把不同的原因都列出來,只對能進行優化的那部分進行重點優化。 ? 所以最終我們能得到一個流失定義是:某類對象(確定想留下的用戶)因為什么原因(流失原因)在多久的周期內(預測窗口)不再做什么行為(流失事件)。 在明確了流失定義后,結合之前的用戶流失行為事件等情況想一想用戶為什么會流失,可以嘗試創建差異化的用戶群體,幫助找到產品內的共性行為。 接下來我們需要知道每個用戶特征或者事件行為對具體預測事件的貢獻程度和概率,通過機器學習模型來進行預測,目前比較常見的黑盒模型是XGBoost+深度神經網絡用于數據模擬,并利用SHAP來實現表達目標。 這部分具體的需要做數據開發或者技術的同學來實現,具體的技術問題有興趣的小伙伴自行百度或者請教相關專業大神,我只是知道有這種技術和方法可以去實現業務,當然也還有很多其他算法模型,如果有了解的更多細節的小伙伴也歡迎留言交流學習一下。 ? 根據數據學習結果,找到的可能不是最終的流失原因,而是與最終的流失因素有關的行為。比如數據告訴我們的可能是用戶流失的最大因素是在具體是在于進入某一個游戲功能板塊頻繁交互以后導致流失的。這種時候其實無法判斷是這個功能不好玩(數值或者設計不合理),還是這個功能使用上有硬傷(卡頓,閃退,服務中斷)等情況導致的,需要了解業務的具體功能設計和運營流程并充分了解客戶行為,基于此基礎上對流失行為進行因素分析,并制定相應的解決方案,是一個從行為表現結果-問題定性-解決問題的過程。 ? 基于某數據行為推斷得到的流失原因,通常不止一個,可以根據特點對不同的客戶群體制定留存措施?,并不斷反饋措施的有效性。 ?
通過反饋對不同預測后果(預測留下或者流失)下的不同結果(留下或者流失)進行回報率預估,可以假設在客戶的平均成本下,對某類改善行為做出的積極相應的概率,以及在進行后留存多長時間。必要的時候,可以測試不同算法(比如隨機森林模型,邏輯回歸模型等)下的最大化效果的算法模型,選擇當前情況下最有利最準確的模型進行進一步完善。 ?
在建立模型以后,需要長久進行的一步就是進行數據源的豐富,這一點和廣告投放一樣,更多的預算更多的數據行為總能幫助Campaign更高效的進行數據學習,更快穩定廣告的表現。 比較常見且首先考慮的肯定是公司的內部數據,比如產品打點的交互數據,新用戶注冊信息,活躍或者充值數據等情況,幫助模型獲取更多相關的信號。根據在模型中需要考慮的各種新因素進行反復的測試,并不斷更新迭代反饋幫助模型更加完善。 通過機器學習,利用產品數據來幫助客觀了解用戶會流失原因,幫助我們在獲取新用戶的基礎上去留住老用戶,畢竟通常老用戶的人均價值都比較高,且獲取成本相比新用戶通常不會更貴。建立一個成功的模型的基礎還是在于對問題有明確的定義和充分了解,如果一開始的的業務定義都不準確,將會直接影響后續的進展。同時,在模型預測時候?,要不斷基于業務實際情況進行考慮,最終落實到用戶維護上,才能真正有效幫助業務進行正向增長,所以模型的建立只是預防流失的開始。
寫這個我自己也查了一些東西,主要是技術方面的資料,作為技術白癡的我說實話看的很痛苦。真正技術上的內容也無法多寫,主要強調了流失模型的作用以及業務層面我們能去做的一些東西,盡量轉化為我們業務端小伙伴能理解的點,希望以后能幫助到建立流失模型的小伙伴。流失模型的建立對業務要求和技術要求都比較高,而且也不是所有公司都有環境和需求去做這個,但不妨礙我們去了解這類模型進一步幫助我們去理解業務運行和模型學習的本質。
下拉推薦菜單可查看更多精彩內容↓
文章為作者獨立觀點,不代表DLZ123立場。如有侵權,請聯系我們。( 版權為作者所有,如需轉載,請聯系作者 )

網站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優質的學習資料。
現在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)