RFM模型分析與客戶細分

  • 作者:由 匿名使用者 發表于 攝影
  • 2022-12-02

RFM模型分析與客戶細分環球青藤 2020-09-30

RFM模型分析與客戶細分

根據美國資料庫營銷研究所Arthur Hughes的研究,客戶資料庫中有三個神奇的要素,這三個要素構成了資料分析最好的指標:最近一次消費(Recency)、消費頻率(Frequency)、消費金額(Monetary)。

RFM模型:R(Recency)表示客戶最近一次購買的時間有多遠,F(Frequency)表示客戶在最近一段時間內購買的次數,M (Monetary)表示客戶在最近一段時間內購買的金額。一般原始資料為3個欄位:客戶ID、購買時間(日期格式)、購買金額,用資料探勘軟體處理,加權(考慮權重)得到RFM得分,進而可以進行客戶細分,客戶等級分類,Customer Level Value得分排序等,實現資料庫營銷!

這裡再次借用@資料探勘與資料分析的RFM客戶RFM分類圖。

本次分析用的的軟體工具:IBM SPSS Statistics 19,IBM SPSS Modeler14。1,Tableau7。0,EXCEL和PPT

因為RFM分析僅是專案的一個小部分分析,但也面臨海量資料的處理能力,這一點對計算機的記憶體和硬碟容量都有要求。

先說說對海量資料探勘和資料處理的一點體會:(僅指個人電腦操作平臺而言)

一般我們拿到的資料都是壓縮格式的文字檔案,需要解壓縮,都在G位元組以上儲存單位,一般最好在外接電源行動硬碟儲存;如果客戶不告知,你大概是不知道有多少記錄和欄位的;

Modeler挖掘軟體預設安裝一般都需要與C盤進行資料交換,至少需要100G空間預留,否則讀取資料過程中將造成空間不足

海量資料處理要有耐心,等待30分鐘以上執行出結果是常有的現象,特別是在進行抽樣、合併資料、資料重構、神經網路建模過程中,要有韌性,否則差一分鐘中斷就悲劇了,呵呵;

資料探勘的準備階段和資料預處理時間佔整個專案的70%,我這裡說如果是超大資料集可能時間要佔到90%以上。一方面是處理費時,一方面可能就只能這臺電腦處理,不能幾臺電腦同時操作;

多帶來不同,這是我一直強調的體驗。所以海量資料需要用到抽樣技術,用來檢視資料和預操作,記住:有時候即使樣本資料正常,也可能全部資料有問題。建議資料分隔符采用“|”儲存;

如何強調一個數據挖掘專案和挖掘工程師對行業的理解和業務的洞察都不為過,好的資料探勘一定是市場導向的,當然也需要IT人員與市場人員有好的溝通機制;

資料探勘會面臨資料字典和語義層含義理解,在MetaData元資料管理和理解上下功夫會事半功倍,否則等資料重構完成發現問題又要推倒重來,悲劇;

每次海量大資料探勘工作時都是我上微博最多的時侯,它真的沒我算的快,只好上微博等它,哈哈!

傳統RFM分析轉換為電信業務RFM分析主要思考:

這裡的RFM模型和進而細分客戶僅是資料探勘專案的一個小部分,假定我們拿到一個月的客戶充值行為資料集(實際上有六個月的資料),我們們先用IBM Modeler軟體構建一個分析流:

資料結構完全滿足RFM分析要求,一個月的資料就有3千萬條交易記錄!

我們先用挖掘工具的RFM模型的RFM彙總節點和RFM分析節點產生R(Recency)、F(Frequency)、M (Monetary);

接著我們採用RFM分析節點就完成了RFM模型基礎資料重構和整理;

現在我們得到了RFM模型的Recency_Score、Frequency_Score、Monetary_Score和RFM_Score;這裡對RFM得分進行了五等分切割,採用100、10、1加權得到RFM得分表明了125個RFM魔方塊。

傳統的RFM模型到此也就完成了,但125個細分市場太多啦無法針對性營銷也需要識別客戶特徵和行為,有必要進一步細分客戶群;

另外:RFM模型其實僅僅是一種資料處理方法,採用資料重構技術同樣可以完成,只是這裡固化了RFM模組更簡單直接,但我們可以採用RFM構建資料的方式不為RFM也可用該模組進行資料重構。

我們可以將得到的資料匯入到Tableau軟體進行描述性分析:(資料探勘軟體在描述性和製表輸出方面非常弱智,哈哈)

我們也可以進行不同塊的對比分析:均值分析、塊類別分析等等

這時候我們就可以看出Tableau視覺化工具的方便性

接下來,我們繼續採用挖掘工具對R、F、M三個欄位進行聚類分析,聚類分析主要採用:Kohonen、K-means和Two-step演算法:

這時候我們要考慮是直接用R(Recency)、F(Frequency)、M (Monetary)三個變數還是要進行變換,因為R、F、M三個欄位的測量尺度不同最好對三個變數進行標準化,例如:Z得分(實際情況可以選擇線性插值法,比較法,對標法等標準化)!另外一個考慮:就是R、F、M三個指標的權重該如何考慮,在現實營銷中這三個指標重要性顯然不同!

有資料研究表明:對RFM各變數的指標權重問題,Hughes,Arthur認為RFM在衡量一個問題上的權重是一致的,因而並沒有給予不同的劃分。而Stone,Bob透過對信用卡的實證分析,認為各個指標的權重並不相同,應該給予頻度最高,近度次之,值度最低的權重;

這裡我們採用加權方法:WR=2 WF=3 WM=5的簡單加權法(實際情況需要專家或營銷人員測定);具體選擇哪種聚類方法和聚類數需要反覆測試和評估,同時也要比較三種方法哪種方式更理想!

下圖是採用快速聚類的結果:

以及kohonen神經演算法的聚類結果:

接下來我們要識別聚類結果的意義和類分析:這裡我們可以採用C5。0規則來識別不同聚類的特徵:

其中Two-step兩階段聚類特徵圖:

採用評估分析節點對C5。0規則的模型識別能力進行判斷:

結果還不錯,我們可以分別選擇三種聚類方法,或者選擇一種更易解釋的聚類結果,這裡選擇Kohonen的聚類結果將聚類欄位寫入資料集後,為方便我們將資料匯入SPSS軟體進行均值分析和輸出到Excel軟體!

輸出結果後將資料匯入Excel,將R、F、M三個欄位分類與該欄位的均值進行比較,利用Excel軟體的條件格式給出與均值比較的趨勢!結合RFM模型魔方塊的分類識別客戶型別:透過RFM分析將客戶群體劃分成重要保持客戶、重要發展客戶、重要挽留客戶、一般重要客戶、一般客戶、無價值客戶等六個級別;(有可能某個級別不存在);

另外一個考慮是針對R、F、M三個指標的標準化得分按聚類結果進行加權計算,然後進行綜合得分排名,識別各個類別的客戶價值水平;

至此如果我們透過對RFM模型分析和進行的客戶細分滿意的話,可能分析就此結束!如果我們還有客戶背景資料資訊庫,可以將聚類結果和RFM得分作為自變數進行其他資料探勘建模工作!

Top