レビュー

RFM分析の拡張手法のレビュー

国内誌に査読論文がacceptされました。ありがたい。「RFMC 分析における Clumpiness 指標の拡張と自社顧客の行動予測への応用 Clumpiness を活用した離脱時期と競合利用の予測手法の提案」です。Clumpiness指標の問題を整理して指標改善してから、スマホゲームの離脱とスーパーマーケットの購買データに当ててモデリングしています。

その分析でも気になっていたんだけど、RFMだとRecency, Frequency, Monetaryの3指標になるからどうしてもウェブサービスとかアプリ利用にはちょっと当てづらい。特に広告収入ベースのフリーのサービスなんかだとMonetaryとして使える指標がない。

RFMを代表値を使った利用ログのsummaryだと考えると、いかに少ない数値で、いかに消費者の異質性を捉えたまま要約できるかというゲームに落とし込める。するとスマホアプリとかウェブ利用なんかにはmonetaryよりもduration(利用時間や滞在時間の合計あるいは平均)を使った方が説明性が高いことは容易に想像できる。

ということでRFMのバリエーションを調べていると、[1] にいくつかレビューされていた(されてはいるがこの論文は手法の出典が書いていないのと、RFRのところで他人の論文の中身がそのまま引っ張られているのを見つけたのでこれ以上の言及はしない)。必ずしも原著は引っ張っていないです。

Weighted RFM(WRFM):同じRFMの値でも他人の利用状況によって相対的なロイヤルティは変わってくるからそこを標準化したっていうような話かな。 [2]

Timely RFM(TRFM):商品購買の周期性(purchase periodicity)と属性(product property)を考慮したRFMの指標化。[3]

Frequency, Recency, Amount and Type(FRAT):Monetaryの代わりにAmount (of Money) & Type (of goods) として、順序尺度に離散化した商品のグレードとかを入れてる(class-A cars, class-B cars and class-C carsみたいに)。離散化した順序尺度ってことは複数購買があった時に平均も出しづらいし、繰り返しがあるような商品購買/サービス利用には適用しづらいよなあ。”what a person buys at present would be indicative of what that person would buy in the future”[4] とのことで自動車みたいな大きい買い物に対して直近の商品データを入れる感じなのかな。次の購買いつになるんだ。

この辺まではRFMの発展。ここからは発展というより変形。

Recency, Frequency, Duration (RFD):調べてみると論文によって定義がまちまちになっていて、たとえば [5] では”uses Duration to measure how long the user actually interacted with the application” とのことで、まさに今回探していたMonetaryの代わりに使用時間の合計としてのDurationを使うイメージなんだけど、一方 [6] では(全文は入手できなかったからサマリーしか読んでないんだけど)”RFD (Recency, Frequency, Duration) model was proposed to consider visit duration for the website visitors”とのことで、visit durationってことは訪問間隔としてdurationを定義している。ただ、仮に平均利用間隔をdurationとして用いる場合、調査期間 t が固定なら

duration = t / frequency

なのでFだけで得られる情報しか内包しないことになり使う意味がない。

RFR(recency, frequency, reach):SNSあたりのソーシャルグラフ(ネットワーク)に当てるために変形した形。”proposed for social graph, i.e. Recency – last post, Frequency – total number of posts, Reach – networks, friends.”とのことなので、ネットワーク(twitterのF/FとかLike/RT)の数ぐらいなら機械的に集めてこられるけど、本当にリーチ(インプレッションとか)のデータを使おうと思ったら共同研究でもしない限り大変だろうなあ。

この中でいくつかの手法が3指標RFMに顧客i (i \in \Omega)、ウェイトw_j (j \in R, F, M) について

score_i = w_R R_i + w_F F_i + w_M M_i

とかってやってるけど、必要以上の要約は情報量を毀損するだけなので私はやりません。

[1] Birant, Derya. “Data mining using RFM analysis.” Knowledge-oriented applications in data mining. IntechOpen, 2011

[2] Sarvari, Peiman Alipour, Alp Ustundag, and Hidayet Takci. “Performance evaluation of different customer segmentation approaches based on RFM and demographics analysis.” Kybernetes (2016).

[3] Lee, Li-Hua Li Fu-Ming, and Wan-Jing Liu. “The timely product recommendation based on RFM method.” (2006).

[4] Cho, Young Sung, et al. “Effective purchase pattern mining with weight based on FRAT analysis for recommender in e-commerce.” Computer Science and its Applications. Springer, Berlin, Heidelberg, 2015. 443-454.

[5] Yan, Bo, and Guanling Chen. “AppJoy: personalized mobile application discovery.” Proceedings of the 9th international conference on Mobile systems, applications, and services. 2011.

[6] Liu, Feng, Shaoqiong Zhao, and Yang Li. “How many, how often, and how new? A multivariate profiling of mobile app users.” Journal of Retailing and Consumer Services 38 (2017): 71-80.