RFM i modelowanie wartości życia klienta w R.

12

Czy ktoś może mi powiedzieć, jak wykonać modelowanie aktualności, częstotliwości i wartości pieniężnej (RFM) oraz modelowanie wartości klienta w R?

Ponadto, czy ktoś może skierować mi trochę literatury na ten temat?

Beta
źródło
1
możesz także spojrzeć na pakiet BTYD w R. Lub kupować aż do śmierci. Myślę, że Bruce Hardie jest jednym z autorów. Nie jestem jednak pewien.

Odpowiedzi:

10

Jeśli chodzi o referencje, eksploracja danych przy użyciu analizy RFM powinna pomóc w zakresie terminologii i dalszych referencji.

Jednym z najprostszych (i popularnych) sposobów modelowania prawdopodobieństwa reakcji klienta jest zastosowanie regresji logistycznej z RFM jako zmiennymi objaśniającymi (wśród innych dostępnych zmiennych).

W celu modelowania wartości pieniężnej można po prostu regresować przychody bezpośrednio na RFM (używając prostego modelu liniowego na początek), co zwykle robi zaskakująco dobrze. Bardziej zaawansowane / nieliniowe modele (takie jak Random Forest lub Gradient Boosting Machine) radzą sobie lepiej niż modele liniowe z mojego doświadczenia.

Innym popularnym podejściem jest zbudowanie nieco bardziej złożonego modelu do przewidywania wartości pieniężnej w oparciu o dwa podmodele: jeden dla prawdopodobieństwa odpowiedzi (np. Wykorzystujący regresję logistyczną jako funkcję RFM), a drugi dla dochodów uzależnionych od odpowiedzi (ponownie, może to być tak proste, jak model liniowy RFM). Oczekiwana wartość pieniężna jest iloczynem dwóch prognoz.

Jeśli dostępne są losowe dane z testu / kontroli, wówczas techniki oparte na podnoszeniu / podnoszeniu są dość popularne do modelowania przyrostowych korzyści leczenia.

Jeśli chodzi o wartość cyklu życia klienta, zobacz Modelowanie wartości czasu życia klienta, aby przejrzeć i dalsze odniesienia.

Jeśli chodzi o modelowanie w języku R, nie znam żadnych gotowych pakietów dla tego typu modelowania. R zapewnia do tego wszystkie niezbędne elementy składowe (chyba że masz olbrzymią ilość danych - w takim przypadku być może będziesz musiał polegać na bardziej skalowalnych narzędziach)

Jewgienij
źródło
1
Bardzo ładna odpowiedź, ale myślę, że pierwszy link może być uszkodzony.
Dimitriy V. Masterov,
@Yevgeny, mam dwa pytania dotyczące podanych sugestii. Po pierwsze, jeśli chodzi o modelowanie wartości pieniężnej, czy można regresować przychody za pomocą opcji Monetary wśród zmiennych predykcyjnych? Obawiam się, że będą to te same zmienne. Po drugie, czy masz jakieś zasoby online, które mogłyby pomóc mi zrozumieć, w jaki sposób przeprowadzić regresję liniową w zależności od odpowiedzi (używając drugiego opisanego przez ciebie podejścia)? Dziękuję Ci bardzo!
nhern121
1) Jest w porządku, o ile nie mylisz zmiennych objaśniających / wejściowych (z danych przeszłych) i zmiennych docelowych (z danych „przyszłych”) 2) Wystarczy wybrać podzbiór danych, w którym klienci coś kupili, i regresować przychody zmienne objaśniające
Jewgienij
5

Nie jestem pewien, czy nadal pracujesz nad modelowaniem RFM. Tutaj ( pdf ) znajduje się artykuł / winieta dla pakietu BTYD w języku R, który może być dla Ciebie pomocny. Cały artykuł oparty jest na R i ma 3 różne modele do obejrzenia. Na stronie 1, 2.1 Przygotowanie danych można zobaczyć kontekst dotyczący RFM.

ostry
źródło
Dzięki Gung! Mimo że obecnie nie pracuję nad tym. Ale to jest najbardziej pomocne. Może też być pomocny dla innych osób, które nad tym pracują.
Beta