Uczę się korzystać z pakietu BTYD, który korzysta z modelu Pareto / NBD, aby przewidzieć, kiedy będzie oczekiwany powrót klienta. Jednak cała literatura na temat tego modelu jest pełna matematyki i nie wydaje się, aby istniało proste / koncepcyjne wyjaśnienie działania tego modelu. Czy można zrozumieć model Pareto / NBD dla nie matematyków? Przejrzałem ten słynny artykuł autorstwa Fadera . Model Pareto / NBD przyjmuje następujące założenia:
ja. Gdy jest aktywny, liczba transakcji dokonanych przez klienta w okresie czasu t rozkłada Poissona ze współczynnikiem transakcji λ.
ii. Niejednorodność stawek transakcyjnych wśród klientów jest zgodna z rozkładem gamma z parametrem kształtu r i parametrem skali α.
iii. Każdy klient ma nieobserwowany „okres istnienia” długości τ. Ten punkt, w którym klient staje się nieaktywny, jest rozkładany wykładniczo wraz ze współczynnikiem rezygnacji µ.
iv) Heterogeniczność współczynników porzucania u klientów jest zgodna z rozkładem gamma z parametrami kształtu i parametrem skali β.
v. Współczynnik transakcji λ i współczynnik rezygnacji µ różnią się niezależnie między klientami. ”
Nie rozumiem (intuicji) uzasadnienia założeń (ii), (iii) i (iv). Dlaczego tylko te dystrybucje, dlaczego nie inne?
Również założenia modelu BG / NBD to:
i.) Podczas aktywności liczba transakcji dokonywanych przez klienta jest zgodna z procesem Poissona ze współczynnikiem transakcji λ. Jest to równoważne z założeniem, że czas między transakcjami jest rozkładany wykładniczo ze stopą transakcji λ
ii) Heterogeniczność w λ wynika z rozkładu gamma
iii) Po każdej transakcji klient staje się nieaktywny z prawdopodobieństwem str. Dlatego punkt, w którym klient „rezygnuje”, jest rozkładany na transakcje zgodnie z (przesuniętym) rozkładem geometrycznym z pmf
iv) Heterogeniczność w p jest zgodna z rozkładem beta
(Intuicyjna) racjonalność założeń (ii), (iii) i (iv) również nie są wcale oczywiste.
Będę wdzięczny za wszelką pomoc. Dzięki.
źródło
Odpowiedzi:
Wyobraź sobie, że jesteś nowo mianowanym kierownikiem kwiaciarni. Masz zapis zeszłorocznych klientów - częstotliwość, z jaką robią zakupy i czas, jaki upłynął od ich ostatniej wizyty. Chcesz wiedzieć, ile firm mogą przynieść w tym roku klienci z listy. Jest kilka rzeczy do rozważenia:
[założenie (ii)] Klienci mają różne nawyki zakupowe.
Dystrybucja musi mieć kilka parametrów (niekoniecznie masz dużo danych), aby być dość elastycznym (prawdopodobnie nie jesteś przedsiębiorczym guru czytającym w myślach i nie wiesz wszystkiego o zwyczajach zakupowych), i wziąć wartości w dodatnich liczbach rzeczywistych. Rozkład gamma zaznacza wszystkie te pola i jest dobrze zbadany i stosunkowo łatwy w obsłudze. Jest często używany jako pierwszeństwo dla pozytywnych parametrów w różnych ustawieniach.
[założenie (iii)] Być może straciłeś już niektórych klientów na liście.
Jeśli Andrea kupowała kwiaty raz w miesiącu co miesiąc w ubiegłym roku, to dość bezpieczny zakład, że wróci w tym roku. Jeśli Ben kupował kwiaty co tydzień, ale nie było go od miesięcy, to może znalazł inną kwiaciarnię. Tworząc przyszłe biznesplany, możesz liczyć na Andreę, ale nie na Bena.
Klienci nie powiedzą ci, kiedy przeprowadzili się do kolejnego etapu. W obu modelach pojawia się założenie „nieobserwowanego życia”. Wyobraź sobie trzeciego klienta, Cary. Modele Pareto / NBD i BG / NBD dają dwa różne sposoby myślenia o tym, jak Cary porzuci sklep na dobre.
W przypadku Pareto / NBD wyobraź sobie, że w dowolnym momencie istnieje niewielka szansa, że Cary natknie się na lepszy sklep niż twój. To ciągłe, nieskończenie małe ryzyko daje wykładniczy czas życia - i im dłużej minęło od ostatniej wizyty Cary'ego, tym dłużej był on narażony na inne (potencjalnie lepsze) kwiaciarnie.
Sprawa BG / NBD jest nieco bardziej przemyślana. Za każdym razem, gdy Cary pojawia się w twoim sklepie, stara się kupować kwiaty. Podczas przeglądania zastanawia się nad zmianami ceny, jakości i różnorodności od czasu swojej ostatniej wizyty, co ostatecznie sprawi, że zdecyduje, czy wróci następnym razem, czy poszuka innego sklepu. Więc zamiast być stale zagrożonym, Cary ma pewne prawdopodobieństwo, że zdecyduje się odejść po każdym zakupie.
[założenie (iv)] Nie wszyscy klienci są w równym stopniu zaangażowani w Twój sklep.
Niektórzy klienci są stałymi bywalcami i tylko śmierć - lub gwałtowny wzrost cen - zmusi ich do odejścia. Inni mogą chcieć odkrywać i chętnie zostawią cię ze względu na nową kwiaciarnię po drugiej stronie ulicy. Zamiast jednego wskaźnika rezygnacji dla wszystkich klientów, sensowniej jest mieć rozkład wskaźników rezygnacji (lub prawdopodobieństwa w przypadku BG / NBD).
Mam nadzieję, że to pomoże. Spójrz na oryginalny artykuł (Schmittlein i in., 1987), jeśli jeszcze tego nie zrobiłeś - przejdą przez pewną intuicję.
źródło