Stawiłem czoła pytaniu kwalifikacyjnemu o pracę, w której ankieter zapytał mnie, czy twoje jest bardzo niskie (od 5 do 10%) dla modelu elastyczności cen. Jak rozwiązałbyś to pytanie?
Nie mogłem wymyślić nic innego niż fakt, że zrobię diagnostykę regresji, aby zobaczyć, co poszło źle lub czy należy zastosować jakąkolwiek metodę nieliniową. Jakoś myślę, że wywiad nie był zadowolony z mojej odpowiedzi. Czy jest coś jeszcze, co można zrobić w takim scenariuszu, aby dopasować model i użyć go do prognozowania poziomu produkcji, mimo że ma niski ?
Edycja : Na późniejszym etapie podali mi dane do modelowania problemu podczas wywiadu i próbowałem dodać zmienne opóźnione, wpływ ceny konkurencji, manekiny sezonowości, aby zobaczyć, czy to coś zmieniło. spadł do 17,6 procent, a jego wyniki w próbie wstrzymania były słabe. Osobiście uważam, że nieetyczne jest umieszczanie takiego modelu prognozowania w środowisku na żywo, ponieważ da on błędne wyniki i spowoduje utratę klientów (wyobraź sobie, że korzystasz z rekomendacji cenowej z takiego modelu w przychodach Twojej firmy!). Czy w takich scenariuszach dzieje się coś jeszcze, co jest zbyt oczywiste, że każdy musi o tym wiedzieć? Coś, czego nie jestem świadomy, co kusi mnie, by powiedzieć „srebrna kula”?
Ponadto, pozwala wyobrazić po dodaniu egzogenne zmienna poprawia przez kolejne 2%, to co można zrobić w tej sytuacji? Czy powinniśmy odrzucić projekt modelowania, czy istnieje jeszcze nadzieja na opracowanie modelu jakości na poziomie produkcji, na co wskazują wyniki na próbce wstrzymania?
Edit2 : Pisałem to pytanie w economics.stackexchange.com forum dla zrozumienia tego problemu z punktu widzenia ekonomii
źródło
Odpowiedzi:
Co jeśli spojrzymy na problem z tej perspektywy. Elastyczność cen to związek między popytem a ceną produktu.
Gdy r-kwadrat w tej sytuacji jest niski, moglibyśmy sugerować, że związek między ceną a popytem na ten konkretny produkt nie jest silny.
Z punktu widzenia wyceny może to oznaczać, że znalazłeś produkt, za który możesz wycenić dowolnie bez dużego wpływu na popyt LUB że popyt jest dość zmienny pomimo różnicowania cen.
Jeśli spojrzysz na towary Veblen , są to przykłady, w których elastyczność jest odwrotna. Wraz ze wzrostem ceny rośnie popyt.
Z drugiej strony, jeśli r-kwadrat jest niski, może to po prostu oznaczać kategorię produktu, dla którego cena jest stosunkowo nieistotna, jeśli chodzi o popyt. Z czubka mojej głowy lek przeciwnowotworowy może być czymś, co przylgnie do tej właściwości. Tam, gdzie znaczenie leku przewyższa cenę, którą nakazuje, i nie może wykazać żadnej zmiany popytu.
Podsumowując, zakładam, że intencją ankietera może być osądzenie, czy wiesz, co oznacza implikacja niskiego kwadratu r, zamiast dowiedzieć się, jak zbudować lepszy model z wyższym kwadratem r.
źródło
Nie jestem pewien, o co chodziło ankieterowi, ale w obliczu słabo wykonanego modelu to są rzeczy, które rozważam i odpowiedź, którą chciałbym usłyszeć jako ankieter (rozmawiam od kilku lat).
Zdobywanie większej ilości danych : to nie zawsze może pomóc, ale jest kilka rzeczy, które mogą pomóc w ocenie efektów tego rozwiązania:
Lepsza inżynieria funkcji : jeśli masz wystarczającą ilość danych i wiesz o głębokim uczeniu się, być może ta nie ma znaczenia. Jeśli nie spełniasz wymienionych kryteriów, skoncentruj swoje wysiłki na tym. W modelach zachowań użytkowników istnieje wiele relacji, które nasza ludzka intuicja lepiej rozumie niż model wyuczony przez maszynę.
Tak jak w przypadku, w którym zaprojektowano kilka dodatkowych funkcji i znacznie poprawiono wydajność modelu. Ten krok jest podatny na błędy, ponieważ zwykle obejmuje kod oparty na logice (jeśli inne / formuły matematyczne).
Lepszy wybór modelu : Jak sugerowałeś, być może model nieliniowy będzie działał lepiej. Czy Twoje dane są jednorodne? Czy masz powody, by sądzić, że cechy krzyżowe lepiej wyjaśnią elastyczność cenową? (sezonowość * cena konkurenta).
Strojenie hiper parametrów : hiperparametry modelu wyszukiwania siatki (+ wyniki weryfikacji krzyżowej) to dobra praktyka, ale o ile mi wiadomo, rzadko poprawia wydajność (na pewno nie od 5% do 90%).
Jest więcej rzeczy, które można zrobić, ale te punkty są dość ogólne.
źródło
Oprócz tego, co sugerują @DaFanat i @Arun, chciałbym dodać, że pomocna może być kontrola wizualna.
źródło