Modelowanie cen w celu określenia wartości odstających cen

1

Obecnie próbuję znaleźć „wartości odstające” w zbiorze danych. Biorąc pod uwagę zestaw cen produktów (w ramach kategorii produktów, np. Mleka) chcę filtrować według podejrzanych cen - na przykład mam zestaw cen mleka a następnie chcę filtrować według 10 i 0,1{1,1.5,10,0.1}100.1 . Problem polega na tym, że w różnych kategoriach produktów przedziały cenowe mogą się bardzo różnić - na przykład ryby: puszka tuńczyka i puszka kawioru, przeliczenie cen na 1 kg ma bardzo dużą różnicę w cenie.

Pytanie więc, jeśli ktoś z was zna model (matematyczny), aby opisać ceny w „podobnych” produktach - bardziej interesują mnie względne wnioski dotyczące cen niż bezwzględne, na przykład: nie jestem zainteresowany 1,5 euro za litr mleko za 1 euro za litr mleka, ale interesuje mnie „cena przedziału może mieć” w celu znalezienia podejrzanych cen.

Do tej pory pracowałem z empiryczną wartością oczekiwaną i odchyleniem standardowym, zakładając, że ceny są rozkładem logarytmiczno-normalnym i obliczałem przedziały 2 sigma i filtrowałem wszystkie ceny poza przedziałem 2 sigma. Daje to mniej więcej dobre wyniki, ale nie jest tak naprawdę satysfakcjonujące.

Abbraxas
źródło
Ten artykuł wydaje się dobrym punktem wyjścia do wprowadzenia „bardziej matematycznego” podejścia do opisywanego problemu.
sen_saven,
Czy masz dodatkowe informacje na temat tego, jak „podobne” są produkty? Jeśli masz coś wymiernego, być może możesz zbudować stochastyczną granicę. Zobacz tę ankietę, na przykład pages.stern.nyu.edu/~wgreene/FrontierModeling/SurveyPapers/...
kitsune
@sen_saven Przeczytałem więc artykuł i, o ile mogę stwierdzić, zbierają dane dla detalisty i testują zauważalne zmiany cen. Jak powiedziałeś, wydaje się to dobrym punktem wyjścia, ale nie jestem pewien, czy ma to zastosowanie w moim przypadku, ponieważ interesują mnie przedziały cenowe w danej grupie produktów, a nie zmiany cen w zagregowanej grupie produktów. Proszę, popraw mnie jeśli się mylę. Ale dzięki i tak spróbuję wyśledzić wspomniane dokumenty i sprawdzić, czy coś znajdę.
Abbraxas,
@kitsune Niestety nie, nie mam wymiernej cechy. Zajrzę do Modelowania Frontier i przekażę opinię.
Abbraxas,
@kitsune Więc przyjrzałem się temu i nie jestem pewien, od czego zacząć? Zasugerowałeś stochastyczną granicę, czy mógłbyś mi pomóc, w jaki sposób miałoby to zastosowanie w moim przypadku?
Abbraxas,