Taki sam czy inny? Sposób bayesowski

10

Powiedz, że mam następujący model:

Poisson(λ){λ1if t<τλ2if tτ

I wywnioskowałem, że tylne dla λ1 i pokazano poniżej z moich danych. Czy istnieje bayesowski sposób stwierdzenia (lub określenia ilościowego), czy i są takie same czy różne ?λ2λ1λ2

Być może pomiar prawdopodobieństwa, że różni się odλ1λ2 ? A może używając rozbieżności KL?

Na przykład, jak mogę zmierzyć , a przynajmniej ?p(λ2λ1)p(λ2>λ1)

Zasadniczo, gdy masz poniżej pokazane plakaty (załóż wszędzie niezerowe wartości PDF dla obu), co jest dobrym sposobem na odpowiedź na to pytanie?

wprowadź opis zdjęcia tutaj

Aktualizacja

Wydaje się, że na to pytanie można odpowiedzieć na dwa sposoby:

  1. Jeśli mamy próbki tylnych, możemy spojrzeć na ułamek próbek, w których (lub równoważnie ). @ Cam.Davidson.Pilon zawiera odpowiedź, która rozwiązałaby ten problem za pomocą takich próbek.λ1λ2λ2>λ1

  2. Łącząc jakąś różnicę z tylnych stron. I to jest ważna część mojego pytania. Jak wyglądałaby ta integracja? Prawdopodobnie metoda próbkowania przybliżyłaby tę całkę, ale chciałbym poznać jej sformułowanie.

Uwaga: powyższe wykresy pochodzą z tego materiału .

Amelio Vazquez-Reina
źródło
Możesz po prostu obliczyć wariancję obu rozkładów i dodać je. To jest różnica różnicy średnich. Następnie oblicz różnicę średnich i zobacz, ile to jest standardowych odchyleń. Możesz zacząć od przybliżenia obu rozkładów normalnym, aby rozpocząć i użyć zwykłych przedziałów ufności dla rozkładu normalnego. Są to wyraźnie inne środki.
Dave31415
2
Odpowiedź na hipotezę wewnętrzną stanowi odpowiedź
Stéphane Laurent,
3
Wszystkie wymagane obliczenia są zawarte w moim artykule, ale nie zbadałem przypadku ( ϕ jest stosunkiem dwóch stawek Poissona)H0:{ϕ=1}ϕ
Stéphane Laurent
Dzięki @ StéphaneLaurent. Twój papier jest świetnym wskaźnikiem, ale wydaje się, że jest specyficzny dla procesów Poissona. Jakie porównanie na wysokim poziomie może zrobić Bayesian, aby oszacować, czy jest takie samo lub różne od λ 1 ? Czy analiza musi być specyficzna dla dystrybucji? λ2λ1
Amelio Vazquez-Reina
2
Przepraszam @ user023472 Obecnie nie mam energii. Zobacz artykuły Bernarda cytowane w mojej pracy. „Wewnętrzny” oznacza, że ​​metoda pochodzi od modelu i tylko z niego.
Stéphane Laurent

Odpowiedzi:

7

Wydaje mi się, że lepszym pytaniem jest to, czy różnią się znacznie?

Aby odpowiedzieć na to pytanie, musimy obliczyć . Nazwij tę liczbę p . Jeśli p 0,50 , istnieje równa szansa, że ​​jedna jest większa od drugiej. Z drugiej strony, jeśli p jest naprawdę bliskie 1, to możemy być pewni, że tak λ 2 jest większy (czytaj: inny) niż λ 1 .P(λ2>λ1)pp0.50pλ2λ1

Jak obliczyć ? Jest to banalne w ramach Bayesian MCMC. Mamy próbki z tyłu, więc po prostu obliczmy chace, że próbki z λ 2 są większe niż λ 1 :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Przepraszam, że nie zawarłem tego w książce, na pewno dodam go, ponieważ uważam, że jest to jeden z najbardziej użytecznych pomysłów w wnioskowaniu bayesowskim

Cam.Davidson.Pilon
źródło
5
Prawdopodobieństwo wynosi 1,0, ponieważ są one różne, ponieważ oba są ciągłymi zmiennymi losowymi. Zastanów się: jakie są twoje wcześniejsze przypuszczenia, że ? Czy naprawdę uważasz, że są one faktycznie równe? (Ignoruj ​​testowanie hipotez: żyjemy w prawdziwym świecie, w którym zmienne nigdy tak naprawdę nie są równe). Zobacz ten post mojego bohatera, Gelmana. Obliczeniowo możesz to sprawdzić, wykonując obliczenia . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon
1
P(|λ1λ2|>1)P(λ1λ2)
3
λ1λ2λ2λ1
1
o Boże, nie chciałbym być w takiej sytuacji! Dotyczy to nieprzyjemnych całek. W przypadku większości modeli nie można tak naprawdę uzyskać tylnych. Nawet jeśli możesz, nadal lepiej jest używać komputera, tylko ze względu na pobieranie próbek. Podsumowując, przykłady> formuły do takich obliczeń.
Cam.Davidson.Pilon
2
Nie mierzysz „wystarczająco dużego”. Rozważ rozkład z pikiem przy zerze, a drugi z jednakowymi masami przy pikach -10, 10. Twoja statystyka - oczekiwana wartość wskaźnika, że ​​jedna próbka jest większa od drugiej - daje 0,5, ale rozkłady są wyraźnie zupełnie inne.
Neil G
5

λ1λ2Pr(λ1=λ2)=0

λ1λ2ϵ[ϵ/2,ϵ/2] . Większe wartości nakładania się wskazują, że dwa tylne są bardziej podobne.

λ2>λ1

Sycorax mówi Przywróć Monikę
źródło
Dzięki. Jak twoja odpowiedź odnosi się do niektórych pomysłów omówionych w komentarzach PO?
Amelio Vazquez-Reina
Przepraszam, ale nie znam żadnej z tych metod, więc nie mogę znacząco komentować. @ Stéphane_Laurent jest jednak dość sprytny, dlatego polecam przejrzenie linku przynajmniej.
Sycorax mówi Przywróć Monikę
1
@ user023472 Przykro mi, ale nie mam dzisiaj energii, aby udzielić odpowiedzi na temat wewnętrznego podejścia do rozbieżności. Opiera się na rozbieżności Kullbacka-Leiblera.
Stéphane Laurent
ϵp(λ2>λ1)p(λ2λ1)
Dzięki @ user777. Interesuje mnie sprawa, gdy nie mamy dostępu do próbek. Wcześniej miałeś całkę w swoim poście, ale najwyraźniej ją usunąłeś. Jak wyglądałaby ta całka?
Amelio Vazquez-Reina