Sprawdzanie, czy dwie próbki Poissona mają tę samą średnią

30

To podstawowe pytanie, ale nie mogłem znaleźć odpowiedzi. Mam dwa pomiary: zdarzenia n1 w czasie t1 i zdarzenia n2 w czasie t2, oba wytworzone (powiedzmy) przez procesy Poissona z możliwie różnymi wartościami lambda.

To tak naprawdę pochodzi z artykułu prasowego, który zasadniczo twierdzi, że od że oba są różne, ale nie jestem pewien, czy twierdzenie jest prawidłowe. Załóżmy, że przedziały czasowe nie zostały wybrane złośliwie (aby zmaksymalizować zdarzenia w jednym lub drugim).n1/t1n2)/t2)

Czy mogę po prostu wykonać test t , czy nie byłoby to właściwe? Liczba zdarzeń jest zbyt mała, abym mógł wygodnie nazwać rozkłady w przybliżeniu normalne.

Charles
źródło
1
Świetny egzemplarz dziennikarstwa naukowego, tam ...
Matt Parker
1
Tak ... widać, dlaczego chciałem sprawdzić użyte statystyki.
Charles

Odpowiedzi:

25

Aby przetestować średnią Poissona, metodę warunkową zaproponowali Przyborowski i Wilenski (1940). Rozkład warunkowy X1 przy danym X1 + X2 jest zgodny z rozkładem dwumianowym, którego prawdopodobieństwo powodzenia jest funkcją stosunku dwóch lambda. Dlatego testy hipotez i procedury szacowania przedziałów można łatwo opracować na podstawie dokładnych metod wnioskowania na temat prawdopodobieństwa sukcesu dwumianowego. W tym celu zwykle bierze się pod uwagę dwie metody,

  1. Test C.
  2. E-test

Szczegóły dotyczące tych dwóch testów można znaleźć w tym artykule. Potężniejszy test do porównania dwóch środków Poissona

Wazir
źródło
4
+1 Dobra referencja, dzięki. Test C jest bardziej rygorystyczną wersją tej, którą naszkicowałem, więc warto go rozważyć. Test E wiąże statystykę t z odpowiednim rozkładem. Obliczanie tego rozkładu wymaga podwójnej nieskończonej sumy, która obliczenia O ( n 1 n 2 ) : dość łatwe do zakodowania, prawdopodobnie przesada w sprawdzaniu gazety! O(n1n2))
whuber
1
Autor artykułu testowego napisał prostą implementację fortranu do obliczenia wartości p dla dwóch średnich poissona tutaj: ucs.louisiana.edu/~kxk4695 Przeniesiłem ich fortran do MATLAB tutaj git.io/vNP86
AndyL
11

Co powiesz na:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Jest to test, który porównuje ze sobą współczynniki Poissona 1 i 2 i daje zarówno wartość ap, jak i 95% przedział ufności.

Rob van Gemert
źródło
Należy zauważyć, że w przypadku problemu dwóch próbek wykorzystuje się test dwumianowy do porównania wskaźników
Jon
10

Szukasz szybkiego i łatwego sprawdzenia.

λt=t1+t2)[0,t1]n1[t1,t1+t2)]n2)

λ^=n1+n2)t1+t2)

njatjaλ^nja

Whuber
źródło
1
Dzięki (+1), to jest właśnie odpowiedni sprawdzian dla tego rodzaju nietypowych rzeczy. Okazało się, że jest bardzo znaczący (p = 0,005), więc artykuł jest w porządku. Mam jednak nadzieję, że nie masz nic przeciwko temu, że zaakceptowałem drugą odpowiedź - dobrze jest znać „prawdziwy” sposób, aby to zrobić, gdy ma to znaczenie.
Charles
5

Byłbym bardziej zainteresowany przedziałem ufności niż wartością ap, oto przybliżenie bootstrapu.

Najpierw obliczamy długości interwałów i sprawdzamy:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Ta kontrola daje nieco inny wynik (wzrost o 100,03%) niż ten z publikacji (wzrost o 101%). Kontynuuj z bootstrap (zrób to dwa razy):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

95% przedział ufności wzrostu wynosi 31% do 202%.

GaBorgulya
źródło