Sprawdzanie, czy dwie próbki Poissona mają tę samą średnią

30

To podstawowe pytanie, ale nie mogłem znaleźć odpowiedzi. Mam dwa pomiary: zdarzenia n1 w czasie t1 i zdarzenia n2 w czasie t2, oba wytworzone (powiedzmy) przez procesy Poissona z możliwie różnymi wartościami lambda.

To tak naprawdę pochodzi z artykułu prasowego, który zasadniczo twierdzi, że od że oba są różne, ale nie jestem pewien, czy twierdzenie jest prawidłowe. Załóżmy, że przedziały czasowe nie zostały wybrane złośliwie (aby zmaksymalizować zdarzenia w jednym lub drugim). $n_1/t_1\neq n_2/t_2$

Czy mogę po prostu wykonać test t , czy nie byłoby to właściwe? Liczba zdarzeń jest zbyt mała, abym mógł wygodnie nazwać rozkłady w przybliżeniu normalne.

hypothesis-testing poisson-distribution Charles
źródło

FWIW, artykuł: health.usnews.com/health-news/family-health/brain-and-behavior/…

Charles

1

Świetny egzemplarz dziennikarstwa naukowego, tam ...

Matt Parker

1

Tak ... widać, dlaczego chciałem sprawdzić użyte statystyki.

Charles

25

Aby przetestować średnią Poissona, metodę warunkową zaproponowali Przyborowski i Wilenski (1940). Rozkład warunkowy X1 przy danym X1 + X2 jest zgodny z rozkładem dwumianowym, którego prawdopodobieństwo powodzenia jest funkcją stosunku dwóch lambda. Dlatego testy hipotez i procedury szacowania przedziałów można łatwo opracować na podstawie dokładnych metod wnioskowania na temat prawdopodobieństwa sukcesu dwumianowego. W tym celu zwykle bierze się pod uwagę dwie metody,

Test C.
E-test

Szczegóły dotyczące tych dwóch testów można znaleźć w tym artykule. Potężniejszy test do porównania dwóch środków Poissona

Wazir
źródło

4

+1 Dobra referencja, dzięki. Test C jest bardziej rygorystyczną wersją tej, którą naszkicowałem, więc warto go rozważyć. Test E wiąże statystykę t z odpowiednim rozkładem. Obliczanie tego rozkładu wymaga podwójnej nieskończonej sumy, która

obliczenia

: dość łatwe do zakodowania, prawdopodobnie przesada w sprawdzaniu gazety!

O (n_{1} n_{2})

$O(n_1 n_2)$

whuber

1

Autor artykułu testowego napisał prostą implementację fortranu do obliczenia wartości p dla dwóch średnich poissona tutaj: ucs.louisiana.edu/~kxk4695 Przeniesiłem ich fortran do MATLAB tutaj git.io/vNP86

AndyL

11

Co powiesz na:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Jest to test, który porównuje ze sobą współczynniki Poissona 1 i 2 i daje zarówno wartość ap, jak i 95% przedział ufności.

Rob van Gemert
źródło

Należy zauważyć, że w przypadku problemu dwóch próbek wykorzystuje się test dwumianowy do porównania wskaźników

Jon

10

Szukasz szybkiego i łatwego sprawdzenia.

$\lambda$ $t = t_1+t_2$ $[0, t_1]$ $n_1$ $[t_1, t_1+t_2]$ $n_2$

\hat{λ} = \frac{n_{1} + n_{2)}}{t_{1} + t_{2)}}

$\hat{\lambda} = \frac{n_1+n_2}{t_1+t_2}$

$n_i$ $t_i\hat{\lambda}$ $n_i$

Whuber
źródło

1

Dzięki (+1), to jest właśnie odpowiedni sprawdzian dla tego rodzaju nietypowych rzeczy. Okazało się, że jest bardzo znaczący (p = 0,005), więc artykuł jest w porządku. Mam jednak nadzieję, że nie masz nic przeciwko temu, że zaakceptowałem drugą odpowiedź - dobrze jest znać „prawdziwy” sposób, aby to zrobić, gdy ma to znaczenie.

Charles

5

Byłbym bardziej zainteresowany przedziałem ufności niż wartością ap, oto przybliżenie bootstrapu.

Najpierw obliczamy długości interwałów i sprawdzamy:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Ta kontrola daje nieco inny wynik (wzrost o 100,03%) niż ten z publikacji (wzrost o 101%). Kontynuuj z bootstrap (zrób to dwa razy):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706

95% przedział ufności wzrostu wynosi 31% do 202%.

GaBorgulya
źródło

Sprawdzanie, czy dwie próbki Poissona mają tę samą średnią

Odpowiedzi: