Tak więc, dla zabawy, pobieram niektóre dane połączeń z call center, w którym pracuję, i próbuję przetestować na nich kilka hipotez, a konkretnie liczbę połączeń odebranych w ciągu tygodnia, i dopasowuję je rozkładem Poissona. Ze względu na przedmiot mojej pracy istnieją dwa rodzaje tygodni, nazwijmy jeden z nich w tygodniach, w których przypuszczam, że jest więcej połączeń, a poza tygodniami, w których hipotetycznie jest ich mniej.
Mam teorię, że z tygodni (nazwijmy to ) jest większa niż z z tygodni (nazwijmy to )
Tak więc hipoteza, którą chcę przetestować, to
Wiem, jak testować jeden parametr (powiedzmy ), ale nie jestem pewien, jak zacząć robić 2, biorąc pod uwagę zestaw danych. Powiedzmy, że biorę dane z dwóch tygodni z każdego i dla tygodnia i i dla tygodnia. Czy ktoś może pomóc mi przejść przez tę prostszą wersję, tak że mogę zastosować ją do większego zestawu danych? Każda pomoc jest doceniana, dziękuję.
źródło
Odpowiedzi:
Zauważ, że normalnie równość jest zerowa (z uzasadnionego powodu).
Pomijając tę kwestię, wspomnę o kilku podejściach do testu tego rodzaju hipotezy
Następnie poniżej zera oczekiwane proporcje sąwnaw i wpozaw odpowiednio. Możesz dość łatwo wykonać jednostronny test proporcji w tygodniach.
Są inne podejścia.
źródło
Co z właśnie zastosowanym GLM ze strukturą błędów Poissona i log-link? Ale idea dwumianu może być silniejsza.
źródło
Rozliczyłbym to za pomocą GLM Poissona lub Quasi-Poissona z preferencją dla quasi-Poissona lub dwumianu ujemnego.
Problem z użyciem tradycyjnego Poissona polega na tym, że wymaga on wariancji i średniej równości, co najprawdopodobniej nie jest prawdą. Quasi-Poisson lub NB szacuje wariancję nieograniczoną średnią.
Możesz wykonać dowolną z tych czynności w R. bardzo łatwo.
Podejście GLM jest korzystne i można je rozszerzyć o dodatkowe zmienne (np. Miesiąc w roku), które mogą mieć wpływ na liczbę połączeń.
Aby to zrobić ręcznie, prawdopodobnie użyłbym normalnego przybliżenia i testu t dwóch próbek.
źródło
Zaczynamy od parametru Maximum Likelihood Estimate dla parametru Poissona, który jest wartością średnią.
Więc,λ^1=Y¯ a n d λ^2)=X¯
Teraz możesz po prostu przetestowaćY¯-X¯∼ N.(λ1-λ2),λ1n1+λ2)n2))
a następnie porównaj, otrzymując wartość Z =(Y¯-X¯) -λ1-λ2)λ1n1+λ2)n2)√
Uwaga: - kryterium odrzucenia jestZ< Cr i t i c a l V. L U e
źródło
Począwszy od strony 125 testowej hipotezy statystycznej Caselli nakreślono odpowiedź na rodzaj sformułowanego pytania. Załączam link do pliku pdf, który znalazłem w Internecie w celach informacyjnych. Testowanie statystycznej hipotezy Caselli, wydanie trzecie .
źródło