Mam zestaw danych danych klienta telefonu komórkowego z dwiema kolumnami. Pierwsza kolumna zawiera pewną kategorię, do której należy konto (A, B lub C), a druga kolumna zawiera wartość binarną określającą, czy to konto zostało anulowane. na przykład
A | cancelled
C | active
B | active
A | cancelled
chcę wymyślić jakiś test hipotez, aby sprawdzić, czy stosunek kont typu A, B i C jest inny dla kont aktywnych i kont anulowanych - hipoteza zerowa jest taka, że są one takie same. To jest jak test hipotez dla proporcji, tyle że nie wiem, jak to zrobić dla 3 wartości
hypothesis-testing
equivalence
użytkownik1893354
źródło
źródło
Odpowiedzi:
Mam zamiar oprzeć moją odpowiedź ogólnie i wstawić komentarze, w jaki sposób twój problem pasuje do środowiska testowego. Ogólnie rzecz biorąc, możemy sprawdzić równość proporcji za pomocą gdzie typowa hipoteza , , jest następująca:χ2 H0
tzn. wszystkie proporcje są sobie równe. Teraz w twoim przypadku hipoteza zerowa jest następująca:
Teraz, aby przeprowadzić test , musimy obliczyć następującą statystykę testową: Wartość statystyki testowej wynosiχ2
gdzie
W twoim przypadku ponieważ możemy uznać ten problem za następującą tabelę:n=6
Teraz, gdy mamy już statystyki testowe, mamy dwie opcje, jak przejść do zakończenia testowania hipotez.
Opcja 1) Możemy porównać nasz test statyczny z odpowiednią wartością krytyczną w ramach hipotezy zerowej. To znaczy, jeśli jest prawdziwe, to statystyka z tabeli kontyngencji z wierszami i kolumnami powinna mieć z stopni wolność. Po obliczeniu naszej wartości krytycznej jeśli mamy to wówczas odrzucimy hipotezę zerową. Oczywiście, jeśli to nie odrzucimy hipotezy zerowej.χ2 H0 χ2 R C χ2 (R−1)×(C−1) χ∗ χ2>χ∗ χ2≤χ∗
Graficznie (wszystkie liczby są złożone) wygląda to następująco:
Z wykresu, jeśli nasza statystyka testowa odpowiada niebieskiej statystyce testowej, nie odrzucilibyśmy hipotezy zerowej, ponieważ ta statystyka testowa nie mieści się w obszarze krytycznym (tj. ). Alternatywnie, zielona statystyka testowa mieści się w obszarze krytycznym, dlatego odrzucilibyśmy hipotezę zerową, gdybyśmy obliczyli statystykę zielonego testu.χ2 χ2<χ∗
W twoim przykładzie twoje stopnie swobody są równe
Opcja 2) możemy obliczyć wartość p związaną ze statystyką testową w ramach hipotezy zerowej, a jeśli ta wartość p jest mniejsza niż określony poziom , możemy odrzucić hipotezę zerową. Jeśli wartość p jest większa niż poziom wówczas nie odrzucamy hipotezy zerowej. Zauważ, że wartość p jest prawdopodobieństwem, że jest większy niż statystyka testowa.α α χ2(R−1)×(C−1)
Graficznie to mamy
gdzie wartość p jest obliczana jako obszar większy niż nasza statystyka testowa (niebieski obszar zacieniowany w przykładzie).
Jeśli więc nie odrzuci hipotezy zerowej , w przeciwnym razieα>p-value H0
jeśli odrzuca hipotezę zerowąα≤p-value H0
źródło