Interpretacja wartości p wytworzonych przez test Levene'a lub Bartletta dla jednorodności wariancji

11

Przeprowadziłem test Levene'a i Bartletta na grupach danych z jednego z moich eksperymentów, aby potwierdzić, że nie naruszam założenia ANOVA o jednorodności wariancji. Chciałbym sprawdzić z wami, że nie robię żadnych niewłaściwych założeń, jeśli nie macie nic przeciwko: D

Wartość p zwrócona przez oba te testy to prawdopodobieństwo, że moje dane, gdyby zostały wygenerowane ponownie przy użyciu równych wariancji, byłyby takie same. Tak więc, używając tych testów, aby móc powiedzieć, że nie naruszam założenia ANOVA o jednorodności wariancji, potrzebowałbym tylko wartości p wyższej niż wybrany poziom alfa (powiedzmy 0,05)?

Np. Przy danych, których obecnie używam, test Bartletta zwraca p = 0,57, podczas gdy test Levene'a (no cóż, nazywają go testem Browna-Forsythe'a typu Levene) daje ap = 0,95. Oznacza to, że bez względu na to, jakiego testu używam, mogę powiedzieć, że dane spełniam założenie. Czy popełniam błąd?

Dzięki.

levesque
źródło

Odpowiedzi:

8

Wartość p twojego testu istotności można interpretować jako prawdopodobieństwo zaobserwowania wartości odpowiedniej statystyki jako lub bardziej ekstremalnej niż wartość faktycznie zaobserwowana, biorąc pod uwagę, że hipoteza zerowa jest prawdziwa. (zauważ, że wartość p nie odnosi się do tego, jakie wartości statystyki są prawdopodobne w ramach alternatywnej hipotezy )

EDIT: w terminologii matematycznej, można to zapisać jako: , gdzie jest jakaś funkcja danych (dalej "statystyka") i jest rzeczywista wartość zaobserwowanego ; oznacza się problemów związanych z hipotezą zerową na rozkład próbkowania .T T o b s T H 0 T

p-vzalumi=P.r(T.>T.obs|H.0)
T. T.obs T. H.0 T.

Nigdy nie możesz być pewien, że twoje założenia są prawdziwe, tylko czy dane, które zaobserwowałeś, są zgodne z twoimi założeniami . Wartość p daje przybliżoną miarę tej spójności.

Wartość p nie daje prawdopodobieństwa, że ​​te same dane zostaną zaobserwowane, a jedynie prawdopodobieństwo, że wartość statystyki jest równa lub bardziej skrajna od obserwowanej wartości, biorąc pod uwagę hipotezę zerową.

prawdopodobieństwo prawdopodobieństwa
źródło
Tylko jedna uwaga na temat wartości p (w odniesieniu do mojego komentarza w nawiasach kwadratowych), może równie dobrze być w przypadku, gdy masz „nietypowe” dane (powiedzmy wartość p 0,0001). ALE może się zdarzyć, że w przypadku alternatywnej hipotezy jest to jeszcze bardziej niezwykłe (powiedzmy wartość p wynoszącą po zmianie hipotezy zerowej i alternatywnej). Uważam, że może się to zdarzyć, gdy statystyka nie jest wystarczającą statystyką do testu hipotez. T10-30T.
probabilityislogic
.. kontynuacja ... Może się zdarzyć, że masz bardzo „dobre” dane (powiedzmy wartość p 0,5). ALE alternatywna hipoteza może być lepsza (lub bardziej spójna) z tymi danymi (powiedzmy wartość p wynoszącą 0,99999, gdy przełączana jest hipoteza zerowa i alternatywna).
probabilityislogic
5

Jesteś po „prawej stronie wartości p”. Chciałbym tylko nieznacznie skorygować twoje stwierdzenie, aby powiedzieć, że JEŻELI grupy miały równe wariancje w swoich populacjach, ten wynik p = 0,95 wskazuje, że losowe próbkowanie przy użyciu tych wielkości n spowodowałoby wariancje tak daleko od siebie lub w 95% przypadków . Innymi słowy, ściśle mówiąc, poprawne jest sformułowanie wyniku w kategoriach tego, co mówi o hipotezie zerowej, ale nie w kategoriach tego, co mówi o przyszłości.

rolando2
źródło
Pamiętam interpretację wartości p jako (w tym przypadku): zakładając, że hipotezy zerowe (tj. Jednorodność wariancji) są prawidłowe, wówczas prawdopodobieństwo uzyskania tego lub bardziej ekstremalnego wyniku (tj. Przeciwnie do zerowej ) wynosi 57% lub 95%. Ale wniosek jest taki sam i poprawny.
Henrik
3

Podczas gdy poprzednie komentarze są w 100% poprawne, wykresy utworzone dla obiektów modelu w R zapewniają graficzne podsumowanie tego pytania. Osobiście zawsze uważam, że wykresy są o wiele bardziej przydatne niż wartość p, ponieważ można później przekształcić dane i natychmiast zauważyć zmiany na wykresie.

richiemorrisroe
źródło
2
Dobrze powiedziane, inna rzecz jest taka, że ​​wartość p nie mówi nic o tym, co zrobić, jeśli hipoteza zerowa zostanie „odrzucona”, ale wykres danych daje wskazówkę co do problemu
prawdopodobieństwo