Jestem całkiem nowy w statystyce i potrzebuję twojej pomocy.
Mam małą próbkę, jak następuje:
H4U
0.269
0.357
0.2
0.221
0.275
0.277
0.253
0.127
0.246
Przeprowadziłem test Shapiro-Wilk przy użyciu R:
shapiro.test(precisionH4U$H4U)
i otrzymałem następujący wynik:
W = 0.9502, p-value = 0.6921
Teraz, jeśli założę, że poziom istotności na 0,05, niż wartość p jest większa niż alfa (0,6921> 0,05) i nie mogę odrzucić hipotezy zerowej dotyczącej rozkładu normalnego, ale czy mogę powiedzieć, że próbka ma rozkład normalny ?
Dzięki!
qqnorm(rnorm(9))
kilka razy ...qqnorm(runif(9))
może dać podobny wynik. Więc właściwie nie możemy nic powiedzieć ...Nie odrzucenie hipotezy zerowej oznacza, że próbka, którą posiadasz, jest zbyt mała, aby wychwycić wszelkie odchylenia od normalności, którą masz - ale twoja próbka jest tak mała, że nawet całkiem znaczne odchylenia od normalności prawdopodobnie nie zostaną wykryte.
Jednak test hipotez jest w większości przypadków nie na miejscu, ponieważ ludzie używają testu normalności, ponieważ - tak naprawdę znasz odpowiedź na pytanie, które testujesz - rozkład populacji z twoich danych nie będzie normalny . (Czasami może być dość blisko, ale w rzeczywistości normalny?)
Pytanie, na które powinieneś zwrócić uwagę, nie brzmi „rozkład, z którego pochodzą one normalne” (nie będzie). Pytanie, na które powinieneś się bardziej przejmować, brzmi bardziej: „czy odchylenie od normalności ma istotny wpływ na moje wyniki?”. Jeśli jest to potencjalnie problem, możesz rozważyć analizę, w której prawdopodobieństwo wystąpienia tego problemu jest mniejsze.
źródło
Biorąc pod uwagę, że jesteś całkiem nowy w statystyce, podejrzewam, że o tym myślisz, ponieważ są to resztki szacunku średniej i chcesz wiedzieć, czy założenie normalności jest ważne dla oszacowań ufności z wykorzystaniem rozkładu .t
Spekuluję dalej, że patrzysz na proporcje, w którym to przypadku możesz zastosować rozkład dwumianowy, jeśli martwisz się naruszeniem założeń.
Jeśli to była inna sprawa, która doprowadziła cię do testów Shapiro, możesz zignorować wszystko, co powiedziałem.
źródło
Jak już powiedział Henry, nie można powiedzieć, że to normalne. Spróbuj uruchomić kilka razy następujące polecenie w R:
Spowoduje to przetestowanie próbki 9 liczb z równomiernego rozkładu. Wiele razy wartość p będzie znacznie większa niż 0,05 - co oznacza, że nie można wnioskować, że rozkład jest normalny.
źródło
Zastanawiałem się również, jak poprawnie interpretować wartość W w teście Shapiro-Wilka i zgodnie z artykułem Emila OW Kirkegaarda „ Wartości W z testu Shapiro-Wilk wizualizowane przy użyciu różnych zestawów danych ” bardzo trudno jest powiedzieć coś o normalności rozkład patrząc tylko na wartość W.
Jak podsumowuje:
Zobacz oryginalny artykuł, aby uzyskać więcej informacji.
źródło
Ważną kwestią nie wymienioną w poprzedniej odpowiedzi są ograniczenia testu:
Aby odpowiedzieć na pierwotne pytanie (bardzo mała próbka): zapoznaj się z następującymi artykułami na temat lepszych alternatyw, takich jak wykres QQ i histogram dla tego konkretnego przypadku.
źródło