Próbuję ustalić, czy mój zestaw danych ciągłych danych jest zgodny z rozkładem gamma o parametrach kształt 1,7 i szybkość = 0,000063.
Problem polega na tym, gdy używam R do utworzenia wykresu QQ mojego zestawu danych względem teoretycznego rozkładu gamma (1,7, 0,000063), otrzymuję wykres, który pokazuje, że dane empiryczne w przybliżeniu zgadzają się z rozkładem gamma. To samo dzieje się z fabułą ECDF.
Jednak gdy przeprowadzam test Kołmogorowa-Smirnowa, daje mi to nieuzasadnioną małą wartość < 1 % .
W co powinienem wierzyć? Wyjście graficzne czy wynik testu KS?
pdf
kolmogorov-smirnov
cdf
qq-plot
użytkownik22119
źródło
źródło
Odpowiedzi:
Nie widzę sensu w „niewiary” w fabułę QQ (jeśli właściwie ją stworzyliście); to tylko graficzna reprezentacja rzeczywistości twoich danych, zestawiona z rozkładem definicji. Oczywiście nie jest to idealne dopasowanie, ale jeśli jest wystarczająco dobre dla twoich celów, może to być mniej więcej koniec historii. Może zechcesz sprawdzić następujące pokrewne pytanie: Czy testowanie normalności jest „zasadniczo bezużyteczne”?
To, czy Twoje dane zbyt różnią się od rozkładu gamma dla zamierzonych celów, to kolejne pytanie. Sam test KS nie jest w stanie odpowiedzieć za ciebie (ponieważ jego wynik będzie zależał między innymi od wielkości próbki), ale wykres QQ może pomóc ci zdecydować. Być może warto przyjrzeć się solidnym alternatywom dla wszelkich innych analiz, które planujesz przeprowadzić, a jeśli szczególnie poważnie podchodzisz do kwestii wrażliwości kolejnych analiz na odchylenia od rozkładu gamma, możesz również rozważyć wykonanie testów symulacyjnych .
źródło
Co możesz zrobić, to utworzyć wiele próbek z rozkładu teoretycznego i wykreślić je na tle twojego wykresu QQ. To da ci wyobrażenie o tym, jakiej zmienności możesz racjonalnie oczekiwać od samego próbkowania.
Możesz rozwinąć ten pomysł, aby utworzyć obwiednię wokół linii teoretycznej, korzystając z przykładu ze stron 86-89:
Venables, WN i Ripley, BD 2002. Nowoczesne statystyki stosowane z S. New York: Springer.
To będzie koperta punktowa. Możesz rozszerzyć ten pomysł jeszcze bardziej, aby utworzyć ogólną kopertę, korzystając z pomysłów ze stron 151-154:
Davison, AC i Hinkley, DV 1997. Metody bootstrap i ich zastosowanie. Cambridge: Cambridge University Press.
Jednak dla podstawowej eksploracji myślę, że wystarczy wykreślić kilka próbek referencyjnych w tle twojego wykresu QQ.
źródło
Test KS zakłada określone parametry twojej dystrybucji. Testuje hipotezę „dane są dystrybuowane zgodnie z tym konkretnym rozkładem”. Być może gdzieś podałeś te parametry. Jeśli nie, mogły zostać użyte niektóre niepasujące wartości domyślne. Zauważ, że test KS stanie się konserwatywny, jeśli oszacowane parametry zostaną włączone do hipotezy.
Jednak większość testów dopasowania jest wykorzystywana w niewłaściwy sposób. Jeśli test KS nie wykazałby znaczenia, nie oznacza to, że model, który chciałeś udowodnić, jest odpowiedni. Tak powiedział @Nick Stauner o zbyt małej wielkości próby. Ten problem jest podobny do testów hipotez punktowych i testów równoważności.
Na koniec: rozważ tylko wykresy QQ.
źródło
Wykres QQ jest eksploracyjną techniką analizy danych i powinien być traktowany jako taki - podobnie jak wszystkie inne wykresy EDA. Mają one jedynie na celu uzyskanie wstępnego wglądu w dostępne dane. Nigdy nie powinieneś decydować ani zatrzymywać analizy na podstawie wykresów EDA, takich jak wykres QQ. Błędem jest rozważanie tylko wykresów QQ. Zdecydowanie powinieneś zastosować techniki ilościowe, takie jak KS Test. Załóżmy, że masz inny wykres QQ dla podobnego zestawu danych. Jak porównałbyś je bez narzędzia ilościowego? Następnym krokiem dla Ciebie, po teście EDA i KS, jest ustalenie, dlaczego test KS daje niską wartość p (w twoim przypadku może to być nawet spowodowane pewnym błędem).
Techniki EDA NIE mają służyć jako narzędzia do podejmowania decyzji. W rzeczywistości powiedziałbym, że nawet wnioskowanie statystyczne ma jedynie charakter eksploracyjny. Dają wskazówki dotyczące kierunku, w którym powinna przebiegać analiza statystyczna. Na przykład test t na próbce dałby tylko poziom pewności, że próbka może (ale nie musi) należeć do populacji, możesz nadal kontynuować na podstawie tego wglądu w to, do jakiego rozkładu należą twoje dane i do czego są jego parametry itp. W rzeczywistości, gdy niektórzy twierdzą, że nawet techniki wdrożone w ramach bibliotek uczenia maszynowego mają również charakter eksploracyjny !!! Mam nadzieję, że mają to na myśli w tym sensie ...!
Podejmowanie decyzji statystycznych na podstawie wykresów lub technik wizualizacji jest kpiną z osiągnięć w dziedzinie statystyki. Jeśli o mnie zapytasz, powinieneś użyć tych wykresów jako narzędzia do przekazania ostatecznych wniosków na podstawie ilościowej analizy statystycznej.
źródło