Mam próbkę danych, która została wygenerowana z ciągłej zmiennej losowej X. I z histogramu, który rysuję za pomocą R, myślę, że może rozkład X jest zgodny z pewnym rozkładem gamma. Ale nie znam dokładnych parametrów tego rozkładu gamma.
Moje pytanie brzmi: jak sprawdzić, czy rozkład X należy do rodziny rozkładów gamma? Istnieje pewna przydatność testów dopasowania, takich jak test Kołmogorowa-Smirnowa, test Andersona-Darlinga itd., Ale jednym z ograniczeń przy stosowaniu tych testów jest to, że parametry rozkładu teoretycznego powinny być znane z góry. Czy ktoś mógłby mi powiedzieć, jak rozwiązać ten problem?
distributions
hypothesis-testing
goodness-of-fit
gamma-distribution
użytkownik8363
źródło
źródło
Odpowiedzi:
Myślę, że pytanie wymaga dokładnego testu statystycznego, a nie porównania histogramu. Przy stosowaniu testu Kołmogorowa-Smirnowa z parametrami szacunkowymi rozkład statystyki testu pod wartością zerową zależy od badanego rozkładu, w przeciwieństwie do przypadku bez parametru szacunkowego. Na przykład przy użyciu (w R)
prowadzi do
póki dostaniemy
dla tej samej próbki x. Poziom istotności lub wartość p należy zatem ustalić za pomocą symulacji Monte Carlo pod wartością zerową, uzyskując rozkład statystyki Kołmogorowa-Smirnowa z próbek symulowanych w ramach szacowanego rozkładu (z niewielkim przybliżeniem wyniku, biorąc pod uwagę, że obserwowana próbka pochodzi z innej dystrybucji, nawet poniżej wartości zerowej).
źródło
Oblicz MLE parametrów przyjmujących rozkład gamma dla danych i porównaj gęstość teoretyczną z histogramem danych. Jeśli oba są bardzo różne, rozkład gamma jest słabym przybliżeniem twoich danych. Do testu formalnego można na przykład obliczyć statystykę testu Kołmogorowa-Smirnoffa, porównując najlepiej dopasowany rozkład gamma z rozkładem empirycznym i test na istotność.
źródło