Mieć, powiedzmy, następujące dane:
8232302 684531 116857 89724 82267 75988 63871
23718 1696 436 439 248 235
Potrzebujesz prostego sposobu dopasowania tego (i kilku innych zestawów danych) do dystrybucji Pareto. Idealnie byłoby wyprowadzić pasujące wartości teoretyczne, mniej idealnie parametry.
r
pareto-distribution
Felix
źródło
źródło
Odpowiedzi:
Cóż, jeśli masz próbkę z rozkładu pareto z parametrami i (gdzie jest dolnym ograniczonym parametrem, a jest parametrem kształtu), prawdopodobieństwo logarytmu tego próbka to: m > 0 α > 0 m αX1,...,Xn m>0 α>0 m α
jest to monotonicznie rosnąca , więc maksymalizator jest największą wartością zgodną z obserwowanymi danymi. Ponieważ parametr określa dolną granicę podparcia dla rozkładu Pareto, optymalne jestmm m
co nie zależy od . Następnie, używając zwykłych sztuczek rachunku różniczkowego, MLE dla musi spełniaćαα α
jakaś prosta algebra mówi nam, że MLE z jestα
W wielu ważnych aspektach (np. Optymalna wydajność asymptotyczna, ponieważ osiąga dolną granicę Cramer-Rao), jest to najlepszy sposób dopasowania danych do rozkładu Pareto. Kod R poniżej oblicza MLE dla danego zestawu danych
X
.Edycja: Na podstawie komentarza @cardinal i I poniżej możemy również zauważyć, że jest odwrotnością średniej próbki z , które zdarzają się mieć rozkład wykładniczy. Dlatego jeśli mamy dostęp do oprogramowania, które może pasować do rozkładu wykładniczego (co jest bardziej prawdopodobne, ponieważ wydaje się, że pojawia się w wielu problemach statystycznych), wówczas dopasowanie rozkładu Pareto można osiągnąć poprzez transformację zestawu danych w ten sposób i dopasowanie go do rozkładu wykładniczego w przekształconej skali. log(Xi/ m )α^ log( Xja/ m^)
źródło
Możesz użyć
fitdist
funkcji dostarczonej wfitdistrplus
pakiecie:źródło
library(fitdistrplus)
?library(actuar)
jest wymagane, aby to zadziałało.