Mam populację próbek zarejestrowanych maksimów amplitudy określonego sygnału. Populacja wynosi około 15 milionów próbek. Stworzyłem histogram populacji, ale nie mogę zgadnąć rozkładu z takim histogramem.
EDYCJA 1: Plik z surowymi przykładowymi wartościami jest tutaj: surowe dane
Czy ktoś może pomóc oszacować rozkład za pomocą następującego histogramu:
distributions
histogram
mbaitoff
źródło
źródło
Odpowiedzi:
Użyj fitdistrplus:
Oto link CRAN do fitdistrplus.
Oto stary link winiety dla fitdistrplus.
Jeśli łącze winiety nie działa, wyszukaj „Użyj biblioteki fitdistrplus do określenia rozkładu z danych”.
Winieta dobrze wyjaśnia, jak korzystać z opakowania. Możesz sprawdzić, jak różne dystrybucje pasują w krótkim czasie. Tworzy również diagram Cullen / Frey.
źródło
plotdist
comamnd? Jak mogę uzyskać diagram Cullen / Frey?descdist()
. Zaktualizowałem powyższy post, aby zawierał trochę kodu i link do starej winiety. Nie mogłem dostać powyższego linku winiety do pracy. Tak więc Google: „Użycie biblioteki fitdistrplus do określenia rozkładu z danych”. Jest to plik .pdf.f1g <- fitdist(x1, "gamma")
dopasowuje rozkład gamma do oryginalnych danychx1
i przechowuje jef1g
. Lewy górny wykresplot(f1g)
pokazuje histogram dla oryginalnych danychx1
jako słupki i dopasowany wykres gęstości gammaf1g
jako linię ciągłą. Wykres gęstości (linia ciągła) jest rysowany na histogramie jako wskaźnik tego, jak dobrze „dopasowanie” reprezentuje dane.Wtedy najprawdopodobniej będziesz w stanie odrzucić jakąkolwiek konkretną dystrybucję prostej, zamkniętej formy.
Nawet ten niewielki guz po lewej stronie wykresu prawdopodobnie wystarczy, abyśmy powiedzieli „wyraźnie nie takie i takie”.
Z drugiej strony jest to prawdopodobnie dość dobrze przybliżone przez wiele popularnych dystrybucji; oczywistymi kandydatami są lognormalne i gamma, ale istnieje wiele innych. Jeśli spojrzysz na log zmiennej x, prawdopodobnie możesz zdecydować, czy lognormal jest w porządku na widoku (po pobraniu logów histogram powinien wyglądać symetrycznie).
Jeśli dziennik jest pochylony, rozważ, czy Gamma jest w porządku, czy jest prawy, sprawdź, czy odwrotna Gamma lub (jeszcze więcej pochylenia) odwrotna gaussowska jest w porządku. Ale to ćwiczenie polega raczej na znalezieniu dystrybucji, która jest wystarczająco blisko, aby z nią żyć; żadna z tych sugestii nie ma w rzeczywistości wszystkich funkcji, które wydają się tam obecne.
Jeśli masz jakąkolwiek teorię na poparcie wyboru, porzuć całą tę dyskusję i skorzystaj z niej.
źródło
Nie jestem pewien, dlaczego miałbyś chcieć klasyfikować próbkę do określonej dystrybucji o tak dużej próbce; parsimony, porównując go z inną próbką, szukając fizycznej interpretacji parametrów?
Większość pakietów statystycznych (R, SAS, Minitab) pozwala na wykreślanie danych na wykresie, który daje linię prostą, jeśli dane pochodzą z określonego rozkładu. Widziałem wykresy, które dają linię prostą, jeśli dane są normalne (log normalny - po transformacji log), Weibull i chi-kwadrat natychmiast przychodzą do mnie. Ta technika pozwoli ci zobaczyć wartości odstające i da ci możliwość przypisania powodów, dla których punkty danych są wartościami odstającymi. W R normalny wykres prawdopodobieństwa nazywa się qqnorm.
źródło