Mam próbkę danych wygenerowanych R
przez rnorm(50,0,1)
, więc dane oczywiście przyjmują rozkład normalny. Jednak R
nie „zna” tych informacji o dystrybucji danych.
Czy istnieje metoda R
pozwalająca oszacować, z jakiego rodzaju dystrybucji pochodzi moja próbka? Jeśli nie, skorzystam z shapiro.test
funkcji i postąpię w ten sposób.
r
distributions
James Highbright
źródło
źródło
Odpowiedzi:
Istnieje
fitdistr
funkcja w pakiecie MASS lub niektóre funkcje w pakiecie fitdistrplus . Oto kilka przykładów z tego ostatniego.więc na przykład
i możesz zobaczyć wykresy za pomocą
więc wydaje się prawdopodobne jako normalny rozkład
ale może także jako dystrybucja logistyczna (będziesz potrzebować większej próbki, aby odróżnić je w reszce)
chociaż za pomocą qqplot i patrząc na CDF można stwierdzić, że prawdopodobnie nie jest to rozkład Cauchy'ego
źródło
fitdist
zapewnia oszacowanie parametrów. Istnieje kilka wskazówek na temat tego, jak może wyglądać rozkład funkcji,descdist(dat, boot = 1000)
ale one także skorzystałyby na większej próbce.fitdist()
jest funkcją pakietu fitdistrplus i właśnie tego używałem. Tymczasemfitdistr()
jest to funkcja w pakiecie MASS i nie działałaby tutaj w tej formie.plot(f1)
zamiast bardziej skomplikowanegoplotdist(dat,"norm",para=list(mean=f1$estimate[1],sd=f1$estimate[2]))