Rozważ następujący kod i wynik:
par(mfrow=c(3,2))
# generate random data from weibull distribution
x = rweibull(20, 8, 2)
# Quantile-Quantile Plot for different distributions
qqPlot(x, "log-normal")
qqPlot(x, "normal")
qqPlot(x, "exponential", DB = TRUE)
qqPlot(x, "cauchy")
qqPlot(x, "weibull")
qqPlot(x, "logistic")
Wydaje się, że wykres QQ dla log-normal jest prawie taki sam jak wykres QQ dla weibulla. Jak możemy je odróżnić? Również jeśli punkty znajdują się w obszarze zdefiniowanym przez dwie zewnętrzne czarne linie, czy oznacza to, że mają one określony rozkład?
library(car)
do kodu, aby ułatwić śledzenie. Ogólnie rzecz biorąc, możesz również ustawić ziarno (np.set.seed(1)
), Aby przykład był odtwarzalny, aby każdy mógł uzyskać dokładnie te same punkty danych, które uzyskałeś, chociaż prawdopodobnie nie jest to tutaj tak ważne.Odpowiedzi:
Jest tu kilka rzeczy do powiedzenia:
źródło
Tak.
Przy tej wielkości próbki prawdopodobnie nie możesz.
Nie. To tylko wskazuje, że nie można odróżnić rozkładu danych od tego, który różni się od tego rozkładu. To brak dowodu różnicy, a nie dowód braku różnicy.
Możesz być prawie pewien, że dane pochodzą z dystrybucji, która nie jest żadną z tych, które rozważałeś (dlaczego miałoby to być dokładnie z którejkolwiek z nich?).
źródło