Wykres qq może być użyty do wizualizacji podobieństwa dwóch rozkładów (np. Wizualizacji podobieństwa rozkładu do rozkładu normalnego, ale także do porównania dwóch rozkładów danych biblioteki artystycznej). Czy są jakieś statystyki, które generują bardziej obiektywną, liczbową miarę, która reprezentuje ich podobieństwo (najlepiej w znormalizowanej (0 <= x <= 1))? Współczynnik Giniego jest na przykład wykorzystywany w ekonomii podczas pracy z krzywymi Lorenza; czy jest coś dla wykresów QQ?
źródło
I niedawno używany korelację między empiryczną CDF CDF i dopasowanej do ilościowego dobroci dopasowania, i zastanawiam się, czy takie podejście może być również użyteczny w obecnym przypadku, który jak rozumiem obejmuje porównanie dwóch zestawów danych empirycznych. Interpolacja może być konieczna, jeśli między zbiorami występuje różna liczba obserwacji.
źródło
Powiedziałbym, że mniej więcej kanonicznym sposobem porównania dwóch rozkładów byłby test chi-kwadrat. Statystyka nie jest jednak znormalizowana i zależy od tego, jak wybierzesz pojemniki. Ostatni punkt można oczywiście postrzegać jako cechę, a nie błąd: odpowiednie wybranie pojemników pozwala na dokładniejsze przyjrzenie się podobieństwu w ogonach, na przykład w środku dystrybucji.
źródło
Dość bezpośrednią miarą „bliskości” liniowości na wykresie QQ byłaby statystyka testu Shapiro-Francii (która jest ściśle związana z lepiej znanym Shapiro-Wilkiem i może być traktowana jako zwykłe przybliżenie).
Statystyka Shapiro-Francia to kwadratowa korelacja między uporządkowanymi wartościami danych a oczekiwanymi statystykami normalnego rzędu (czasami oznaczonymi jako „kwantyle teoretyczne”) - to znaczy powinien to być kwadrat korelacji widoczny na wykresie, dość bezpośredni miara podsumowująca.
(Shapiro-Wilk jest podobny, ale bierze pod uwagę korelacje między statystykami zamówień; ma podobną interpretację jak Shapiro-Francia i jest prawie tak samo przydatny jak podsumowanie wykresu QQ.)
Tak czy inaczej, dla pojedynczego podsumowania tego, co pokazuje wykres QQ, jeden z nich może być odpowiednim sposobem na podsumowanie wykresu.
źródło