Wiem, że jeśli mediana i średnia są w przybliżeniu równe, oznacza to rozkład symetryczny, ale w tym konkretnym przypadku nie jestem pewien. Średnia i mediana są dość bliskie (różnica tylko 0,487 m / galon), co doprowadziłoby mnie do stwierdzenia, że istnieje rozkład symetryczny, ale patrząc na wykres pudełkowy, wygląda na to, że jest nieco dodatnio wypaczony (mediana jest bliższa Q1 niż Q3, co potwierdzono według wartości).
(Używam programu Minitab, jeśli masz jakieś konkretne porady dotyczące tego oprogramowania).
Odpowiedzi:
Bez wątpienia powiedziano ci inaczej, ale średnia mediana nie oznacza symetrii.=
Istnieje miara skośności oparta na średniej minus mediana (druga skośność Pearsona), ale może wynosić 0, gdy rozkład nie jest symetryczny (jak w przypadku każdej z popularnych miar skośności).
Podobnie związek między średnią a medianą niekoniecznie implikuje podobny związek między środkową ( ) a medianą. Mogą sugerować przeciwną skośność lub jeden może być równy medianie, a drugi nie.(Q1+Q3) / 2
Jednym ze sposobów badania symetrii jest użycie wykresu symetrii *.
Jeśli są uporządkowanymi obserwacjami od najmniejszej do największej (statystyki rzędu), a jest medianą, wówczas wykresy symetrii vs , vs , ... i tak dalej. M Y ( n ) -MM- Y ( 1 ) Y ( n - 1 ) -MM- Y ( 2 )Y( 1 ), Y( 2 ), . . . , Y( n ) M. Y( n )- M M.- Y( 1 ) Y( n - 1 )- M M.- Y( 2 )
* Minitab może to zrobić . Rzeczywiście podnoszę tę fabułę jako możliwą, ponieważ widziałem, jak zrobiono to w Minitabie.
Oto cztery przykłady:
(Rzeczywiste rozkłady były (od lewej do prawej, górny wiersz pierwszy) - Laplace, Gamma (kształt = 0,8), beta (2,2) i beta (5,2). Kod jest Ross Ihaka, stąd )
W przypadku symetrycznych przykładów z grubymi ogonami często skrajne punkty mogą znajdować się bardzo daleko od linii; zwracasz mniejszą uwagę na odległość od linii jednego lub dwóch punktów, gdy znajdujesz się w prawym górnym rogu figury.
Istnieją oczywiście inne wykresy (wspomniałem o wykresie symetrii nie ze szczególnego poparcia tego konkretnego, ale ponieważ wiedziałem, że został już zaimplementowany w Minitab). Przeanalizujmy kilka innych.
Oto odpowiednie wykresy skośne, które Nick Cox zasugerował w komentarzach:
Na tych wykresach wzrost w górę oznaczałby zwykle cięższy prawy ogon niż lewy, a trend w dół oznaczałby zwykle cięższy lewy ogon niż prawy, podczas gdy symetria byłaby sugerowana przez stosunkowo płaski (choć być może dość głośny) wykres.
Nick sugeruje, że ta fabuła jest lepsza (konkretnie „bardziej bezpośrednia”). Jestem skłonny się zgodzić; interpretacja wykresu wydaje się w związku z tym nieco łatwiejsza, chociaż informacje na odpowiednich wykresach są często dość podobne (po odjęciu nachylenia jednostki w pierwszym zestawie, otrzymujesz coś bardzo podobnego do drugiego zestawu).
[Oczywiście, żadna z tych rzeczy nie powie nam, że rozkład, z którego zostały pobrane dane, jest w rzeczywistości symetryczny; otrzymujemy wskazanie, jak bliska jest symetryczność próbki, i w tym zakresie możemy ocenić, czy dane są racjonalnie spójne z danymi pochodzącymi z populacji prawie symetrycznej.]
źródło
skewplot
(SSC). Pomysł powraca przynajmniej do sugestii przypisanej JW Tukeyowi w Wilk, MB i Gnanadesikan, R. 1968. Metody kreślenia prawdopodobieństwa dla analizy danych. Biometrika 55: 1-17.Najłatwiej jest obliczyć skośność próbki . Do tego służy Minitab. Rozkłady symetryczne będą miały zerową skośność. Zero skośności niekoniecznie oznacza symetrię, ale w większości praktycznych przypadków tak.
Jak zauważył @NickCox, istnieje więcej niż jedna definicja skośności. Używam tego, który jest kompatybilny z Excelem , ale możesz użyć dowolnego innego.
źródło
Wyśrodkuj dane wokół zera, odejmując średnią z próbki. Teraz podziel dane na dwie części: negatywną i pozytywną. Weź wartość bezwzględną ujemnych punktów danych. Teraz wykonaj dwupróbkowy test Kołmogorowa-Smirnowa, porównując dwie partycje ze sobą. Wyciągnij wniosek na podstawie wartości p.
źródło
Umieść swoje obserwacje posortowane według rosnących wartości w jednej kolumnie, a następnie umieść je posortowane według malejących wartości w innej kolumnie.
Następnie oblicz współczynnik korelacji (nazwij go Rm) między tymi dwiema kolumnami.
Oblicz indeks chiralny: CHI = (1 + Rm) / 2.
CHI przyjmuje wartości w przedziale [0..1].
CHI ma wartość zerową JEŻELI i TYLKO JEŚLI próbka jest rozmieszczona symetrycznie.
Nie potrzeba trzeciej chwili.
Teoria:
http://petitjeanmichel.free.fr/itoweb.petitjean.skewness.html
http://petitjeanmichel.free.fr/itoweb.petitjean.html
(większość artykułów cytowanych na tych dwóch stronach można pobrać w formacie pdf)
Mam nadzieję, że to pomaga, nawet ostatnio.
źródło