Czy ktoś może podać przykład unimodalnego rozkładu, który ma skośność równą zero, ale który nie jest symetryczny?

31

W maju 2010 r. Użytkownik Wikipedii Mcorazao dodał zdanie do artykułu o skośności: „Wartość zero wskazuje, że wartości są względnie równomiernie rozłożone po obu stronach średniej, zazwyczaj, ale niekoniecznie, implikując rozkład symetryczny”. Jednak na stronie wiki nie ma faktycznych przykładów dystrybucji, które łamią tę regułę. Googlowanie „przykładowe rozkłady asymetryczne z zerową skośnością” również nie daje prawdziwych przykładów, przynajmniej w pierwszych 20 wynikach.

Używając definicji, że pochylenie jest obliczane przez orazwzór R.E[(Xμσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Potrafię skonstruować mały, dowolny rozkład, aby obniżyć skośność. Na przykład dystrybucja

x = c(1, 3.122, 5, 4, 1.1) 

daje przekrzywienie . Ale to mała próbka, a ponadto odchylenie od symetrii nie jest duże. Czy jest więc możliwe zbudowanie większego rozkładu z jednym pikiem, który jest wysoce asymetryczny, ale nadal ma skośność prawie zero?5.64947105

Andy McKenzie
źródło
3
Czy chcesz, aby dystrybucja była jednomodalna, czy nie? Tytuł tak mówi, ale tekst ledwo wspomina o tym punkcie.
Dilip Sarwate
@Dipip Tak, uważam, że byłoby bardziej interesujące, gdyby rozkład był jednomodalny, ponieważ skośność, jako centralny moment, naprawdę nie ma sensu inaczej.
Andy McKenzie,

Odpowiedzi:

28

Rozważ dyskretne rozkłady. Taki, który jest obsługiwany na wartości x 1 , x 2 , , x k jest określony przez nieujemne prawdopodobieństwa p 1 , p 2 , , p k pod warunkiem, że (a) sumują się do 1 i (b) współczynnik skośności wynosi 0 (co jest równoważne z trzecim momentem centralnym równym zero). Pozostawia to k - 2 stopnie swobody (w sensie rozwiązywania równań, nie statystycznego!). Możemy mieć nadzieję, że znajdziemy rozwiązania, które są niemodalne.kx1,x2,,xkp1,p2,,pkk2

Aby ułatwić wyszukiwanie przykładów, szukałem rozwiązań obsługiwanych na małym symetrycznym wektorze z unikalnym trybem przy 0 , średniej zero i zerowej skośności . Jednym z takich rozwiązań jest ( s 1 , ... , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 ,x=(3,2,1,0,1,2,3)0 .(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Funkcja prawdopodobieństwa

Widać, że jest asymetryczny.

Oto bardziej oczywiste rozwiązanie asymetryczne z (który jest asymetryczny) ip = ( 1 , 18 , 72 , 13 , 4 ) / 108 :x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Funkcja prawdopodobieństwa 2

Teraz jest oczywiste, co się dzieje: ponieważ średnia wynosi , wartości ujemne przyczyniają się ( - 3 ) 3 = - 27 i 18 × ( - 1 ) 3 = - 18 do trzeciego momentu, podczas gdy wartości dodatnie przyczyniają się 4 × 2 3 = 32 i 13 × 1 3 = 13 , dokładnie równoważąc ujemne wkłady. Możemy przyjąć rozkład symetryczny około 0 , na przykład x =0(3)3=2718×(1)3=184×23=3213×13=130 przy p = ( 1 , 4 , 1 ) / 6 i przesunąć małą masę z + 1 na + 2 , małą masę z + 1 na - 1 i niewielką ilość masy do - 3 , utrzymując średnią na 0, a skośność na 0x=(1,0,1)p=(1,4,1)/6+1+2+11300a także tworząc asymetrię. To samo podejście zadziała, aby utrzymać zerową średnią i zerową skośność ciągłego rozkładu, jednocześnie czyniąc go asymetrycznym; jeśli nie będziemy zbyt agresywni przy przesuwaniu masy, pozostanie on jednomodalny.


Edycja: ciągłe rozkłady

Ponieważ problem wciąż się pojawia, dajmy wyraźny przykład z ciągłymi dystrybucjami. Peter Flom miał dobry pomysł: spójrz na mieszanki normalnych. Mieszanka dwóch normalnych nie zadziała: gdy zniknie skośność, będzie symetryczna. Kolejnym najprostszym przypadkiem jest mieszanka trzech normalnych.

Mieszaniny trzech normalnych, po odpowiednim wyborze lokalizacji i skali, zależą od sześciu rzeczywistych parametrów, a zatem powinny mieć więcej niż wystarczającą elastyczność, aby stworzyć asymetryczne rozwiązanie zerowej skośności. Aby je znaleźć, musimy wiedzieć, jak obliczać skośności mieszanin normalnych. Spośród nich będziemy szukać tych, które są jednomodalne (możliwe, że nie ma żadnych).

Otóż, na ogół, (nie centralne) Moment rozkładu normalnego jest równa zero, gdy R jest liczbą nieparzystą, a poza tym jest równa 2 R / 2 y ( 1 - Rrthr . Kiedy przeskalować że standardowy rozkład normalny mieć odchylenie standardoweĎTheRthchwila jest mnożona przezĎr. Kiedy przesunąć dowolną dystrybucję przezľ, nowyRthchwili może być wyrażona w chwilach włącznier. Moment mieszanki rozkładów (to znaczy ich ważona średnia) jest taką samą średnią ważoną poszczególnych momentów. Wreszcie skośność wynosi zero dokładnie wtedy, gdy trzeci centralny moment wynosi zero, i można to łatwo obliczyć w odniesieniu do pierwszych trzech momentów.2r/2Γ(1r2)/πσrthσrμrthr

To daje nam algebraiczny atak na problem. Jednym z rozwiązań, że stwierdzone jest równa mieszaninę trzech normalnych parametrów równym ( 0 , 1 ) , ( 1 / 2 , 1 ) oraz ( 0 , (μ,σ)(0,1)(1/2,1). Jego średnia równe(0+1/2+0)/3=1/6. Ten obraz pokazuje pdf na niebiesko, a pdf dystrybucjiobrócony o swoją średniąna czerwono. Różnice między nimi pokazują, że oba są asymetryczne. (Tryb około0,0519216nierówne średniej z1/6). Obie zero skośność ze względów konstrukcyjnych.(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

Ciągłe przykłady

Wykresy wskazują, że są one jednomodalne. (Możesz to sprawdzić za pomocą Calculus, aby znaleźć lokalne maksima.)

Whuber
źródło
(+1) Bardzo sprytna odpowiedź. Czy będzie to działać z ciągłymi dystrybucjami? Czy zmiana nie stworzyłaby potencjalnie małych trybów? Może nie myślę prosto ...
Makro
1
Myślicie całkiem dobrze, Makro: wszyscy powinniśmy być sceptyczni. Sztuką jest przesunięcie niewielkich ilości w szerokim zakresie. Test pierwszej pochodnej umożliwi sprawdzenie możliwych trybów, a także stanowi podstawę do udowodnienia, że wystarczająco małe przesunięcia tej formy nie spowodują powstania nowych trybów.
whuber
Dziękuję za odpowiedź! Jest to podobne do tego, co intuicyjnie myślałem, chociaż nie umiałem tego dobrze wyrazić słowami - że trzeba „zbalansować” masę po każdej stronie rozkładu. Zastanawiam się, czy istnieją stereotypowe sposoby wykonywania tej czynności równoważenia.
Andy McKenzie
Jednym ze sposobów Andy jest rozpoczęcie od rozwiązania dyskretnego, a następnie połączenie go z rozkładem normalnym. W takim przypadku wymóg jednomodalności zmusi to rozkład normalny do dużego odchylenia standardowego. Mimo to, jeśli splot nie zmienia znacząco wymaganych właściwości (takich jak zerowa skośność) lub zmienia go w przewidywalny sposób, masz matematyczne podejście do problemu. W pewnym sensie moją ostatnią edycję można uznać za taki atak, chociaż nie jest to ściśle splot (ponieważ trzy normalne mają różne odchylenia standardowe).
whuber
2
Sprawdziłem, Andy: zwoje dyskretnego rozwiązania o normalnym rozkładzie nie zmieniają skosu. Jeśli nadasz temu rozkładowi normalnemu odchylenie standardowe około 0,57 lub większe, wynik będzie jednomodalny. Podobnie jak leżący u podstaw dyskretny rozkład, nadal ma zerową średnią, zerową skośność i jest asymetryczny. Pomieszanie tego ze standardowym rozkładem normalnym oznacza kontrolowany ruch masy między standardowym rozkładem normalnym a dyskretnym: może to spełnić Twoje żądanie zastosowania metody „stereotypowej”.
whuber
23

k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Ma średnią 0,5387, odchylenie standardowe 0,2907, skośność 0,0000 i kurtozę 2,0000. Źródło nazywa to również „dystrybucją słoni”: wprowadź opis zdjęcia tutaj

Moja reprodukcja w języku R została stworzona za pomocą

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

wydajność

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15
Christoph Hanck
źródło
Dziękuję za edycję. To powiedziawszy, nie mogłem odtworzyć skośności od 0,0000 do czterech cyfr, otrzymując zamiast tego 0,0001245138 (patrz następna edycja, w kodzie R).
Christoph Hanck
ck
Właściwie 0,0003756196. 0.0001245138 było już po wstępnej optymalizacji, podanej tutaj przez pomyłkę. Zerknę.
Christoph Hanck
@amoeba, próbowałem trochę zoptymalizować, ale nie twierdzę, że zrobiłem to w sprytny sposób, mam niewielkie doświadczenie w optymalizacji.
Christoph Hanck
2
Skośność, która wynosi od zera do trzech cyfr (prawie cztery), była dla mnie wystarczająca; to nie jest tak, że bardziej precyzyjna wartość sprawi, że będzie wyglądać inaczej. Jeśli skośność przekroczy zero w tym sąsiedztwie i jasne będzie, w jakich kierunkach zmienić wartości, jeśli potrzebna jest większa dokładność, uważam, że to wystarczy. Ale pochwały za dodatkowy wysiłek. (
Nawiasem mówiąc
9

Rozważ rozkład na dodatniej połowie rzeczywistej linii, który zwiększa się liniowo od 0 do trybu, a następnie jest wykładniczy na prawo od trybu, ale jest ciągły w tym trybie.

Można to nazwać rozkładem wykładniczym trójkątnym (choć często wygląda trochę jak płetwa rekina).

θλ

λθλθ6.15

Trójkątny wykładniczy z zerową skośnością

[1][2]

Wątek Nietypowe rozkłady z zerową skośnością i zerową kurtozą? ma kilka asymetrycznych przykładów, w tym mały dyskretny przykład i kolejny ciągły nieimodalny:

Jednomodalna mieszanka Gaussa z zerową skośnością

Dyskretne rozkłady unimodalne - lub równoważnie próbki - o zerowej skośności są dość łatwe do zbudowania, o dużych lub małych rozmiarach.

Oto przykład, który możesz potraktować jako próbkę lub (dzieląc nieprzetworzone częstotliwości przez 3000) jako pmf (wartości „x” to pobrane wartości, a „n” to liczba przypadków, w których wartość występuje w próbce ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Wykres funkcji prawdopodobieństwa skonstruowany na podstawie powyższego

Ten przykład zbudowany jest z 3-punktowych rozkładów:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

ccinixi=0inixi3=0c

Istnieje wiele innych takich „atomów”, które można zbudować, ale w tym przykładzie użyto tylko jednego rodzaju. Do pewnej kombinacji atomów, takich jak te, dodaje się kilka symetrycznie umieszczonych wartości w celu wypełnienia pozostałych otworów i zagwarantowania niejednoznaczności bez niszczenia struktury średniej i trzeciego momentu.

[1]


[2]


Glen_b - Przywróć Monikę
źródło
3
Mógłby to nazwać „płetwą rekina”?
Glen_b
@Glen_b Totally Shark-fin rzeczywiście.
Alecos Papadopoulos
2

Pewnie. Spróbuj tego:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Zrobiłeś już ciężkie rzeczy!)

Peter Flom - Przywróć Monikę
źródło
1
Fajne, lubię to. +1
Gung - Przywróć Monikę
4
To nie jest bimodalny ... to strasznie wielu -modal. Spróbuj wykreślić gęstość; curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
gość
1
Dane generowane w ten sposób z pewnością nie są jednomodalne. Wszystko, co musisz zrobić, aby zobaczyć, że jest wycięty i wklej swój kod, dosłownie. Rzeczywiście, mieszanina normalnie rozłożonych zmiennych nigdy nie będzie unimodalna (chyba że jedna z proporcji mieszanki to 1).
Makro
8
@Macro, to nie jest poprawne. Zobacz na przykład streszczenie Roedera 1994 (JASA) dla dobrze znanego wyniku, że „gęstość dwóch mieszanych normalnych nie jest bimodalna, chyba że średnie są oddzielone przez co najmniej 2 odchylenia standardowe”. Jeśli dzieli je mniej niż to, mieszanina jest jednomodalna.
gość
1
Masz rację @ gość. Zapomniałem o tej możliwości, kiedy napisałem swój post
Makro
2

E[(Xμσ)3]=0
E[(Xμσ)3|Xμ]+E[(Xμσ)3|X>μ]=0.

YZμ

E[(Yμσ)3]=E[(Zμσ)3]
XYμ(μZ)

YZμμ

krlmlr
źródło
1
Jak możesz zagwarantować, że dystrybucja jest jednomodalna?
Dilip Sarwate
YZμ
σYZ
@whuber: Cholera. Wiedziałem, że musi być jakaś pułapka ... :-)
krlmlr
2

Następujący dyskretny rozkład jest asymetryczny i ma zerową skośność: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Znalazłem to w pracy Doric i in., Qual Quant (2009) 43: 481–493; DOI 10.1007 / s11135-007-9128-9

Petitjean
źródło
+1 Sprawdza się i jest jednomodalny. To najprostszy możliwy przykład.
whuber