Dlaczego wszystkie znane dystrybucje są niemodalne?

13

Nie znam żadnych dystrybucji multimodalnych.

Dlaczego wszystkie znane dystrybucje są niemodalne? Czy jest jakaś „znana” dystrybucja, która ma więcej niż jeden tryb?

Oczywiście mieszanki dystrybucji są często multimodalne, ale chciałbym wiedzieć, czy istnieją jakieś dystrybucje „niemiksowane”, które mają więcej niż jeden tryb.

Miroslav Sabo
źródło
5
Mówisz o „standardowych” dystrybucjach, a nie o „znanych” dystrybucjach
Stéphane Laurent
12
A może beta z α=β=0.5 ?
ameba mówi Przywróć Monikę
1
Jeśli nie masz nic przeciwko ograniczonym rozkładom bimodalnym , Wikipedia wspomina również o rozkładzie kwadratowym i łukowym . Sądzę, że są to tylko szczególne przypadki dystrybucji beta ... Wikipedia wymienia także przykłady naturalnych wystąpień dystrybucji multimodalnej .
Nick Stauner
12
@ StéphaneLaurent: Lubię „dystrybucje markowe” , ponieważ przekazywanie, że nazwanie samo w sobie nie oznacza żadnego specjalnego statusu dla dystrybucji. „Znane” dystrybucje sprawiają, że wydaje się, że reszta może być gdzieś tam, czekając na odkrycie, jak potwór z Loch-Ness lub ciemna materia.
Scortchi - Przywróć Monikę
5
Doskonałe @Scortchi, świetne słownictwo! Wielu nie-matematyków naukowców, z którymi się spotkałem, ma wrażenie, że dystrybucja bez nazwy nie istnieje. Być może kryje się za tym głębszy fakt filozoficzny, pomieszanie nazwy i rzeczy oznaczonej tym imieniem (jak powiedział Russell: „Słowo„ pies ”nie przypomina psa”)
Stéphane Laurent,

Odpowiedzi:

17

Pierwsza część pytania odpowiedzi w komentarzach do pytania: dużo „markowych” dystrybucje są multimodalny, taki jak każdy Beta dystrybucji z pomocą < 1 i b < 1 . Przejdźmy zatem do drugiej części pytania.(a,b)a<1b<1

Wszystkie dyskretne rozkłady są wyraźnie mieszaninami (atomów, które są jednomodalne).

Pokażę, że większość ciągłych rozkładów to także mieszanki rozkładów unimodalnych. Intuicja stojąca za tym jest prosta: możemy „wygładzić” nierówności z wyboistego wykresu PDF, jeden po drugim, aż wykres będzie poziomy. Guzki stają się składnikami mieszanki, z których każdy jest oczywiście jednomodalny.

W związku z tym, z wyjątkiem być może niektórych niecodziennych dystrybucji, których pliki PDF są wysoce nieciągłe, odpowiedź na pytanie brzmi „brak”: wszystkie rozkłady multimodalne, które są absolutnie ciągłe, dyskretne, lub kombinacja tych dwóch są mieszaninami rozkładów unimodalnych.


Rozważ ciągłe rozkłady których pliki PDF f są ciągłe (są to rozkłady „absolutnie ciągłe”). (Ciągłość nie stanowi większego ograniczenia; można ją rozluźnić poprzez dokładniejszą analizę, zakładając jedynie, że punkty nieciągłości są dyskretne.) Ff

Aby poradzić sobie z „plateau”, wartości stałych, które mogą wystąpić, określenie „stan”, aby być odstęp (który może być pojedynczy punkt, w którym x L = x U ) takie, żem=[xl,xu]xl=xu

  1. ma stałą wartość na m , powiedzmy y .fm,y

  2. nie jest stałe w żadnym przedziale, który ściśle zawiera m .fm

  3. Istnieje liczba dodatnia taka, że ​​maksymalna wartość f osiągnięta na [ x l - ϵ , x u + ϵ ] wynosi y .ϵf[xlϵ,xu+ϵ]y

Niech będzie dowolnym trybem f . Ponieważ f jest ciągły, istnieją przedziały [ x l , x u ] zawierające m, dla których f nie zmniejsza się w [ x l , x l ] (co jest odpowiednim przedziałem, a nie tylko punktem) i nie wzrasta w [ x u , x u ]m=[xl,xu]ff[xl,xu]mf[xl,xl][xu,xu](co jest również właściwym interwałem). Niech być infinimum wszystkich tych wartości, a x ' U supremum wszystkich tych wartości.xlxu

Konstrukcja ta zdefiniowała jeden „garb” na wykresie rozciągający się od x l do x u . Niech Y jest większe od f ( x " l ) i F ( x " u ) . Z założenia zbiór punktów x w [ x l , x u ], dla którego f ( x ) y jest odpowiednim przedziałem m fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymściśle zawierające (ponieważ zawiera albo całe [ x l , x l ] lub [ x u , x u ] ).m[xl,xl][xu,xu]

Postać

Na tej ilustracji multimodalnego pliku PDF tryb jest identyfikowany przez czerwoną kropkę na osi poziomej. Poziomy zasięg czerwonej części wypełnienia to przedział m : jest to podstawa garbu określona przez tryb m . Podstawa tego garbu znajduje się na wysokości y 0,16 . Oryginalny plik PDF jest sumą czerwonego i niebieskiego wypełnienia. Zauważ, że niebieskie wypełnienie ma tylko jeden tryb w pobliżu 2 ; tryb oryginalny w [ 0 , 0 ] został usunięty.m=[0,0]mmy0.162[0,0]

Pisanie dla długości m zdefiniuj|m|m

pm=PrF(m)y|m|

i

fm(x)=f(x)ypm

gdy i przeciwnym razie. ( sprawia to, że jest funkcją ciągłą.) Licznik jest wielkością, o jaką wzrasta powyżej a mianownik jest obszarem między wykresem i . Zatem jest nieujemne i ma całkowity obszar : jest to PDF rozkładu prawdopodobieństwa. Ze względu na budowę ma unikalny tryb .f m ( x ) = 0 f m f y p m f y f m 1 mxmfm(x)=0fmfypmfyfm1m

Również przez budowę, funkcja

fm(x)=f(x)pmfm(x)1pm

jest PDF . (Oczywiście, jeśli nie ma już nic z co na początku musiało być unimodalne.) Co więcej, nie ma trybów w przedziale (gdzie jest stały, dlatego poprzednia staranna definicja konieczny był tryb jako interwał). Ponadto,p m = 1 f , m pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

jest mieszanką unimodalnego PDF i PDF .f mfmfm

Powtórz tę procedurę za pomocą (która jako liniowa kombinacja funkcji ciągłych jest nadal funkcją ciągłą, umożliwiając nam kontynuowanie jak poprzednio), tworząc sekwencję trybów ; odpowiadające sekwencje wag ; oraz pliki PDF Wynik ograniczający istnieje, ponieważ (a) przedział, w którym jest spłaszczony, obejmuje odpowiedni przedział, który nie został spłaszczony w poprzednim m = m 1 , m 2 , ... P 1 = s m , p 2 = s m 2 , ... f 1 = f m , K 2 = f m 2 , ... . f i i - 1 ffmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,.fii1operacje i (b) liczb rzeczywistych nie można rozłożyć na więcej niż policzalną liczbę takich przedziałów. Limit nie może mieć żadnych modów, a zatem jest stały, który musi wynosić zero (w przeciwnym razie jego całka rozdzieliłaby się). W związku z tym zostało wyrażone (być może nie jednoznacznie, ponieważ kolejność wybierania trybów będzie miała znaczenie) jako mieszaninaf

f(x)=ipifi(x)

rozkładów jednomodalnych, QED.

Whuber
źródło
7

Przez unimodal uważam, że OP oznacza po prostu, że istnieje tylko jeden tryb wewnętrzny (tj. Z wyłączeniem rozwiązań narożnych). Pytanie tak naprawdę nasuwa pytanie ...

why is it that brand name distributions do NOT have more than one interior mode?

tzn. dlaczego większość dystrybucji nazw marek wygląda mniej więcej tak:

wprowadź opis zdjęcia tutaj

... plus lub minus pewna skośność lub pewne nieciągłości? Gdy pytanie zostanie postawione w ten sposób, rozkład Beta nie byłby prawidłowym kontrprzykładem.

Wygląda na to, że przypuszczenie OP ma pewną trafność: większość popularnych dystrybucji marek nie pozwala na więcej niż jeden tryb wewnętrzny. Mogą istnieć teoretyczne powody. Na przykład, każda dystrybucja, która jest członkiem rodziny Pearson (która obejmuje Beta), będzie koniecznie (wewnętrzna) unimodalna, w wyniku równania różniczkowego nadrzędnego, które definiuje całą rodzinę. A rodzina Pearson obejmuje większość najbardziej znanych marek.

Niemniej jednak oto kilka przykładów liczników marek ...

Przykład licznika

Jednym z przykładów marki jest dystrybucja z pdf:Sinc2

f(x)=sin2(x)πx2

zdefiniowane w wierszu rzeczywistym. Oto wykres pdf:Sinc2

wprowadź opis zdjęcia tutaj

Moglibyśmy również dodać rodzinę kardiodyków i dystrybucji związanych z tą klasą ... z wykresami pdf, takimi jak:

wprowadź opis zdjęcia tutaj

Rodzina odzwierciedlonych dystrybucji marek mogłaby być również potencjalnymi pretendentami do marki (choć można je uznać za „oszustwo” ... ale nadal są to nazwy marek), takie jak pokazany tutaj Reflected Weibull:

wprowadź opis zdjęcia tutaj

wilki
źródło
1
Mój, ten wykres pewno wygląda na to, że ma jakieś ujemne wartości! (Czy to może być artefakt fabularny?) ... A rozkłady kardioidalne wyglądają tak, jakby miały tylko jeden tryb wewnętrzny. Sinc2
whuber
1
Cześć @ whuber ... muszę zgodzić się na artefakt fabularny (zajmę się tym na Mathematica SE!). Re cardiod family: pomysł jest taki, że można rozszerzyć domenę takich rodzin, jak jedna, i jak fala sinusoidalna, wciąż daje :)
wilki
1
(+1) To dziwny artefakt: wydaje się, że twój ostatni wątek (odbitych rozkładów) go nie pokazuje. Możesz śledzić generowanie punktów wykresu na wykresie aby zobaczyć, gdzie one leżą; Podejrzewam, że niewielkie wartości ujemne mogą być przekroczeniem splajnu niewielkiej liczby punktów. Sinc2
whuber
Wydaje mi się, że dzieje się tak tylko dlatego, że narysowana linia jest grubsza niż linia osi, więc wydaje się, że „przekracza” oś, gdy jest bliska zeru. Jeśli linia zostanie narysowana cieńsza, artefakt znika.
wilki
Ale na twojej dolnej figurze nie ma takiego artefaktu, który również ma linie grubsze niż oś.
whuber
3

To, że możesz nie pomyśleć o żadnym, nie oznacza, że ​​nie ma żadnych.

Potrafię wymienić „znane” dystrybucje, które nie są jednomodalne.

Na przykład rozkład wersji beta z i zarówno .β < 1αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

Zobacz także

http://en.wikipedia.org/wiki/U-quadratic_distribution

(To nie jest szczególny przypadek dystrybucji wersji beta, pomimo komentarza, który mówi, że tak jest. Obie rodziny się jednak pokrywają.)

Rozkłady mieszanin są z pewnością znane i wiele z nich jest multimodalnych.

Glen_b - Przywróć Monikę
źródło
Kwadrat U jest okrojonym rozkładem beta.
becko
1

Rozkład alfa-skośny-normalny (Elal-Olivero 2010) ma plik PDF:

(1αxμσ)2+12+α2φ(xμσ),

φ

|α|>1.34μ=1,σ=0.5,a=2

wprowadź opis zdjęcia tutaj

corey979
źródło