Nie znam żadnych dystrybucji multimodalnych.
Dlaczego wszystkie znane dystrybucje są niemodalne? Czy jest jakaś „znana” dystrybucja, która ma więcej niż jeden tryb?
Oczywiście mieszanki dystrybucji są często multimodalne, ale chciałbym wiedzieć, czy istnieją jakieś dystrybucje „niemiksowane”, które mają więcej niż jeden tryb.
distributions
mode
Miroslav Sabo
źródło
źródło
Odpowiedzi:
Pierwsza część pytania odpowiedzi w komentarzach do pytania: dużo „markowych” dystrybucje są multimodalny, taki jak każdy Beta dystrybucji z pomocą < 1 i b < 1 . Przejdźmy zatem do drugiej części pytania.( a , b ) a < 1 b < 1
Wszystkie dyskretne rozkłady są wyraźnie mieszaninami (atomów, które są jednomodalne).
Pokażę, że większość ciągłych rozkładów to także mieszanki rozkładów unimodalnych. Intuicja stojąca za tym jest prosta: możemy „wygładzić” nierówności z wyboistego wykresu PDF, jeden po drugim, aż wykres będzie poziomy. Guzki stają się składnikami mieszanki, z których każdy jest oczywiście jednomodalny.
W związku z tym, z wyjątkiem być może niektórych niecodziennych dystrybucji, których pliki PDF są wysoce nieciągłe, odpowiedź na pytanie brzmi „brak”: wszystkie rozkłady multimodalne, które są absolutnie ciągłe, dyskretne, lub kombinacja tych dwóch są mieszaninami rozkładów unimodalnych.
Rozważ ciągłe rozkłady których pliki PDF f są ciągłe (są to rozkłady „absolutnie ciągłe”). (Ciągłość nie stanowi większego ograniczenia; można ją rozluźnić poprzez dokładniejszą analizę, zakładając jedynie, że punkty nieciągłości są dyskretne.)fa fa
Aby poradzić sobie z „plateau”, wartości stałych, które mogą wystąpić, określenie „stan”, aby być odstęp (który może być pojedynczy punkt, w którym x L = x U ) takie, żem = [ xl, xu] xl= xu
ma stałą wartość na m , powiedzmy y .fa m , y
nie jest stałe w żadnym przedziale, który ściśle zawiera m .fa m
Istnieje liczba dodatnia taka, że maksymalna wartość f osiągnięta na [ x l - ϵ , x u + ϵ ] wynosi y .ϵ fa [ xl- ϵ , xu+ ϵ ] y
Niech będzie dowolnym trybem f . Ponieważ f jest ciągły, istnieją przedziały [ x ′ l , x ′ u ] zawierające m, dla których f nie zmniejsza się w [ x ′ l , x l ] (co jest odpowiednim przedziałem, a nie tylko punktem) i nie wzrasta w [ x u , x ′ u ]m = [ xl, xu] fa fa [x′l,x′u] m f [x′l,xl] [xu,x′u] (co jest również właściwym interwałem). Niech być infinimum wszystkich tych wartości, a x ' U supremum wszystkich tych wartości.x′l x′u
Konstrukcja ta zdefiniowała jeden „garb” na wykresie rozciągający się od x ′ l do x ′ u . Niech Y jest większe od f ( x " l ) i F ( x " u ) . Z założenia zbiór punktów x w [ x ′ l , x ′ u ], dla którego f ( x ) ≥ y jest odpowiednim przedziałem m ′f x′l x′u y f(x′l) f(x′u) x [x′l,x′u] f(x)≥y m′ ściśle zawierające (ponieważ zawiera albo całe [ x ′ l , x l ] lub [ x u , x ′ u ] ).m [x′l,xl] [xu,x′u]
Na tej ilustracji multimodalnego pliku PDF tryb jest identyfikowany przez czerwoną kropkę na osi poziomej. Poziomy zasięg czerwonej części wypełnienia to przedział m ′ : jest to podstawa garbu określona przez tryb m . Podstawa tego garbu znajduje się na wysokości y ≈ 0,16 . Oryginalny plik PDF jest sumą czerwonego i niebieskiego wypełnienia. Zauważ, że niebieskie wypełnienie ma tylko jeden tryb w pobliżu 2 ; tryb oryginalny w [ 0 , 0 ] został usunięty.m=[0,0] m′ m y≈0.16 2 [0,0]
Pisanie dla długości m ′ zdefiniuj|m′| m′
i
gdy i przeciwnym razie. ( sprawia to, że jest funkcją ciągłą.) Licznik jest wielkością, o jaką wzrasta powyżej a mianownik jest obszarem między wykresem i . Zatem jest nieujemne i ma całkowity obszar : jest to PDF rozkładu prawdopodobieństwa. Ze względu na budowę ma unikalny tryb .f m ( x ) = 0 f m f y p m f y f m 1 mx∈m′ fm(x)=0 fm f y pm f y fm 1 m
Również przez budowę, funkcja
jest PDF . (Oczywiście, jeśli nie ma już nic z co na początku musiało być unimodalne.) Co więcej, nie ma trybów w przedziale (gdzie jest stały, dlatego poprzednia staranna definicja konieczny był tryb jako interwał). Ponadto,p m = 1 f , m ′pm<1 pm=1 f, m′
jest mieszanką unimodalnego PDF i PDF .f ′ mfm f′m
Powtórz tę procedurę za pomocą (która jako liniowa kombinacja funkcji ciągłych jest nadal funkcją ciągłą, umożliwiając nam kontynuowanie jak poprzednio), tworząc sekwencję trybów ; odpowiadające sekwencje wag ; oraz pliki PDF Wynik ograniczający istnieje, ponieważ (a) przedział, w którym jest spłaszczony, obejmuje odpowiedni przedział, który nie został spłaszczony w poprzednim m = m 1 , m 2 , ... P 1 = s m , p 2 = s m 2 , ... f 1 = f m , K 2 = f m 2 , ... . f i i - 1 ff′m m=m1,m2,… p1=pm,p2=pm2,… f1=fm,f2=fm2,…. fi i−1 operacje i (b) liczb rzeczywistych nie można rozłożyć na więcej niż policzalną liczbę takich przedziałów. Limit nie może mieć żadnych modów, a zatem jest stały, który musi wynosić zero (w przeciwnym razie jego całka rozdzieliłaby się). W związku z tym zostało wyrażone (być może nie jednoznacznie, ponieważ kolejność wybierania trybów będzie miała znaczenie) jako mieszaninaf
rozkładów jednomodalnych, QED.
źródło
Przez unimodal uważam, że OP oznacza po prostu, że istnieje tylko jeden tryb wewnętrzny (tj. Z wyłączeniem rozwiązań narożnych). Pytanie tak naprawdę nasuwa pytanie ...
tzn. dlaczego większość dystrybucji nazw marek wygląda mniej więcej tak:
... plus lub minus pewna skośność lub pewne nieciągłości? Gdy pytanie zostanie postawione w ten sposób, rozkład Beta nie byłby prawidłowym kontrprzykładem.
Wygląda na to, że przypuszczenie OP ma pewną trafność: większość popularnych dystrybucji marek nie pozwala na więcej niż jeden tryb wewnętrzny. Mogą istnieć teoretyczne powody. Na przykład, każda dystrybucja, która jest członkiem rodziny Pearson (która obejmuje Beta), będzie koniecznie (wewnętrzna) unimodalna, w wyniku równania różniczkowego nadrzędnego, które definiuje całą rodzinę. A rodzina Pearson obejmuje większość najbardziej znanych marek.
Niemniej jednak oto kilka przykładów liczników marek ...
Przykład licznika
Jednym z przykładów marki jest dystrybucja z pdf:Sinc2
zdefiniowane w wierszu rzeczywistym. Oto wykres pdf:Sinc2
Moglibyśmy również dodać rodzinę kardiodyków i dystrybucji związanych z tą klasą ... z wykresami pdf, takimi jak:
Rodzina odzwierciedlonych dystrybucji marek mogłaby być również potencjalnymi pretendentami do marki (choć można je uznać za „oszustwo” ... ale nadal są to nazwy marek), takie jak pokazany tutaj Reflected Weibull:
źródło
To, że możesz nie pomyśleć o żadnym, nie oznacza, że nie ma żadnych.
Potrafię wymienić „znane” dystrybucje, które nie są jednomodalne.
Na przykład rozkład wersji beta z i zarówno .β < 1α β <1
http://en.wikipedia.org/wiki/Beta_distribution
Zobacz także
http://en.wikipedia.org/wiki/U-quadratic_distribution
(To nie jest szczególny przypadek dystrybucji wersji beta, pomimo komentarza, który mówi, że tak jest. Obie rodziny się jednak pokrywają.)
Rozkłady mieszanin są z pewnością znane i wiele z nich jest multimodalnych.
źródło
Rozkład alfa-skośny-normalny (Elal-Olivero 2010) ma plik PDF:
źródło