Myślałem o znaczeniu rodziny o skali lokalizacji. Mi się, że dla każdego członek lokalizacji skalę rodziny z parametrami położenie i b skalę, to dystrybucja Z = ( X - ) / b nie zależy od jakichkolwiek parametrów i jest taka sama dla każdego X należącego do rodzina.
Moje pytanie brzmi: czy możesz podać przykład, w którym dwie losowe z tej samej rodziny dystrybucyjnej są znormalizowane, ale to nie daje zmiennej losowej o tej samej dystrybucji?
Powiedzmy, że i pochodzą z tej samej rodziny dystrybucyjnej (gdzie z rodziną mam na myśli na przykład zarówno normalną, jak i obie gamma itd.). Definiować:
wiemy, że zarówno i mają takie same oczekiwania i wariancję, .
Ale czy mogą mieć różne wyższe momenty?
Próbuję odpowiedzieć na to pytanie, jeśli rozkład i Y zależy od więcej niż 2 parametrów, niż mogłoby być. I myślę o uogólnionym t - s t u d e n t, który ma 3 parametry.
Ale jeśli liczba parametrów wynosi a X i Y pochodzą z tej samej rodziny rozkładów o tym samym oczekiwaniu i wariancji, to czy to oznacza, że Z 1 i Z 2 mają ten sam rozkład (wyższe momenty)?
Odpowiedzi:
Najwyraźniej istnieje pewne zamieszanie co do tego, czym jest rodzina rozkładów i jak liczyć parametry wolne w porównaniu do parametrów wolnych plus stałych (przypisanych). Te pytania są na bok niezwiązane z intencją PO i tą odpowiedzią. Nie używam tutaj słowa rodzina, ponieważ jest mylące. Na przykład rodzina według jednego źródła jest wynikiem zmiany parametru kształtu. @whuber stwierdza, że „parametryzacja” rodziny jest ciągłą mapą z podzbioru ℝ n , ze zwykłą topologią, w przestrzeń dystrybucji, której obraz jest tą rodziną.n Użyję formy słowa, która obejmuje zarówno zamierzone użycie tego słowaidentyfikacja i liczenie rodziny i parametrów . Na przykład, wzórx2−2x+4 ma postać kwadratowego wzoru, tj 2 x 2 + 1 x + 0 jeśli w 1 = 0 wzór ma nadal postać kwadratowego. Jednakże, gdy 2 = 0a2x2+a1x+a0 a1=0 a2=0 formuła jest liniowa, a forma nie jest już wystarczająco kompletna, aby zawierać kwadratowy wyraz kształtu. Ci, którzy chcą używać słowa rodzina w odpowiednim kontekście statystycznym, są zachęcani do udziału w tym osobnym pytaniu .
Odpowiedzmy na pytanie: „Czy mogą mieć różne wyższe momenty?”. Istnieje wiele takich przykładów. Na marginesie zauważamy, że pytanie dotyczy symetrycznych plików PDF, które zwykle mają lokalizację i skalę w prostym przypadku dwuparametrowym. Logika: Załóżmy, że istnieją dwie funkcje gęstości o różnych kształtach, mające dwa identyczne parametry (położenie, skala). Następnie istnieje albo parametr kształtu, który dostosowuje kształt, albo funkcje gęstości nie mają wspólnego parametru kształtu, a zatem są funkcjami gęstości bez wspólnej formy.
Oto przykład, w jaki sposób parametr kształtu kształtuje się w nim. Uogólniona funkcja gęstości błąd i tutaj , to odpowiedź, która wydaje się mieć dowolnie wybrany kurtozę.
Autorstwa Skbkekas - Praca własna, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753
PDF (funkcja gęstości „prawdopodobieństwa” AKA, zwróć uwagę, że słowo „prawdopodobieństwo” jest zbyteczne) toβ2αΓ(1β)e−(|x−μ|α)β
Średnia i lokalizacja toμ , skala to α , a β to kształt. Zauważ, że łatwiej jest prezentować symetryczne pliki PDF, ponieważ te pliki PDF często mają lokalizację i skalę jako najprostsze przypadki dwóch parametrów, podczas gdy pliki asymetryczne, takie jak plik gamma PDF , mają zwykle kształt i skalę jako najprostsze parametry przypadków. Kontynuując funkcję gęstości błędu, wariancja wynosi α2Γ(3β)Γ(1β) , skośność wynosi0 , a kurtoza wynosiΓ(5β)Γ(1β)Γ(3β)2−3 . Zatem jeśli ustawimy wariancję na 1, wówczas przypisujemy wartośćα odα2=Γ(1β)Γ(3β) przy zmiennymβ>0 , tak że kurtozę można wybrać w zakresie od−0.601114 do∞ .
To znaczy, jeśli chcemy zmieniać momenty wyższego rzędu i jeśli chcemy zachować średnią zero i wariancję 1, musimy zmienić kształt. To implikuje trzy parametry, które ogólnie są 1) średnią lub inną właściwą miarą lokalizacji, 2) skalą do dostosowania wariancji lub inną miarą zmienności oraz 3) kształtem. TO WYMAGA TO TRZY PARAMETRÓW.
Zauważ, że jeśli dokonamy podstawieńβ=2 , α=2–√σ w powyższym pliku PDF, otrzymujemye−(x−μ)22σ22π−−√σ,
która jest funkcją gęstości rozkładu normalnego. Zatem uogólniona funkcja gęstości błędu jest uogólnieniem funkcji gęstości rozkładu normalnego. Istnieje wiele sposobów uogólnienia funkcji gęstości rozkładu normalnego. Innym przykładem, ale z funkcją gęstości rozkładu normalnego jedynie jako wartością graniczną, a nie z wartościami podstawienia średniego zakresu, jak uogólniona funkcja gęstości błędu, jest funkcja gęstości Studenta−t . Używając funkcji gęstości t −t , mielibyśmy raczej bardziej ograniczony wybór kurtozy, a df≥2 jest parametrem kształtu, ponieważ drugi moment nie istnieje dla df<2 . Co więcej, df nie jest w rzeczywistości ograniczony do dodatnich wartości całkowitych, na ogół jest prawdziwe ≥1 . Uczeń −t staje się normalny w granicach jako df→∞ , dlatego nie wybrałem go jako przykładu. Nie jest to ani dobry przykład, ani kontrprzykład, w związku z czym nie zgadzam się z @ Xi'an i @whuber.
Pozwól mi wyjaśnić to dalej. Można wybrać dwie z wielu dowolnych funkcji gęstości dwóch parametrów, aby mieć przykładowo średnią zero i wariancję jednego. Jednak nie wszystkie będą miały tę samą formę. Pytanie dotyczy jednak funkcji gęstości formy SAME, a nie różnych form. Twierdzono, że które funkcje gęstości mają tę samą formę, jest to arbitralne przypisanie, ponieważ jest to kwestia definicji, a moja opinia jest inna. Nie zgadzam się, że jest to arbitralne, ponieważ albo można dokonać podstawienia w celu przekształcenia jednej funkcji gęstości na inną, albo nie można. W pierwszym przypadku funkcje gęstości są podobne i jeśli przez podstawienie możemy wykazać, że funkcje gęstości nie są równoważne, wówczas te funkcje gęstości mają inną postać.
Tak więc, na przykładzie Studenta−t PDF, do wyboru są albo uznać, że jest uogólnieniem normalnym formacie PDF, w którym to przypadku normalnego PDF ma dopuszczalną formę dla Studenta −t „s PDF, czy nie, w którym to przypadku studenta −t „s PDF jest z innej formie od normalnego formatu PDF , a tym samym nie ma wpływu na postawione pytanie .
Możemy argumentować na wiele sposobów. Moja opinia jest taka, że to normalne PDF jest formą sub-wybrany z Studenta−t „s PDF, ale to normalne PDF nie jest sub-wybór gamma PDF chociaż ograniczającym wartość gamma PDF mogą być wyświetlane na być normalnym plikiem PDF, a moim powodem jest to, że w przypadku normalnym / Studenta −t wsparcie jest takie samo, ale w przypadku normalnym / gamma wsparcie jest nieskończone w porównaniu do częściowo nieskończonego, co jest wymaganą niezgodnością .
źródło
Jeśli potrzebujesz przykładu, który jest „oficjalnie nazwaną sparametryzowaną rodziną dystrybucji, możesz spojrzeć na uogólnioną dystrybucję gamma, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Ta rodzina dystrybucji ma trzy parametry, więc możesz ustalić średnią i wariancji, i nadal mam swobodę zmieniania wyższych momentów. Ze strony wiki algebra nie wygląda zachęcająco, wolałbym to robić numerycznie. W przypadku aplikacji statystycznych wyszukaj w tej witrynie gamlss, który jest rozszerzeniem gam (dodatek ogólny) modeluje samo w sobie uogólnienie glm), które mają parametry dla „lokalizacji, skali i kształtu”.
Innym przykładem sąt dystrybucje rozszerzone na rodzinę o skali lokalizacji. Następnie trzecim parametrem będą stopnie swobody, które będą zmieniać kształt dla ustalonego położenia i skali.
źródło
Istnieje nieskończona liczba rozkładów o średniej zero i wariancji jeden, stąd weźmy rozkład z jednego z tych rozkładów, powiedzmy N ( 0 , 1 ) , i ϵ 2 z innego z tych rozkładów, powiedzmy t z 54 stopniami wolności przeskalowanej przez √ϵ1 N(0,1) ϵ2 t więc jego wariancja wynosi jeden, a następnie
X=μ+σϵ113−−√
ciesz się wymienionymi właściwościami. „Liczba” parametrów nie ma znaczenia dla właściwości.
Oczywiście, jeśli ustawisz dalsze reguły dla definicji tej rodziny, na przykład stwierdzając, że istnieje stała gęstość taka że gęstość X wynosi 1f X możesz otrzymać jeden możliwy rozkład.
źródło
Myślę, że pytasz, czy dwie losowe zmienne pochodzące z tej samej rodziny o skali lokalizacji mogą mieć tę samą średnią i wariancję, ale co najmniej jeden inny wyższy moment. Odpowiedź brzmi nie.
Dowód : Niech i X 2 będą dwiema takimi losowymi zmiennymi. Ponieważ X 1 i X 2 należą do tej samej rodziny w skali lokalizacji, istnieje zmienna losowa X i liczby rzeczywiste a 1 > 0 , a 2 > 0 , b 1 , b 2 takie, że X 1 d =X1 X2 X1 X2 X a1>0,a2>0,b1,b2 i X 2 d = a 2 XX1=da1X+b1 . Ponieważ X 1 i X 2 mają tę samą średnią i wariancję, mamy:X2=da2X+b2 X1 X2
Jeśli , to X 1 = E [ X 1 ] = X 2 = E [ X 2 ] z prawdopodobieństwem 1 , a zatem wyższe momenty X 1 i X 2 są równe. Możemy więc założyć, że Var [ X ] ≠ 0 . Korzystanie z tego (2) oznacza, że | a 1 | = | a 2 | . OdVar[X]=0 X1=E[X1]=X2=E[X2] 1 X1 X2 Var[X]≠0 |a1|=|a2| i 2 > 0 , mamy w tym, że 1 ] = E [ ( a 2 X + b 2 ) k ] =a1>0 a2>0 . Z kolei (1) powyżej oznacza teraz, że b 1 = b 2 . Mamy zatem:
E [ X k 1 ] = E [ ( a 1 X + b 1 ) ka1=a2 b1=b2
dla dowolnego k , tj. Wszystkie momenty X 1 i X 2 są równe.
źródło
Ponieważ pytanie można interpretować na wiele sposobów, podzielę tę odpowiedź na dwie części.
Problem z przypadkiem A może być łatwo rozwiązany / zademonstrowany przez wiele rodzin z parametrem kształtu.
Problem z przypadkiem B jest trudniejszy, ponieważ wydaje się, że półtora parametru wystarcza do określenia lokalizacji i skali (lokalizacja wR i skala w R>0 ), a problem polega na tym, czy do zakodowania (wielu) można użyć dwóch parametrów kształty również. To nie jest takie trywialne. Możemy z łatwością wymyślić konkretne dwuparametrowe rodziny skal lokalizacji i wykazać, że nie masz różnych kształtów, ale nie dowodzi to, że jest to stała reguła dla dowolnej rodziny skal parametrów dwóch parametrów.
Odp .: Czy dwie różne rozkłady z tej samej rodziny rozkładów 2 parametrów mogą mieć tę samą średnią i wariancję?
Odpowiedź brzmi: tak i można ją już pokazać przy użyciu jednego z wyraźnie wymienionych przykładów: znormalizowanego rozkładu gamma
Rodzina znormalizowanych rozkładów gamma
NiechZ=X−μσ zX zmienną gamma rozdzielone. (Skumulowany) rozkładZ jest następujący:
B: Czy dwie różne rozkłady z tej samej 2-parametrowej skali lokalizacji rodziny dystrybucji w mogą mieć tę samą średnią i wariancję?
Uważam, że odpowiedź brzmi „ nie”, jeśli weźmiemy pod uwagę tylko rodziny gładkie (gładkie: niewielka zmiana parametrów spowoduje niewielką zmianę rozkładu / funkcji / krzywej). Ale ta odpowiedź nie jest tak trywialna, a kiedy użyjemy bardziej ogólnych (nieładnych) rodzin, możemy powiedzieć tak , chociaż te rodziny istnieją tylko w teorii i nie mają praktycznego znaczenia.
Generowanie rodziny o skali lokalizacji z pojedynczej dystrybucji poprzez tłumaczenie i skalowanie
Dla rodziny o skali lokalizacji, którą można wygenerować w taki sposób, mamy:
Czy dla wszystkich dwóch rodzin z parametrami w skali lokalizacji ich rozkłady członków mogą być generowane z dystrybucji jednego członka przez tłumaczenie i skalowanie?
Dla konkretnych dwóch parametrów w skali rodziny lokalizacji, takich jak rodzina rozkładów normalnych, nie jest zbyt trudne wykazanie, że można je wygenerować zgodnie z powyższym procesem (skalowanie i tłumaczenie pojedynczego przykładowego elementu).
Można się zastanawiać, czy możliwe jest generowanie co dwa parametry rodziny skalowania lokalizacji z jednego elementu przez translację i skalowanie. Lub sprzeczne stwierdzenie: „Czy rodzina lokalizacja skalę dwa parametry zawierają dwa różne rozkłady członków z tej samej średniej i wariancji”, dla których będzie to konieczne , że rodzina jest związkiem wielu podrodzin, że każdy generowane przez tłumaczenia i skalowanie.
Przypadek 1: Rodzina uogólnionych rozkładów t Studentów, parametryzowanych przez dwie zmienne
Użyjmy (trzyparametrowego) uogólnionego rozkładu t Studenta:
Następnie mamy
który można uznać za dwuparametrową rodzinę w skali lokalizacji (choć niezbyt użyteczną), której nie można wygenerować przez translację i skalowanie tylko jednego elementu.
Przypadek 2: Rodziny w skali lokalizacji generowane przez ujemne skalowanie pojedynczego rozkładu z niezerowym pochyleniem
Gładkie rodziny
źródło