Czy to możliwe, że dwie Zmienne Losowe z tej samej rodziny dystrybucji mają takie same oczekiwania i wariancje, ale różne wyższe momenty?

12

Myślałem o znaczeniu rodziny o skali lokalizacji. Mi się, że dla każdego X członek lokalizacji skalę rodziny z parametrami położenie i b skalę, to dystrybucja Z = ( X - ) / b nie zależy od jakichkolwiek parametrów i jest taka sama dla każdego X należącego do rodzina.abZ=(Xa)/bX

Moje pytanie brzmi: czy możesz podać przykład, w którym dwie losowe z tej samej rodziny dystrybucyjnej są znormalizowane, ale to nie daje zmiennej losowej o tej samej dystrybucji?

Powiedzmy, że X i Y pochodzą z tej samej rodziny dystrybucyjnej (gdzie z rodziną mam na myśli na przykład zarówno normalną, jak i obie gamma itd.). Definiować:

Z1=Xμσ

Z2=Yμσ

wiemy, że zarówno Z1 i Z2 mają takie same oczekiwania i wariancję, μZ=0,σZ2=1 .

Ale czy mogą mieć różne wyższe momenty?

Próbuję odpowiedzieć na to pytanie, jeśli rozkład i Y zależy od więcej niż 2 parametrów, niż mogłoby być. I myślę o uogólnionym t - s t u d e n t, który ma 3 parametry.XYtstudent

Ale jeśli liczba parametrów wynosi a X i Y pochodzą z tej samej rodziny rozkładów o tym samym oczekiwaniu i wariancji, to czy to oznacza, że Z 1 i Z 2 mają ten sam rozkład (wyższe momenty)?2XYZ1Z2

gioxc88
źródło
4
Tak, moga. Ale potrzebujesz co najmniej 3 parametrów w uogólnionym rozkładzie.
Carl
5
@Carl Wystarczy jeden parametr.
whuber
5
@ Carl Nie jest jasne, co rozumiesz przez „tę samą dystrybucję”. Dosłownie odnosi się to do unikalnego rozkładu, z jednym prawem, a zatem wyjątkowym oczekiwaniem, unikalną wariancją i wyjątkowymi momentami (w zakresie, w jakim są zdefiniowane). Jeśli masz na myśli „tę samą rodzinę dystrybucyjną ”, twoja uwaga jest bez znaczenia, ponieważ rodzina jest tym, czym ją zdefiniujesz.
whuber
3
@HardCore Ponieważ wydaje Ci się, że czujesz, że na twoje pytanie udzielono odpowiedzi, zobacz Co mam zrobić, gdy ktoś odpowie na moje pytanie?
Glen_b
2
@Carl Poparłem również twoją odpowiedź. Użycie OP wydaje się potwierdzać pojęcie jako mające ten sam standardowy rozkład dla wszystkich wyborów X w rodzinie. Zobaczmy, która odpowiedź zostanie zaakceptowana przez PO (jeśli OP kiedykolwiek przeczyta komentarz Glen_b i zastosuje się do niego). Z=(Xa)/bX
Dilip Sarwate,

Odpowiedzi:

7

Najwyraźniej istnieje pewne zamieszanie co do tego, czym jest rodzina rozkładów i jak liczyć parametry wolne w porównaniu do parametrów wolnych plus stałych (przypisanych). Te pytania są na bok niezwiązane z intencją PO i tą odpowiedzią. Nie używam tutaj słowa rodzina, ponieważ jest mylące. Na przykład rodzina według jednego źródła jest wynikiem zmiany parametru kształtu. @whuber stwierdza, że „parametryzacja” rodziny jest ciągłą mapą z podzbioru ℝ n , ze zwykłą topologią, w przestrzeń dystrybucji, której obraz jest tą rodziną. n Użyję formy słowa, która obejmuje zarówno zamierzone użycie tego słowaidentyfikacja i liczenie rodziny i parametrów . Na przykład, wzórx22x+4 ma postać kwadratowego wzoru, tj 2 x 2 + 1 x + 0 jeśli w 1 = 0 wzór ma nadal postać kwadratowego. Jednakże, gdy 2 = 0a2x2+a1x+a0a1=0a2=0formuła jest liniowa, a forma nie jest już wystarczająco kompletna, aby zawierać kwadratowy wyraz kształtu. Ci, którzy chcą używać słowa rodzina w odpowiednim kontekście statystycznym, są zachęcani do udziału w tym osobnym pytaniu .

Odpowiedzmy na pytanie: „Czy mogą mieć różne wyższe momenty?”. Istnieje wiele takich przykładów. Na marginesie zauważamy, że pytanie dotyczy symetrycznych plików PDF, które zwykle mają lokalizację i skalę w prostym przypadku dwuparametrowym. Logika: Załóżmy, że istnieją dwie funkcje gęstości o różnych kształtach, mające dwa identyczne parametry (położenie, skala). Następnie istnieje albo parametr kształtu, który dostosowuje kształt, albo funkcje gęstości nie mają wspólnego parametru kształtu, a zatem są funkcjami gęstości bez wspólnej formy.

Oto przykład, w jaki sposób parametr kształtu kształtuje się w nim. Uogólniona funkcja gęstości błąd i tutaj , to odpowiedź, która wydaje się mieć dowolnie wybrany kurtozę.

wprowadź opis zdjęcia tutaj

Autorstwa Skbkekas - Praca własna, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=6057753

PDF (funkcja gęstości „prawdopodobieństwa” AKA, zwróć uwagę, że słowo „prawdopodobieństwo” jest zbyteczne) to

β2αΓ(1β)e(|xμ|α)β

Średnia i lokalizacja to μ , skala to α , a β to kształt. Zauważ, że łatwiej jest prezentować symetryczne pliki PDF, ponieważ te pliki PDF często mają lokalizację i skalę jako najprostsze przypadki dwóch parametrów, podczas gdy pliki asymetryczne, takie jak plik gamma PDF , mają zwykle kształt i skalę jako najprostsze parametry przypadków. Kontynuując funkcję gęstości błędu, wariancja wynosi α2Γ(3β)Γ(1β), skośność wynosi0, a kurtoza wynosiΓ(5β)Γ(1β)Γ(3β)23. Zatem jeśli ustawimy wariancję na 1, wówczas przypisujemy wartośćαodα2=Γ(1β)Γ(3β)przy zmiennymβ>0, tak że kurtozę można wybrać w zakresie od0.601114do.

To znaczy, jeśli chcemy zmieniać momenty wyższego rzędu i jeśli chcemy zachować średnią zero i wariancję 1, musimy zmienić kształt. To implikuje trzy parametry, które ogólnie są 1) średnią lub inną właściwą miarą lokalizacji, 2) skalą do dostosowania wariancji lub inną miarą zmienności oraz 3) kształtem. TO WYMAGA TO TRZY PARAMETRÓW.

Zauważ, że jeśli dokonamy podstawień β=2 , α=2σw powyższym pliku PDF, otrzymujemy

e(xμ)22σ22πσ,

która jest funkcją gęstości rozkładu normalnego. Zatem uogólniona funkcja gęstości błędu jest uogólnieniem funkcji gęstości rozkładu normalnego. Istnieje wiele sposobów uogólnienia funkcji gęstości rozkładu normalnego. Innym przykładem, ale z funkcją gęstości rozkładu normalnego jedynie jako wartością graniczną, a nie z wartościami podstawienia średniego zakresu, jak uogólniona funkcja gęstości błędu, jest funkcja gęstości Studenta t . Używając funkcji gęstości t t , mielibyśmy raczej bardziej ograniczony wybór kurtozy, a df2 jest parametrem kształtu, ponieważ drugi moment nie istnieje dla df<2. Co więcej, df nie jest w rzeczywistości ograniczony do dodatnich wartości całkowitych, na ogół jest prawdziwe 1 . Uczeń t staje się normalny w granicach jako df , dlatego nie wybrałem go jako przykładu. Nie jest to ani dobry przykład, ani kontrprzykład, w związku z czym nie zgadzam się z @ Xi'an i @whuber.

Pozwól mi wyjaśnić to dalej. Można wybrać dwie z wielu dowolnych funkcji gęstości dwóch parametrów, aby mieć przykładowo średnią zero i wariancję jednego. Jednak nie wszystkie będą miały tę samą formę. Pytanie dotyczy jednak funkcji gęstości formy SAME, a nie różnych form. Twierdzono, że które funkcje gęstości mają tę samą formę, jest to arbitralne przypisanie, ponieważ jest to kwestia definicji, a moja opinia jest inna. Nie zgadzam się, że jest to arbitralne, ponieważ albo można dokonać podstawienia w celu przekształcenia jednej funkcji gęstości na inną, albo nie można. W pierwszym przypadku funkcje gęstości są podobne i jeśli przez podstawienie możemy wykazać, że funkcje gęstości nie są równoważne, wówczas te funkcje gęstości mają inną postać.

Tak więc, na przykładzie Studenta t PDF, do wyboru są albo uznać, że jest uogólnieniem normalnym formacie PDF, w którym to przypadku normalnego PDF ma dopuszczalną formę dla Studenta t „s PDF, czy nie, w którym to przypadku studenta t „s PDF jest z innej formie od normalnego formatu PDF , a tym samym nie ma wpływu na postawione pytanie .

Możemy argumentować na wiele sposobów. Moja opinia jest taka, że to normalne PDF jest formą sub-wybrany z Studenta t „s PDF, ale to normalne PDF nie jest sub-wybór gamma PDF chociaż ograniczającym wartość gamma PDF mogą być wyświetlane na być normalnym plikiem PDF, a moim powodem jest to, że w przypadku normalnym / Studenta t wsparcie jest takie samo, ale w przypadku normalnym / gamma wsparcie jest nieskończone w porównaniu do częściowo nieskończonego, co jest wymaganą niezgodnością .

Carl
źródło
6
(-1) Jak stwierdzono w innych komentarzach, kwestią jest „co oznacza rodzina dystrybucji?”. Mogę łatwo zdefiniować nową „rodzinę” rozkładów, które są po prostu przeskalowanymi rozkładami t, aby miały średnią = 0, sd = 1, z jednym parametrem: df. Wtedy 1. i 2. moment są równe dla wszystkich df, ale dla różnych wartości df mają różne wyższe momenty.
Cliff AB,
5
Hard Core, ten komentarz jest trudny do zrozumienia, biorąc pod uwagę, że sam tytuł zawiera słowo „rodzina”! Co więcej, jeśli zaprzeczysz, że rodzina ma sens, to pytanie nie ma sensu. Wyjaśnij, edytując swoje pytanie, aby odzwierciedlić twoje zamiary.
whuber
5
-1, ponieważ zaczynasz od powiedzenia „Odpowiedź brzmi NIE”. a następnie przejdź do przykładu, który skutecznie odpowiada Tak (inny przykład podano w odpowiedzi kjetilbhalvorsen, którą pozytywnie wspominasz). To nie ma dla mnie sensu. Myślę, że matematyka tutaj jest jasna dla nas wszystkich, więc moje zdanie jest tylko z powodu braku konsekwencji w prezentacji.
ameba
3
Carl, istnieje wyraźna niespójność między pytaniem a komentarzami Hard Core. Pytanie jest jednoznaczne: „podać przykład, w którym dwie losowe [zmienne] z tej samej rodziny dystrybucji są znormalizowane, ale to nie skutkuje ... Zmiennymi losowymi [s] o tym samym rozkładzie.” Oczywiście zamierzone jest pewne znaczenie „rodziny”. Zwykłe znaczenie jest jasne, mimo że istnieją różne warianty techniczne, a (łatwo wykazana) poprawna odpowiedź brzmi „tak, istnieje wiele takich przykładów”.
whuber
4
Dziękuję Ci. Najwyraźniej masz dobre pojęcie o tym, o czym piszesz, ale niestety twój post budzi pewne zamieszanie co do znaczenia „dystrybucji”, „kształtu”, „formy” i „parametru”. Jako jeden z przykładów subtelności rozważ rodzinę rozkładów utworzoną przez dowolne prawo dystrybucji które ma niezerowy trzeci centralny moment. Rodzina jest indeksowana przez dwie liczby rzeczywiste ( μ , σ 0 ) i składa się ze wszystkich praw x F ( σ x + μ ) . Jest to rodzina o skali lokalizacji, ale kształty tych praw różnią się w zależności od znaku σ .F(μ,σ0)xF(σx+μ)σ
whuber
17

Jeśli potrzebujesz przykładu, który jest „oficjalnie nazwaną sparametryzowaną rodziną dystrybucji, możesz spojrzeć na uogólnioną dystrybucję gamma, https://en.wikipedia.org/wiki/Generalized_gamma_distribution . Ta rodzina dystrybucji ma trzy parametry, więc możesz ustalić średnią i wariancji, i nadal mam swobodę zmieniania wyższych momentów. Ze strony wiki algebra nie wygląda zachęcająco, wolałbym to robić numerycznie. W przypadku aplikacji statystycznych wyszukaj w tej witrynie gamlss, który jest rozszerzeniem gam (dodatek ogólny) modeluje samo w sobie uogólnienie glm), które mają parametry dla „lokalizacji, skali i kształtu”.

Innym przykładem są t dystrybucje rozszerzone na rodzinę o skali lokalizacji. Następnie trzecim parametrem będą stopnie swobody, które będą zmieniać kształt dla ustalonego położenia i skali.

kjetil b halvorsen
źródło
1
Chociaż ogólny rozkład błędów mógł być lepszym wyborem.
Carl
2
Bardzo dziękuję za odpowiedź!! Wybrałam Carla, ponieważ był bardziej szczegółowy, ale to też było w porządku .. dziękuję bardzo !!!
gioxc88,
14

Istnieje nieskończona liczba rozkładów o średniej zero i wariancji jeden, stąd weźmy rozkład z jednego z tych rozkładów, powiedzmy N ( 0 , 1 ) , i ϵ 2 z innego z tych rozkładów, powiedzmy t z 54 stopniami wolności przeskalowanej przez ϵ1N(0,1)ϵ2t więc jego wariancja wynosi jeden, a następnie X=μ+σϵ113 ciesz się wymienionymi właściwościami. „Liczba” parametrów nie ma znaczenia dla właściwości.

X=μ+σϵ1andY=μ+σϵ2

Oczywiście, jeśli ustawisz dalsze reguły dla definicji tej rodziny, na przykład stwierdzając, że istnieje stała gęstość taka że gęstość X wynosi 1fXmożesz otrzymać jeden możliwy rozkład.

1σdf({xμ}/σ)
Xi'an
źródło
dziękuję za odpowiedź, ale myślę, że nie o to pytałem
gioxc88,
6
Myślę, że tak, ponieważ jeśli rodzina rozkładów jest zdefiniowana przez połączenie obu rozkładów i Y , to masz sprzeczność z tą właściwością. „Rodzina” dystrybucji jest dość niejasnym pojęciem. XY
Xi'an,
tak, w rzeczywistości jest dość niejasne, ale jeśli przeczytałeś moje pytanie, napisałem, że w tym kontekście z rodziną mam na myśli zarówno normalną, jak i obie gamma itd. Dałeś przykład z jednym normalnym i jednym uczniem
gioxc88
4
Hard Core, wydaje się, że mylisz nazwę rodziny z jej koncepcją . Ta odpowiedź jest dobra i dobrze ilustruje koncepcję. Twoje pytanie nie wymaga, aby rozwiązaniem była rodzina o skali lokalizacji. Jeśli potrzebujesz takiej odpowiedzi, zawsze możesz wziąć tę odpowiedź - lub dowolną inną - i rozszerzyć ją na rodzinę o skali lokalizacji, zezwalając na dowolne tłumaczenia i skalowania. Punkt Xi'ana dotyczący liczby parametrów nadal obowiązuje.
whuber
@ whuber Myślę, że jest to mylące jako odpowiedź. Sama wartość t-studenta byłaby lepszą odpowiedzią, niż użycie skrajnej odpowiedzi i nieokreślanie jej. Rzeczywiście, to d f jest trzecim parametrem. df=3,df
Carl
6

Myślę, że pytasz, czy dwie losowe zmienne pochodzące z tej samej rodziny o skali lokalizacji mogą mieć tę samą średnią i wariancję, ale co najmniej jeden inny wyższy moment. Odpowiedź brzmi nie.

Dowód : Niech i X 2 będą dwiema takimi losowymi zmiennymi. Ponieważ X 1 i X 2 należą do tej samej rodziny w skali lokalizacji, istnieje zmienna losowa X i liczby rzeczywiste a 1 > 0 , a 2 > 0 , b 1 , b 2 takie, że X 1 d =X1X2X1X2Xa1>0,a2>0,b1,b2 i X 2 d = a 2 XX1=da1X+b1 . Ponieważ X 1 i X 2 mają tę samą średnią i wariancję, mamy:X2=da2X+b2X1X2

  1. .E[X1]=E[X2]a1E[X]+b1=a2E[X]+b2
  2. .Var[X1]=Var[X2]a12Var[X]=a22Var[X]

Jeśli , to X 1 = E [ X 1 ] = X 2 = E [ X 2 ] z prawdopodobieństwem 1 , a zatem wyższe momenty X 1 i X 2 są równe. Możemy więc założyć, że Var [ X ] 0 . Korzystanie z tego (2) oznacza, że | a 1 | = | a 2 | . OdVar[X]=0X1=E[X1]=X2=E[X2]1X1X2Var[X]0|a1|=|a2| i 2 > 0 , mamy w tym, że 1 ] = E [ ( a 2 X + b 2 ) k ] =a1>0a2>0 . Z kolei (1) powyżej oznacza teraz, że b 1 = b 2 . Mamy zatem: E [ X k 1 ] = E [ ( a 1 X + b 1 ) ka1=a2b1=b2 dla dowolnego k , tj. Wszystkie momenty X 1 i X 2 są równe.

E[X1k]=E[(a1X+b1)k]=E[(a2X+b2)k]=E[X2k],
kX1X2
yyzz
źródło
1
(+1) Nie mogę znaleźć błędu w tej odpowiedzi. Najwyraźniej ktoś to robi, a także ma winę za moją. Nie rozumiem tego niewyjaśnionego zachowania.
Carl
5
@Carl Ta odpowiedź jest niepoprawna - dlatego jest poniżana. Xi'an przedstawił już kontrprzykład.
whuber
1
@whuber Proszę zobaczyć moje komentarze pod odpowiedzią Xi'ana. Nie zgadzam się z nim, ale nie głosowałem za nim, ponieważ zarówno on, jak i ty mają prawo do twojej opinii, nawet jeśli uważam to za nieprawidłowe.
Carl
8
@Carl Po ponownym przeczytaniu tej odpowiedzi muszę cofnąć moją oryginalną ocenę: ta odpowiedź jest poprawna (i +1 za to), i jest poprawna, ponieważ jasno wyjaśnia, w jaki sposób interpretuje oryginalne pytanie. (W szczególności istnieje powszechna, ale wąska koncepcja „rodziny o skali lokalizacji”, która składa się tylko z jednego standardowego rozkładu wraz z wszystkimi jej tłumaczeniami i pozytywnymi zmianami skali .) Uważam, że pierwotne pytanie miało na celu zadać coś nieco innego; podstawą tego przekonania jest odniesienie do więcej niż dwóch parametrów w poście.
whuber
2
Przepraszam, jeśli nie byłem bardzo jasny i dziękuję za czas poświęcony na zbadanie tego, ale nie o to prosiłem.
gioxc88,
1

Ponieważ pytanie można interpretować na wiele sposobów, podzielę tę odpowiedź na dwie części.

  • Odp .: rodziny dystrybucyjne.
  • B: rodziny dystrybucji w skali lokalizacji.

Problem z przypadkiem A może być łatwo rozwiązany / zademonstrowany przez wiele rodzin z parametrem kształtu.

Problem z przypadkiem B jest trudniejszy, ponieważ wydaje się, że półtora parametru wystarcza do określenia lokalizacji i skali (lokalizacja w R i skala w R>0 ), a problem polega na tym, czy do zakodowania (wielu) można użyć dwóch parametrów kształty również. To nie jest takie trywialne. Możemy z łatwością wymyślić konkretne dwuparametrowe rodziny skal lokalizacji i wykazać, że nie masz różnych kształtów, ale nie dowodzi to, że jest to stała reguła dla dowolnej rodziny skal parametrów dwóch parametrów.

Odp .: Czy dwie różne rozkłady z tej samej rodziny rozkładów 2 parametrów mogą mieć tę samą średnią i wariancję?

Odpowiedź brzmi: tak i można ją już pokazać przy użyciu jednego z wyraźnie wymienionych przykładów: znormalizowanego rozkładu gamma

Rodzina znormalizowanych rozkładów gamma

Niech Z=Xμσ zXzmienną gamma rozdzielone. (Skumulowany) rozkładZjest następujący:

FZ(z;k)={0ifz<k1Γ(k)γ(k,zk+k)ifzk

γ

Z1Z2μ=0σ=1k

B: Czy dwie różne rozkłady z tej samej 2-parametrowej skali lokalizacji rodziny dystrybucji w mogą mieć tę samą średnią i wariancję?

Uważam, że odpowiedź brzmi „ nie”, jeśli weźmiemy pod uwagę tylko rodziny gładkie (gładkie: niewielka zmiana parametrów spowoduje niewielką zmianę rozkładu / funkcji / krzywej). Ale ta odpowiedź nie jest tak trywialna, a kiedy użyjemy bardziej ogólnych (nieładnych) rodzin, możemy powiedzieć tak , chociaż te rodziny istnieją tylko w teorii i nie mają praktycznego znaczenia.

Generowanie rodziny o skali lokalizacji z pojedynczej dystrybucji poprzez tłumaczenie i skalowanie

f(x)

f(x;μ,σ)=1σf(xμσ)

Dla rodziny o skali lokalizacji, którą można wygenerować w taki sposób, mamy:

  • f(x;μ1,σ1)f(x;μ2,σ2)f(x;μ1,σ1)=f(x;μ2,σ2)

Czy dla wszystkich dwóch rodzin z parametrami w skali lokalizacji ich rozkłady członków mogą być generowane z dystrybucji jednego członka przez tłumaczenie i skalowanie?

θ1θ2μσ

Dla konkretnych dwóch parametrów w skali rodziny lokalizacji, takich jak rodzina rozkładów normalnych, nie jest zbyt trudne wykazanie, że można je wygenerować zgodnie z powyższym procesem (skalowanie i tłumaczenie pojedynczego przykładowego elementu).

Można się zastanawiać, czy możliwe jest generowanie co dwa parametry rodziny skalowania lokalizacji z jednego elementu przez translację i skalowanie. Lub sprzeczne stwierdzenie: „Czy rodzina lokalizacja skalę dwa parametry zawierają dwa różne rozkłady członków z tej samej średniej i wariancji”, dla których będzie to konieczne , że rodzina jest związkiem wielu podrodzin, że każdy generowane przez tłumaczenia i skalowanie.

Przypadek 1: Rodzina uogólnionych rozkładów t Studentów, parametryzowanych przez dwie zmienne

R2R3θ1θ2

Użyjmy (trzyparametrowego) uogólnionego rozkładu t Studenta:

f(x;ν,μ,σ)=Γ(ν+12)Γ(ν2)πνσ(1+1ν(xμσ)2)ν+12

μ=tan(θ1)σ=θ2ν=0.5+θ1/π

Następnie mamy

f(x;θ1,θ2)=Γ(0.5+θ1/π+12)Γ(0.5+θ1/π2)π0.5+θ1/πθ2(1+10.5+θ1/π(xtan(θ1)θ2)2)0.5+θ1/π+12

który można uznać za dwuparametrową rodzinę w skali lokalizacji (choć niezbyt użyteczną), której nie można wygenerować przez translację i skalowanie tylko jednego elementu.

Przypadek 2: Rodziny w skali lokalizacji generowane przez ujemne skalowanie pojedynczego rozkładu z niezerowym pochyleniem

xf(x/b+a)b

Gładkie rodziny

f:R2R3 , tzn. nieskończenie różniczkowego, choć istnieją) funkcje, które wykonałyby zadanie, takie jak krzywe Peano).

θ1θ2θ1θ2μσ

θ1=fθ1(μ,σ)θ2=fθ2(μ,σ)

fθ1(μ,σ)μσ

θ1θ1f(x;θ1)x

Sextus Empiricus
źródło
1
xf,b1fθR2R3.„Problem z tymi„ mapami ”polega na tym, że nie mogą one być ciągłe i nie będą miały znaczenia statystycznego.
whuber
2
R2R3θθ
1
Drugi punkt jest nieprawidłowy: ani nie wynika z żadnego z założeń, ani nie jest częścią definicji rodziny o skali lokalizacji.
whuber
1
θiθixF(bx+a)F(a,b)R2b>0F
1
μσθ1θ2μσ