Jaki jest rozkład różnicy rozkładów dwóch-t

19

... i dlaczego ?

Zakładając , że , są niezależnymi zmiennymi losowymi o wartości odpowiednio i wariancji . Moja podstawowa książka statystyk mówi mi, że dystrybucja ma następujące właściwości:X 2 μ 1 , μ 2 σ 2 1 , σ 2 2 X 1 - X 2X1X2)μ1,μ2)σ12),σ2)2)X1-X2)

  • mi(X1-X2))=μ1-μ2)
  • V.zar(X1-X2))=σ12)+σ2)2)

Powiedzmy teraz, że , są rozkładami z , stopniami swobody. Jaka jest dystrybucja ?X1X2)n1-1n2)-2)X1-X2)

To pytanie zostało zredagowane: pierwotne pytanie brzmiało: „Jakie są stopnie swobody różnicy między dwoma rozkładami t?”. . mpiktas wskazał już, że nie ma to sensu, ponieważ nie jest rozkładem t, bez względu na to, jak w przybliżeniu może być normalny (tj. wysoki df).X1-X2)X1,X2)

steffen
źródło
1
jest to powiązane pytanie, które może być interesujące.
mpiktas
2
Google test t Satterthwaite, test t CABF (przybliżenie Cochrana do Behrensa-Fishera) i problem Behrensa-Fishera.
whuber
3
W szczególnym przypadku, gdy stopnie swobody wynoszą 1 (rozkład Cauchy'ego), odpowiedź na pierwotne pytanie wynosi 1. Suma (lub różnica) dwóch niezależnych zmiennych losowych rozmieszczonych w Cauchy'ego to Cauchy z parametrem skali , ale z drugiej strony Rozkład Cauchy'ego nie ma nawet wartości średniej. 2)
NRH
1
Musisz sprawdzić rozkład Behrensa – Fishera
Wis

Odpowiedzi:

15

Suma dwóch niezależnych zmiennych losowych o rozkładzie t nie jest rozkładem t. Dlatego nie można mówić o stopniach swobody tego rozkładu, ponieważ wynikowy rozkład nie ma żadnych stopni swobody w sensie, jaki ma rozkład t.

mpiktas
źródło
@mpiktas: Głupie pytanie. Jeśli rozkład tz n-1 df można wyprowadzić z sumy n niezależnych rozkładów normalnych (patrz wikipedia) i podać df wystarczająco wysoko, aby rozkład t był zbliżony do rozkładu normalnego, nie wynika z tego, że suma rozkładów t jest znowu rozkładem t?
steffen
@mpiktas: A co ze statystyką testową testu t, która wydaje się wynikać z różnicy dwóch rozkładów t?
steffen
1
@steffen, no. Będzie w przybliżeniu normalny, ponieważ dodasz dwie w przybliżeniu normalne zmienne rozkładowe normalne. rozkład t z wysokim df jest w przybliżeniu normalny, ale w przybliżeniu normalny niekoniecznie jest rozkładem t z wysokim df.
mpiktas
1
@steffen, statystyki t-testowe wyprowadza się z różnicy dwóch normalnych, a nie dwóch rozkładów-t. Zauważ, że definicja rozkładu t jest ułamkiem normalnego i pierwiastka kwadratowego chi-kwadrat.
mpiktas
1
@steffen, często mówię moim studentom, że nie ma głupich pytań, tylko głupi ludzie, którzy nie zadają żadnych pytań. Nie jestem bardzo popularnym nauczycielem, który powinienem dodać :)
mpiktas
4

Zgadzam się z powyższymi odpowiedziami, różnica dwóch niezależnych zmiennych losowych o rozkładzie t nie jest rozkładana. Ale chcę dodać kilka sposobów na obliczenie tego.

  1. Najłatwiejszym sposobem obliczenia tego jest użycie metody Monte Carlo. Na przykład w R losowo próbkujesz 100 000 liczb z pierwszego rozkładu t, a następnie losowo próbujesz kolejne 100 000 liczb z drugiego rozkładu t. Zezwalasz na pierwszy zestaw 100 000 liczb minus drugi zestaw 100 000 liczb. Uzyskane 100 000 nowych liczb to losowe próbki z rozkładu różnicy między dwoma rozkładami. Możesz obliczyć średnią i wariancję, po prostu używając mean()i var().

    1. Nazywa się to rozkładem Behrensa – Fishera. Możesz odnieść się do strony Wiki: https://en.wikipedia.org/wiki/Behrens%E2%80%93Fisher_distribution . CI podane przez ten rozkład nazywa się „interwałem odniesienia”, nie jest to CI .

    2. Integracja numeryczna może działać. Jest to kontynuowane jako punktator 2. Możesz odnieść się do Sekcji 2.5.2 Inferencji Bayesowskiej w analizie statystycznej według Boxa, George'a EP, Tiao, George'a C. Zawiera ona szczegółowe etapy integracji i sposób, w jaki jest to przybliżone rozkład Behrensa – Fishera.

Shijia Bian
źródło
1
Wydaje mi się, że rozkład Behrensa-Fishera ma zastosowanie tam, gdzie wariancja dwóch rozkładów t nie jest równa. Czy to samo można powiedzieć, jeśli wariancja dwóch rozkładów jest równa?
Ian Sudbery
1
Przepraszam, wciśnięty klawisz Enter dwa wcześnie? Aby kontynuować ... Na przykład powiedzmy, że mamy dwa normalne rozkłady o jednakowej, ale nieznanej wariancji, ale różnych środkach. Wyciągamy dwie próbki z każdej z tych dystrybucji. Różnica średnich między dwiema próbkami z tego samego rozkładu będzie zgodna z rozkładem t, ale jaki jest rozkład różnicy różnic.
Ian Sudbery