Rozkłady inne niż normalne, w których średnia i wariancja są niezależne

32

Zastanawiałem się, czy są jakieś rozkłady poza normą, w których średnia i wariancja są od siebie niezależne (lub innymi słowy, gdzie wariancja nie jest funkcją średniej).

Wolfgang
źródło
1
Nie jestem pewien, czy dobrze rozumiem pytanie. Czy pytasz, czy istnieją jakieś rozkłady oprócz normalnej, które są całkowicie określone przez średnią i wariancję? W pewnym sensie wariancja jest funkcją środka, ponieważ jest miarą rozproszenia wokół środka, ale myślę, że nie o to ci chodzi.
masz na myśli średnią próbki i wariancja próbki1X¯=1ni=1nXisą niezależne. Dobre pytanie ! może rzutowanie zmiennej losowej gaussa zachowa niezależność? 1ni=1n(XiX¯)2
robin girard
4
Srikant ma rację. Jeśli pytanie dotyczy „średniej próby i wariancji”, wówczas odpowiedź brzmi „nie”. Jeśli pytanie dotyczy średniej populacji i wariancji, odpowiedź brzmi: tak; David podaje dobre przykłady poniżej.
1
Żeby wyjaśnić, miałem na myśli to. Dla rozkładu normalnego średnia i wariancja σ 2 w pełni charakteryzuje rozkład, a σ 2 nie jest funkcją μ . W przypadku wielu innych dystrybucji tak nie jest. Na przykład dla rozkładu dwumianowego mamy średnią π i wariancję n π ( 1 - π ) , więc wariancja jest funkcją średniej. Inne przykłady to rozkład gamma z parametrami θ (w skali) i κ (kształt), przy czym średnia wynosi μ = κ θμσ2σ2μπnπ(1π)θκμ=κθa wariancja wynosi , więc wariancja jest w rzeczywistości μ θ . κtheta2μθ
Wolfgang,
7
Zastanów się zatem nad zmodyfikowaniem pytania, ponieważ odpowiedź, którą zaznaczyłeś jako preferowaną, nie odpowiada na pytanie w obecnej formie (a druga tak). Obecnie używasz słowa „niezależny” w idiosynkratyczny sposób. Twój przykład z Gamma pokazuje to: można po prostu sparametryzować Gamma pod względem średniej (mu) i wariancji (sigma), ponieważ możemy odzyskać theta = sigma / mu i kappa = mu ^ 2 / sigma. Innymi słowy, funkcjonalna „niezależność” parametrów jest zwykle bez znaczenia (z wyjątkiem rodzin jednoparametrowych).
whuber

Odpowiedzi:

11

Uwaga: przeczytaj odpowiedź @G. Jay Kerns i zobacz Carlin i Lewis 1996 lub swoje ulubione odniesienie prawdopodobieństwa w celu uzyskania tła na temat obliczania średniej i wariancji jako wartości oczekiwanej i drugiego momentu zmiennej losowej.

Szybki skan Załącznika A w Carlin i Lewis (1996) dostarcza następujących rozkładów, które są podobne pod tym względem do normy, ponieważ te same parametry rozkładu nie są wykorzystywane w obliczeniach średniej i wariancji. Jak wskazał @robin, przy obliczaniu oszacowań parametrów na podstawie próbki, średnia próbki jest wymagana do obliczenia sigma.

Wielowymiarowy Normalny

V a r ( X ) = Σ

E(X)=μ
Var(X)=Σ

t i wielowymiarowy t:

V a r ( X ) = ν σ 2 / ( ν - 2 )

E(X)=μ
Var(X)=νσ2/(ν2)

Podwójny wykładniczy: V a r ( X ) = 2 σ 2

E(X)=μ
Var(X)=2σ2

Cauchy: Z pewnymi zastrzeżeniami można argumentować, że średnia i wariancja Cauchy'ego nie są zależne.

E(X)Var(X)

Odniesienie

Carlin, Bradley P. i Thomas A. Louis. 1996. Bayes and Empirical bayes Methods for Data Analysis, 2nd ed. Chapman and Hall / CRC, Nowy Jork

David LeBauer
źródło
7
W każdej rodzinie o skali lokalizacji średnia i wariancja będą w ten sposób funkcjonalnie niezależne!
whuber
1
David, podwójny wykładniczy jest doskonałym przykładem. Dzięki! Nie myślałem o tym. Rozkład t jest również dobrym przykładem, ale czy E (X) = 0 i Var (X) = v / (v-2)? Czy Carlin i in. (1996) zdefiniować uogólnioną wersję rozkładu t, który jest przesunięty w jego średniej i skalowany przez sigma ^ 2?
Wolfgang,
Masz rację, rozkład t wydaje się często charakteryzowany ze średnią = 0 i wariancją = 1, ale ogólny pdf dla t podany przez Carlin i Louis wyraźnie zawiera zarówno sigma, jak i mu; parametr nu uwzględnia różnicę między normalną a t.
David LeBauer,
27

W rzeczywistości odpowiedź brzmi „nie”. Niezależność średniej próbki i wariancji charakteryzuje rozkład normalny. Zostało to pokazane przez Eugene'a Lukacsa w „A Characterization of Normal Distribution”, The Annals of Mathematical Statistics, tom. 13, nr 1 (mar., 1942), s. 91–93.

Nie wiedziałem tego, ale Feller, „Wstęp do teorii prawdopodobieństwa i jej zastosowania, tom II” (1966, str. 86), twierdzi, że RC Geary również to udowodnił.


źródło
3
@onestop Myślę, że to niefortunny artefakt w moim wieku. Nie jest przesadą stwierdzenie, że książki Fellera zrewolucjonizowały sposób dokonywania prawdopodobieństwa - na całym świecie. Duża część naszej współczesnej notacji zawdzięcza mu. Przez dziesięciolecia jego książki były te książki prawdopodobieństwo badania. Może i tak powinny być. BTW: Dodałem tytuł dla tych, którzy nie słyszeli o jego książkach.
1
Zadałem
robin girard
2
Jay, dziękuję za odniesienie do pracy Lukacsa, który ładnie pokazuje, że rozkłady próbkowania średniej próbki i wariancji są niezależne tylko dla rozkładu normalnego. Co do drugiego momentu centralnego, istnieją pewne rozkłady, w których nie jest to funkcja pierwszego momentu (David podał kilka dobrych przykładów).
Wolfgang,
1
Geary, RC (1936), „Rozkład współczynnika„ studenta ”dla próbek innych niż normalne”, Journal of Royal Statistics Society, Suppl. 3, 178–184.
vqv,