Oczekiwana wartość iid zmiennych losowych

10

Natknąłem się na ten wyprowadzeniu których nie rozumiem: jeśli X1,X2,...,Xn są losowych próbek o wymiarach N zaczerpniętych z populacji średniej μ i wariancji σ2 , a następnie

X¯=(X1+X2+...+Xn)/n

E(X¯)=E(X1+X2+...+Xn)/n=(1/n)(E(X1)+E(X2)+...+E(Xn))

E(X¯)=(1/n)(μ+μ+...n times)=μ

Tu się zgubiłem. Zastosowano argument E(Xi)=μ ponieważ są one identycznie rozłożone. W rzeczywistości to nie jest prawda. Załóżmy, że mam próbkę, S={1,2,3,4,5,6} a następnie, jeśli losowo wybiorę 2 liczby z zamianą i powtórzę tę procedurę 10 razy, to otrzymam 10 próbek: (5, 4) (2 , 5) (1, 2) (4, 1) (4, 6) (2, 4) (6, 1) (2, 4) (3, 1) (5, 1). Tak to wygląda dla 2 zmiennych losowych X1,X2 . Teraz, jeśli wezmę wartość oczekiwanąX1 dostaję,

E(X1)=1.(1/10)+2.(3/10)+3.(1/10)+4.(2/10)+5.(2/10)+6.(1/10)=34/10=3.4

Ale oczekiwana wartość populacji wynosi 3,5. Co właściwie jest nie tak w moim rozumowaniu?

RenamedUser7008
źródło
1
Nieprawidłowe jest to, że jest zmienną losową, a nie próbką ...X
Tim
6
Mylisz średnią empiryczną na podstawie próby i średnią probabilistyczną na podstawie rozkładu populacji. Pierwsza jest losowa, druga nie.
Xi'an,

Odpowiedzi:

8

Przede wszystkim, nie są próbki. Są to zmienne losowe, jak wskazał Tim. Załóżmy, że przeprowadzasz eksperyment, w którym szacujesz ilość wody w produkcie spożywczym; w tym celu powiedzmy 100 pomiarów zawartości wody dla 100 różnych artykułów spożywczych. Za każdym razem, gdy otrzymujesz wartość zawartości wody. Tutaj zawartość wody jest zmienna losowa i teraz załóżmy, że na świecie istniało ogółem 1000 artykułów spożywczych. 100 różnych artykułów spożywczych będzie nazywanych próbką tych 1000 artykułów spożywczych. Zauważ, że zawartość wody jest zmienną losową i 100 próbek uzyskanej zawartości wody stanowi próbkę. X1,X2,...,Xn

Załóżmy, że losowo próbkujesz n wartości z rozkładu prawdopodobieństwa, niezależnie i identycznie, przy założeniu, że . Teraz trzeba znaleźć się wartość oczekiwaną ° X . Ponieważ każdy z X i jest pobierany niezależnie i identycznie, oczekiwana wartość każdego z X i wynosi μ . Dlatego otrzymujesz n μE(X)=μX¯XiXiμ.nμn=μ

Trzecie równanie w twoim pytaniu jest warunkiem, aby estymator był obiektywnym estymatorem parametru populacji. Warunkiem bycia estymatorem jest bezstronny

E(θ¯)=θ

gdzie theta jest parametrem populacji, a jest parametrem oszacowanym na podstawie próby.θ¯

W twoim przykładzie populacja wynosi i otrzymałeś próbkę 10 wartości id, które wynoszą { 5 , 2 , 1 , 4 , 4 , 2 , 6 , 2 , 3 , 5 }{1,2,3,4,5,6}10{5,2,1,4,4,2,6,2,3,5}. Pytanie brzmi: w jaki sposób oszacowałbyś średnią populacji przy tej próbie. Zgodnie z powyższym wzorem średnia w próbie jest obiektywnym estymatorem średniej populacji. Bezstronny estymator nie musi być równy rzeczywistej średniej, ale jest tak bliski średniej, jak to tylko możliwe, biorąc pod uwagę te informacje.

Abhinav Gupta
źródło