Ogólna metoda wyprowadzania błędu standardowego

11

Nie mogę nigdzie znaleźć ogólnej metody wyprowadzania standardowych błędów. Przeglądałem google, tę stronę internetową, a nawet podręczniki, ale wszystko, co mogę znaleźć, to wzór na standardowe błędy średniej, wariancji, proporcji, współczynnika ryzyka itp., A nie sposób, w jaki te formuły zostały osiągnięte.

Gdyby jakikolwiek organ mógł to wyjaśnić w prosty sposób, a nawet połączyć mnie z dobrym zasobem, który to wyjaśnia, byłbym wdzięczny.

Daniel Gardiner
źródło
2
Podaję ogólny prosty model i stosuję go, z dopracowanymi wszystkimi szczegółami, w poście na stronie stats.stackexchange.com/a/18609/919 . Ten i wiele innych postów na temat standardowych błędów (prawie tysiąc do tej pory) można znaleźć, przeszukując naszą stronę w poszukiwaniu „standardowego błędu”
whuber

Odpowiedzi:

22

To, co chcesz znaleźć, to odchylenie standardowe rozkładu próbkowania średniej. To znaczy, w prostym języku angielskim, rozkład próbkowania ma miejsce, gdy wybierzesz elementów z populacji, dodasz je razem i podzielisz sumę przez . Następnie znajdujemy wariancję tej wielkości i uzyskujemy odchylenie standardowe, biorąc pierwiastek kwadratowy z tej wariancji.nnn

Niech wybrane elementy będą reprezentowane przez losowe zmienne , każdy z nich identycznie rozłożony z wariancją . Próbki są pobierane niezależnie, więc wariancja sumy jest tylko sumą wariancji. σ 2 Var ( n i = 1 X i ) = n i = 1 Var ( X i ) = n i = 1 σ 2 = n σ 2Xi,1inσ2

Var(i=1nXi)=i=1nVar(Xi)=i=1nσ2=nσ2

Następnie dzielimy przez . Wiemy ogólnie, że , więc stawiając mamyVar ( k Y ) = k 2 Var ( Y ) k = 1 / nnVar(kY)=k2Var(Y)k=1/n

Var(i=1nXin)=1n2Var(i=1nXi)=1n2nσ2=σ2n

Na koniec weź pierwiastek kwadratowy, aby uzyskać odchylenie standardowe . Gdy odchylenie standardowe populacji nie jest dostępne, przykładowe odchylenie standardowe jest używane jako oszacowanie, dając . ssσnssn

Wszystko powyższe jest prawdą bez względu na rozkład , ale nasuwa się pytanie, co tak naprawdę chcesz zrobić ze standardowym błędem? Zazwyczaj możesz chcieć skonstruować przedziały ufności, a następnie ważne jest przypisanie prawdopodobieństwa do skonstruowania przedziału ufności zawierającego średnią.Xi

Jeśli twoje są normalnie rozłożone, jest to łatwe, ponieważ wtedy rozkład próbkowania jest również normalnie rozłożony. Można powiedzieć, że 68% próbek średniej będzie mieściło się w granicach 1 błędu standardowego od prawdziwej średniej, 95% będzie w granicach 2 błędów standardowych itp.Xi

Jeśli masz wystarczająco dużą próbkę (lub mniejszą próbkę, a nie są zbyt nienormalne), możesz odwołać się do centralnego twierdzenia granicznego i powiedzieć, że rozkład próbkowania jest w przybliżeniu normalnie rozłożony, a twoje twierdzenia prawdopodobieństwa są również przybliżone.Xi

pnXip(1p)p(1p)/npnpn(1p)5tutaj dla sprawdzonego przykładu standardowych błędów z proporcją).

±1

TooTone
źródło
Dzięki, to podejście ma sens i widzę, jak odnosi się do średniej, ale nie widzę, jak rozszerzyć ją na inne statystyki. Na przykład, jak znaleźć błąd standardowy stawki? czy współczynnik szybkości?
Daniel Gardiner
Zaktualizowałem swój post. Kluczową kwestią jest to, że wielkości takie jak średnia, wariancja itp. - a zatem stderr - można znaleźć dla dowolnego rozkładu. Ale aby złożyć oświadczenia o prawdopodobieństwie, musisz wiedzieć coś o rozkładzie, czy to normalnym, dwumianowym czy czymkolwiek. Stderr zawsze można znaleźć, ale to, jak użyteczne jest, zależy od sytuacji.
TooTone
var(Xi)=σ2s2
1
XiXis2s2Xis2
TooTone
4

Błąd standardowy jest odchyleniem standardowym statystyki (pod hipotezą zerową, jeśli testujesz). Ogólną metodą znajdowania błędu standardowego byłoby najpierw znalezienie funkcji rozkładu lub generowania momentu w statystyce, znalezienie drugiego momentu centralnego i wyprowadzenie pierwiastka kwadratowego.

μσ2X¯=1ni=1nXiμσ2/n

  1. Suma niezależnych zmiennych losowych jest normalna,
  2. E[i=1naiXi]=i=1naiE[Xi]
  3. X1X2Var(a1X1+a2X2)=a12Var(X1)+a22Var(X2)

σ/n

Istnieją skróty, na przykład, że niekoniecznie musisz znaleźć rozkład statystyki, ale myślę, że koncepcyjnie warto mieć rozkłady z tyłu głowy, jeśli je znasz.

P. Schnell
źródło