Ostatnio przyglądałem się wewnętrznym działaniom standardowego błędu i nie byłem w stanie zrozumieć, jak to działa. Rozumiem błąd standardowy, ponieważ jest to standardowe odchylenie rozkładu średnich próbek. Moje pytania to:
• skąd wiemy, że błąd standardowy oznacza odchylenie standardowe próbki, gdy zwykle pobieramy tylko jedną próbkę?
• dlaczego równanie do obliczenia błędu standardowego nie odzwierciedla równania odchylenia standardowego dla pojedynczej próbki?
standard-error
luciano
źródło
źródło
Odpowiedzi:
Tak, błąd standardowy średniej (SEM) to odchylenie standardowe (SD) średniej. (Błąd standardowy to inny sposób określenia SD rozkładu próbkowania. W tym przypadku rozkład próbkowania jest średnim dla próbek o ustalonym rozmiarze, powiedzmy N.) Istnieje matematyczny związek między SEM a populacją SD: SEM = populacja SD / pierwiastek kwadratowy z N. Ten związek matematyczny jest bardzo pomocny, ponieważ prawie nigdy nie mamy bezpośredniego oszacowania SEM, ale mamy oszacowanie SD populacji (mianowicie SD naszej próby). Jeśli chodzi o twoje drugie pytanie, jeśli chcesz zebrać wiele próbek o rozmiarze N i obliczyć średnią dla każdej próbki, możesz oszacować SEM po prostu przez obliczenie SD średnich. Tak więc wzór na SEM rzeczywiście odzwierciedla wzór na SD pojedynczej próbki.
źródło
Załóżmy, że są niezależne i identycznie rozmieszczone. Z taką sytuacją jestem pewien, że masz na myśli. Niech ich wspólna średnia będzie μ, a ich wspólna wariancja będzie σ 2 .X1,X2,…,Xn μ σ2
Teraz średnia próbki wynosi . Liniowość oczekiwań pokazuje, że średnia X b wynosi również μ . Z założenia niezależności wynika, że wariancja X b jest sumą wariancji jej składników. Każdy taki termin X i / n ma wariancję σ 2 / n 2 (ponieważ wariancja stałej razy zmienna losowa jest stałą kwadratową razy wariancja zmiennej losowej). Mamy nXb=∑iXi/n Xb μ Xb Xi/n σ2/n2 n identycznie rozłożył takie zmienne, aby sumować, więc każdy termin ma tę samą wariancję. W rezultacie otrzymujemy dla wariancji średniej próbki.nσ2/n2=σ2/n
Zwykle nie znamy i dlatego musimy oszacować to na podstawie danych. W zależności od ustawienia można to zrobić na różne sposoby. Dwa najczęstsze oszacowania σ 2 ogólnego przeznaczenia to wariancja próbki s 2 = 1σ2 σ2 s2=1n∑i(Xi−Xb)2 s2u=nn−1s2 σ2 σ2 s/n−−√ su/n−−√
źródło
Ponieważ zazwyczaj uważamy, że hipoteza zerowa nie jest prawdziwa, punkt @ JoelW. Ma rację, ale pracuję nad tym, ponieważ uważam, że jasność, jaką zapewnia, jest pomocna w zrozumieniu tych problemów.
źródło