Załóżmy, że przeprowadzam eksperyment, który może mieć 2 wyniki i zakładam, że leżący u podstaw „prawdziwy” rozkład 2 wyników jest rozkładem dwumianowym o parametrach i : .p B i n o m i a l ( n , p )
Mogę obliczyć błąd standardowy, , z postaci wariancji : gdzie . Tak więc . Za standardowy błąd dostaję: , ale widziałem gdzieś, że . Co zrobiłem źle? Binomial(n,p)σ2X=npqq=1-pσX=√
SEX= √ SEX= √
binomial
standard-error
Szczery
źródło
źródło
Odpowiedzi:
Wygląda na to, że używasz dwa razy na dwa różne sposoby - zarówno jako wielkość próby, jak i liczbę prób bernoulli, które składają się na losową zmienną dwumianową; aby wyeliminować wszelkie dwuznaczności, użyję aby odnieść się do tego drugiego.kn k
Jeśli masz niezależnych próbek z rozkładu , wariancja ich średniej próbki wynosiB i n o m i a l ( k , p )n Binomial(k,p)
gdzie i to ta sama średnia. Wynika to późniejq=1−p X¯¯¯¯
(1) , dla dowolnej zmiennej losowej, i dowolnej stałej .var(cX)=c2var(X) X c
(2) wariancja sumy niezależnych zmiennych losowych jest równa sumie wariancji .
Standardowy błąd to pierwiastek kwadratowy wariancji: . W związku z tym,X¯¯¯¯ kpqn−−−√
Gdy , otrzymujesz wskazaną formułę:k=n pq−−√
Kiedy , a zmienne dwumianowe są tylko próbami bernoulli , otrzymujesz wzór, który widziałeś gdzie indziej:k=1 pqn−−√
źródło
Łatwo jest pomylić dwie rozkłady dwumianowe:
npq to liczba sukcesów, podczas gdy npq / n = pq to stosunek sukcesów. Powoduje to różne standardowe formuły błędów.
źródło
Możemy na to spojrzeć w następujący sposób:
Załóżmy, że przeprowadzamy eksperyment, w którym musimy rzucić obiektywną monetę razy. Ogólnym wynikiem eksperymentu jest które jest sumą poszczególnych rzutów (powiedzmy, głowa jako 1, a ogon jako 0). Tak więc dla tego eksperymentu , gdzie są wynikami poszczególnych rzutów.n Y Y=∑ni=1Xi Xi
Tutaj wynik każdego rzutu zgodny z rozkładem Bernoulliego, a ogólny wynik jest rozkładem dwumianowym.Xi Y
Cały eksperyment można traktować jako pojedynczą próbkę. Zatem, jeśli powtórzymy eksperyment, możemy uzyskać kolejną wartość , która utworzy kolejną próbkę. Wszystkie możliwe wartości będą stanowić całkowitą populację.Y Y
Wracając do pojedynczego rzutu monetą, który następuje po rozkładzie Bernoulliego, wariancję podaje , gdzie jest prawdopodobieństwem główki (sukcesu), a .pq p q=1–p
Teraz, jeśli spojrzymy na wariancję , . Ale dla wszystkich indywidualnych eksperymentów Bernoulliego . Ponieważ istnieje rzutów lub badań Bernoulliego w doświadczeniu . Oznacza to, że ma wariancję .Y V(Y)=V(∑Xi)=∑V(Xi) V(Xi)=pq n V(Y)=∑V(Xi)=npq Y npq
Teraz proporcja próbki jest podawana przez , co daje „proporcję sukcesu lub głów”. Tutaj jest stałą, ponieważ planujemy wziąć taką samą liczbę rzutów monetą dla wszystkich eksperymentów w populacji.p^=Yn n
Zatem .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n
Zatem standardowy błąd dla (przykładowa statystyka) to √p^ pq/n−−−−√
źródło
$x$
Daje .Myślę, że istnieje również pewne zamieszanie w początkowym poście między błędem standardowym a odchyleniem standardowym. Odchylenie standardowe to sqrt wariancji rozkładu; błąd standardowy jest standardowym odchyleniem szacunkowej średniej próbki od tego rozkładu, tj. rozkładem średnich, które zaobserwowałbyś, gdybyś zrobił tę próbkę nieskończenie wiele razy. Ten pierwszy jest nieodłączną własnością dystrybucji; to drugie jest miarą jakości twojego oszacowania własności (średniej) rozkładu. Kiedy przeprowadzasz eksperyment z próbami N Bernouilli w celu oszacowania nieznanego prawdopodobieństwa sukcesu, niepewność twojego szacunkowego p = k / N po zobaczeniu k sukcesów jest standardowym błędem szacowanej proporcji, sqrt (pq / N) gdzie q = 1 -p. Prawdziwy rozkład charakteryzuje parametr P, prawdziwe prawdopodobieństwo sukcesu.
źródło