Jak możemy poznać wariancję populacji?

10

W testach hipotez powszechne pytanie brzmi: jaka jest wariancja populacji? Moje pytanie brzmi: skąd możemy poznać wariancję populacji? Gdybyśmy znali cały rozkład, równie dobrze moglibyśmy poznać średnią całej populacji. Jaki jest zatem sens testowania hipotez?

Biologiczny
źródło
Kilka istotnych literatur: nber.org/papers/w20325
dv_bn
Można poznać tę wariancję, nie wiedząc nic o średniej. Na przykład wariancję można odzyskać z kwadratów wszystkich różnic wartości w populacji, ale różnice te nie dają informacji o średniej. Niezależnie od tego nie rozumiem, w jaki sposób stwierdzenia i pytania w tym poście prowadzą do samego pytania o sens testowania hipotez.
whuber

Odpowiedzi:

10

Nie jestem pewien, czy ten problem naprawdę pojawia się „często” poza Statystykami 101 (wprowadzenie do statystyki). Nie jestem pewien, czy kiedykolwiek to widziałem. Z drugiej strony, prezentujemy w ten sposób materiał podczas nauczania kursów wprowadzających, ponieważ zapewnia on logiczny postęp: Zaczynasz od prostej sytuacji, w której jest tylko jedna grupa i znasz różnicę, a następnie przechodzisz do miejsca, w którym nie poznaj wariancję, a następnie przejdź do miejsca, w którym znajdują się dwie grupy (ale z jednakową wariancją) itp.

Aby zająć się nieco inną kwestią, pytasz, dlaczego mielibyśmy zawracać sobie głowę testowaniem hipotez, gdybyśmy znali wariancję, skoro zatem musimy także znać średnią. Druga część jest rozsądna, ale pierwsza część jest nieporozumieniem: średnia, którą znalibyśmy, byłaby średnią pod hipotezą zerową. Właśnie to testujemy. Rozważ przykład wyników IQ @ StephanKolassa. Wiemy, że średnia wynosi 100, a odchylenie standardowe wynosi 15; testujemy to, jeśli nasza grupa (powiedzmy, rudowłosi rudy lub studenci statystyk wprowadzających) różni się od tego.

gung - Przywróć Monikę
źródło
2
(+1) Być może pojawia się więcej, gdy „pobieranie próbek z populacji” jest sposobem myślenia o procesie generowania danych, a nie czymś, co należy traktować dosłownie. Znając na przykład precyzję przyrządu pomiarowego.
Scortchi - Przywróć Monikę
Gung, jako praktykujący z ponad 20-letnią karierą, ten problem pojawiał się w moim doświadczeniu częściej niż sugerujesz. Nie sugeruję, że pojawiał się „często”, tylko że debaty miały miejsce. Jednak, o ile chodzi o statystyki 101, dyskusje były częściej niż czerwonymi śledziami, które niewiele lub wcale nie rozwiązały kwestii badań lub projektu - ktoś chciał tylko zadać pytanie inteligencji.
Mike Hunter,
1
@DJohnson, przypuszczam, że zależy to od tematów, nad którymi pracujesz.
Gung - Przywróć Monikę
4

Często nie znamy wariancji populacji jako takiej - ale mamy bardzo wiarygodne szacunki z innej próby. Na przykład, tutaj jest przykład oceny, czy spadła średnia waga pingwinów, gdzie używamy średniej z próbki małej, ale wariancji z większej próbki niezależnej. Oczywiście zakłada to, że wariancja jest taka sama w obu populacjach.

Innym przykładem mogą być klasyczne skale IQ. Są one znormalizowane, aby uzyskać średnią 100 i odchylenie standardowe 15, przy użyciu naprawdę dużych próbek. Możemy wtedy pobrać konkretną próbkę (powiedzmy 50 leworęcznych rudych) i zapytać, czy ich średnie IQ jest znacznie większe niż 100, używając 15 ^ 2 jako „znanej” wariancji. Oczywiście po raz kolejny nasuwa się pytanie, czy wariancja jest naprawdę równa między dwiema próbkami - w końcu już testujemy, czy średnie są różne, więc dlaczego wariancje powinny być równe?

Konkluzja: Twoje obawy są aktualne i zwykle testy ze znanymi momentami służą wyłącznie celom dydaktycznym. Na kursach statystycznych zwykle są one natychmiast obserwowane za pomocą testów z wykorzystaniem szacunkowych momentów.

Stephan Kolassa
źródło
2

Jedynym sposobem poznania wariancji populacji jest zmierzenie całej populacji.

Jednak pomiar całej populacji często nie jest możliwy; wymaga zasobów, w tym pieniędzy, narzędzi, personelu i dostępu. Z tego powodu próbkujemy populacje; który mierzy podzbiór populacji. Proces pobierania próbek powinien być zaprojektowany starannie i w celu stworzenia populacji próby reprezentatywnej dla populacji; podając dwie kluczowe kwestie - wielkość próby i technikę pobierania próbek.

Przykład zabawki: chcesz oszacować wariancję wagi dla dorosłej populacji Szwecji. Istnieje około 9,5 miliona Szwedów, więc nie jest prawdopodobne, że możesz wyjść i zmierzyć ich wszystkich. Dlatego należy zmierzyć próbkę populacji, na podstawie której można oszacować prawdziwą wariancję wewnątrz populacji.

Udajesz się na próbkę szwedzkiej populacji. Aby to zrobić, idziesz i stoisz w centrum Sztokholmu, a tak się składa, że ​​stoisz przed popularną fikcyjną szwedzką siecią burgerów Burger Kungen . W rzeczywistości pada deszcz i jest zimno (musi być lato), więc stoisz w restauracji. Tutaj ważysz cztery osoby.

Możliwe, że twoja próba nie będzie dobrze odzwierciedlała populacji Szwecji. To, co masz, to próbka ludzi ze Sztokholmu, którzy są w restauracji z burgerami. Jest to zła technika próbkowania, ponieważ może ona wpływać na wynik, nie dając rzetelnej reprezentacji populacji, którą próbujesz oszacować. Ponadto masz niewielki rozmiar próbki, więc masz wysokie ryzyko wybrania czterech osób, które znajdują się w skrajnych populacjach; albo bardzo lekki albo bardzo ciężki. Jeśli pobrano próbkę z 1000 osób, istnieje mniejsze prawdopodobieństwo, że spowoduje ona błąd; jest znacznie mniej prawdopodobne, aby wybrać 1000 osób, które są niezwykłe, niż wybrać cztery, które są niezwykłe. Większy rozmiar próbki dałby przynajmniej dokładniejsze oszacowanie średniej i wariancji wagi wśród klientów Burger Kungen.

wprowadź opis zdjęcia tutaj

Histogram ilustruje wpływ techniki pobierania próbek, rozkład szarości może reprezentować populację Szwecji, która nie je w Burger Kungen (średnia 85 kg), podczas gdy czerwony może reprezentować populację klientów Burger Kungen (średnia 100 kg) , a niebieskie kreski mogą oznaczać cztery osoby, które próbujesz. Prawidłowa technika pobierania próbek musiałaby sprawiedliwie zważyć populację, w tym przypadku ~ 75% populacji, a zatem 75% mierzonych próbek, nie powinno być klientami Burger Kungen.

Jest to poważny problem w przypadku wielu ankiet. Na przykład osoby, które mogą odpowiedzieć na ankiety dotyczące zadowolenia klientów lub ankiety w wyborach, są zwykle nieproporcjonalnie reprezentowane przez osoby o skrajnych poglądach; ludzie o mniej zdecydowanych opiniach wydają się być bardziej powściągliwi w wyrażaniu ich.

Celem testowania hipotez jest ( nie zawsze ) na przykład sprawdzenie, czy dwie populacje różnią się między sobą. Np. Czy klienci Burger Kungen ważą więcej niż Szwedzi, którzy nie jedzą w Burger Kungen? Możliwość dokładnego przetestowania tego zależy od właściwej techniki pobierania próbek i wystarczającej wielkości próbki.


Kod R do przetestowania sprawi, że to wszystko się stanie:

df1 = data.frame(rnorm(9500000, 85, 15), sample(c("Y","N","N","N"), replace = T))
colnames(df1) = c("weight","customer")
df1$weight = ifelse(df1$customer == "Y", df1$weight + rnorm(length(df1$weight[df1$customer =="Y"]), 15, 2), df1$weight)
subsample = sample(df1$weight[df1$customer=="Y"], size = 4)

png(paste0(path,"SwedenWeight.png"), res =1000, width = 4, height = 4, units = "in")
par(mar=c(5,6,2,2))
hist(df1$weight[df1$customer=="N"], xlab = "Kilograms", col = rgb(0,0,0,0.5), main ="")
hist(df1$weight[df1$customer=="Y"], add = T, col = rgb(1,0,0,0.5))
axis(side = 1, at = c(subsample), labels = c("","","",""), tck = -0.03, col = "blue")
axis(side = 1, at = c(0,150), labels = c("",""), tck = -0)
dev.off()

t.test(df1$weight~df1$customer)

Wyniki:

> t.test(df1$weight~df1$customer)

        Welch Two Sample t-test

data:  df1$weight by df1$customer
t = -1327.7, df = 4042400, p-value < 2.2e-16
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 -15.04688 -15.00252
sample estimates:
mean in group N mean in group Y 
       84.99555       100.02024 
rg255
źródło
1

Czasami wariancja populacji jest ustalana z góry . Na przykład wyniki SAT są skalowane w taki sposób, że odchylenie standardowe wynosi 110, a testy IQ są skalowane w celu uzyskania odchylenia standardowego 15 .

TrynnaDoStat
źródło
Tak, to prawda, ale w takich przypadkach skalowanie ma również ustaloną średnią, więc nie daje sytuacji, w której istnieje nieznana średnia i znana wariancja. Ponadto skalowanie jest wykonywane po poznaniu wszystkich wartości.
Ben - Przywróć Monikę
1

Jedyny realistyczny przykład, jaki mogę wymyślić, gdy średnia jest nieznana, ale wariancja jest znana, to przypadkowe próbkowanie punktów na hipersferze (w dowolnym wymiarze) o stałym promieniu i nieznanym środku. Ten problem ma nieznaną średnią (środek kuli), ale stałą wariancję (kwadratowy promień kuli). Nie znam żadnych innych realistycznych przykładów, w których istnieje nieznana średnia, ale znana wariancja. (Żeby było jasne: samo oszacowanie wariancji zewnętrznej na podstawie innych danych nie jest przykładem znanej wariancji. Ponadto, jeśli masz oszacowanie wariancji na podstawie innych danych, dlaczego nie masz również odpowiedniego oszacowania wariancji z tego samego dane?)

Moim zdaniem wstępne kursy statystyczne, które uczą testów z nieznaną średnią i znaną wariancją, są anachronizmem i są mylnie interpretowane jako nowoczesne narzędzie nauczania. Pedagogicznie o wiele lepiej jest zacząć od testu T w przypadku nieznanej średniej i wariancji i potraktować test Z jako asymptotyczne przybliżenie tego, które ma miejsce, gdy stopień swobody jest duży (lub nie nawet w ogóle uczyć testu Z). Liczba sytuacji, w których istniałaby znana wariancja, ale nieznana średnia, jest znikomo mała, a uczniowie wprowadzają ten (wyjątkowo rzadki) przypadek w błąd.

Ben - Przywróć Monikę
źródło
0

Czasami w zastosowanych problemach istnieją powody przedstawione przez fizykę, ekonomię itp., Które mówią nam o wariancji i nie są niepewne. Innym razem populacja może być skończona i może zdarzyć się, że wiemy coś o wszystkich, ale musimy pobrać próbki i przeprowadzić statystyki, aby poznać resztę.

Zasadniczo twoje obawy są dość uzasadnione.

Mustafa S Eisa
źródło
5
Mam twardy czas wyobrażając przykład z fizyki i ekonomii, gdzie chcielibyśmy wiedzieć wariancję, ale nie średnie. Podobnie jest w przypadku dystrybucji dyskretnych. Czy możesz podać konkretny przykład lub dwa?
Stephan Kolassa
@StephanKolassa Wierzę, że fizykalne pomiary eksperymentalne byłyby przykładem - możemy mieć proces lub urządzenie pomiarowe, które ma dobrze znaną wariancję (błąd pomiaru), więc mierząc określone zdarzenie, możesz założyć, że wariancja jest taka sama, ale ty może jedynie oszacować prawdziwy środek.
Peteris,
2
@Peteris: to ma sens - ale bardziej przypomina to przypadek, który zauważam , o wariancji (twojego instrumentu) oszacowanej na poprzednich „próbkach kalibracyjnych”. Spodziewałbym się, że teoretycznie wyprowadzona wariancja bez niepewności (!) Będzie inną rzeczą.
Stephan Kolassa