W testach hipotez powszechne pytanie brzmi: jaka jest wariancja populacji? Moje pytanie brzmi: skąd możemy poznać wariancję populacji? Gdybyśmy znali cały rozkład, równie dobrze moglibyśmy poznać średnią całej populacji. Jaki jest zatem sens testowania hipotez?
hypothesis-testing
variance
t-test
z-test
Biologiczny
źródło
źródło
Odpowiedzi:
Nie jestem pewien, czy ten problem naprawdę pojawia się „często” poza Statystykami 101 (wprowadzenie do statystyki). Nie jestem pewien, czy kiedykolwiek to widziałem. Z drugiej strony, prezentujemy w ten sposób materiał podczas nauczania kursów wprowadzających, ponieważ zapewnia on logiczny postęp: Zaczynasz od prostej sytuacji, w której jest tylko jedna grupa i znasz różnicę, a następnie przechodzisz do miejsca, w którym nie poznaj wariancję, a następnie przejdź do miejsca, w którym znajdują się dwie grupy (ale z jednakową wariancją) itp.
Aby zająć się nieco inną kwestią, pytasz, dlaczego mielibyśmy zawracać sobie głowę testowaniem hipotez, gdybyśmy znali wariancję, skoro zatem musimy także znać średnią. Druga część jest rozsądna, ale pierwsza część jest nieporozumieniem: średnia, którą znalibyśmy, byłaby średnią pod hipotezą zerową. Właśnie to testujemy. Rozważ przykład wyników IQ @ StephanKolassa. Wiemy, że średnia wynosi 100, a odchylenie standardowe wynosi 15; testujemy to, jeśli nasza grupa (powiedzmy, rudowłosi rudy lub studenci statystyk wprowadzających) różni się od tego.
źródło
Często nie znamy wariancji populacji jako takiej - ale mamy bardzo wiarygodne szacunki z innej próby. Na przykład, tutaj jest przykład oceny, czy spadła średnia waga pingwinów, gdzie używamy średniej z próbki małej, ale wariancji z większej próbki niezależnej. Oczywiście zakłada to, że wariancja jest taka sama w obu populacjach.
Innym przykładem mogą być klasyczne skale IQ. Są one znormalizowane, aby uzyskać średnią 100 i odchylenie standardowe 15, przy użyciu naprawdę dużych próbek. Możemy wtedy pobrać konkretną próbkę (powiedzmy 50 leworęcznych rudych) i zapytać, czy ich średnie IQ jest znacznie większe niż 100, używając 15 ^ 2 jako „znanej” wariancji. Oczywiście po raz kolejny nasuwa się pytanie, czy wariancja jest naprawdę równa między dwiema próbkami - w końcu już testujemy, czy średnie są różne, więc dlaczego wariancje powinny być równe?
Konkluzja: Twoje obawy są aktualne i zwykle testy ze znanymi momentami służą wyłącznie celom dydaktycznym. Na kursach statystycznych zwykle są one natychmiast obserwowane za pomocą testów z wykorzystaniem szacunkowych momentów.
źródło
Jedynym sposobem poznania wariancji populacji jest zmierzenie całej populacji.
Jednak pomiar całej populacji często nie jest możliwy; wymaga zasobów, w tym pieniędzy, narzędzi, personelu i dostępu. Z tego powodu próbkujemy populacje; który mierzy podzbiór populacji. Proces pobierania próbek powinien być zaprojektowany starannie i w celu stworzenia populacji próby reprezentatywnej dla populacji; podając dwie kluczowe kwestie - wielkość próby i technikę pobierania próbek.
Przykład zabawki: chcesz oszacować wariancję wagi dla dorosłej populacji Szwecji. Istnieje około 9,5 miliona Szwedów, więc nie jest prawdopodobne, że możesz wyjść i zmierzyć ich wszystkich. Dlatego należy zmierzyć próbkę populacji, na podstawie której można oszacować prawdziwą wariancję wewnątrz populacji.
Udajesz się na próbkę szwedzkiej populacji. Aby to zrobić, idziesz i stoisz w centrum Sztokholmu, a tak się składa, że stoisz przed popularną fikcyjną szwedzką siecią burgerów Burger Kungen . W rzeczywistości pada deszcz i jest zimno (musi być lato), więc stoisz w restauracji. Tutaj ważysz cztery osoby.
Możliwe, że twoja próba nie będzie dobrze odzwierciedlała populacji Szwecji. To, co masz, to próbka ludzi ze Sztokholmu, którzy są w restauracji z burgerami. Jest to zła technika próbkowania, ponieważ może ona wpływać na wynik, nie dając rzetelnej reprezentacji populacji, którą próbujesz oszacować. Ponadto masz niewielki rozmiar próbki, więc masz wysokie ryzyko wybrania czterech osób, które znajdują się w skrajnych populacjach; albo bardzo lekki albo bardzo ciężki. Jeśli pobrano próbkę z 1000 osób, istnieje mniejsze prawdopodobieństwo, że spowoduje ona błąd; jest znacznie mniej prawdopodobne, aby wybrać 1000 osób, które są niezwykłe, niż wybrać cztery, które są niezwykłe. Większy rozmiar próbki dałby przynajmniej dokładniejsze oszacowanie średniej i wariancji wagi wśród klientów Burger Kungen.
Histogram ilustruje wpływ techniki pobierania próbek, rozkład szarości może reprezentować populację Szwecji, która nie je w Burger Kungen (średnia 85 kg), podczas gdy czerwony może reprezentować populację klientów Burger Kungen (średnia 100 kg) , a niebieskie kreski mogą oznaczać cztery osoby, które próbujesz. Prawidłowa technika pobierania próbek musiałaby sprawiedliwie zważyć populację, w tym przypadku ~ 75% populacji, a zatem 75% mierzonych próbek, nie powinno być klientami Burger Kungen.
Jest to poważny problem w przypadku wielu ankiet. Na przykład osoby, które mogą odpowiedzieć na ankiety dotyczące zadowolenia klientów lub ankiety w wyborach, są zwykle nieproporcjonalnie reprezentowane przez osoby o skrajnych poglądach; ludzie o mniej zdecydowanych opiniach wydają się być bardziej powściągliwi w wyrażaniu ich.
Celem testowania hipotez jest ( nie zawsze ) na przykład sprawdzenie, czy dwie populacje różnią się między sobą. Np. Czy klienci Burger Kungen ważą więcej niż Szwedzi, którzy nie jedzą w Burger Kungen? Możliwość dokładnego przetestowania tego zależy od właściwej techniki pobierania próbek i wystarczającej wielkości próbki.
Kod R do przetestowania sprawi, że to wszystko się stanie:
Wyniki:
źródło
Czasami wariancja populacji jest ustalana z góry . Na przykład wyniki SAT są skalowane w taki sposób, że odchylenie standardowe wynosi 110, a testy IQ są skalowane w celu uzyskania odchylenia standardowego 15 .
źródło
Jedyny realistyczny przykład, jaki mogę wymyślić, gdy średnia jest nieznana, ale wariancja jest znana, to przypadkowe próbkowanie punktów na hipersferze (w dowolnym wymiarze) o stałym promieniu i nieznanym środku. Ten problem ma nieznaną średnią (środek kuli), ale stałą wariancję (kwadratowy promień kuli). Nie znam żadnych innych realistycznych przykładów, w których istnieje nieznana średnia, ale znana wariancja. (Żeby było jasne: samo oszacowanie wariancji zewnętrznej na podstawie innych danych nie jest przykładem znanej wariancji. Ponadto, jeśli masz oszacowanie wariancji na podstawie innych danych, dlaczego nie masz również odpowiedniego oszacowania wariancji z tego samego dane?)
Moim zdaniem wstępne kursy statystyczne, które uczą testów z nieznaną średnią i znaną wariancją, są anachronizmem i są mylnie interpretowane jako nowoczesne narzędzie nauczania. Pedagogicznie o wiele lepiej jest zacząć od testu T w przypadku nieznanej średniej i wariancji i potraktować test Z jako asymptotyczne przybliżenie tego, które ma miejsce, gdy stopień swobody jest duży (lub nie nawet w ogóle uczyć testu Z). Liczba sytuacji, w których istniałaby znana wariancja, ale nieznana średnia, jest znikomo mała, a uczniowie wprowadzają ten (wyjątkowo rzadki) przypadek w błąd.
źródło
Czasami w zastosowanych problemach istnieją powody przedstawione przez fizykę, ekonomię itp., Które mówią nam o wariancji i nie są niepewne. Innym razem populacja może być skończona i może zdarzyć się, że wiemy coś o wszystkich, ale musimy pobrać próbki i przeprowadzić statystyki, aby poznać resztę.
Zasadniczo twoje obawy są dość uzasadnione.
źródło