Mój ojciec jest entuzjastą matematyki, ale mało interesuje go statystyka. Byłoby fajnie spróbować zilustrować niektóre wspaniałe fragmenty statystyk, a CLT jest głównym kandydatem. Jak przekazałbyś matematyczną urodę i wpływ centralnego twierdzenia o granicy niepistatystom?
33
Odpowiedzi:
To, co najbardziej podobało mi się w CLT, to przypadki, gdy nie ma ono zastosowania - daje mi to nadzieję, że życie jest nieco bardziej interesujące niż sugeruje krzywa Gaussa. Pokaż mu rozkład Cauchy'ego.
źródło
Aby w pełni docenić CLT, należy to zobaczyć.
Stąd pojęcie maszyny do fasoli i wiele filmów z youtube dla ilustracji.
źródło
Często, gdy matematycy mówią o prawdopodobieństwie, zaczynają od znanego rozkładu prawdopodobieństwa, a następnie mówią o prawdopodobieństwie zdarzeń. Prawdziwa wartość centralnego twierdzenia granicznego polega na tym, że pozwala nam on zastosować rozkład normalny jako przybliżenie w przypadkach, w których nie znamy rozkładu rzeczywistego. Możesz zadać swojemu ojcu standardowe pytanie statystyczne (ale sformułowane jako matematyka), jakie jest prawdopodobieństwo, że średnia próbki będzie większa niż podana wartość, jeśli dane pochodzą z rozkładu ze średnią sigma sd, a następnie sprawdź, czy zakłada dystrybucję (o której wtedy mówisz, że nie wiemy) lub mówi, że musi znać dystrybucję. Następnie możesz pokazać, że w wielu przypadkach możemy przybliżyć odpowiedź za pomocą CLT.
Do porównania matematyki ze statystykami lubię stosować twierdzenie o wartości średniej całki (która mówi, że dla całki od a do b istnieje prostokąt od a do b o tym samym obszarze, a wysokość prostokąta jest średnią z krzywa). Matematyk patrzy na to twierdzenie i mówi „fajnie, mogę użyć całki, aby obliczyć średnią”, podczas gdy statystyka patrzy na to samo twierdzenie i mówi „fajnie, mogę użyć średniej do obliczenia całki”.
Tak naprawdę mam w swoim biurze zszyte draperie ścienne twierdzenia o wartości średniej i CLT (wraz z twierdzeniem Bayesa).
źródło
Lubię zademonstrować zmienność próbkowania i zasadniczo twierdzenie o limicie centralnym poprzez ćwiczenie „w klasie”. Wszyscy w klasie mówią, że 100 uczniów zapisuje swój wiek na kartce papieru. Wszystkie kawałki papieru są tego samego rozmiaru i złożone w ten sam sposób po obliczeniu średniej. To jest populacja i ja obliczam średni wiek. Następnie każdy uczeń losowo wybiera 10 kawałków papieru, zapisuje wieki i zwraca je do torby. (S) oblicza średnią i podaje torbę do następnego ucznia. W końcu mamy 100 próbek po 10 studentów, z których każdy szacuje średnią liczbę ludności, którą możemy opisać za pomocą histogramu i niektórych statystyk opisowych.
Następnie tym razem powtarzamy demonstrację, używając zestawu 100 „opinii”, które replikują niektóre pytania Tak / Nie z ostatnich sondaży, np. Jeśli jutro zwołane zostaną wybory (Brytyjskiego Generała), czy rozważysz głosowanie na Brytyjską Partię Narodową. Uczniowie próbują 10 z tych opinii.
Na koniec zademonstrowaliśmy zmienność próbkowania, Twierdzenie o granicy centralnej itp. Z danymi ciągłymi i binarnymi.
źródło
Zabawa poniższym kodem, zmienianie wartości
M
i wybieranie rozkładów innych niż mundur może być zabawną ilustracją.źródło
Jeśli używasz Stata, możesz użyć polecenia -clt-, które tworzy wykresy rozkładów próbkowania, patrz
http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm
źródło
Z mojego doświadczenia wynika, że CLT jest mniej użyteczny niż się wydaje. W środku projektu nigdy nie wiadomo, czy n jest wystarczająco duże, aby przybliżenie było odpowiednie do zadania. A w przypadku testów statystycznych CLT pomaga chronić błąd typu I, ale niewiele robi, aby utrzymać błąd typu II na dystans. Na przykład test t może mieć dowolnie niską moc dla dużych n, gdy rozkład danych jest bardzo wypaczony.
źródło