Naprawdę lubię słyszeć proste wyjaśnienia złożonych problemów. Jaka jest twoja ulubiona analogia lub anegdota, która wyjaśnia trudną koncepcję statystyczną?
Moim ulubionym jest wyjaśnienie Murraya dotyczące kointegracji za pomocą pijaka i jej psa. Murray wyjaśnia, w jaki sposób dwa przypadkowe procesy (wędrujący pijany i jej pies, Oliver) mogą mieć korzenie jednostkowe, ale nadal mogą być powiązane (zintegrowane), ponieważ ich pierwsze wspólne różnice są nieruchome.
Pijani wyruszają z baru, błąkając się bez celu w sposób losowy. Ale okresowo intonuje „Oliver, gdzie jesteś?”, A Oliver przerywa jego bezcelową wędrówkę, by szczekać. On ją słyszy; słyszy go. Myśli: „Och, nie mogę pozwolić jej odejść zbyt daleko; ona mnie zablokuje”. Myśli: „Och, nie mogę pozwolić mu odejść zbyt daleko; obudzi mnie w środku nocy swoim szczekaniem”. Każdy ocenia, jak daleko jest drugi, i przesuwa się, aby częściowo wypełnić tę lukę.
źródło
Wcześniej chodziłem po pijaku do przypadkowego spaceru, a pijana i jej pies do kointegracji; są bardzo pomocni (częściowo dlatego, że są zabawni).
Jednym z moich ulubionych wspólnych przykładów jest Birthday Paradox ( wpis na Wikipedii ), który ilustruje niektóre ważne pojęcia prawdopodobieństwa. Możesz to zasymulować w pokoju pełnym ludzi.
Nawiasem mówiąc, zdecydowanie polecam „Teaching Statistics: A Bag of Tricks” Andrew Gelmana, aby uzyskać przykłady kreatywnych metod nauczania pojęć statystycznych (patrz spis treści ). Spójrz również na jego artykuł na temat kursu, który uczy na temat nauczania statystyki: „Kurs na temat nauczania statystyki na poziomie uniwersyteckim” . I na temat „Nauczanie Bayesa doktorantom z zakresu nauk politycznych, socjologii, zdrowia publicznego, edukacji, ekonomii, ...” .
Przy opisywaniu metod bayesowskich używanie nieuczciwej monety i wielokrotne jej rzucanie jest dość powszechnym / skutecznym podejściem.
źródło
Lubię zademonstrować zmienność próbkowania i zasadniczo twierdzenie o limicie centralnym poprzez ćwiczenie „w klasie”. Wszyscy w klasie mówią, że 100 uczniów zapisuje swój wiek na kartce papieru. Wszystkie kawałki papieru są tego samego rozmiaru i złożone w ten sam sposób po obliczeniu średniej. To jest populacja i ja obliczam średni wiek. Następnie każdy uczeń losowo wybiera 10 kawałków papieru, zapisuje wieki i zwraca je do torby. (S) oblicza średnią i podaje torbę do następnego ucznia. W końcu mamy 100 próbek po 10 studentów, z których każdy szacuje średnią liczbę ludności, którą możemy opisać za pomocą histogramu i niektórych statystyk opisowych.
Następnie tym razem powtarzamy demonstrację, używając zestawu 100 „opinii”, które replikują niektóre pytania Tak / Nie z ostatnich sondaży, np. Jeśli jutro zwołane zostaną wybory (Brytyjskiego generała), czy rozważysz głosowanie na Brytyjską Partię Narodową. Uczniowie próbują 10 z tych opinii.
Na koniec zademonstrowaliśmy zmienność próbkowania, Twierdzenie o granicy centralnej itp. Z danymi ciągłymi i binarnymi.
źródło
Zdecydowanie problem Monty Hall. http://en.wikipedia.org/wiki/Monty_Hall_problem
źródło
1) Dobra prezentacja tego, jak należy zdefiniować „losowy”, aby ustalić prawdopodobieństwo wystąpienia określonych zdarzeń:
Jaka jest szansa, że losowa linia narysowana na okręgu będzie dłuższa niż promień?
Pytanie całkowicie zależy od tego, jak narysujesz swoją linię. Możliwości, które można opisać w realnym świecie dla okręgu narysowanego na ziemi, mogą obejmować:
Narysuj dwa losowe punkty wewnątrz okręgu i narysuj linię przez nie. (Zobacz, gdzie spadają dwie muchy / kamienie ...)
Wybierz stały punkt na obwodzie, a następnie losowy w innym miejscu w okręgu i dołącz do nich. (W efekcie powoduje to kij w poprzek koła pod zmiennym kątem przez dany punkt i losowy, np. W miejscu, w którym spada kamień).
Narysuj średnicę. Losowo wybierz punkt wzdłuż niego i narysuj przez niego prostopadłość. (Przetocz kij wzdłuż linii prostej, tak aby spoczywał na okręgu).
Stosunkowo łatwo jest pokazać komuś, kto potrafi wykonać pewną geometrię (ale niekoniecznie statystyki), odpowiedź na pytanie może być bardzo zróżnicowana (od około 2/3 do około 0,866 lub więcej).
3) Wyjaśnienie, dlaczego diagnoza medyczna może wydawać się naprawdę wadliwa. Test na foo choroby, który jest w 99,9% dokładny w identyfikacji tych, którzy go mają, ale. 1% fałszywie pozytywnie diagnozuje tych, którzy tak naprawdę go nie mają, może wydawać się błędny tak często, gdy częstość występowania choroby jest naprawdę niska ( np. 1 na 1000), ale wielu pacjentów jest na to testowanych.
To najlepiej wyjaśnić liczbami rzeczywistymi - wyobraź sobie, że 1 milion ludzi jest testowanych, więc 1000 ma chorobę, 999 jest poprawnie zidentyfikowanych, ale 0,1% z 999,000 to 999, którym powiedziano, że mają, ale nie mają. Tak więc połowa tych, którym powiedziano, że tak, faktycznie tego nie robi, pomimo wysokiego poziomu dokładności (99,9%) i niskiego poziomu fałszywych trafień (0,1%). Drugi (idealnie inny) test rozdzieli te grupy.
[Nawiasem mówiąc, wybrałem liczby, ponieważ są one łatwe w obsłudze, oczywiście nie muszą się sumować do 100%, ponieważ dokładność / współczynnik fałszywie dodatnich wyników jest niezależnym czynnikiem w teście.]
źródło
Książka Sama Savage'a Flaw of Averages jest wypełniona dobrymi świeckimi objaśnieniami pojęć statystycznych. W szczególności ma dobre wytłumaczenie nierówności Jensena. Jeśli wykres zwrotu z inwestycji jest wypukły, tzn. „Uśmiecha się do ciebie”, przypadkowość jest na twoją korzyść: średni zwrot jest większy niż średni zwrot.
źródło
Wzdłuż linii średniej jako punktu równowagi podoba mi się ten widok mediany jako punktu równowagi:
źródło
Behar i wsp. Mają zbiór 25 analogii do nauczania statystyki. Oto dwa przykłady:
Inne przykłady obejmują
Referencje
źródło
Zabawne pytanie.
Ktoś odkrył, że pracuję w biostatystyce i zapytał mnie (w zasadzie) „Czy statystyki nie są tylko kłamstwem?”
(Co przywraca cytat Marka Twaina o kłamstwach, przeklętych kłamstwach i statystykach).
Próbowałem wyjaśnić, że statystyki pozwalają nam ze 100 procentową precyzją stwierdzić, że przy założeniach i danych dane, że prawdopodobieństwo takiego i takiego było dokładnie takie a takie.
Nie była pod wrażeniem.
źródło