Czego należy najpierw nauczyć: prawdopodobieństwo czy statystyka?

Niedawno dołączyłem jako członek wydziału w dziale matematyki. renomowanej instytucji. Będę prowadził kurs Prawdopodobieństwo i statystyka na poziomie licencjackim. Instytucja ma już program nauczania tego kursu, z którego nie jestem bardzo zadowolony. W tym programie najpierw uwzględniono statystyki, brakuje również części dotyczącej szacowania. Zawsze uważałem, że należy nauczyć podstaw prawdopodobieństwa przed nauczeniem statystyki. Czy ktoś może wypowiedzieć się na ten temat? Doceniana jest również sugestia dotycząca tematów, które powinny być omówione na takim kursie.

teaching Ashok
źródło

Wydaje mi się, że podstawowe zrozumienie (niekoniecznie zbyt matematycznych pojęć) prawdopodobieństwa jest wymagane, aby uzyskać logikę i intuicję za technikami statystycznymi, o czym świadczy fakt, że większość statystyk na poziomie podstawowym zaczyna się od prawdopodobieństwa. Również w mojej klasie biznes licencjackiej uczono nas prawdopodobieństwa, a następnie statystyki.

rsl

Czy są to statystyki teoretyczne czy stosowane? Wiele ze stosowanych statystyk można pomyśleć bez szczegółowego wprowadzenia do prawdopodobieństwa. Może to być również dobry apetizer dla prawdopodobieństwa i statystyk teoretycznych w późniejszym czasie. Więc to nie musi być taki zły pomysł.

Tim

Jakie programy studiów realizują studenci? Czy są to kierunki matematyczne, czy moduł jest oferowany głównie studentom z innych wydziałów, np. Socjologii lub biznesu?

Robert Long,

@RobertLong: Mówi się, że eng. Mechaniczne. studenci i nasi główni studenci matematyki będą uczestniczyć w kursie. Inne z ekonomii elektr. Eng. i studenci informatyki mogą również uczestniczyć.

Ashok,

Odpowiedzi:

Wydaje się, że nie jest to już kwestia opinii: wydaje się, że świat znacznie wykroczył poza tradycyjne „nauczanie prawdopodobieństwa, a następnie nauczanie statystyki jako jego zastosowania”. Aby dowiedzieć się, dokąd zmierza nauczanie statystyki, spójrz na listę tytułów papierowych w zeszłorocznym wydaniu specjalnym The American Statistician (zamieszczonym poniżej): żaden z nich nie odnosi się do prawdopodobieństwa.

Omawiają nauczanie prawdopodobieństwa i jego rolę w programie nauczania. Dobrym przykładem jest artykuł George'a Cobba i jego odpowiedzi . Oto kilka odpowiednich cytatów:

Współczesna praktyka statystyczna jest znacznie szersza niż jest to uznawane przez nasz tradycyjny nacisk programowy na wnioskowanie oparte na prawdopodobieństwie.

To, czego uczymy, pozostaje o dziesięciolecia opóźnione w stosunku do tego, co ćwiczymy. Nasz paradygmat programowy kładzie nacisk na formalne wnioskowanie z częstych orientacji, opartych albo na centralnym twierdzeniu granicznym na poziomie podstawowym, albo, w trakcie kierunków matematycznych, na niewielkim zestawie parametrycznych modeli prawdopodobieństwa, które nadają się do rozwiązań w formie zamkniętej pochodzących z rachunku różniczkowego . Różnica między naszym programem sprzed pół wieku a naszą współczesną praktyką statystyczną stale się powiększa.

Moja teza ... jest taka, że jako zawód dopiero zaczęliśmy badać możliwości. Historia naszego przedmiotu również potwierdza tę tezę: W przeciwieństwie do prawdopodobieństwa, matematyka, statystyki wyrosły de novo z ziemi nauki.

Prawdopodobieństwo to pojęcie bardzo śliskie. Różnica między intuicją a formalnym traktowaniem może być większa niż w jakiejkolwiek innej dziedzinie matematyki stosowanej. Jeśli nalegamy, aby myślenie statystyczne musiało opierać się na modelu prawdopodobieństwa, jak pogodzić ten wymóg z celami uczynienia centralnych idei „prostymi i dostępnymi” oraz zminimalizowania „warunków wstępnych badań”?

Jako eksperyment myślowy zapoznaj się z podstawowymi pojęciami i teorią szacowania. Zwróć uwagę, jak prawie wszystkie z nich można wyjaśnić i zilustrować przy użyciu tylko rachunku pierwszego semestru, z prawdopodobieństwem wprowadzonym po drodze.

Oczywiście chcemy, aby uczniowie uczyli się rachunku różniczkowego i prawdopodobieństwa, ale byłoby miło, gdybyśmy mogli dołączyć do wszystkich innych nauk w nauczaniu podstawowych pojęć naszego przedmiotu dla studentów pierwszego roku.

Jest o wiele więcej takich. Możesz sam to przeczytać; materiał jest swobodnie dostępny.

Bibliografia

Specjalne wydanie American Statistician na temat „Statistics and the Undergraduate Curriculum” (listopad 2015) jest dostępne na stronie http://amstat.tandfonline.com/toc/utas20/69/4 .

Nauczanie studentów nowej generacji statystyki, aby „myśleli z danymi”: wydanie specjalne na temat statystyki i programu studiów licencjackich Nicholas J. Horton i Johanna S. Hardin DOI: 10.1080 / 00031305.2015.1094283

Zwykła renowacja jest za mało za późno: musimy ponownie przemyśleć nasz program licencjacki od podstaw George Cobb DOI: 10.1080 / 00031305.2015.1093029

Statystyka nauczania w skali Google Nicholas Chamandy, Omkar Muralidharan & Stefan Wager strony 283-291 DOI: 10.1080 / 00031305.2015.1089790

Poszukiwania w badaniach statystycznych: podejście do ujawnienia studentom autentycznej analizy danych Deborah Nolan & Duncan Temple Lang DOI: 10.1080 / 00031305.2015.1073624

Ponad normą: przygotowanie studentów do pracy w statystyce Capstone Byran J. Smucker i A. John Bailer DOI: 10.1080 / 00031305.2015.1077731

Plany infuzji doświadczeń związanych z autentycznymi danymi w ramach statystyki Kursy Scott D. Grimshaw DOI: 10.1080 / 00031305.2015.1081106

Wspieranie zrozumienia pojęciowego w statystyce matematycznej Jennifer L. Green i Erin E. Blankenship DOI: 10.1080 / 00031305.2015.1069759

Drugi kurs statystyki: projektowanie i analiza eksperymentów? Natalie J. Blades, G. Bruce Schaalje i William F. Christensen DOI: 10.1080 / 00031305.2015.1086437

Kurs Data Science dla studentów: Myślenie z danymi Ben Baumer DOI: 10.1080 / 00031305.2015.1081105

Data Science in Statistics Curricula: Przygotowanie studentów do „myślenia z danymi” J. Hardin, R. Hoerl, Nicholas J. Horton, D. Nolan, B. Baumer, O. Hall-Holt, P. Murrell, R. Peng, P , Roback, D. Temple Lang i MD Ward DOI: 10.1080 / 00031305.2015.1077729

Wykorzystanie symulacji opartych na grach online w celu lepszego zrozumienia przez studentów praktycznych zagadnień statystycznych w analizie danych rzeczywistych Shonda Kuiper & Rodney X. Sturdivant DOI: 10.1080 / 00031305.2015.1075421

Zwalczanie myślenia antystatycznego za pomocą metod opartych na symulacji w programie nauczania Nathan Tintle, Beth Chance, George Cobb, Soma Roy, Todd Swanson i Jill VanderStoep DOI: 10.1080 / 00031305.2015.1081619

Co nauczyciele powinni wiedzieć o Bootstrap: Ponowne próbkowanie w programie nauczania statystyki licencjackiej Tim C. Hesterberg DOI: 10.1080 / 00031305.2015.1089789

Włączanie doradztwa statystycznego Studia przypadków do wstępnych szeregów czasowych Davit Khachatryan DOI: 10.1080 / 00031305.2015.1026611

Opracowanie nowego programu licencjackiego dla interdyscyplinarnych analiz obliczeniowych: podejście jakościowo-ilościowo-jakościowe Scotland Leman, Leanna House & Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

Od wytycznych dotyczących programu nauczania do efektów uczenia się: ocena na poziomie programu Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Ocena programu dla statystyki licencjata Major Allison Amanda Moore i Jennifer J. Kaplan DOI: 10.1080 / 00031305.2015.1087331

Whuber
źródło

(+1) Myślę, że to świetna odpowiedź. Problem z nauczaniem teorii prawdopodobieństwa po pierwsze polega na tym, że sprawia wrażenie, że statystyki dotyczą specyfikacji, dopasowania i diagnostyki modeli probabilistycznych. Jest to nie tylko niewielka część statystyk, ale pomija niektóre z najbardziej podstawowych kwestii podczas myślenia o danych: jak je wizualizować i jak je podsumować. Jakie są względne zalety średniej lub mediany w celu identyfikacji lokalizacji zestawu danych? Jak powinniśmy zestawiać nasze wyniki w tabeli? Jakie wykresy są odpowiednie i co mówią nam o danych?

Silverfish,

@Silverfish, to tak różni się od tego, jak faceci tacy jak Bernoulli podeszli do statystyk. Spójrz na ten jego piękny artykuł Jego próba nowej analizy śmiertelności spowodowanej ospą i zalet zaszczepienia, aby temu zapobiec . Zasadniczo zaczął od współczesnej epidemiologii. Gdyby był skupiony na rzeczach, o których wspomniałeś, takich jak wizualizacja itp., Nie dałby wglądu w zrozumienie leżącego u podstaw procesu.

Aksakal

@Aksakal Nie twierdzę, że modelowanie nie jest ważne, ani że dobra dawka teorii prawdopodobieństwa nie jest niezbędna. Ale statystyki są szersze niż to. Myślę, że błędem jest postrzeganie teorii prawdopodobieństwa jako fundamentalnej: w takim stopniu, że oznacza to, że należy ją najpierw nauczyć. Można zobaczyć irracjonalne liczby, takie jak lub po raz pierwszy w szkole średniej, ale nie wprowadzają ich za pomocą cięć Dedekinda! Zrozumienie danych jest w dużej mierze dostępne dla studentów bez wiedzy matematycznej, a znalezienie wzorców jest ważniejsze niż zupa o wartości p.

\sqrt{2}

$\sqrt 2$

π

$\pi$

Silverfish,

Dla wczesnych przełomów w epidemiologii przedstawię ci studium Johna Snowa na temat wybuchu cholery na Broad Street w 1854 roku - coś, co można znaleźć w wielu dobrych książkach wprowadzających wizualizację danych, oraz procesy myślowe, które z pewnością muszą znajdować się w sercu Stats 101.

Silverfish

@Aksakal Doceniam twoją wzmiankę o Bernoulli. Jednak to, w jaki sposób pionierzy i wielcy matematycy podchodzą i rozwiązują problemy, jest czymś zupełnie innym niż to, jak należy uczyć rozwiązań. Chciałbym podkreślić, że nikt (afaik) nie opowiada się za prawdopodobieństwem nauczania: pytanie dotyczy tego, kiedy takie pomysły należy wprowadzić do programu wprowadzającego (uczelni) i do jakiego stopnia należy je realizować. Istnieją silne powody pedagogiczne (oparte na psychologii i doświadczeniu nauczycielskim), aby najpierw wprowadzić wiele idei statystycznych.

whuber

Liczba mnoga anegdoty nie jest danymi, ale w prawie każdym kursie, jaki widziałem, przynajmniej podstawa prawdopodobieństwa pojawia się przed statystykami.

Z drugiej strony, historycznie, zwykłe najmniejsze kwadraty powstawały przed odkryciem rozkładu normalnego! Metoda statystyczna była na pierwszym miejscu, a bardziej rygorystyczne, oparte na prawdopodobieństwie uzasadnienie, dlaczego działa, zajęło drugie miejsce!

Historia statystyki Stephena Stiglera : pomiar niepewności Przed 1900 r. Prowadzi czytelnika przez rozwój historyczny:

Matematycy, astronomowie rozumieli podstawową mechanikę i prawo grawitacji. Mogą opisać ruch ciał niebieskich jako funkcję kilku parametrów.
Mieli również setki obserwacji ciał niebieskich, ale jak połączyć te obserwacje, aby odzyskać parametry?
- Sto obserwacji daje sto równań, ale jeśli są tylko trzy niewiadome do rozwiązania, jest to system o zbyt dużym znaczeniu ...
Legendre jako pierwszy opracował metodę minimalizacji sumy błędu kwadratowego. Później było to związane z pracą z prawdopodobieństwem Gaussa i Laplace'a, że zwykłe najmniejsze kwadraty były w pewnym sensie optymalne, biorąc pod uwagę błędy normalnie rozłożone.

Dlaczego o tym wspominam?

Jest pewna logiczna elegancja, aby najpierw zbudować maszynę matematyczną wymaganą do uzyskania, zrozumienia jakiejś metody, aby położyć fundament przed budową domu.

Jednak w rzeczywistości nauki dom często jest na pierwszym miejscu, a fundament na drugim: P.

Chciałbym zobaczyć wyniki z literatury edukacyjnej. Co jest bardziej skuteczne w nauczaniu? Co więc dlaczego? A dlaczego więc co?

(Być może jestem dziwakiem, ale odkryłem, że historia najmniejszych kwadratów została opracowana jako ekscytujący przewracacz stron! Opowieści mogą sprawić, że nudne, abstrakcyjne rzeczy ożyją ...)

Matthew Gunn
źródło

Literatura na temat edukacji statystycznej wydaje się spójna i jednoznaczna w tej kwestii: prawdopodobieństwo nie jest statystyką, statystyka jest czymś więcej niż prawdopodobieństwo, a statystyki (przynajmniej na poziomie szkoły średniej i szkół wyższych) powinny być wprowadzane jako myślenie oparte na danych, a nie jako zastosowanie prawdopodobieństwa. Oprócz odniesień , które podałem w mojej odpowiedzi, sprawdź inne bezpłatne zasoby, takie jak CauseWeb , GAISE i J. Statistics Education .

whuber

Myślę, że dla większości ludzi powinien to być proces iteracyjny: uczysz się małego prawdopodobieństwa, potem trochę statystyk, potem trochę więcej prawdopodobieństwa i trochę więcej statystyk itp.

Na przykład spójrz na wymagania doktoranckie w GWU. Kurs prawdopodobieństwa stopnia doktora 8257 ma następujący krótki opis:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Zwróć uwagę, w jaki sposób ma kursy statystyki poziomu magisterskiego 6201 i 6202 w warunkach wstępnych. Jeśli przejdziesz do najniższego poziomu statystyki lub kursu prawdopodobieństwa w GWU, przejdziesz do Wprowadzenie do statystyki biznesowej i ekonomicznej 1051 lub Wprowadzenie do statystyki w naukach społecznych 1053 . Oto opis jednego z nich:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Zauważ, jak kurs ma tytuł „Statystyka”, ale uczy prawdopodobieństwo w nim. Dla wielu jest to pierwsze spotkanie z teorią prawdopodobieństwa po szkolnym kursie „Statystyki”.

Jest to nieco podobne do tego, jak nauczano mnie za moich czasów: kursy i podręczniki były zwykle zatytułowane „Teoria prawdopodobieństwa i statystyka matematyczna”, np. Tekst Gmurmana .

Nie wyobrażam sobie studiowania teorii prawdopodobieństwa bez jakichkolwiek statystyk. Kurs na poziomie doktora powyżej 8257 zakłada, że znasz już statystyki. Tak więc, nawet jeśli najpierw nauczymy prawdopodobieństwa, konieczne będzie nauczenie się statystyki. To tylko pierwszy kurs, który prawdopodobnie ma sens, aby nieco bardziej rozważyć statystyki i użyć go do wprowadzenia teorii prawdopodobieństwa.

Ostatecznie jest to proces iteracyjny, jak opisałem na początku. I jak w każdym dobrym procesie iteracyjnym pierwszy krok nie jest ważny, to, czy pierwsza koncepcja pochodzi ze statystyk, czy prawdopodobieństwo nie będzie miało znaczenia po kilku iteracjach: niezależnie od tego dostaniesz się w to samo miejsce.

Ostatnia uwaga, podejście do nauczania zależy od dziedziny. Jeśli studiujesz fizykę, dostaniesz takie rzeczy, jak mechanika statystyczna, statystyki Fermi-Diraca, z którymi nie będziesz się zajmować w naukach społecznych. Również w fizyce podejścia częstokroć są naturalne, a w rzeczywistości opierają się na niektórych fundamentalnych teoriach. Dlatego sensowne jest nauczanie samodzielnej teorii prawdopodobieństwa na wczesnym etapie, w przeciwieństwie do nauk społecznych, w których spędzanie czasu na niej nie ma większego sensu, a zamiast tego ważniejsze są statystyki.

Aksakal
źródło

Na pierwszy rzut oka wydaje się, że program studiów doktoranckich zawiera niewiele wskazówek dotyczących tego, jak uczyć studentów przedmiotów licencjackich. Cele i publiczność są zupełnie inne. Dodam osobistą notatkę: w moich interakcjach z niektórymi ustalonymi działami statystycznymi zauważyłem, że program nauczania odzwierciedla 30-letnie idee pedagogiki i rozwoju i będzie to kontynuował, dopóki nie przejmie nowego pokolenia profesorów. Być może powinniśmy być ostrożni w stosowaniu takich programów nauczania jako normatywnych modeli tego, co należy zrobić.

whuber

@whuber A wtedy program nauczania będzie odzwierciedlał pomysły z 30 lat ... ale przynajmniej nie będą to pomysły z 60 lat. W każdym razie, jak się mówi, nauka postępuje, pogrzeb po pogrzebie.

Mark L. Stone,