Nauczając klasę wprowadzającą, znani nauczyciele mają tendencję do wymyślania pewnych liczb i historii w celu zilustrowania metody, której nauczają.
Wolałbym opowiedzieć prawdziwą historię z prawdziwymi liczbami. Historie te muszą jednak odnosić się do bardzo małego zestawu danych, który umożliwia ręczne obliczenia.
Wszelkie sugestie dotyczące takich zestawów danych będą bardzo mile widziane.
Kilka przykładowych tematów dla małych zestawów danych:
- korelacja / regresja (podstawowa)
- ANOVA (1/2 sposobu)
- testy z / t - jedna / dwie niesparowane próbki
- porównania proporcji - tabele dwukierunkowe / wielostronne
dataset
references
teaching
Tal Galili
źródło
źródło
Odpowiedzi:
Biblioteka danych i historii to „internetowa biblioteka plików danych i historii, które ilustrują użycie podstawowych metod statystycznych”.
Ta witryna wydaje się mieć to, czego potrzebujesz, i możesz wyszukiwać w niej określone zestawy danych.
źródło
Jest książka zatytułowana „Handbook of Small Datasets” autorstwa DJ Handa, F. Daly, AD Lunn, KJ McConway i E. Ostrowskiego. Departament Statystyki w NCSU są elektronicznie pisał zestawy danych z tej książki tutaj .
Powyższa strona internetowa podaje tylko dane; musisz przeczytać książkę, aby uzyskać historię za liczbami, to znaczy każdą historię wykraczającą poza to, co można uzyskać z tytułu zbioru danych. Ale są małe i są prawdziwe .
źródło
W przypadku tabel dwukierunkowych podoba mi się dane dotyczące płci i przeżycia pasażerów Titanica:
Na podstawie tych danych można omówić takie rzeczy, jak test chi-kwadrat dla niezależności i miary przydziału, na przykład współczynnik względny i iloraz szans. Na przykład pasażerki-kobiety były ~ 4 razy bardziej narażone na przeżycie niż pasażerowie-mężczyźni. Jednocześnie pasażerowie płci męskiej byli ~ 2,5 razy bardziej narażeni na śmierć niż pasażerki płci żeńskiej. Jednak iloraz szans na przeżycie / śmierć wynosi zawsze 10.
źródło
Journal Edukacji Statystycznej ma archiwum zbiorów danych edukacyjnych.
źródło
CAUSEweb ma zestawy danych, a także wiele innych zasobów edukacyjnych.
Zestaw danych można znaleźć na stronie http://www.causeweb.org/resources/datasets/ .
CAUSE oznacza Consortium for Advancement of Undergraduate Statistics Education.
źródło
Prawdopodobnie tak oczywista odpowiedź, że tak naprawdę nie trzeba jej wymieniać, ale dla korelacji lub regresji liniowej kwartet Anscombe jest logicznym wyborem. Chociaż nie jest to prawdziwa historia z prawdziwymi danymi, myślę, że jest to tak prosty przykład, że rozsądnie pasowałby do twoich kryteriów.
źródło
StatSci.org to miłe źródło zestawów danych.
źródło
Ładny artykuł zatytułowany Resource Discovery for Teaching Statistics rzucił światło na ten temat.
źródło
https://tuvalabs.com
Jestem pewien, że już dawno znalazłeś to, czego szukałeś, ale dla każdego, kto spotyka wątek - TuvaLabs jest dobrym źródłem zestawów danych dla Classrooms. Wyszukuje zestawy danych, historię, opis, małe ćwiczenia i możliwości wizualizacji, a także można żądać zestawów danych na ten temat.
źródło