Korzystanie z symulacji komputerowych w celu lepszego zrozumienia pojęć statystycznych na poziomie absolwenta

11

Cześć, studiuję na kierunku Statystyka, omawiamy statystyki testowe i inne pojęcia.

Jednak często jestem w stanie zastosować formuły i rozwinąć swoistą intuicję dotyczącą tego, jak działają rzeczy, ale często mam wrażenie, że być może, jeśli poprę moje badanie symulowanymi eksperymentami, rozwinę lepszą intuicję w bieżące problemy .

Zastanawiałem się więc nad napisaniem prostych symulacji, aby lepiej zrozumieć niektóre koncepcje omawiane na zajęciach. Teraz mógłbym użyć powiedz Java do:

  1. Utwórz losową populację o normalnej średniej i standardowym odchyleniu.
  2. Następnie pobierz małą próbkę i spróbuj empirycznie obliczyć błędy typu I i typu II.

Teraz mam pytania:

  1. Czy jest to uzasadnione podejście do rozwijania intuicji?
  2. Czy jest do tego oprogramowanie ( SAS?, R?)
  3. czy jest to dyscyplina w statystyce, która zajmuje się takim programowaniem: statystyka eksperymentalna ?, statystyka obliczeniowa? symulacja?
użytkownik1172468
źródło
1
Cały czas korzystam z symulacji, aby lepiej zrozumieć, co się dzieje. Do wykonywania tego typu eksperymentów można użyć prawie dowolnego języka programowania lub programu statystycznego (nawet Excel).
Jan
1
+1, symulacje i liczby to 2 najbardziej pomocne techniki budowania intuicji. Używałem ich często, aby pomóc innym i mnie zrozumieć. Istnieje wiele odpowiedzi na pytania CV, które wykorzystują simy do zilustrowania różnych rzeczy. Jeśli chcesz linki, z łatwością mogę wymienić niektóre z moich własnych odpowiedzi, które wykorzystywały w ten sposób karty SIM. Możesz również zadać pytanie tutaj na CV w tym stylu; np. „Próbuję zrozumieć _____, ale mam trudności, czy ktoś może podać wyjaśnienie dotyczące karty SIM, które to wyjaśni?” lub „Zrobiłem tę kartę SIM i sugeruje, że działa w ten sposób, prawda?”
gung - Przywróć Monikę
4
Aby sprostać wysokim standardom i oczekiwaniom tej witryny, używam symulacji (a także pochodnych teoretycznych i ilustracji) w każdej odpowiedzi, która by na tym skorzystała. Znaczna część moich ostatnich odpowiedzi będzie zawierała jakąś formę symulacji, szczególnie prawie każdą odpowiedź na pytanie ze znacznikiem r . Na przykład możesz przejrzeć je na stronie wyszukiwania, jeśli jesteś zainteresowany.
whuber
2
Znajdziesz wiele świetnych, przeglądając odpowiedzi @ whuber. Ponieważ moje odpowiedzi (i umiejętności programowania) są mniej skomplikowane, mogą być dobrym krokiem. Używam karty SIM, aby pokazać, że trudno jest użyć dopasowania modelu, aby wybrać najlepsze łącze w GLiM tutaj: różnica między modelami logit i probit . Tutaj używam sima, aby pokazać, w jaki sposób spadki mocy, gdy wielkości grup stają się nierówne w teście t: jak interpretować porównanie średnich z różnych wielkości próby .
gung - Przywróć Monikę
2
To pytanie CV: wyjaśnienie symulacji statystycznej może być również interesujące dla czytelników tego wątku.
gung - Przywróć Monikę

Odpowiedzi:

7

Podoba mi się twoje pytanie, ale nie mam konkretnych odpowiedzi na 2 i 3? Wyobrażam sobie, że pakiety oprogramowania, takie jak SAS (ogólnie mówiąc o produktach SAS, a nie tylko SAS / STAT), mogą zawierać narzędzia ułatwiające symulację, ale nie jestem pewien. Nie wydaje mi się, aby takie rzeczy pasowały do ​​gałęzi matematyki lub statystyki.

Teraz pytanie 1 jest tym, na czym chciałbym się skupić. Symulacja może pomóc w nauce statystyk na wszystkich poziomach i ogólnie w badaniach statystycznych. Rzeczywiście istnieją czasopisma poświęcone symulacji i obliczeniom. Nawet FDA uznaje znaczenie symulacji w projektowaniu badań klinicznych i pomaga przewidywać wyniki.

W latach 60. XX wieku Julian Simon uczył statystyk wprowadzających wykorzystujących symulację jako czynnik motywujący. Chociaż kontrowersyjny, później twierdził, że przed Efronem przeprowadzał ponowne próbkowanie (permutacja i bootstrap). W 1969 r. Opublikował książkę, w której wykorzystał te pomysły. Z pewnością brakowało jej teorii i był jedynie pomocą dydaktyczną, a nie nowym podejściem do estymacji statystycznej. Nie rozwinął żadnych właściwości matematycznych, które pojawiły się wraz z Efronem i po nim.

Myślę, że w przypadku statystyk wprowadzających przydatne jest przeprowadzenie symulacji w celu zademonstrowania rozkładów próbkowania, pokazania, w jaki sposób powstaje twierdzenie o granicy centralnej, a symulacja fizyczna przez quincunx demonstruje wersję DeMoivre'a - Laplace'a twierdzenia o granicy centralnej.

Czasami poprawia to intuicję. Myślę, że problem Monty Hall jest zagadkowy i pozornie paradoksalny nawet dla matematyków takich jak Paul Erdos. Ale symulowanie gry jest często bardzo przekonujące. Prawdopodobnie istnieje wiele problemów, które są sprzeczne z intuicją i symulacja może, jak sądzę, pomóc.

W 1978 r., Kiedy pracowałem nad doktoratem z teorii ekstremalnych wartości, miałem intuicyjny pomysł na twierdzenie o granicy, które próbowałem udowodnić. Walczyłem z matematyką. Potem postanowiłem symulować proces stochastyczny, a symulacja „potwierdziła” mój wynik. To dało mi pewność, że mogę to udowodnić.

Zatem nawet na poziomie absolwenta i poza nim symulacja może być przydatna na dwa sposoby.

  1. Aby pomóc rozwinąć intuicję, tak jak sugerujesz w pytaniu 1, ale także

  2. Aby potwierdzić intuicję, tak jak to zrobiłem w mojej pracy dyplomowej

Michael R. Chernick
źródło
Znalazłem kogoś, kto rozwiązał problem Monty Hall w SAS i R tutaj sas-and-r.blogspot.com/2010/01/… - enjoy
user1172468
Susan Holmes z Uniwersytetu Stanforda umieściła symulację gry Monty Hall na swojej stronie internetowej kilka lat temu. Dziękujemy za przypomnienie @ user1172468, że wiele osób może i prawdopodobnie wprowadza symulacje na stronach internetowych.
Michael R. Chernick
Problem Monty Hall z R (bardzo łatwy do naśladowania): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf
vasili111
8
  1. Tak. W końcu chodzi o twoją intuicję.
  2. R pasowałby ci dobrze. Kodowanie będzie dla ciebie dość łatwe, jeśli znasz już Javę (lub inny „standardowy język programowania” w tym zakresie).
  3. Statystyka obliczeniowa zajmuje się projektowaniem algorytmów do implementacji metod statystycznych, prawdopodobnie jest to najbliższa próba opisania tutaj.

Baw się dobrze na swoim kursie!

usεr11852
źródło
Myślę, że twoja odpowiedź komplementuje moją. Udzieliłem szczegółowej odpowiedzi na 1, a ty udzieliłeś bardziej ostatecznej odpowiedzi na 2 i 3. Wygląda na to, że odpowiadasz na pytanie w ciągu kilku minut od mojego. Prawdopodobnie się pokryliśmy. W każdym razie dałeś 2 dobre odpowiedzi, a ja dałem ci za nie głosowanie!
Michael R. Chernick
Dzięki za kciuki do góry! Wygląda na to, że jesteś o krok ode mnie w udzielaniu odpowiedzi. :)
usεr11852
Odpowiadaj dalej. Zamierzam odpocząć. Już prawie osiągnąłem dzienny limit powtórzeń.
Michael R. Chernick
Chłopaki, myślałem, że obie odpowiedzi są dobre. Wybrałem odpowiedź @ Michaela, ponieważ mogę wybrać tylko jedną poprawną odpowiedź i czułem, że poradziłem sobie z niektórymi bardziej fundamentalnymi kwestiami.
user1172468,
1
@ user1172468 Naprawdę nie musisz wyjaśniać, ale miło, że to zrobiłeś.
Michael R. Chernick
4

Pakiet TeachingDemos dla R powstał z podobnego procesu myślowego jak twój, próbując wizualizować i rozumieć pojęcia na różne sposoby. W pakiecie znajdują się funkcje wykorzystujące symulację, aby pomóc w zrozumieniu niektórych kluczowych pojęć. Wersja rozwojowa (R-forge, ale jeszcze nie w CRAN) zawiera funkcję „simfun”, której można użyć do tworzenia funkcji symulacyjnych w celu dalszej pomocy w symulacjach.

Greg Snow
źródło
1
Już w CRAN: cran.r-project.org/package=TeachingDemos
vasili111
1
Również lista innych linków do nauczania i uczenia się dla statystyk z R: cran.r-project.org/web/views/TeachingStatistics.html
vasili111