Przyszłość statystyki

11

To pytanie przyszło mi do głowy, kiedy siedziałem na publicznym wykładzie na temat nierozwiązanych pytań w matematyce. Powszechnie wiadomo, że wciąż istnieje wiele nierozwiązanych pytań matematycznych. Sprawiło, że pomyślałem o nierozwiązanych problemach w statystyce. Po spędzeniu czasu na wyszukiwaniu go w tym temacie nie sądzę, aby istniała stosunkowo szczegółowa dyskusja na ten temat. Dlatego naprawdę chciałbym usłyszeć, co ludzie o tym myślą. Gdzie statystyki idą jako dyscyplina? Czy powinniśmy poświęcać więcej czasu na doskonalenie teorii, czy też powinniśmy skupić się na analizie konkretnych danych zebranych z różnego rodzaju eksperymentów naukowych? Wszelkie uwagi na ten temat są bardzo mile widziane. Dziękuję Ci!

20826
źródło
2
Zanim będziemy mogli mówić o nierozwiązanych problemach w statystyce, musimy zdefiniować statystyki. Dimitriy Masterov udzielił odpowiedzi dotyczącej ekonometrii, a Aksakal - nauki danych. W matematyce problemy Hilberta zostały opracowane w czasie, gdy mogło być co, 100? 200? czołowi matematycy na całym świecie, a większość z nich zgodzi się, że tak, każdy z 23 problemów jest zarówno ważny do rozwiązania, jak i uroczy, który można wznowić. Obecnie jest więcej statystyk i są zbyt zajęci, aby koordynować.
StasK

Odpowiedzi:

7

Moim zdaniem, wędrując po marginesie statystyki w pobliżu nauk społecznych , statystyki powinny więcej mówić i lepiej odnosić się do innych dyscyplin, a statystycy powinni spędzać więcej czasu na uczeniu się, jak lepiej komunikować się (a) w czym są przydatne, (b ), co oznaczają ich ustalenia w odniesieniu do tej dyscypliny, (c) dlaczego te inne dyscypliny lepiej współpracują ze statystykami niż bez nich. Nie wiem, czy zależy od tego przyszłość statystyki, ale w jej krótkiej historii zbyt wiele możliwości zostało utraconych, a inne dyscypliny wymyślają własne metody statystycznekiedy właściwe statystyki nie mogłyby dostarczyć. Prawie każda inna dyscyplina naukowa / badawcza, od biologii po antropologię, od psychiatrii po inżynierię strukturalną, może z łatwością umieścić listę 5-10-20 otwartych pytań, na które chciałaby odpowiedzieć statystyka.

StasK
źródło
10

David Cox wyjaśnił to wszystko w swoim wywiadzie .

@ocram wskazał na pytanie 14-15. Co ciekawe, jego odpowiedzi były również pouczające. Byłem bardzo sceptycznie nastawiony do szumu w Big Data . Fizycy zajmowali się ogromnymi zbiorami danych przez dziesięciolecia bez większego hałasu i irytujących reklam, podobnie jak badacze genetyki. Teraz, kiedy zaangażowali się marketingowcy, to Justin Bieber ze statystyk. Cox ma jednak rację, że w naukach społecznych nigdy nie mieliśmy dostępnych dużych zbiorów danych, może z wyjątkiem finansowania ilościowego. W rzeczywistości opracowano wiele technik ekonometrycznych do obsługi małych próbek. Dlatego interesujące jest to, co wyjdzie z pchnięcia Big Data, może jakieś ekscytujące zmiany w statystykach. Myślę, że nacisk zostanie położony na nauki społeczne, w których nie ma dobrych modeli niczego. Posiadanie złych modeli i niewielkiej ilości danych może zupełnie różnić się od posiadania złych modeli i dużej ilości danych, być może mniejszy nacisk zostanie położony na zrozumienie zjawisk, zamiast na korzyść uzyskiwania dokładnych prognoz dzięki dużej ilości danych i sprytnym statystykom.

Aksakal
źródło
Pytania 14-17.
ocram
3
„Teraz, kiedy marketingowcy się zaangażowali, to Justin Bieber ze statystyk”. - Bardzo dobrze.
gregory_britten
To interesujący osąd dotyczący ekonometrii. Myślałem, że ekonometrycy polegali głównie na teorii asymptotycznej w swoich fundamentach, takich jak GMM . Najsłodsze dokumenty z ekonomii empirycznej wykorzystują to, co będzie się teraz nazywać big data, np. Wszystkie akty urodzenia stanu Kalifornia .
StasK
Ekonometria jest dość szeroką dziedziną, GMM jest popularnym narzędziem w ekonomii, ale stosuje się wszelkiego rodzaju inne techniki, takie jak programowanie dynamiczne i procesy decyzyjne Markowa w mikroekonometrii, MIDAS w nowcastingach itp. To dużo zabawy.
Aksakal
3

Jak myśleć o wnioskowaniu przyczynowym, gdy dochodzi do zakłócenia kontroli leczenia lub efektów równowagi ogólnej.

Dimitriy V. Masterov
źródło