Matematyka ma swoje słynne problemy milenijne (i historycznie Hilberta 23 ), pytania, które pomogły kształtować kierunek w tej dziedzinie.
Nie mam jednak pojęcia, jakie byłyby hipotezy Riemanna i P vs. NP statystyki.
Więc jakie są nadrzędne otwarte pytania w statystyce?
Zredagowano, aby dodać: Jako przykład ogólnego ducha odpowiedzi (jeśli nie dość specyficznej), którego szukam, znalazłem inspirowany wykład Davida Donoho „Hilberta 23” na konferencji „Wyzwania matematyczne XXI wieku”: Analiza danych wielowymiarowych: przekleństwa i błogosławieństwa wymiaru
Potencjalna odpowiedź mogłaby więc mówić o dużych zbiorach danych i dlaczego jest to ważne, rodzaje wyzwań statystycznych, jakie stanowią dane wielowymiarowe, oraz metody, które należy opracować lub pytania, na które należy odpowiedzieć, aby pomóc rozwiązać problem.
Odpowiedzi:
Duży pytanie powinno dotyczyć kluczowych kwestii metodologii statystycznej lub, ponieważ statystyka jest całkowicie o aplikacjach, powinno dotyczyć jak statystyka jest stosowany przy problemach ważnych dla społeczeństwa.
Ta charakterystyka sugeruje, że przy rozważaniu dużych problemów należy uwzględnić:
Jak najlepiej przeprowadzać badania narkotykowe . Obecnie klasyczne testowanie hipotez wymaga wielu formalnych faz badań. Na późniejszych (potwierdzających) etapach kwestie gospodarcze i etyczne stają się coraz poważniejsze. Czy możemy zrobić lepiej? Czy musimy umieszczać setki lub tysiące chorych osób w grupach kontrolnych i trzymać ich tam na przykład do końca badania, czy też możemy znaleźć lepsze sposoby na identyfikację naprawdę skutecznych metod leczenia i dostarczenie ich członkom badania (i inni) wcześniej?
Radzenie sobie z uprzedzeniami publikacji naukowych . Negatywne wyniki są publikowane znacznie mniej po prostu dlatego, że po prostu nie osiągają magicznej wartości p. Wszystkie gałęzie nauki muszą znaleźć lepsze sposoby na ujawnienie ważnych naukowo , a nie tylko statystycznie istotnych wyników. (Problem wielokrotnych porównań i radzenie sobie z danymi wielowymiarowymi to podkategorie tego problemu).
Sondowanie granic metod statystycznych i ich interfejsów z uczeniem maszynowym i poznaniem maszynowym . Nieunikniony postęp w technologii komputerowej sprawi, że prawdziwa sztuczna inteligencja będzie dostępna za naszych czasów. Jak zaprogramujemy sztuczne mózgi? Jaką rolę może odgrywać myślenie statystyczne i uczenie się statystyki w tworzeniu tych osiągnięć? W jaki sposób statystycy mogą pomóc w myśleniu o sztucznym poznaniu, sztucznym uczeniu się, w eksplorowaniu ich ograniczeń i robieniu postępów?
Opracowywanie lepszych sposobów analizy danych geoprzestrzennych . Często twierdzi się, że większość lub ogromna większość baz danych zawiera odniesienia lokalizacyjne. Wkrótce wiele osób i urządzeń będzie zlokalizowanych w czasie rzeczywistym za pomocą technologii GPS i telefonów komórkowych. Metody statystyczne do analizy i wykorzystywania danych przestrzennych są naprawdę dopiero w powijakach (i wydają się być relegowane do GIS i oprogramowania przestrzennego, które jest zwykle używane przez statystyków niestatystycznych).
źródło
Michael Jordan ma krótki artykuł zatytułowany Jakie są otwarte problemy w statystyce bayesowskiej? , w którym zapytał grupę statystów o ich opinie na temat otwartych problemów w statystyce. Podsumuję (aka, skopiuj i wklej) trochę tutaj, ale prawdopodobnie najlepiej po prostu przeczytać oryginał.
Nonparametrics and semiparametrics
Priors
Relacje bayesowskie / częste
Obliczenia i statystyki
Wybór modelu i testowanie hipotez
źródło
Nie jestem pewien, jak duże są, ale istnieje strona Wikipedii zawierająca nierozwiązane problemy w statystykach. Ich lista obejmuje:
źródło
Jako przykład ogólnego ducha (jeśli nie dość specyficznego) odpowiedzi, której szukam, znalazłem inspirowany wykład Davida Donoho „Hilberta 23” na konferencji „Wyzwania matematyczne XXI wieku”:
Analiza danych wielowymiarowych: przekleństwa i błogosławieństwa wymiaru
źródło
Mathoverflow ma podobne pytanie o duże problemy w teorii prawdopodobieństwa .
Z tej strony wynikałoby, że największe pytania dotyczą samodzielnego unikania przypadkowych spacerów i przesiadek.
źródło
Możesz zapoznać się z kolokwium Harvarda pt. „Trudne problemy w naukach społecznych”, które odbyło się w tym roku. Kilka z tych rozmów dotyczy problemów z wykorzystaniem statystyki i modelowania w naukach społecznych.
źródło
Moją odpowiedzią będzie walka między statystykami częstokrzyskimi a bayesowskimi. Kiedy ludzie pytają cię, w co „wierzysz”, to nie jest dobrze! Specjalnie dla dyscypliny naukowej.
źródło