Czy ktoś może mi wyjaśnić, dlaczego ktoś miałby wybrać parametryczną zamiast nieparametrycznej metody statystycznej do testowania hipotez lub analizy regresji?
W moim umyśle, to jak pójście do raftingu i wybierając odporny zegarek bez wody, bo może nie dostać mokre. Dlaczego nie skorzystać z narzędzia, które działa na każdą okazję?
Odpowiedzi:
Rzadko, jeśli w ogóle, test parametryczny i test nieparametryczny faktycznie mają tę samą wartość zerową. Parametryczny test polega na sprawdzeniu średniej rozkładu, zakładając, że istnieją pierwsze dwa momenty. Test sumy rang Wilcoxona nie zakłada żadnych momentów, a zamiast tego testuje równość rozkładów. Jego implikowanym parametrem jest dziwna funkcja rozkładów, prawdopodobieństwo, że obserwacja z jednej próbki jest niższa niż obserwacja z drugiej. Możesz w pewnym sensie mówić o porównaniach między dwoma testami przy całkowicie określonym zeru identycznych rozkładów ... ale musisz rozpoznać, że dwa testy testują różne hipotezy.t
Informacje, które przynoszą testy parametryczne wraz z ich założeniem, pomagają poprawić moc testów. Oczywiście te informacje lepiej są słuszne, ale w dzisiejszych czasach istnieje niewiele dziedzin wiedzy ludzkiej, w których takie wstępne informacje nie istnieją. Ciekawym wyjątkiem, który wyraźnie mówi „nie chcę niczego zakładać”, jest sala sądowa, w której metody nieparametryczne są nadal popularne - i ma to sens dla aplikacji. Prawdopodobnie jest dobry powód, pomyślał pun, że Phillip Good jest autorem dobrych książek na temat zarówno statystyk nieparametrycznych, jak i statystyk na sali sądowej .
Istnieją również sytuacje testowe, w których nie masz dostępu do mikrodanych niezbędnych do testu nieparametrycznego. Załóżmy, że poproszono Cię o porównanie dwóch grup osób w celu oceny, czy jedna jest bardziej otyła niż druga. W idealnym świecie będziesz mieć pomiary wzrostu i masy ciała dla każdego, i możesz utworzyć test permutacji stratyfikujący według wzrostu. W mniej niż idealnym (tj. Rzeczywistym) świecie możesz mieć tylko średnią wysokość i średnią wagę w każdej grupie (lub mogą być pewne zakresy lub warianty tych cech na górze średnich próbek). Najlepszym rozwiązaniem jest obliczenie średniego BMI dla każdej grupy i porównanie ich, jeśli masz tylko środki; lub załóż dwuwymiarową normalną dla wzrostu i masy ciała, jeśli masz środki i wariancje (prawdopodobnie będziesz musiał wziąć korelację z niektórych danych zewnętrznych, jeśli nie pochodzi z twoimi próbkami),
źródło
Jak napisali inni: jeśli warunki wstępne zostaną spełnione, test parametryczny będzie silniejszy niż test nieparametryczny.
W analogii zegarka niewodoodporny byłby o wiele dokładniejszy, gdyby nie zmokł. Na przykład Twój wodoodporny zegarek może być wyłączony o godzinę w jedną stronę, podczas gdy wodoodporny byłby dokładny ... i musisz złapać autobus po podróży raftingiem. W takim przypadku warto zabrać ze sobą zegarek odporny na wodę i upewnić się, że nie zmoknie.
Punkt bonusowy: metody nieparametryczne nie zawsze są łatwe. Tak, test permutacji alternatywny do testu jest prosty. Ale nieparametryczna alternatywa dla mieszanego modelu liniowego z wieloma dwustronnymi interakcjami i zagnieżdżonymi efektami losowymi jest nieco trudniejsza do skonfigurowania niż zwykłe wezwanie do
nlme()
. Zrobiłem to, wykorzystując testy permutacji i z mojego doświadczenia wynika, że wartości p testów parametrycznych i permutacyjnych zawsze były dość blisko siebie, nawet jeśli reszty z modelu parametrycznego były dość nietypowe. Testy parametryczne są często zaskakująco odporne na odstępstwa od ich warunków wstępnych.źródło
Chociaż zgadzam się, że w wielu przypadkach techniki nieparametryczne są korzystne, istnieją również sytuacje, w których metody parametryczne są bardziej przydatne.
Skoncentrujmy się na dyskusji „dwóch prób t-test w porównaniu z testem sumy rang Wilcoxona” (w przeciwnym razie musimy napisać całą książkę).
źródło
W testowaniu hipotez testy nieparametryczne często testują różne hipotezy, co jest jednym z powodów, dla których nie zawsze można po prostu zastąpić test nieparametryczny testem parametrycznym.
źródło
Modele półparametryczne mają wiele zalet. Oferują testy takie jak test Wilcoxona jako szczególny przypadek, ale umożliwiają oszacowanie współczynników efektu, kwantyli, średnich i prawdopodobieństw przekroczenia. Obejmują one dane podłużne i cenzurowane. Są wytrzymałe w przestrzeni Y i są niezmienne w transformacji, z wyjątkiem średnich szacunkowych. Zobacz http://biostat.mc.vanderbilt.edu/rms link do materiałów szkoleniowych, aby uzyskać szczegółowy przykład / studium przypadku.
źródło
Wśród wielu dostarczonych odpowiedzi chciałbym również zwrócić uwagę na statystyki bayesowskie. Niektórych problemów nie da się rozwiązać tylko na podstawie prawdopodobieństwa. Frequentist stosuje alternatywne rozumowanie, w którym „prawdopodobieństwo” odnosi się do alternatywnych wszechświatów, a alternatywne ramy wszechświata nie mają sensu, jeśli chodzi o wnioskowanie o stanie jednostki, takie jak wina lub niewinność przestępcy, czy też wąskie gardło częstotliwości genów w gatunki narażone na ogromne zmiany środowiskowe doprowadziły do ich wyginięcia. W kontekście bayesowskim prawdopodobieństwo to „wiara”, a nie częstotliwość, którą można zastosować do tego, co już wytrąciło się.
Obecnie większość metod bayesowskich wymaga pełnego określenia modeli prawdopodobieństwa dla wcześniejszego i wyniku. I większość z tych modeli prawdopodobieństwa jest parametryczna. Zgodnie z tym, co mówią inni, nie muszą one być dokładnie poprawne, aby uzyskać znaczące podsumowania danych. „Wszystkie modele są nieprawidłowe, niektóre modele są przydatne”.
Istnieją oczywiście nieparametryczne metody bayesowskie. Mają one wiele statystycznych zmarszczek i, ogólnie rzecz biorąc, wymagają prawie wyczerpujących danych dotyczących populacji, aby mogły być sensownie wykorzystane.
źródło
Jedyny powód, dla którego odpowiadam pomimo wszystkich powyższych dobrych odpowiedzi, to fakt, że nikt nie zwrócił uwagi na główny powód, dla którego stosujemy testy parametryczne (przynajmniej w analizie danych fizyki cząstek). Ponieważ znamy parametryzację danych. Hه! To duża zaleta. Sprowadzasz swoje setki, tysiące lub miliony punktów danych do kilku parametrów, na których Ci zależy i które opisujesz swoją dystrybucję. Mówią ci o fizyce leżącej u podstaw (lub o czymkolwiek nauka daje twoje dane).
Oczywiście, jeśli nie masz pojęcia o podstawowej gęstości prawdopodobieństwa, nie masz wyboru: użyj testów nieparametrycznych. Testy nieparametryczne mają tę zaletę, że nie zawierają żadnych uprzedzeń, ale mogą być trudniejsze do wdrożenia - czasem znacznie trudniejsze.
źródło
Statystyka nieparametryczna ma swoje problemy! Jednym z nich jest nacisk na testowanie hipotez, często potrzebujemy oszacowań i przedziałów ufności, a umieszczenie ich w skomplikowanych modelach z parametrami nieparametrycznymi jest --- skomplikowane. Jest na ten temat bardzo dobry post na blogu, z dyskusją na stronie http://andrewgelman.com/2015/07/13/dont-do-the-wilcoxon/ Dyskusja prowadzi do tego drugiego postu, http: // notstatschat. tumblr.com/post/63237480043/rock-paper-scissors-wilcoxon-test , który jest zalecany z zupełnie innego punktu widzenia na Wilcoxon. Krótka wersja to: Wilcoxon (i inne testy rang) mogą prowadzić do nieprzechodniości.
źródło
Powiedziałbym, że statystyki nieparametryczne mają bardziej ogólne zastosowanie w tym sensie, że przyjmują mniej założeń niż statystyki parametryczne.
Niemniej jednak, jeśli zastosuje się statystyki parametryczne i podstawowe założenia zostaną spełnione, wówczas statystyki paramatryczne będą silniejsze niż parametry nieparametryczne.
źródło
Statystyki parametryczne są często sposobami na włączenie wiedzy zewnętrznej [do danych]. Na przykład wiesz, że rozkład błędów jest normalny i ta wiedza pochodzi z wcześniejszych doświadczeń lub z innych względów, a nie z zestawu danych. W takim przypadku, zakładając normalny rozkład, włączasz tę wiedzę zewnętrzną do oszacowań parametrów, co musi poprawić twoje oszacowania.
Na twojej analogii zegarka. Obecnie prawie wszystkie zegarki są wodoodporne, z wyjątkiem specjalnych elementów z biżuterią lub niezwykłych materiałów, takich jak drewno. Powód ich noszenia jest właśnie taki: są wyjątkowe. Jeśli chodziło Ci o wodoodporność, to wiele zegarków nie jest wodoodpornych. Powodem ich noszenia jest ich funkcja: nie nosisz zegarka dla nurka z zestawem i krawatem. Ponadto w dzisiejszych czasach wiele zegarków ma otwarte plecy, dzięki czemu możesz cieszyć się oglądaniem ruchu przez kryształ. Oczywiście te zegarki zwykle nie są wodoodporne.
źródło
To nie jest scenariusz testowania hipotez, ale może być dobrym przykładem odpowiedzi na twoje pytanie: rozważmy analizę skupień. Istnieje wiele „nieparametrycznych” metod klastrowania, takich jak hierarchiczne, K-średnie itp., Ale problemem zawsze jest to, jak ocenić, czy rozwiązanie klastrowania jest „lepsze”, niż inne możliwe rozwiązanie (i często istnieje wiele możliwych rozwiązań) . Każdy algorytm daje Ci to, co najlepsze, ale skąd wiesz, czy nie ma nic lepszego ...? Obecnie istnieją również parametryczne podejścia do klastrowania, tak zwane klastrowanie oparte na modelu, jak modele skończonej mieszanki. Za pomocą FMM budujesz model statystyczny opisujący rozkład danych i dopasowujesz je do danych. Gdy masz swój model, możesz ocenić prawdopodobieństwo danych w tym modelu, możesz użyć testów współczynnika prawdopodobieństwa, porównać AIC i użyć wielu innych metod sprawdzania dopasowania modelu i porównania modelu. Nieparametryczne algorytmy grupowania po prostu grupują dane przy użyciu niektórych kryteriów podobieństwa, a przy użyciu FMM pozwalają opisywać i próbować zrozumieć dane, sprawdzić, jak dobrze to pasuje, dokonać prognoz ... W praktyce podejścia nieparametryczne są proste, praca od razu po wyjęciu z pudełka i są całkiem dobre, podczas gdy FMM może być problematyczny, ale podejścia oparte na modelach często zapewniają bogatsze wyniki.
źródło
Prognozy i prognozy dla nowych danych są często bardzo trudne lub niemożliwe dla modeli nieparametrycznych. Na przykład mogę przewidzieć liczbę roszczeń gwarancyjnych na następne 10 lat, korzystając z modelu przeżycia Weibulla lub Lognormala, jednak nie jest to możliwe przy użyciu modelu Coxa lub Kaplana-Meiera.
Edycja: Pozwól mi być bardziej przejrzystym. Jeśli firma ma wadliwy produkt, często jest zainteresowana prognozą przyszłej stopy roszczeń gwarancyjnych i CDF na podstawie bieżących roszczeń gwarancyjnych i danych sprzedaży. Pomoże im to zdecydować, czy konieczne jest wycofanie. Nie wiem, jak to robisz za pomocą modelu nieparametrycznego.
źródło
Szczerze wierzę, że nie ma właściwej odpowiedzi na to pytanie. Sądząc z podanych odpowiedzi, konsensus jest taki, że testy parametryczne mają większą moc niż równoważniki nieparametryczne. Nie będę kwestionować tego poglądu, ale widzę go raczej jako hipotetyczny, a nie faktyczny punkt widzenia, ponieważ nie jest to coś wyraźnie nauczanego w szkołach i żaden recenzent nigdy nie powie ci „twój artykuł został odrzucony, ponieważ użyłeś testów nieparametrycznych”. To pytanie dotyczy czegoś, na co świat statystyki nie jest w stanie jednoznacznie odpowiedzieć, ale uznał to za coś oczywistego.
Moje osobiste zdanie jest takie, że preferencja parametryczna lub nieparametryczna ma więcej wspólnego z tradycją niż z czymkolwiek innym (z powodu braku lepszego terminu). Techniki parametryczne do testowania i przewidywania były pierwsze i miały długą historię, więc nie jest łatwo całkowicie je zignorować. W szczególności przewidywanie ma imponujące nieparametryczne rozwiązania, które są obecnie szeroko stosowane jako narzędzie pierwszego wyboru. Myślę, że jest to jeden z powodów, dla których techniki uczenia maszynowego, takie jak sieci neuronowe i drzewa decyzyjne, które z natury są nieparametryczne, zyskały w ostatnich latach dużą popularność.
źródło
Jest to kwestia siły statystycznej. Testy nieparametryczne mają zazwyczaj niższą moc statystyczną niż ich odpowiedniki parametryczne.
źródło
Wiele dobrych odpowiedzi już, ale jest kilka powodów, o których nie wspomniałem:
Znajomość. W zależności od odbiorców wynik parametryczny może być znacznie bardziej znany niż w przybliżeniu równoważny wynik nieparametryczny. Jeśli obie dadzą podobne wnioski, znajomość jest dobra.
Prostota. Czasami test parametryczny jest łatwiejszy do wykonania i zgłoszenia. Niektóre metody nieparametryczne wymagają dużej ilości komputera. Oczywiście komputery stały się znacznie szybsze i algorytmy również się poprawiły, ale .... dane stały się „większe”.
źródło