Co to jest solidny test statystyczny? Co to jest potężny test statystyczny?

14

Niektóre testy statystyczne są solidne, a niektóre nie. Co dokładnie oznacza solidność? Zaskakujące, że nie mogłem znaleźć takiego pytania na tej stronie.

Co więcej, czasami solidność i moc testu są omawiane razem. I intuicyjnie nie mogłem rozróżnić tych dwóch pojęć. Co to jest potężny test? Czym różni się od solidnego testu statystycznego?

Zmęczenie spowodowane różnicą czasu
źródło
2
Moc i wytrzymałość to pojęcia ortogonalne, nawet jeśli są dwiema ważnymi właściwościami testu. Wydaje mi się, że lepiej byłoby zadać dwa osobne pytania.
Stephan Kolassa
2
Moglibyśmy wyrazić solidność jako właściwość dostosowanej procedury, która jest niewrażliwa na naruszenie niektórych założeń jej podstawowej teorii.
Firebug,

Odpowiedzi:

21

Odporność ma różne znaczenie w statystykach, ale wszystkie implikują pewną odporność na zmiany rodzaju wykorzystywanych danych. Może to zabrzmieć nieco dwuznacznie, ale dzieje się tak, ponieważ odporność może odnosić się do różnego rodzaju nieczułości na zmiany. Na przykład:

  • Odporność na wartości odstające
  • Odporność na nienormalność
  • Odporność na niestałe wariancje (lub heteroscedastyczność)

W przypadku testów odporność zwykle oznacza, że ​​test jest nadal ważny, biorąc pod uwagę taką zmianę. Innymi słowy, to, czy wynik jest znaczący, czy nie, ma sens tylko wtedy, gdy spełnione są założenia testu. Kiedy takie założenia są rozluźnione (tzn. Nie tak ważne), mówi się, że test jest rzetelny.

Moc testu to jego zdolność do wykrycia znaczącej różnicy, jeśli istnieje prawdziwa różnica. Powodem zastosowania testów i modeli specyficznych dla różnych założeń jest to, że założenia te upraszczają problem (np. Wymagają oszacowania mniejszej liczby parametrów). Im więcej założeń wynika z testu, tym mniej jest on solidny, ponieważ wszystkie te założenia muszą zostać spełnione, aby test był ważny.

Z drugiej strony test z mniejszą liczbą założeń jest bardziej niezawodny. Jednak wytrzymałość generalnie wiąże się z kosztem energii, ponieważ albo wykorzystuje się mniej informacji z wejścia, albo trzeba oszacować więcej parametrów.


t

t


fafa

Frans Rodenburg
źródło
1
Twoja odpowiedź jest bardzo jasna i łatwa do zrozumienia. Redagowałem pytaniem, aby dowiedzieć się więcej o tym, czy test jest taki, powerfuljak widzę, że omówiłeś to w swojej odpowiedzi. Czy mógłbyś wyjaśnić, co oznacza potężny test?
JetLag,
Zamieściłem krótki opis tego, jak odnosi się to do mocy testu.
Frans Rodenburg,
1
To świetna odpowiedź, wystarczy dodać, że istnieją sposoby sformalizowania definicji. Niektórzy uważają test za solidny, jeśli ma zarówno solidność ważności , tj. Poziom istotności testu jest stabilny, biorąc pod uwagę małe odstępstwa od zera, oraz solidność wydajności , tj. Moc jest nadal dobra, biorąc pod uwagę małe odstępstwa od określonej alternatywy; a te cechy można skwantyfikować za pomocą funkcji wpływu .
Francis
1
@Eric, czy równoważność nie jest prawdziwa tylko dla dwóch grup?
Sextus Empiricus,
1
fa
3

Nie ma formalnej definicji „solidnego testu statystycznego”, ale istnieje rodzaj ogólnego porozumienia co do tego, co to oznacza. Witryna Wikipedii ma dobrą definicję tego (pod względem statystyki, a nie samego testu):

Solidne statystyki to statystyki o dobrej wydajności dla danych pochodzących z szerokiego zakresu rozkładów prawdopodobieństwa, szczególnie dla rozkładów, które nie są normalne.

https://en.wikipedia.org/wiki/Robust_statistics

Rob Ustinov
źródło