Jaka jest różnica między statystykami / metodami bez dystrybucji a statystykami nieparametrycznymi?

12

Z Wikipedii

Pierwsze znaczenie nieparametryczne obejmuje techniki, które nie opierają się na danych należących do określonego rozkładu. Należą do nich między innymi:

  • metody bez dystrybucji, które nie opierają się na założeniach, że dane pochodzą z danego rozkładu prawdopodobieństwa. Jako taki jest przeciwieństwem statystyki parametrycznej. Obejmuje nieparametryczne modele statystyczne, wnioskowanie i testy statystyczne.
  • statystyki nieparametryczne (w sensie statystyki nad danymi, która jest zdefiniowana jako funkcja w próbce, która nie jest zależna od parametru), której interpretacja nie zależy od populacji pasującej do dowolnych sparametryzowanych rozkładów. Statystyki oparte na szeregach obserwacji są jednym z przykładów takich statystyk, które odgrywają centralną rolę w wielu podejściach nieparametrycznych.

Nie widzę różnicy między tymi dwoma przypadkami: metodami bez dystrybucji i statystykami nieparametrycznymi. Czy oboje nie zakładają, że dane pochodzą z jakiejś dystrybucji? Czym się różnią?

Dziękuję i pozdrawiam!

Tim
źródło
1
Podana przez ciebie definicja sugeruje, że druga część jest podzbiorem pierwszej, ale ponieważ faktycznie ją tam zdefiniowali (zamieniłem niektóre części tych definicji na drugi termin!) - i zwykle w praktyce - wydają się być używane zamiennie. W tym sensie nieparametryczny w zasadzie oznacza „nieskończenie parametryczny”, podczas gdy metody bez dystrybucji to takie, których implementacja i właściwości, takie jak rozkłady zerowe, nie zależą od kształtu dystrybucji. Niektóre książki dokonują rozróżnienia między nimi; jeśli pomyślę o referencji, wrócę i dodam ją.
Glen_b
@Glen_b: Dzięki! Doceniamy również niektóre referencje!
Tim
@Glen_b: Dlaczego „drugi jest podzbiorem pierwszego”? Czuję się odwrotnie. Czy możesz podać mi jakieś referencje? Dzięki!
Tim
„Obejmuje nieparametryczne modele statystyczne”, co daje takie wrażenie. Odniesienia do definicji terminów? Różne książki na temat statystyk bez dystrybucji / nieparametrycznych próbują zdefiniować lub wyróżnić; minęło dużo czasu, odkąd przeczytałem kilka z nich, ale standardowe książki, takie jak Conover, Bradley, Daniel, Marascuilo i McSweeney, Lindley byłyby początkiem. Spośród nich chciałbym najpierw sprawdzić Bradleya. Mam tylko Conovera, Neave'a i Worthingtona; Ku mojemu zaskoczeniu nie zauważyłem żadnej definicji w ciągu kilku minut. Myślałem, że oboje coś mają.
Glen_b
@Glen_b: Dzięki! Czy uważasz, że którekolwiek z dwóch znaczeń statystyki nieparametrycznej w cytacie ma coś wspólnego ze statystykami bez dystrybucji?
Tim

Odpowiedzi:

5

Ilustrujący przykład różnicy - porównywanie próbek z dwóch populacji.

W pierwszej definicji możesz nadal porównywać średnie z dwóch populacji, w jakiś sposób używając próbek do wyciągania wniosków (na przykład porównując średnie z próbek). Średnie populacji to parametry, ale nie przyjmuje się żadnych założeń dotyczących rozkładu (np. Nie zakłada się, że populacja jest normalnie podzielona). To statystyki „bez dystrybucji”. Ja nie sądzę, że należy to nazwać częścią statystyki nieparametrycznej - z powodu oczywistej logicznej sprzeczności.

Zgodnie z drugą definicją w ogóle nie bierze się pod uwagę średniej populacji ani żadnego innego parametru. Zamiast tego używasz metod takich jak porównania rankingów. To prawda, statystyki nieparametryczne.

Peter Ellis
źródło
Dzięki! Czy w obu przypadkach rozkłady ich statystyk nie opierają się na prawdziwym rozkładzie próby?
Tim
Czy zgadzasz się z Glen_b, że „drugi jest podzbiorem pierwszego”?
Tim
Tim, nie sądzę, że drugi jest podzbiorem pierwszego; przeczytaj ponownie mój komentarz, a zobaczysz, że wcale nie to powiedziałem. Opisywałem to, co powiedziałeś, co powiedziałeś. Jeśli powiem „Wygląda na to, że Bill myśli X”, nie oznacza to, że „Glen_b myśli X”. Mogę nie myśleć nic takiego.
Glen_b
1
Niezależnie od tego, kto (jeśli ktoś) tak uważa, nie, drugi przypadek nie jest podzbiorem pierwszego. Drugi przypadek wyraźnie wyklucza zainteresowanie parametrami, na których skupia się pierwszy.
Peter Ellis,
@PeterEllis To dobra uwaga
Glen_b