Dobry tekst do ponownego próbkowania?

10

Czy grupa może polecić dobry tekst / zasób wprowadzający do zastosowanych technik ponownego próbkowania? W szczególności interesują mnie alternatywy dla klasycznych testów parametrycznych (np. Testy t, ANOVA, ANCOVA) do porównywania grup w przypadku wyraźnego naruszenia założeń takich jak normalność.

Przykładowy typ problemu, który chciałbym nauczyć się lepszego sposobu rozwiązania, może obejmować coś takiego jak:

I)
2 grupy: leczenie i kontrola

Zależny Var: Zmiana stanu środków na rachunku po interwencji

Współzmienna: Saldo na rachunku przed interwencją dolary.

Problem ze stosowaniem ANCOVA: wiele przedmiotów nie będzie miało żadnych zmian (wiele zer).

II)
2 grupy: leczenie i kontrola

Warunek zależny: dodano nowe konta

Współzmienna: liczba kont sprzed interwencji.

* Wiele przedmiotów nie będzie miało dodanego konta (wiele zer).

Czy mogę użyć bootstrap? Test permutacji? Jest to rodzaj analizy, do której chciałbym zastosować nieparametryczne metody ponownego próbkowania.

B_Miner
źródło

Odpowiedzi:

5

Jeśli chodzi o dobre odniesienie, poleciłbym Philipowi Goodowi , Resampling Methods: A Practical Guide to Data Analysis (Birkhäuser Boston, 2005, wydanie 3) dla stosowanego podręcznika towarzyszącego. A oto Annotated Bibliography for Bootstrap Resampling . Metody ponownego próbkowania: koncepcje, zastosowania i uzasadnienie również stanowią dobry początek.

Istnieje wiele pakietów R, które ułatwiają stosowanie technik ponownego próbkowania:

(Istnieje wiele innych pakietów ...)

chl
źródło
@chi i @whuber: Dziękuję, zastanawiałem się, czy Dobra książka była dobrym wyborem. W przypadku rodzajów problemów, które przedstawiłem - w zasadzie ANCOVA z naruszeniami, czy jestem na dobrej drodze z permutacją lub ładowaniem?
B_Miner
@ user2040 Trudno jest pomylić się z testami permutacji. Good ma rozdziały dotyczące konkretnie projektów wieloczynnikowych, danych kategorycznych i analizy wielowymiarowej (w tym MANCOVA). Chociaż nie do końca rozumiem twój konkretny problem, jestem pewien, że znajdziesz tam coś przydatnego.
whuber
@ user2040 Dodam kilka referencji, ale uważam, że wasze dwa punkty również są trudne do zrozumienia. Według mojej wiedzy nie ma dokładnego testu permutacji, gdy zmienna towarzysząca jest ciągła.
chl
1
@chl Myślę, że jeśli dobrze rozumiem twój komentarz na temat ciągłych zmiennych towarzyszących, dokładność zależy od roli przypadkowej w danych. Kiedy randomizacja następuje z założenia , wydaje się, że nie ma znaczenia, jaki rodzaj danych masz. Test permutacji przyjmuje dane zgodnie z podanymi danymi i pozwala po prostu zobaczyć, jak wyglądałyby wyniki statystyczne, gdyby nasze generatory liczb losowych (na przykład) skutkowały różnymi przypisaniami osobników do grup leczenia i kontrolnych.
whuber
@chi i @whuber, Jeszcze raz dziękuję. Zobaczę, która z dobrych książek jest najlepsza (wiele kalamburów zamierzonych). Jeśli chodzi o mój problem, zasadniczo jest to eksperyment z dwoma próbkami (leczenie i kontrola / brak leczenia), w którym istnieje miara wyjściowa przed eksperymentem i miara po leczeniu, przy czym ta ostatnia jest zmienną zależną (w rzeczywistości jest to zmiana miary od przed do postu). Byłoby to więc typowa ANCOVA lub ANOVA (w zależności od tego, czy zmiana jest zależna, czy jest, z pre jako współzmienną), z tym wyjątkiem, że wiele pomiarów po jest zerowych (klient nic nie kupił).
B_Miner
4

Phillip Good, Permutation, Parametric i Bootstrap Test of Hypotheses (wydanie trzecie). Springer, 2005.

Ta książka jest matematycznie łatwa, dostępna i obejmuje szeroki zakres zastosowań.

Whuber
źródło
(+1) Ach ... zacytowaliśmy tę samą książkę :)
chl
@chl Nie sądzę: są tego samego autora, ale mają nieco inne tytuły i różnych wydawców. Może każdy z nas powinien powiedzieć coś więcej na ich temat, abyśmy mogli ustalić, który z nich będzie bardziej odpowiedni dla PO. Dodałem kilka szczegółów w komentarzu do twojej odpowiedzi.
whuber
Usunąłem mój po obejrzeniu twojego.
chl
@chl Ah, rozumiem. Więc nie ma redundancji.
whuber