Jak wykonać test ładowania początkowego, aby porównać średnie z dwóch próbek?

12

Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t.

Jaka jest poprawna procedura, aby to zrobić?


Proces, którego używam

Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w ostatnim etapie, gdy wiem, że nie jest to normalnie rozpowszechniane.

Oto moje kroki:

  • Bootstrap - losowo próbka z zamiennikiem (N = 1000)
  • Oblicz statystyki t dla każdego paska startowego, aby utworzyć rozkład t:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • Oszacuj t przedziały ufności, otrzymując i 1 - α / 2 percentyle rozkładu tα/21α/2
  • Uzyskaj przedziały ufności poprzez:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    SE=σX12/n+σX22/n
  • Spójrz, gdzie mieszczą się przedziały ufności, aby ustalić, czy istnieje znacząca różnica w średnich (tj. Niezerowych)

Patrzyłem też na sumę rang Wilcoxona, ale nie daje ona bardzo rozsądnych wyników z powodu bardzo mocno wypaczonego rozkładu (np. 75. = = 95. percentyl). Z tego powodu chciałbym dalej badać test t bootstrapped.

Więc moje pytania to:

  1. Czy to odpowiednia metodologia?
  2. Czy właściwe jest użycie SE obserwowanych danych, gdy wiem, że jest mocno wypaczony?

Możliwy duplikat: jaka metoda jest preferowana, test ładowania początkowego lub test nieparametryczny oparty na rankingu?

CatsLoveJazz
źródło
Jak duże są próbki?
Michael M.
@Michael Mayer Około 800
CatsLoveJazz
Zobacz także stats.stackexchange.com/questions/189587
mówi Przywróć Monikę

Odpowiedzi:

16

Po prostu zrobiłbym regularny test bootstrap:

  • obliczyć statystykę t w swoich danych i zapisać ją
  • zmienić dane tak, aby hipoteza zerowa była prawdziwa. W takim przypadku odejmij średnią z grupy 1 dla grupy 1 i dodaj ogólną średnią, i zrób to samo dla grupy 2, w ten sposób średnie w obu grupach będą średnią ogólną.
  • Pobierz próbki ładowania początkowego z tego zestawu danych, prawdopodobnie rzędu 20 000.
  • oblicz statystyki t dla każdej z tych próbek ładowania początkowego. Rozkład tych statystyk t jest oszacowaniem początkowym rozkładu próbkowania statystyki t w przekrzywionych danych, jeśli hipoteza zerowa jest prawdziwa.
  • p(+1)(+1)

Możesz przeczytać więcej na ten temat w:

  • Rozdział 4 AC Davison i DV Hinkley (1997) Metody ładowania i ich zastosowanie . Cambridge: Cambridge University Press.

  • Rozdział 16 Bradley Efron i Robert J. Tibshirani (1993) Wprowadzenie do Bootstrap . Boca Raton: Chapman & Hall / CRC.

  • Wpis w Wikipedii dotyczący testowania hipotez bootstrap.

Maarten Buis
źródło
Zasadniczo to robię, ale patrząc na proporcję, w której pierwotna / obserwowana statystyka t jest> = statystyki t butyrapped. Czy w pierwszej kolejności można wykonać test t na mocno wypaczonych danych, jest to jeden z powodów, dla których chcę zwiększyć wydajność.
CatsLoveJazz
2
Technicznie rzecz biorąc, do testu ładowania początkowego potrzebujesz tylko statystyki testu, aby nie stanowiło to problemu. Zasadniczo test t porównuje średnie, a w przypadku wypaczonych danych mediany są często bardziej znaczące niż średnie. Zatem test porównujący mediany zamiast środków może mieć większy sens. Zależy to jednak od twojej hipotezy zerowej, która jest twoim wyborem i twoim wyborem.
Maarten Buis
Ok, dziękuję, to jest środek, który chcemy przetestować, ponieważ wszystkie nasze inne wyniki były w tej formie.
CatsLoveJazz