Mam dwie mocno wypaczone próbki i próbuję użyć ładowania początkowego w celu porównania ich średnich za pomocą statystyki t.
Jaka jest poprawna procedura, aby to zrobić?
Proces, którego używam
Niepokoi mnie właściwość zastosowania standardowego błędu oryginalnych / zaobserwowanych danych w ostatnim etapie, gdy wiem, że nie jest to normalnie rozpowszechniane.
Oto moje kroki:
- Bootstrap - losowo próbka z zamiennikiem (N = 1000)
- Oblicz statystyki t dla każdego paska startowego, aby utworzyć rozkład t:
- Oszacuj t przedziały ufności, otrzymując i 1 - α / 2 percentyle rozkładu t
Uzyskaj przedziały ufności poprzez:
- Spójrz, gdzie mieszczą się przedziały ufności, aby ustalić, czy istnieje znacząca różnica w średnich (tj. Niezerowych)
Patrzyłem też na sumę rang Wilcoxona, ale nie daje ona bardzo rozsądnych wyników z powodu bardzo mocno wypaczonego rozkładu (np. 75. = = 95. percentyl). Z tego powodu chciałbym dalej badać test t bootstrapped.
Więc moje pytania to:
- Czy to odpowiednia metodologia?
- Czy właściwe jest użycie SE obserwowanych danych, gdy wiem, że jest mocno wypaczony?
Możliwy duplikat: jaka metoda jest preferowana, test ładowania początkowego lub test nieparametryczny oparty na rankingu?
źródło
Odpowiedzi:
Po prostu zrobiłbym regularny test bootstrap:
Możesz przeczytać więcej na ten temat w:
Rozdział 4 AC Davison i DV Hinkley (1997) Metody ładowania i ich zastosowanie . Cambridge: Cambridge University Press.
Rozdział 16 Bradley Efron i Robert J. Tibshirani (1993) Wprowadzenie do Bootstrap . Boca Raton: Chapman & Hall / CRC.
Wpis w Wikipedii dotyczący testowania hipotez bootstrap.
źródło