Czytam książkę Larry'ego Wassermana, All of Statistics , a obecnie o wartościach p (strona 187). Pozwól mi najpierw wprowadzić kilka definicji (cytuję):
Definicja 1 Funkcja mocy testu z obszarem odrzucenia jest zdefiniowana przez Rozmiar testu jest określony na Mówi się, że test ma poziom \ alpha, jeśli jego rozmiar jest mniejszy lub równy \ alpha .
Mówi to w zasadzie, że , rozmiar jest „największym” prawdopodobieństwem błędu typu I. Wartość określa się następnie za pomocą (cytuję)
Definicja 2 Załóżmy, że dla każdego mamy test rozmiaru z regionem odrzucającym . Następnie
gdzie .
Dla mnie oznacza to: biorąc pod uwagę konkretną istnieje region testowy i odrzucania tak że . Dla wartości po prostu biorę wtedy najmniejszą ze wszystkich .
Pytanie 1 Jeśli tak by było, to mógłbym wyraźnie wybrać dla arbitralnie małego . Jaka jest moja błędna interpretacja definicji 2, tj. Co to dokładnie znaczy?
Teraz Wasserman jest ciągły i twierdzi, że ma „równoważną” definicję wartości którą znam (cytuję):
Twierdzenie Załóżmy, że rozmiar test ma postać Następnie gdzie jest obserwowaną wartością .
Oto moje drugie pytanie:
Pytanie 2 Jak mogę faktycznie udowodnić to twierdzenie? Być może wynika to z mojego niezrozumienia definicji wartości , ale nie mogę jej rozgryźć.
źródło
Odpowiedzi:
Mamy kilka danych wielowymiarowych , pochodzących z rozkładu z nieznanym parametrem . Zauważ, że to przykładowe wyniki.x D θ x
Chcemy przetestować hipotezę o nieznanym parametrze , wartości pod hipotezą zerową znajdują się w zbiorze .θ θ θ0
W przestrzeni możemy zdefiniować region odrzucenia , a moc tego regionu jest następnie zdefiniowana jako . Tak więc moc jest obliczana dla określonej wartości z jako prawdopodobieństwo, że wynik próby znajduje się w regionie odrzucenia gdy wartość wynosi . Oczywiście moc zależy od regionu i wybranego .X R R PRθ¯=Pθ¯(x∈R) θ¯ θ x R θ θ¯ R θ¯
Definicja 1 definiuje rozmiar regionuR jako supremum wszystkich wartości dla w , więc tylko dla wartości pod . Oczywiście w zależności od regionu, tak .PRθ¯ θ¯ θ0 θ¯ H0 αR=supθ¯∈θ0PRθ¯
Ponieważ zależy od , mamy inną wartość, gdy zmienia się region, i to jest podstawa do zdefiniowania wartości p: zmień region, ale w taki sposób, że obserwowana wartość próbki nadal należy do regionu, ponieważ każdy taki region obliczyć jak zdefiniowano powyżej, i podjąć infimum: . Tak więc wartość p jest najmniejszym rozmiarem wszystkich regionów zawierających .αR R αR pv(x)=infR|x∈RαR x
Twierdzenie to jest po prostu jego „tłumaczeniem”, a mianowicie przypadkiem, gdy regiony są zdefiniowane za pomocą statystyki a dla wartości definiujesz region jako . Jeśli użyjesz tego typu regionu w powyższym rozumowaniu, następuje twierdzenie następujące.R T c R R={x|T(x)≥c} R
EDYCJA z powodu komentarzy:
@ user8: dla twierdzenia; jeśli zdefiniujesz regiony odrzucenia jak w twierdzeniu, to region odrzucenia o rozmiarze jest zbiorem, który wygląda jak dla niektórych .α Rα={X|T(X)≥cα} cα
Aby znaleźć wartość p obserwowanej wartości , tj. , musisz znaleźć najmniejszy region , tj. Największą wartość taką, że nadal zawiera , ten ostatni (region zawiera ) jest równoważny (ze względu na sposób definiowania regionów) z twierdzeniem, że , więc musisz znaleźć największy taki, żex pv(x) R c {X|T(X)≥c} x x c≥T(x) c {X|T(X)≥c&c≥T(x)}
Oczywiście największe takie, że powinno wynosić a wtedy supra zestawu staje sięc c≥T(x) c=T(x) {X|T(X)≥c=T(x)}={X|T(X)≥T(x)}
źródło
W definicji 2 wartość statystyki testowej jest największą dolną granicą wszystkich tak że hipoteza jest odrzucana dla testu wielkości . Przypomnijmy, że im mniejsza jest wartość , tym mniej tolerancja błędu typu I jest dozwolona, dlatego region odrzucenia również się zmniejszy. Tak więc (bardzo) nieformalnie rzecz biorąc, wartość jest najmniejszą jaką możemy wybrać, co wciąż pozwala nam odrzucić dla danych, które zaobserwowaliśmy. Nie możemy arbitralnie wybrać mniejszego ponieważ w pewnym momenciep α α α Rα p α H0 α Rα będą tak małe, że wykluczą (tzn. nie będą zawierać) zdarzenia, które zaobserwowaliśmy.
Teraz, w świetle powyższego, zapraszam do ponownego rozważenia twierdzenia.
źródło