Gdy czytam książkę Wassermanna Wszystkie statystyki, dostrzegam subtelną subtelność w definicji wartości p, której nie mogę zrozumieć. Nieformalnie Wassermann określa wartość p jako
[..] prawdopodobieństwo (poniżej ) zaobserwowania wartości statystyki testowej takiej samej lub bardziej ekstremalnej niż rzeczywista obserwowana.
Podkreślenie dodane. To samo bardziej formalnie (Twierdzenie 10.12):
Załóżmy, że test rozmiar ma postać
odrzucić wtedy i tylko wtedy, gdy .
Następnie,
gdzie jest obserwowaną wartością . Jeśli to
Ponadto Wassermann definiuje wartość p testu \ chi ^ 2 Pearsona (i innych testów analogicznie) jako:
Część, o którą lubię prosić o wyjaśnienie, to znak większej równości ( ) w pierwszej i większy ( ) znak w drugiej definicji. Dlaczego nie piszemy , który pasowałby do pierwszego cytatu „ to samo lub bardziej ekstremalne?”
Czy to czysta wygoda, aby obliczyć wartość p jako ? Zauważam, że R używa również definicji ze znakiem , np . W.chisq.test
Odpowiedzi:
„As or more extreme” jest poprawne.
Formalnie zatem, jeśli rozkład jest taki, że prawdopodobieństwo uzyskania samej statystyki testowej jest dodatnie, to prawdopodobieństwo (i wszystko równie ekstremalne, takie jak odpowiednia wartość w drugim ogonie) powinno zostać uwzględnione w wartości p.
Oczywiście przy ciągłej statystyce prawdopodobieństwo dokładnej równości wynosi 0. Nie ma znaczenia, jeśli mówimy lub .> ≥
źródło
Pierwszym punktem jest to, że przestrzeń hipotezy jest topologicznie zamknięta w całej przestrzeni parametrów. Bez uwzględnienia losowości może to być przydatna konwencja, jeśli masz pewne twierdzenie na temat zbieżnej sekwencji parametrów należących do hipotezy, ponieważ wtedy wiesz, że granica nie należy nagle do alternatywy.≥
Biorąc pod uwagę rozkłady prawdopodobieństwa, są one (zwykle) prawe ciągłe. Oznacza to, że mapowanie zamkniętej przestrzeni hipotez na przedział jest ponownie zamykane. Dlatego też przedziały ufności są również zamykane umownie.[0,1]
To poprawia matematykę. Wyobraź sobie, że skonstruowałbyś przedział ufności dla parametru lokalizacji asymetrycznego rozkładu prawdopodobieństwa. Tam musiałbyś wymienić długość na górny ogon na długość na dolny ogon. Prawdopodobieństwo w obu ogonach powinno sumować się do . Aby CI był jak najbardziej informacyjny, musisz skrócić jego długość tak, aby prawdopodobieństwo jego pokrycia było nadal . To jest zamknięty zestaw. Można tam znaleźć optymalne rozwiązanie za pomocą algorytmu iteracyjnego, np. Twierdzenia Banacha o punkcie stałym. Jeśli byłby to otwarty zestaw, nie można tego zrobić.α ≥1−α
źródło