Jaka jest różnica między wynikami Z a wartościami p?

11

W algorytmach motywów sieciowych wydaje się dość powszechne zwracanie zarówno wartości p, jak i wyniku Z dla statystyki: „Sieć wejściowa zawiera X kopii podgrupy G”. Podgraf jest uważany za motyw, jeśli spełnia

  • wartość p <A,
  • Wynik Z> B i
  • X> C, dla niektórych A, B i C. zdefiniowanych przez użytkownika (lub zdefiniowanych przez społeczność)

To motywuje pytanie:

Pytanie : Jakie są różnice między wartością p a wynikiem Z?

I pytanie:

Pytanie : Czy istnieją sytuacje, w których wartość p i wynik Z tej samej statystyki mogą sugerować przeciwne hipotezy? Czy wymienione powyżej pierwsze i drugie warunki są zasadniczo takie same?

Douglas S. Kamienie
źródło

Odpowiedzi:

9

Na podstawie twojego pytania powiedziałbym, że nie ma różnicy między trzema testami. Oznacza to, że zawsze możesz wybrać A, B i C, aby podjąć tę samą decyzję, niezależnie od tego, jakiego kryterium używasz. Chociaż musisz mieć wartość p opartą na tej samej statystyce (tj. Wynik Z)

Aby użyć wyniku Z, zakłada się , że zarówno średnia i wariancja są znane, a rozkład przyjmuje się jako normalny (lub asymptotycznie / w przybliżeniu normalny). Załóżmy, że kryterium wartości p wynosi zwykle 5%. Następnie mamy:μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

Mamy więc potrójne które wszystkie reprezentują te same wartości graniczne.(0.05,1.645,μ+1.645σ)

Należy zauważyć, że ta sama korespondencja będzie miała zastosowanie do testu t, chociaż liczby będą różne. Test dwóch ogonów również będzie miał podobną korespondencję, ale z różnymi liczbami.

prawdopodobieństwo prawdopodobieństwa
źródło
Dziękuję za to! (i dzięki również innym użytkownikom).
Douglas S. Stones
8

-score opisuje swoją odchylenie od średniej w jednostkach odchylenia standardowego. Nie jest jasne, czy akceptujesz, czy odrzucasz hipotezę zerową.Z

-value jest prawdopodobieństwo, że zgodnie z hipotezą zerową mogliśmy obserwować punkt, który jest tak radykalna, jak swojej statystyce. Mówi to wyraźnie, czy odrzucasz lub akceptujesz hipotezę zerową, biorąc pod uwagę rozmiar testu .pα

Rozważ przykład, w którym a hipoteza zerowa to . Następnie obserwujesz . Twój wynik wynosi 5 (co pokazuje tylko, jak daleko odbiegasz od zerowej hipotezy pod względem ), a twoja wartość wynosi 5,733e-7. Dla 95% pewności będziesz mieć rozmiar testu a ponieważ wówczas odrzucasz hipotezę zerową. Ale dla każdej statystyki powinny istnieć pewne równoważne i tak aby testy były takie same.XN(μ,1)μ=0x1=5Zσpα=0.05p<αAB

Gary
źródło
3
@Gary - wartość p nie mówi, aby odrzucić lub nie więcej niż wynik Z. To tylko liczby. Tylko reguła decyzyjna decyduje o przyjęciu lub odrzuceniu. Tę regułę decyzyjną można równie dobrze zdefiniować w kategoriach wyniku Z (np. Reguła lub )2σ3σ
probabilityislogic
@probabilityislogic Zgadzam się z tobą. Rzeczywiście, możesz skonstruować jakiś test oparty na progu wyniku ale nie pozwala ci to jawnie zdefiniować rozmiaru testu w klasycznym znaczeniu (tj. Pod względem prawdopodobieństwa). Tego rodzaju kryteria mogą być kłopotliwe, jeśli twoja dystrybucja ma grube ogony. Kiedy konstruujesz test, wyraźnie określasz rozmiar testu, a zatem wartość natychmiast mówi ci, czy akceptujesz, czy odrzucasz, o co właśnie starałem się podchodzić. Zp
Gary
@gary - nie bardzo, bo wartość p nie odnosi się do alternatyw. Dlatego nie można go użyć do bezpośredniego porównania alternatyw. Na przykład weźmy vs . Wartość p dla pozostaje taka sama . Mówisz więc „odrzuć zero”, co oznacza „zaakceptuj alternatywę” i zadeklaruj . Ale to absurdalne, nikt by tego nie zrobił, ale reguła wartości p, której tu używasz, robi to. Innymi słowy, reguła wartości p, którą opisałeś, nie jest niezmienna w odniesieniu do tak zwanej „hipotezy zerowej” (nadchodząca rozdzielczość)H0:μ=0HA:μ=1H05×107μ=1
prawdopodobieństwo prawdopodobieństwa
(kont.) Rozdzielczość pozornej absurdu należy zauważyć, że wartość p nie jest testem „absolutnym”, ale względnym, zdefiniowanym za pomocą domyślnej alternatywnej hipotezy. W tym przypadku domyślną alternatywą jest . Można to zauważyć, zauważając, że jeśli wartość p dla , otrzymam , która jest mniejsza niż wartość p dla . Teraz w tym przykładzie „niejawną alternatywę” można łatwo znaleźć intuicyjnie, ale znacznie trudniej jest znaleźć ją w bardziej złożonych problemach, w których parametry uciążliwe lub brak wystarczającej statystyki. H A 1 × 10 - 9 H 0Himp:μ=5HA1×109H0
probabilityislogic
1
@Gary - wartość p nie jest już bardziej rygorystyczna tylko dlatego, że istnieje prawdopodobieństwo. Jest to monotoniczna transformacja wyniku Z w skali 1 do 1. każdy „rygor” posiadany przez wartość p ma również wynik Z. Chociaż jeśli używasz testu dwustronnego, odpowiednikiem jest wartość bezwzględna wyniku Z. Aby porównać z wartością zerową, musisz przyjąć podejście „minimax”: wybrać ostrą hipotezę, która jest najbardziej obsługiwana przez dane i spójna z . Chyba, że ​​potrafisz wykazać, jak obliczyćH 1 P ( X | μ 1 )H1:μ0H1P(X|μ1)
prawdopodobieństwo prawdopodobieństwa
6

zpWartość wskazuje, jak mało prawdopodobne są statystyki. -score wskazuje, jak daleko jest od średniej. Może występować różnica między nimi w zależności od wielkości próbki.z

W przypadku dużych próbek nawet niewielkie odchylenia od średniej stają się mało prawdopodobne. Czyli może -value być bardzo małe, nawet na niskim -score. I odwrotnie, w przypadku małych próbek nawet duże odchylenia nie są mało prawdopodobne. Czyli duża -score niekoniecznie będzie oznaczać niewielką -value.z z ppzzp

Sheldon Cooper
źródło
jeśli wielkość próbki jest duża, wówczas odchylenie standardowe będzie małe, stąd wynik Z będzie wysoki. Myślę, że możesz to odkryć, jeśli spróbujesz numerycznego przykładu.
probabilityislogic
1
Nie całkiem. Załóżmy, że próbkujesz od N (0, 1). Wtedy twój standard wyniesie około 1, niezależnie od wielkości próbki. Zmniejszy się błąd standardowy średniej, a nie odchylenie standardowe. Wartości p oparte są na SEM, a nie na standardzie.
SheldonCooper
Wynik Z wynosi (średnia obserwowana) / (odchylenie standardowe). Ale średnia i odchylenie standardowe dotyczą obserwowanej statystyki, a nie populacji, z której zostały sporządzone jej składniki. Moja luźna terminologia została tutaj złapana. Jeśli jednak testujesz średnią, wówczas odpowiednim odchyleniem standardowym w wyniku Z jest błąd standardowy, który zmniejsza się w tym samym tempie co wartość p.
probabilityislogic