Jaka jest formuła skorygowanej wartości p Benjaminiego-Hochberga?

14

Rozumiem procedurę i to, co kontroluje. Jaki jest zatem wzór skorygowanej wartości p w procedurze BH dla wielokrotnych porównań?


Właśnie teraz zdałem sobie sprawę, że pierwotny BH nie wytworzył skorygowanych wartości p, a jedynie dostosował warunek (nie) odrzucenia: https://www.jstor.org/stable/2346101 . Gordon Smyth wprowadził skorygowane wartości p BH w 2002 r., Więc pytanie nadal obowiązuje. Jest zaimplementowany w R jak p.adjustw metodzie BH.

Firebug
źródło

Odpowiedzi:

6

Słynny artykuł Benjamini i Hochberg (1995) opisał procedurę przyjmowania / odrzucania hipotez opartą na dostosowywaniu poziomów alfa. Ta procedura ma proste równoważne przeformułowanie pod względem skorygowanych wartości , ale nie zostało to omówione w oryginalnym artykule. Według Gordona Smytha wprowadził skorygowane wartości w 2002 r. Podczas implementacji w R. Niestety, nie ma odpowiedniego cytatu, więc zawsze nie było dla mnie jasne, co należy cytować, jeśli używa się wartości skorygowanych pod kątem BH .pp ppp.adjustp

Okazuje się, że procedura jest opisana w Benjamini, Heller, Yekutieli (2009) :

Alternatywnym sposobem przedstawienia wyników tej procedury jest przedstawienie skorygowanych wartości . Wartości skorygowane o BH są zdefiniowane jakopp

p(i)BH=min{minji{mp(j)j},1}.

Ta formuła wygląda na bardziej skomplikowaną, niż jest w rzeczywistości. To mówi:

  1. Najpierw uporządkuj wszystkie wartości od małych do dużych. Następnie pomnóż każdą wartość przez całkowitą liczbę testów i podziel przez kolejność rang.ppm
  2. Po drugie, upewnij się, że wynikowa sekwencja nie zmniejsza się: jeśli kiedykolwiek zacznie się zmniejszać, spraw, aby poprzednia wartość równa kolejnej (wielokrotnie, aż cała sekwencja nie zmniejszy się).p
  3. Jeśli jakakolwiek wartość kończy się na 1, ustaw ją na 1.p

Jest to proste przeformułowanie oryginalnej procedury BH z 1995 r. Może istnieć wcześniejszy artykuł, w którym wyraźnie wprowadzono koncepcję wartości skorygowanych pod kątem BH , ale nie jestem jej świadomy.p


Aktualizacja. @Zenit stwierdził, że Yekutieli i Benjamini (1999) opisali to samo już w 1999 roku:

wprowadź opis zdjęcia tutaj

ameba mówi Przywróć Monikę
źródło
Takiej odpowiedzi oczekiwałem +1. Pamiętam też, jak czytałem o implementacji skorygowanej wartości p Gordona Smytha i nie wiedząc, kogo cytować, fajnie jest zobaczyć cytat „kanoniczny” na ten temat.
Firebug
1
Wierzę, że istnieje jeszcze wcześniejsze odniesienie: Yekutieli i Benjamini (1999) (wersja pdf dostępna tutaj ). Definicja 2.4 opisuje, w jaki sposób można sformułować pierwotną procedurę FDR z 1995 r. Pod względem skorygowanych wartości p. Podziękowania dla tego wpisu na blogu, w którym znalazłem informacje na ten temat.
Zenit
@Zenit Oh wow! Świetne znalezisko! Powinienem zaktualizować swoją odpowiedź.
ameba mówi Przywróć Monikę
Dzięki za źródło @Zenit! To dość dziwne, że tak wszechobecna metoda statystyczna nie ma dobrze znanego odniesienia.
Firebug
8

Najpierw odpowiedź na pytanie. Weź pod uwagę, że jest wartością (pojedynczego testu) powiązaną z wartością statystyki testowej. Benjamini-Hochberg FDR jest obliczany w dwóch krokach ( = # pvalues , = # pvalues): p z 0 N 0p 0p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


Teraz zrozummy to. (Bayesowska) idea polega na tym, że obserwacje pochodzą z mieszanki dwóch rozkładów:

  • π0N obserwacji z gęstości zerowejf0(z)
  • (1π0)N obserwacji z alternatywnej gęstości .f1(z)

Obserwuje się połączenie tych dwóch:

  • f(z)=π0f0(z)+(1π0)f1(z)

wprowadź opis zdjęcia tutaj

Definicje (bayesowskie) to:

  • Fdr=π0(1F0(z0))(1F(z)) (ułamek obszarów ogona)
  • fdr=π0f0(z0)f(z) (ułamek gęstości ogona)

Jak pokazano poniżej, Fdr odpowiada FDR Benjamini hocherg, gdy (co ma miejsce w większości badań bioinformatycznych)π01

wprowadź opis zdjęcia tutaj

(Na podstawie wnioskowania statystycznego dotyczącego wieku komputerowego Efron & Tibshirani )

Aditya
źródło