Słynny artykuł Benjamini i Hochberg (1995) opisał procedurę przyjmowania / odrzucania hipotez opartą na dostosowywaniu poziomów alfa. Ta procedura ma proste równoważne przeformułowanie pod względem skorygowanych wartości , ale nie zostało to omówione w oryginalnym artykule. Według Gordona Smytha wprowadził skorygowane wartości w 2002 r. Podczas implementacji w R. Niestety, nie ma odpowiedniego cytatu, więc zawsze nie było dla mnie jasne, co należy cytować, jeśli używa się wartości skorygowanych pod kątem BH .pp ppp.adjust
p
Okazuje się, że procedura jest opisana w Benjamini, Heller, Yekutieli (2009) :
Alternatywnym sposobem przedstawienia wyników tej procedury jest przedstawienie skorygowanych wartości . Wartości skorygowane o BH są zdefiniowane jakopppBH(i)=min{minj≥i{mp(j)j},1}.
Ta formuła wygląda na bardziej skomplikowaną, niż jest w rzeczywistości. To mówi:
- Najpierw uporządkuj wszystkie wartości od małych do dużych. Następnie pomnóż każdą wartość przez całkowitą liczbę testów i podziel przez kolejność rang.ppm
- Po drugie, upewnij się, że wynikowa sekwencja nie zmniejsza się: jeśli kiedykolwiek zacznie się zmniejszać, spraw, aby poprzednia wartość równa kolejnej (wielokrotnie, aż cała sekwencja nie zmniejszy się).p
- Jeśli jakakolwiek wartość kończy się na 1, ustaw ją na 1.p
Jest to proste przeformułowanie oryginalnej procedury BH z 1995 r. Może istnieć wcześniejszy artykuł, w którym wyraźnie wprowadzono koncepcję wartości skorygowanych pod kątem BH , ale nie jestem jej świadomy.p
Aktualizacja. @Zenit stwierdził, że Yekutieli i Benjamini (1999) opisali to samo już w 1999 roku:
Najpierw odpowiedź na pytanie. Weź pod uwagę, że jest wartością (pojedynczego testu) powiązaną z wartością statystyki testowej. Benjamini-Hochberg FDR jest obliczany w dwóch krokach ( = # pvalues , = # pvalues): p z 0 N 0 ≤ p 0p0 p z0 N0 ≤ p0 N
Teraz zrozummy to. (Bayesowska) idea polega na tym, że obserwacje pochodzą z mieszanki dwóch rozkładów:
Obserwuje się połączenie tych dwóch:
Definicje (bayesowskie) to:
Jak pokazano poniżej, Fdr odpowiada FDR Benjamini hocherg, gdy (co ma miejsce w większości badań bioinformatycznych)π0≈1
(Na podstawie wnioskowania statystycznego dotyczącego wieku komputerowego Efron & Tibshirani )
źródło