Mam zestaw danych, w którym testuję pod kątem znaczących różnic między trzema populacjami w odniesieniu do około 50 różnych zmiennych. Robię to z jednej strony za pomocą testów Kruskala-Wallisa, az drugiej za pomocą testów współczynnika prawdopodobieństwa zagnieżdżonych modeli GLM (z populacją i bez jako niezależna zmienna).
W rezultacie, mam listę Kruskala-Wallisa -values z jednej strony, i co myślę są Chi kwadrat -values od porównań LRT, z drugiej strony.
Muszę zrobić jakąś formę wielokrotnej korekcji testów, ponieważ jest> 50 różnych testów, a Benjamini-Hochberg FDR wydaje się, że jest to najbardziej rozsądny wybór.
Jednak zmienne prawdopodobnie nie są niezależne, a kilka „klanów” z nich jest skorelowanych. Pytanie brzmi zatem: w jaki sposób mogę stwierdzić, czy zestaw podstawowych statystyk dla moich wartości spełnia wymagania dodatniej zależności, które są potrzebne, aby procedura Benjamini-Hochberg była nadal związana z FDR?
Artykuł Benjamini-Hochberg-Yekutieli z 2001 roku stwierdza, że warunek PRDS dotyczy wielowymiarowego rozkładu normalnego i studenckiego. Co z moim testem współczynnika wiarygodności Wartości chi kwadrat dla porównania modelu? Co z wartościami jakie mam dla testów Kruskala-Wallisa?
Mogę użyć korekcji FDR Benjamini-Hochberg-Yekutieli w najgorszym przypadku, która nie zakłada niczego na podstawie zależności, ale myślę, że w tym przypadku może być ona zbyt konserwatywna i brakuje niektórych istotnych sygnałów.
źródło
PRDS jest wystarczającym, ale nie koniecznym warunkiem dla BH do kontrolowania FDR. Sugerowałbym, abyś go użył, a także zastosować procedurę Benjamini-Yekutieli dla ogólnej zależności. Jeśli różnica wnioskowania jest duża, spróbuj wykazać, że BH kontroluje FDR w konkretnej konfiguracji za pomocą permutacji lub technik opartych na ponownym próbkowaniu, które chronią twoją strukturę zależności.
źródło