Prosty język oznaczeń „zależnych” i „niezależnych” testów w literaturze z wieloma porównaniami?

18

Zarówno w literaturze dotyczącej wskaźnika błędu rodzinnego (FWER), jak i wskaźnika fałszywego wykrywania (FDR), określone metody kontrolowania FWER lub FDR są odpowiednie do testów zależnych lub niezależnych. Na przykład w artykule z 1979 r. „Prosta sekwencyjnie wielokrotna procedura testowa wielokrotnego testu” Holm napisał, aby skontrastować swoją metodę podwyższania Šidáka z metodą zwiększania kontroli Bonferroniego:

Tę samą prostotę obliczeniową uzyskuje się, gdy statystyki testu są niezależne .

W „Controlling the False Discovery Rate” Benjaminiego i Hochberga (1995) autorzy piszą:

Twierdzenie 1. W przypadku niezależnych statystyk testowych i dowolnej konfiguracji hipotez fałszywie zerowych powyższa procedura kontroluje FDR w .q

Później, w 2001 r., Benjamini i Jekutieli piszą:

1.3 Problem . Gdy próbuje użyć podejście FDR w praktyce zależne statystyki testowe są spotykane częściej niż niezależnych te, przykład wiele punktów końcowych z powyższych bycia przykładem.

Jakie szczególne znaczenie niezależnego zależnego używają ci autorzy? Byłbym szczęśliwy z formalnych definicji tego, co czyni testy zależnymi lub niezależnymi od siebie, jeśli towarzyszą im wyjaśnienia w prostym języku.

Mogę wymyślić kilka różnych możliwych znaczeń, ale nie do końca rozumiem, które mogą być:

  • „Zależny” oznacza testy wielowymiarowe (tj. Wiele zmiennych zależnych z tymi samymi lub podobnymi predyktorami); niezależny oznacza testy jednowymiarowe (tj. wiele zmiennych niezależnych, jedna zmienna zależna).

  • „Zależny” oznacza testy oparte na sparowanych / dopasowanych osobnikach (np. Sparowany test t , ANOVA z powtarzanymi pomiarami itp.); „niezależny” oznacza niesparowane / niezależne projekty badań próbek.

  • „Zależny” oznacza, że ​​prawdopodobieństwo odrzucenia testu jest skorelowane z prawdopodobieństwem odrzucenia innego testu, a „dodatnia zależność” oznacza, że ​​ta korelacja jest dodatnia; „niezależny” oznacza, że ​​prawdopodobieństwo odrzucenia jest nieskorelowane.

Odniesienia
Benjamini, Y. i Hochberg, Y. (1995). Kontrolowanie częstotliwości fałszywych odkryć: praktyczne i skuteczne podejście do wielokrotnych testów . Journal of the Royal Statistics Society. Seria B (metodologiczna) , 57 (1): 289–300.

Benjamini, Y. i Yekutieli, D. (2001). Kontrola współczynnika fałszywych odkryć w wielu testach w zależności od zależności . Annals of Statistics , 29 (4): 1165–1188.

Holm, S. (1979). Prosta sekwencyjna procedura wielokrotnego testowania . Scandinavian Journal of Statistics , 6 (65-70): 1979.

Alexis
źródło
1
Statystyka testowa jest zmienną losową. „Niezależny” w tym kontekście ma dokładnie to samo znaczenie, co ma dla dowolnego zestawu zmiennych losowych.
whuber
Dzięki @whuber masz jakąkolwiek szansę, aby zamienić to w odpowiedź? :)
Alexis,

Odpowiedzi:

13

1/201/201/2020 różne testy.

20

201/2020(1-0,05)200,361-0,36=0,64

2020

(ANOVA radzi sobie z tym problemem za pomocą ogólnego testu F. Jest to swego rodzaju porównanie „rządzić nimi wszystkimi”: nie będziemy ufać porównaniu między grupami, chyba że najpierw ten test F będzie znaczący.)

(p1,p2),,pn)nnz nich w ramach jednej decyzji. W przeciwnym razie najlepsze, co zwykle możemy zrobić, to polegać na przybliżonych granicach (które są na przykład podstawą korekty Bonferroniego).

Wspólne rozkłady niezależnych zmiennych losowych są łatwe do obliczenia. W literaturze rozróżnia się zatem tę sytuację od przypadku braku niezależności.

W związku z tym poprawne znaczenie „niezależnych” w cytatach ma zwykłe znaczenie statystyczne dla niezależnych zmiennych losowych.


n(x1,,xm)μμ=0p1μ=1p2)(p1,p2))

Whuber
źródło
+1 Dziękuję, kurwa! Czy w przypadku przykładu ANOVA każde porównanie par po ANOVA, w którym testowane są wszystkie możliwe pary, byłoby „zależne”, czy tylko przypadek, w którym jedna grupa jest porównywana z wyborem innych? (Myślę, że ten pierwszy, ale chcę mieć pewność).
Alexis,
2
W ANOVA wariancja reszt jest szacowana na podstawie wszystkich danych. Zatem dowolne dwa porównania będą (nieznacznie) zależne choćby z tego powodu, nawet jeśli porównania nie mają wspólnych grup. Gdy porównania mają wspólne grupy (takie jak „A” vs „C” i „B” vs „C”), zależność jest bardziej oczywista i wyraźna.
whuber