Ogólny błąd typu I podczas wielokrotnego testowania gromadzących dane

12

Mam pytanie dotyczące grupowych metod sekwencyjnych .

Według Wikipedii:

W randomizowanym badaniu z dwiema grupami leczenia stosuje się klasyczne sekwencyjne badanie grupowe w następujący sposób: Jeśli dostępnych jest n osobników w każdej grupie, przeprowadzana jest analiza tymczasowa na 2 osobach. Analizę statystyczną przeprowadza się w celu porównania dwóch grup, a jeśli hipoteza alternatywna zostanie zaakceptowana, badanie zostanie zakończone. W przeciwnym razie próba będzie kontynuowana dla kolejnych 2n pacjentów, z n osobnikami na grupę. Analizę statystyczną przeprowadza się ponownie na 4n osobach. Jeśli alternatywa zostanie zaakceptowana, wówczas próba zostanie zakończona. W przeciwnym razie kontynuuje się okresowe oceny, aż dostępnych będzie N zestawów 2n przedmiotów. W tym momencie przeprowadzany jest ostatni test statystyczny, a badanie jest przerywane

Ale poprzez wielokrotne testowanie gromadzących dane w ten sposób poziom błędu typu I jest zawyżony ...

Gdyby próbki były od siebie niezależne, ogólny błąd typu I, , byłbyα

α=1(1α)k

gdzie to poziom każdego testu, zaś to liczba tymczasowych wyglądów.kαk

Ale próbki nie są niezależne, ponieważ się pokrywają. Zakładając, że analizy okresowe są przeprowadzane z jednakowymi przyrostami informacji, można stwierdzić, że (slajd 6)

wprowadź opis zdjęcia tutaj

Czy możesz mi wyjaśnić, w jaki sposób uzyskano ten stół?

ocram
źródło

Odpowiedzi:

12

Poniższe slajdy, do 14, wyjaśniają ten pomysł. Chodzi o to, jak zauważasz, że sekwencja statystyk jest skorelowana.

Kontekstem jest test Z ze znanym odchyleniem standardowym. Pierwsza statystyka testowa , odpowiednio wystandaryzowana, ma rozkład normalny (0,1) z cdf . Podobnie robi druga statystyka , ale - ponieważ pierwsza wykorzystuje podzbiór danych użytych do drugiej - dwie statystyki są skorelowane ze współczynnikiem korelacji . Dlatego ma rozkład dwumianowy. Prawdopodobieństwo błędu typu I (zgodnie z hipotezą zerową) jest równe prawdopodobieństwu, że (a) błąd typu I wystąpi w pierwszym teście lub (b) błąd typu I nie wystąpi w pierwszym teście, ale wystąpi w drugi test. Niech Φ z 2 z1Φz2 (z1,z2)C=Φ - 1 (1-0,05/2)a-| z1| >c| z1| c| z2| >c1/2(z1,z2)c=Φ1(10.05/2)być wartością krytyczną (dla testu dwustronnego o wielkości nominalnej = 0,05). Wtedy szansa na błąd typu I po dwóch analizach równa się szansie, że lub i . Całkowanie numeryczne daje wartość 0,0831178 dla tego prawdopodobieństwa, zgodnie z tabelą. Kolejne wartości w tabeli są uzyskiwane z podobnym uzasadnieniem (i bardziej skomplikowanymi integracjami).α|z1|>c|z1|c|z2|>c

Ta grafika przedstawia binormalny plik pdf i region integracji (jednolita powierzchnia). Binormal PDF, wykres powierzchni 3D

Whuber
źródło
Rozumiem, dziękuję! Czy trudno jest uzyskać korelację kore (z1, z2)?
ocram
@ Marco, Korelacja jest łatwa do obliczenia, ponieważ statystyka testu jest tak prosta: jest to liniowa kombinacja zmiennych normalnych. (Jest tak, ponieważ zakładamy, że wariancja jest znana.) Alternatywnie możesz myśleć o drugiej statystyce jako o sumie dwóch niezależnych zmiennych losowych: pierwszej, , plus zmiany utworzonej przez dodatkowe dane, . W bardziej skomplikowanych przypadkach korelacja może być dość trudna do obliczenia: to jeden z powodów, dla których ta nieco wyidealizowana sytuacja służy do motywowania kolejnych testów! z 1 - z 2z1z1z2
whuber
Dziękuję Ci bardzo. Tak, korelacja wydaje się dość łatwa do obliczenia. W rzeczywistości nie było dla mnie jasne, że kontekstem było porównanie średnich dwóch rozkładów normalnych. Teraz jest jasne, a wszystko inne jest bardzo jasne! Dziękuję Ci!
ocram
czy możesz podać wzór (lub kod R), jak to obliczyć dla np. n = 400? Zrobiłbym to sam, ale niestety nie wiem jak. I jak musiałbym dostosować wzór, jeśli chcę obliczyć ogólny poziom błędu, jeśli mam wiele porównań (np. Porównując 4 proporcje) i nie robię korekty jak Bonferroni i powtarzam testy? Czy możesz mi w tym pomóc?
Andreas