Natknąłem się na badanie, w którym pacjenci w wieku powyżej 50 lat byli pseudolosowi losowo według roku urodzenia. Jeśli rok urodzenia był liczbą parzystą, zwykła opieka, jeśli liczba nieparzysta, interwencja.
Łatwiej jest go wdrożyć, trudniej jest go obalić (łatwo sprawdzić, jakie leczenie powinien otrzymać pacjent), łatwo go zapamiętać (zadanie trwało kilka lat). Ale nadal mi się nie podoba, wydaje mi się, że właściwa randomizacja byłaby lepsza. Ale nie umiem wyjaśnić dlaczego.
Czy się mylę, czy to dobry powód, aby preferować „prawdziwą” randomizację?
experiment-design
clinical-trials
random-allocation
Jeremy Miles
źródło
źródło
Odpowiedzi:
Masz rację, by być sceptycznym. Ogólnie rzecz biorąc, należy stosować „rzeczywistą” randomizację, ponieważ zazwyczaj nie ma się pełnej wiedzy na temat istotnych czynników (nieobserwowalnych). Jeśli jeden z tych nieobserwowalnych jest skorelowany z nieparzystym lub parzystym wiekiem, to jest również skorelowany z tym, czy otrzymali leczenie. W takim przypadku nie możemy zidentyfikować efektu leczenia: obserwowane przez nas skutki mogą wynikać z leczenia lub z powodu nieobserwowanych czynników.
Nie jest to problem z prawdziwą randomizacją, w której nie oczekujemy zależności między leczeniem a nieobserwowalnością (choć oczywiście w przypadku małych próbek może tam być).
Aby skonstruować historię, dlaczego ta procedura randomizacji może być problemem, załóżmy, że badanie obejmowało tylko osoby w wieku 17/18 lat, gdy, powiedzmy, wojna w Wietnamie. Z 17 nie było szansy na sporządzenie (popraw mnie, jeśli się mylę), podczas gdy była szansa na 18 lat. Zakładając, że szansa była nieistotna i że doświadczenie wojenne zmienia ludzi, oznacza to, że lata później te dwie grupy różnią się, chociaż dzieli ich zaledwie rok. Być może więc leczenie (lek) wygląda na to, że nie działa, ale ponieważ otrzymała je tylko grupa z weteranami z Wietnamu, może to wynikać z faktu, że nie działa na osoby z PTSD (lub innymi czynnikami związanymi z bycie weteranem). Innymi słowy, obie grupy (leczenie i kontrola) muszą być identyczne, z wyjątkiem leczenia, aby zidentyfikować efekt leczenia.
Więc jeśli nie możesz wykluczyć, że nie ma nieobserwowanych różnic między grupami (ale jak to zrobić, jeśli nie jest to obserwowane?), Prawdziwa randomizacja jest lepsza.
źródło
Warto od czasu do czasu podtrzymywać sprzeczne poglądy, więc zacznę od podania kilku powodów przemawiających za tą pseudolosową randomizacją. Zasadniczo różnią się one nieznacznie od innych form systematycznego pobierania próbek, takich jak pobieranie próbek czynników środowiskowych w punktach siatki na polu lub pobieranie próbek z każdego innego drzewa w sadzie, dlatego pobieranie próbek może mieć porównywalne zalety .
Analogia tutaj jest idealna: wiek był „ułożony w siatkę” z roku na rok, zaczynając od zera i przypisania do grup naprzemiennie wzdłuż tej (jednowymiarowej) siatki. Niektóre zalety tego podejścia to zagwarantowanie szerokiego, równomiernego rozproszenia próbki na polu lub w sadzie (lub w tym przypadku wieku), co pomaga wyrównać wpływy związane z lokalizacją (lub czasem). Może to być szczególnie przydatne, gdy teoria sugeruje, że lokalizacja jest dominującym czynnikiem w zmienności odpowiedzi. Co więcej, z wyjątkiem naprawdę małych próbek, analizując dane tak, jakbybyły prostą próbą losową, która wprowadza stosunkowo niewielki błąd. Ponadto możliwa jest pewna randomizacja: w polu możemy losowo wybrać początek i orientację siatki. W niniejszym przypadku możemy przynajmniej losowo ustalić, czy lata parzyste są podmiotami kontrolnymi czy leczonymi.
Kolejną zaletą próbkowania w siatce jest wykrywanie zlokalizowanej zmienności. W terenie byłyby to „kieszenie” nietypowych odpowiedzi. Statystycznie możemy myśleć o nich jako przejawach korelacji przestrzennej. W obecnej sytuacji, jeśli istnieje szansa, że stosunkowo wąski przedział wiekowy doświadcza nietypowych reakcji, wówczas projekt w kratkę jest doskonałym wyborem, ponieważ projekt czysto losowy może przypadkowo zawierać duże luki wiekowe w obrębie jednej z grup. (Ale lepszym rozwiązaniem może być rozwarstwienie: użyj parytetu wieku, aby utworzyć dwie warstwy analityczne, a następnie, niezależnie w obrębie każdej warstwy, randomizuj pacjentów do grup kontrolnych i leczonych).
źródło
Zgadzam się, że podany przez ciebie przykład jest dość nieszkodliwy, ale ...
Jeśli zaangażowani agenci (osoba przeprowadzająca interwencję lub osoby biorące interwencję) dowiedzą się o schemacie przydziału, mogą z niego skorzystać. Taki wybór powinien być dość oczywisty, dlaczego jest problematyczny w większości eksperymentalnych projektów.
Jeden z przykładów, jaki znam w kryminologii, jest taki; Eksperyment miał na celu przetestowanie odstraszającego efektu nocy w więzieniu po sporze domowym, a nie tylko proszenie sprawcy o wyjście na noc. Oficerowie otrzymali broszurę z arkuszami, a kolor bieżącego arkusza na górze miał na celu określenie, jakiego traktowania sprawca. w tym szczególnym incydencie miał zostać przyjęty.
Ostatecznie zdarzyło się, że oficerowie celowo nie zastosowali się do projektu badania i wybrali arkusz oparty na osobistych preferencjach dotyczących tego, co należy zrobić ze sprawcą. Nie jest wykluczone, że podejrzewasz, że podobne kroczenie lat jest co najmniej możliwe w twoim przykładzie.
źródło
Całkowita randomizacja oparta na losowym rozkładzie nie jest przewidywalna, w twoim przypadku wiadomo, czy sprawa zostanie przypisana do interwencji lub kontroli przed potwierdzeniem kwalifikowalności.
źródło