Co jest nie tak z (niektórymi) pseudolosami?

23

Natknąłem się na badanie, w którym pacjenci w wieku powyżej 50 lat byli pseudolosowi losowo według roku urodzenia. Jeśli rok urodzenia był liczbą parzystą, zwykła opieka, jeśli liczba nieparzysta, interwencja.

Łatwiej jest go wdrożyć, trudniej jest go obalić (łatwo sprawdzić, jakie leczenie powinien otrzymać pacjent), łatwo go zapamiętać (zadanie trwało kilka lat). Ale nadal mi się nie podoba, wydaje mi się, że właściwa randomizacja byłaby lepsza. Ale nie umiem wyjaśnić dlaczego.

Czy się mylę, czy to dobry powód, aby preferować „prawdziwą” randomizację?

Jeremy Miles
źródło
1
Witamy na stronie! Cieszę się, że widzisz tutaj swój post.
Andy W
Dzięki powyższym odpowiedziom lepiej czuję się „losowo” do DZIEŃ urodzenia! Dziwny dzień na leczenie, nawet dzień na kontrolę ... Adalberto
AADF
6
@Adalberto To pomija główny punkt, a mianowicie to, że jakakolwiek określona, ​​nieprzypadkowa procedura przypisywania pacjentów do grup nie może być pewna, że ​​ma pożądane właściwości, które ma procedura zrandomizowana. Załóżmy, że spędzasz lata na takich badaniach dopiero później, aby recenzent wskazał nieoczekiwany, ale silny pomieszanie między leczeniem a parytetem dnia urodzenia? Ponieważ nie możemy przewidzieć wszystkich takich problemów, omijamy problem za pomocą losowego przypisania.
whuber

Odpowiedzi:

28

Masz rację, by być sceptycznym. Ogólnie rzecz biorąc, należy stosować „rzeczywistą” randomizację, ponieważ zazwyczaj nie ma się pełnej wiedzy na temat istotnych czynników (nieobserwowalnych). Jeśli jeden z tych nieobserwowalnych jest skorelowany z nieparzystym lub parzystym wiekiem, to jest również skorelowany z tym, czy otrzymali leczenie. W takim przypadku nie możemy zidentyfikować efektu leczenia: obserwowane przez nas skutki mogą wynikać z leczenia lub z powodu nieobserwowanych czynników.

Nie jest to problem z prawdziwą randomizacją, w której nie oczekujemy zależności między leczeniem a nieobserwowalnością (choć oczywiście w przypadku małych próbek może tam być).

Aby skonstruować historię, dlaczego ta procedura randomizacji może być problemem, załóżmy, że badanie obejmowało tylko osoby w wieku 17/18 lat, gdy, powiedzmy, wojna w Wietnamie. Z 17 nie było szansy na sporządzenie (popraw mnie, jeśli się mylę), podczas gdy była szansa na 18 lat. Zakładając, że szansa była nieistotna i że doświadczenie wojenne zmienia ludzi, oznacza to, że lata później te dwie grupy różnią się, chociaż dzieli ich zaledwie rok. Być może więc leczenie (lek) wygląda na to, że nie działa, ale ponieważ otrzymała je tylko grupa z weteranami z Wietnamu, może to wynikać z faktu, że nie działa na osoby z PTSD (lub innymi czynnikami związanymi z bycie weteranem). Innymi słowy, obie grupy (leczenie i kontrola) muszą być identyczne, z wyjątkiem leczenia, aby zidentyfikować efekt leczenia.

Więc jeśli nie możesz wykluczyć, że nie ma nieobserwowanych różnic między grupami (ale jak to zrobić, jeśli nie jest to obserwowane?), Prawdziwa randomizacja jest lepsza.

Bezimienny
źródło
Dzięki. Niezły przykład. (Zapomniałem nazwać to pseudolosową, zredagowałem to w pytaniu).
Jeremy Miles
2
(+1) Kiedy czytałem to pytanie, Wietnam był pierwszym przykładem, który natychmiast przyszedł mi do głowy. Zabawnie było widzieć, że wybrałeś ten sam sprzęt. Podejrzewam, że jest to najbardziej oczywisty wybór, biorąc pod uwagę podany wiek badanych, choć wiek od wczesnych do połowy lat 60. jest nieco bliższy.
kardynał
Przepraszamy za pingowanie poza tematem: Meta sugeruje, aby uczynić [randomized-eksperyment] synonimem tagu [random-przydział] ( stats.meta.stackexchange.com/a/4651 ). Masz wystarczająco dużo reputacji w tym tagu, aby zagłosować na tę sugestię tutaj: stats.stackexchange.com/tags/random-allocation/synonimy - teraz potrzeba 4 głosów poparcia. Jeśli nie zgadzasz się z propozycją, rozważ skomentowanie Meta, aby wyjaśnić dlaczego. Wkrótce usunę ten komentarz. Twoje zdrowie.
ameba mówi Przywróć Monikę
18

Warto od czasu do czasu podtrzymywać sprzeczne poglądy, więc zacznę od podania kilku powodów przemawiających za tą pseudolosową randomizacją. Zasadniczo różnią się one nieznacznie od innych form systematycznego pobierania próbek, takich jak pobieranie próbek czynników środowiskowych w punktach siatki na polu lub pobieranie próbek z każdego innego drzewa w sadzie, dlatego pobieranie próbek może mieć porównywalne zalety .

Analogia tutaj jest idealna: wiek był „ułożony w siatkę” z roku na rok, zaczynając od zera i przypisania do grup naprzemiennie wzdłuż tej (jednowymiarowej) siatki. Niektóre zalety tego podejścia to zagwarantowanie szerokiego, równomiernego rozproszenia próbki na polu lub w sadzie (lub w tym przypadku wieku), co pomaga wyrównać wpływy związane z lokalizacją (lub czasem). Może to być szczególnie przydatne, gdy teoria sugeruje, że lokalizacja jest dominującym czynnikiem w zmienności odpowiedzi. Co więcej, z wyjątkiem naprawdę małych próbek, analizując dane tak, jakbybyły prostą próbą losową, która wprowadza stosunkowo niewielki błąd. Ponadto możliwa jest pewna randomizacja: w polu możemy losowo wybrać początek i orientację siatki. W niniejszym przypadku możemy przynajmniej losowo ustalić, czy lata parzyste są podmiotami kontrolnymi czy leczonymi.

Kolejną zaletą próbkowania w siatce jest wykrywanie zlokalizowanej zmienności. W terenie byłyby to „kieszenie” nietypowych odpowiedzi. Statystycznie możemy myśleć o nich jako przejawach korelacji przestrzennej. W obecnej sytuacji, jeśli istnieje szansa, że ​​stosunkowo wąski przedział wiekowy doświadcza nietypowych reakcji, wówczas projekt w kratkę jest doskonałym wyborem, ponieważ projekt czysto losowy może przypadkowo zawierać duże luki wiekowe w obrębie jednej z grup. (Ale lepszym rozwiązaniem może być rozwarstwienie: użyj parytetu wieku, aby utworzyć dwie warstwy analityczne, a następnie, niezależnie w obrębie każdej warstwy, randomizuj pacjentów do grup kontrolnych i leczonych).

9być związane z czynnikami ważnymi dla eksperymentu. To sprawia, że ​​troska w pytaniu jest mniej niż hipotetyczna: jest prawdziwa. W tym momencie poprzednie odpowiedzi w tym wątku przedstawiają dodatkowe przemyślenia, które chciałbym zrobić, więc zatrzymam się i zapraszam do ich ponownego przeczytania.

Whuber
źródło
(+1) W szczególności w przypadku ustawienia kontrargumentu.
kardynał
13

Zgadzam się, że podany przez ciebie przykład jest dość nieszkodliwy, ale ...

Jeśli zaangażowani agenci (osoba przeprowadzająca interwencję lub osoby biorące interwencję) dowiedzą się o schemacie przydziału, mogą z niego skorzystać. Taki wybór powinien być dość oczywisty, dlaczego jest problematyczny w większości eksperymentalnych projektów.

Jeden z przykładów, jaki znam w kryminologii, jest taki; Eksperyment miał na celu przetestowanie odstraszającego efektu nocy w więzieniu po sporze domowym, a nie tylko proszenie sprawcy o wyjście na noc. Oficerowie otrzymali broszurę z arkuszami, a kolor bieżącego arkusza na górze miał na celu określenie, jakiego traktowania sprawca. w tym szczególnym incydencie miał zostać przyjęty.

Ostatecznie zdarzyło się, że oficerowie celowo nie zastosowali się do projektu badania i wybrali arkusz oparty na osobistych preferencjach dotyczących tego, co należy zrobić ze sprawcą. Nie jest wykluczone, że podejrzewasz, że podobne kroczenie lat jest co najmniej możliwe w twoim przykładzie.

Andy W.
źródło
Fajny przykład, dziękuję, ale część uzasadnienia była taka, że ​​krówki były znacznie trudniejsze - nie mogli argumentować, że prześcieradło było (powiedzmy) żółte, ponieważ mogę iść i sprawdzić datę urodzenia i sprawdzić, czy zostały poprawnie przypisane.
Jeremy Miles
3
Zgadzam się @JeremyMiles, jest to jednak kolejny powód do randomizowanych badań z podwójnie ślepą próbą. Jest to jedynie zamierzony argument przeciwko pseudolosom randomizacji - że łatwiej jest ominąć zamierzone leczenie niż faktyczna randomizacja. (Mój przykład tak naprawdę nie jest przykładem pseudolosowości, ale zwięźle ilustruje ten punkt).
Andy W
Zależy to od sposobu (prawdziwej) randomizacji - osoby zaangażowane w badanie zrobiły to częściowo, aby uniknąć problemów z subwersją. Jeśli korzystasz z rzeczywistej randomizacji, potrzebujesz dobrego prowadzenia dokumentacji, aby upewnić się, że osoba, która określa randomizację, komunikuje się z osobą zapewniającą leczenie, a osoba dostarczająca postępuje właściwie. Na twoim przykładzie, gdyby użyli numeru domu (powiedzmy), oficerowie mogliby mieć trudniejszy czas obalenia, nawet jeśli nie był to przypadek.
Jeremy Miles
1
Przepraszamy za pingowanie poza tematem: Meta sugeruje, aby uczynić [randomized-eksperyment] synonimem tagu [random-przydział] ( stats.meta.stackexchange.com/a/4651 ). Masz wystarczająco dużo reputacji w tym tagu, aby zagłosować na tę sugestię tutaj: stats.stackexchange.com/tags/random-allocation/synonimy - teraz potrzeba 4 głosów poparcia. Jeśli nie zgadzasz się z propozycją, rozważ skomentowanie Meta, aby wyjaśnić dlaczego. Wkrótce usunę ten komentarz. Twoje zdrowie.
ameba mówi Przywróć Monikę
0

Całkowita randomizacja oparta na losowym rozkładzie nie jest przewidywalna, w twoim przypadku wiadomo, czy sprawa zostanie przypisana do interwencji lub kontroli przed potwierdzeniem kwalifikowalności.

Ayat
źródło