Losowe zadanie: po co zawracać sobie głowę?

9

Losowe przydzielanie jest cenne, ponieważ zapewnia niezależność leczenia od potencjalnych wyników. W ten sposób prowadzi do obiektywnych oszacowań średniego efektu leczenia. Ale inne schematy przydziału mogą również systematycznie zapewniać niezależność leczenia od potencjalnych wyników. Dlaczego więc potrzebujemy losowego przydziału? Innymi słowy, jaka jest przewaga losowego przypisywania nad nielosowymi schematami przypisywania, które również prowadzą do obiektywnego wnioskowania?

Pozwolić Zbyć wektorem przypisań do leczenia, w których każdy element ma wartość 0 (jednostka nieprzypisana do leczenia) lub 1 (jednostka przypisana do leczenia). W artykule JASA Angrist, Imbens i Rubin (1996, 446-47) mówią, że przypisanie do leczeniaZi jest losowy, jeśli Pr(Z=c)=Pr(Z=c)dla wszystkich i takich, że , gdzie to wektor kolumny ze wszystkimi elementami równymi 1 .ccιTc=ιTcι

słowy, twierdzenie jest takie, że przypisanie jest losowe, jeśli jakikolwiek wektor przypisań, który obejmuje przypisań do leczenia, jest równie prawdopodobny, jak każdy inny wektor, który zawiera przypisań do leczenia.Zimm

Jednak w celu zapewnienia niezależności potencjalnych wyników od przypisania do leczenia wystarczy upewnić się, że każda jednostka w badaniu ma równe prawdopodobieństwo przypisania do leczenia. I może to łatwo nastąpić, nawet jeśli większość wektorów przydziału leczenia ma zerowe prawdopodobieństwo wyboru. Oznacza to, że może wystąpić nawet przy nielosowym przydziale.

Oto przykład. Chcemy przeprowadzić eksperyment z czterema jednostkami, w których traktowane są dokładnie dwie. Istnieje sześć możliwych wektorów przypisania:

  1. 1100
  2. 1010
  3. 1001
  4. 0110
  5. 0101
  6. 0011

gdzie pierwsza cyfra w każdej liczbie wskazuje, czy pierwsza jednostka była leczona, druga cyfra wskazuje, czy druga jednostka była leczona i tak dalej.

Załóżmy, że przeprowadzamy eksperyment, w którym wykluczamy możliwość przypisania wektorów 3 i 4, ale w którym każdy z pozostałych wektorów ma równą (25%) szansę na wybranie. Ten schemat nie jest losowym przypisaniem w sensie AIR. Ale w oczekiwaniu prowadzi to do obiektywnego oszacowania średniego efektu leczenia. I to nie jest przypadek. Każdy schemat przydziału, który daje badanym równe prawdopodobieństwo przypisania do leczenia, pozwoli na obiektywne oszacowanie ATE.

Więc: dlaczego potrzebujemy losowego przypisania w sensie AIR? Mój argument jest oparty na wnioskowaniu losowym; jeśli zamiast tego myśli się w oparciu o wnioskowanie oparte na modelu, czy definicja AIR wydaje się bardziej możliwa do obrony?

użytkownik697473
źródło
3
Nie czytałem Angrista i wsp., Więc może coś mi umknęło, ale mam spór z twoim frazowaniem. Nie używamy losowego przydziału, aby zapewnić, że leczenie jest niezależne od potencjalnych wyników. To, czy leczenie jest niezależne od wyników w prawdziwym eksperymencie, zależy od tego, czy istnieje bezpośredni związek przyczynowy b / t leczenie i wynik. Raczej losowe przypisanie zapewnia, że ​​leczenie jest niezależne od czających się zmiennych (lub potencjalnych czynników zakłócających). Istnieje możliwość, że wynik był spowodowany czymś innym niż leczenie, które mamy nadzieję wykluczyć.
gung - Przywróć Monikę
1
@ Gung, myślę, że łączysz „potencjalne wyniki” i „wyniki”. Prawdą jest, że losowe przypisanie nie zapewnia niezależności leczenia od wyników (to znaczy od obserwowanych wyników). Ale potencjalne wyniki nie są takie same jak wyniki obserwowane, a losowe przypisanie zapewnia niezależność leczenia od potencjalnych wyników. Nie będę edytować oryginalnego postu, aby rozwinąć ten punkt; zrobienie tego zabrałoby mnie zbyt daleko od głównego tematu. Ale en.wikipedia.org/wiki/Rubin_causal_model może być pomocny w tej kwestii.
user697473
3
„Aby zapewnić niezależność potencjalnych wyników od przypisania do leczenia, wystarczy upewnić się, że każda jednostka w badaniu ma równe prawdopodobieństwo przypisania do leczenia.” To jest niepoprawne. Załóżmy, że w badaniu zapisałeś mężczyzn i kobiet. Rzuć uczciwą monetą: w przypadku głów przypisz wszystkie kobiety do grupy leczonej (i wszystkich mężczyzn do grupy kontrolnej); jeśli ogony, wszyscy mężczyźni będą w grupie leczonej, a wszystkie kobiety w grupie kontrolnej. Każdy osobnik (oczywiście) ma 50% szans na przypisanie do grupy leczonej - ale leczenie jest całkowicie pomylone z płcią. xx
whuber
1
@ whuber, twój komentarz nie brzmi poprawnie. Aby zobaczyć dlaczego, załóżmy, że = 1. Potencjalne wyniki mężczyzny to Y (1) = 1 i Y (0) = 0. (To znaczy, = 1, jeśli mężczyzna jest leczony, 0 jeśli nie.) potencjalne wyniki to Y (1) = -1 i Y (0) = 2. (Konkretne potencjalne wyniki nie mają większego znaczenia, ale małe liczby całkowite utrzymują prostotę.) Następnie E [Y (1) | Z] = E [Y (1)] = 0. Podobne równości obowiązują dla E [Y (0)]. Mówiąc bardziej ogólnie, twój mechanizm przypisania nie jest mylony z płcią i da bezstronną ocenę ATE. Jeśli coś nie rozumiem, daj mi znać. xYm
user697473,
3
Jasne, szacunek jest „bezstronny” w tym samym sensie, że zatrzymany zegar daje bezstronny szacunek czasu! W rzeczywistości jest jeszcze gorzej: ta metoda losowej selekcji daje wyniki, których nie można przypisać do leczenia, ponieważ równie dobrze można je przypisać płci. To właśnie oznacza zamieszanie. Koncentrowanie się na uzyskiwaniu obiektywnych wyników przy jednoczesnym niszczeniu wszystkich przydatnych informacji w eksperymencie to przysłowiowe wyrzucanie dziecka ...
whuber

Odpowiedzi:

8

Jest to kontynuacja komentarza Gunga. Ogólny średni efekt leczenia nie ma znaczenia.

Załóżmy, że masz nowych przypadków cukrzycy u pacjentów w wieku od do oraz nowych pacjentów z cukrzycą powyżej . Chcesz przypisać połowę do leczenia. Dlaczego nie rzucić monetą, a na głowy leczyć wszystkich młodych pacjentów, a na ogonach leczyć wszystkich starszych pacjentów? Każdy miałby100051510003050%szansa na wybranie do leczenia, więc nie wpłynie to na średni wynik leczenia, ale wyrzuci wiele informacji. Nie byłoby zaskoczeniem, gdyby okazało się, że cukrzyca młodszych lub młodszych pacjentów reaguje znacznie lepiej lub gorzej niż starsi pacjenci z cukrzycą typu II lub ciążową. Obserwowany efekt leczenia może być bezstronny, ale na przykład miałby znacznie większe odchylenie standardowe niż w przypadku losowego przypisania i pomimo dużej próbki nie byłbyś w stanie wiele powiedzieć. Jeśli zastosujesz losowe przypisanie, wówczas z dużym prawdopodobieństwem około przypadków w każdej grupie wiekowej uzyska leczenie, dzięki czemu będziesz w stanie porównać leczenie bez leczenia w każdej grupie wiekowej. 500

Możesz być w stanie zrobić coś lepszego niż losowe przydzielanie. Jeśli zauważysz czynnik, który Twoim zdaniem może wpłynąć na odpowiedź na leczenie, możesz chcieć upewnić się, że osoby z tym atrybutem są podzielone bardziej równomiernie, niż by to miało miejsce w wyniku losowego przypisania. Losowe przypisywanie pozwala na dość dobre radzenie sobie ze wszystkimi czynnikami jednocześnie, dzięki czemu można później analizować wiele możliwych wzorców.

Douglas Zare
źródło
Dziękuję Douglas. Ta odpowiedź ma dla mnie sens. Dla przypomnienia, nie miałem na myśli niczego tak ekstremalnego jak twój przykład lub przykład @ whubera powyżej. Zastanawiałem się nad przypadkami, w których eliminujemy z rozważań tylko kilka wektorów leczenia. (Rozważ przypadek, w którym klient mówi: „możesz leczyć tę osobę lub inną, ale nie jedno i drugie”). Myślę jednak, że twoje ogólne uwagi dotyczą nawet łagodniejszych przypadków, które mam na myśli.
user697473,
Myślę, że jeśli wyeliminujesz tylko kilka wektorów, nie zmienisz ilości informacji, które możesz wydobyć. Dokładne określenie tego może być nieporządne - istnieją naiwne granice, które są prawdopodobnie zbyt pesymistyczne.
Douglas Zare
@DouglasZare Mam pytanie dotyczące twojego ekstremalnego przykładu. Uważam, że celem jest ustalenie, czy leczenie jest skuteczne w populacji, która ma zarówno młodych, jak i starszych pacjentów. Następnie twoja metoda wygeneruje dwie próbki, których nie można uznać za reprezentatywną próbkę z potencjalnego rozkładu wyników którym wszyscy ludzie podejmują leczenie, i potencjalnego rozkładu wyników którym wszyscy ludzie przejmują kontrolę. Zatem twój obserwowany efekt leczenia jest stronniczyFtFc
KevinKim
1

W twoim przykładzie możesz również pominąć 2 i 5 i nie zaprzeczaj sobie. Na poziomie przedmiotu nadal istnieje równa szansa na 1 lub 0, gdy istnieje tylko 1: 1 szansa na wybranie 1 lub 6. Ale teraz to, co zrobiłeś, usuwając 3 i 4, staje się bardziej oczywiste.

Jan
źródło
Dzięki, John. Tak, masz rację. Wydaje się, że możemy wyeliminować dowolną liczbę wektorów przypisania leczenia w dowolnej kombinacji, o ile wykorzystamy pozostałe wektory w sposób, który zapewni każdej jednostce równe prawdopodobieństwo przypisania do leczenia.
user697473,
Nie sądzę, że rozumiesz co mówię. Przedstawiłem przypadek ad absurdum dla twojego argumentu, który przemawia przeciwko niemu.
John
Twój przykład jest skrajny, ale nie widzę w tym nic absurdalnego. Jest to prawidłowa demonstracja tego: nielosowe schematy przypisywania (jak przy użyciu tylko wektorów 1 i 6) mogą prowadzić bezpośrednio do obiektywnej oceny średniego efektu leczenia. Wynika z tego, że nie potrzebujemy losowego przypisania, aby uzyskać obiektywne szacunki ATE. Oczywiście mogą istnieć jeszcze powody, dla których źle jest eliminować wektory od 2 do 5. (Patrz komentarz Douglasa Zarea powyżej ). Nie przemyślałem jeszcze tych powodów.
user697473,
Powinieneś. Dlatego nie możesz ich wyeliminować.
Jan
1

Oto kolejna zmienna czająca się lub myląca: czas (lub dryf instrumentalny, efekty przechowywania próbek itp.).
Istnieją więc argumenty przeciwko randomizacji (jak mówi Douglas: możesz zrobić coś lepszego niż randomizacja). Np. Możesz wcześniej wiedzieć, że chcesz, aby twoje skrzynki były wyważone w czasie. Tak jak wcześniej możesz wiedzieć, że chcesz zachować równowagę płci i wieku.

Innymi słowy, jeśli chcesz ręcznie wybrać jeden ze swoich 6 schematów, powiedziałbym, że 1100 (lub 0011) jest zdecydowanie złym wyborem. Zauważ, że pierwsze możliwości, które wyrzuciłeś, to te, które są najbardziej zrównoważone w czasie ... A najgorsze pozostały po tym, jak John zaproponował wyrzucenie również 2 i 5 (przeciwko którym nie protestowałeś).
Innymi słowy, twoja intuicja, które schematy są „ładne”, prowadzi niestety do złego projektu eksperymentalnego (IMHO jest to dość powszechne; być może uporządkowane rzeczy wyglądają ładniej - i na pewno łatwiej jest śledzić logiczne sekwencje podczas eksperymentu).

Możesz być w stanie radzić sobie lepiej w przypadku schematów nierandomizowanych, ale możesz także zrobić znacznie gorzej. IMHO, powinieneś być w stanie podać argumenty fizyczne / chemiczne / biologiczne / medyczne / ... za konkretny schemat nielosowy, którego używasz, jeśli wybierasz schemat nieprzypadkowy.

cbeleites niezadowoleni z SX
źródło