Losowe przydzielanie jest cenne, ponieważ zapewnia niezależność leczenia od potencjalnych wyników. W ten sposób prowadzi do obiektywnych oszacowań średniego efektu leczenia. Ale inne schematy przydziału mogą również systematycznie zapewniać niezależność leczenia od potencjalnych wyników. Dlaczego więc potrzebujemy losowego przydziału? Innymi słowy, jaka jest przewaga losowego przypisywania nad nielosowymi schematami przypisywania, które również prowadzą do obiektywnego wnioskowania?
Pozwolić być wektorem przypisań do leczenia, w których każdy element ma wartość 0 (jednostka nieprzypisana do leczenia) lub 1 (jednostka przypisana do leczenia). W artykule JASA Angrist, Imbens i Rubin (1996, 446-47) mówią, że przypisanie do leczenia jest losowy, jeśli dla wszystkich i takich, że , gdzie to wektor kolumny ze wszystkimi elementami równymi 1 .
słowy, twierdzenie jest takie, że przypisanie jest losowe, jeśli jakikolwiek wektor przypisań, który obejmuje przypisań do leczenia, jest równie prawdopodobny, jak każdy inny wektor, który zawiera przypisań do leczenia.
Jednak w celu zapewnienia niezależności potencjalnych wyników od przypisania do leczenia wystarczy upewnić się, że każda jednostka w badaniu ma równe prawdopodobieństwo przypisania do leczenia. I może to łatwo nastąpić, nawet jeśli większość wektorów przydziału leczenia ma zerowe prawdopodobieństwo wyboru. Oznacza to, że może wystąpić nawet przy nielosowym przydziale.
Oto przykład. Chcemy przeprowadzić eksperyment z czterema jednostkami, w których traktowane są dokładnie dwie. Istnieje sześć możliwych wektorów przypisania:
- 1100
- 1010
- 1001
- 0110
- 0101
- 0011
gdzie pierwsza cyfra w każdej liczbie wskazuje, czy pierwsza jednostka była leczona, druga cyfra wskazuje, czy druga jednostka była leczona i tak dalej.
Załóżmy, że przeprowadzamy eksperyment, w którym wykluczamy możliwość przypisania wektorów 3 i 4, ale w którym każdy z pozostałych wektorów ma równą (25%) szansę na wybranie. Ten schemat nie jest losowym przypisaniem w sensie AIR. Ale w oczekiwaniu prowadzi to do obiektywnego oszacowania średniego efektu leczenia. I to nie jest przypadek. Każdy schemat przydziału, który daje badanym równe prawdopodobieństwo przypisania do leczenia, pozwoli na obiektywne oszacowanie ATE.
Więc: dlaczego potrzebujemy losowego przypisania w sensie AIR? Mój argument jest oparty na wnioskowaniu losowym; jeśli zamiast tego myśli się w oparciu o wnioskowanie oparte na modelu, czy definicja AIR wydaje się bardziej możliwa do obrony?
źródło
Odpowiedzi:
Jest to kontynuacja komentarza Gunga. Ogólny średni efekt leczenia nie ma znaczenia.
Załóżmy, że masz nowych przypadków cukrzycy u pacjentów w wieku od do oraz nowych pacjentów z cukrzycą powyżej . Chcesz przypisać połowę do leczenia. Dlaczego nie rzucić monetą, a na głowy leczyć wszystkich młodych pacjentów, a na ogonach leczyć wszystkich starszych pacjentów? Każdy miałby1000 5 15 1000 30 50% szansa na wybranie do leczenia, więc nie wpłynie to na średni wynik leczenia, ale wyrzuci wiele informacji. Nie byłoby zaskoczeniem, gdyby okazało się, że cukrzyca młodszych lub młodszych pacjentów reaguje znacznie lepiej lub gorzej niż starsi pacjenci z cukrzycą typu II lub ciążową. Obserwowany efekt leczenia może być bezstronny, ale na przykład miałby znacznie większe odchylenie standardowe niż w przypadku losowego przypisania i pomimo dużej próbki nie byłbyś w stanie wiele powiedzieć. Jeśli zastosujesz losowe przypisanie, wówczas z dużym prawdopodobieństwem około przypadków w każdej grupie wiekowej uzyska leczenie, dzięki czemu będziesz w stanie porównać leczenie bez leczenia w każdej grupie wiekowej. 500
Możesz być w stanie zrobić coś lepszego niż losowe przydzielanie. Jeśli zauważysz czynnik, który Twoim zdaniem może wpłynąć na odpowiedź na leczenie, możesz chcieć upewnić się, że osoby z tym atrybutem są podzielone bardziej równomiernie, niż by to miało miejsce w wyniku losowego przypisania. Losowe przypisywanie pozwala na dość dobre radzenie sobie ze wszystkimi czynnikami jednocześnie, dzięki czemu można później analizować wiele możliwych wzorców.
źródło
W twoim przykładzie możesz również pominąć 2 i 5 i nie zaprzeczaj sobie. Na poziomie przedmiotu nadal istnieje równa szansa na 1 lub 0, gdy istnieje tylko 1: 1 szansa na wybranie 1 lub 6. Ale teraz to, co zrobiłeś, usuwając 3 i 4, staje się bardziej oczywiste.
źródło
Oto kolejna zmienna czająca się lub myląca: czas (lub dryf instrumentalny, efekty przechowywania próbek itp.).
Istnieją więc argumenty przeciwko randomizacji (jak mówi Douglas: możesz zrobić coś lepszego niż randomizacja). Np. Możesz wcześniej wiedzieć, że chcesz, aby twoje skrzynki były wyważone w czasie. Tak jak wcześniej możesz wiedzieć, że chcesz zachować równowagę płci i wieku.
Innymi słowy, jeśli chcesz ręcznie wybrać jeden ze swoich 6 schematów, powiedziałbym, że 1100 (lub 0011) jest zdecydowanie złym wyborem. Zauważ, że pierwsze możliwości, które wyrzuciłeś, to te, które są najbardziej zrównoważone w czasie ... A najgorsze pozostały po tym, jak John zaproponował wyrzucenie również 2 i 5 (przeciwko którym nie protestowałeś).
Innymi słowy, twoja intuicja, które schematy są „ładne”, prowadzi niestety do złego projektu eksperymentalnego (IMHO jest to dość powszechne; być może uporządkowane rzeczy wyglądają ładniej - i na pewno łatwiej jest śledzić logiczne sekwencje podczas eksperymentu).
Możesz być w stanie radzić sobie lepiej w przypadku schematów nierandomizowanych, ale możesz także zrobić znacznie gorzej. IMHO, powinieneś być w stanie podać argumenty fizyczne / chemiczne / biologiczne / medyczne / ... za konkretny schemat nielosowy, którego używasz, jeśli wybierasz schemat nieprzypadkowy.
źródło