Jak „kontrolujesz” czynnik / zmienną?

19

W moim rozumieniu „kontrola” może mieć dwa znaczenia w statystyce.

  1. Grupa kontrolna: W eksperymencie członek grupy kontrolnej nie jest leczony. Np .: Placebo vs. Lek: Dajesz leki jednej grupie, a nie drugiej (kontrola), co jest również określane jako „kontrolowany eksperyment”.

  2. Kontrola zmiennej: technika oddzielania efektu określonej zmiennej niezależnej. Niektóre inne nazwy nadane tym technikom to „rozliczanie”, „utrzymywanie stałej”, „kontrolowanie”, pewna zmienna. Na przykład: w badaniu oglądania piłki nożnej (podobnym lub nie lubionym) możesz chcieć poznać wpływ płci, ponieważ naszym zdaniem płeć powoduje uprzedzenia, to znaczy, że mężczyzna może bardziej lubić kobietę niż kobietę.

Moje pytanie dotyczy więc punktu (2). Dwa pytania:

Jak ogólnie „kontrolować” / „uwzględniać” zmienne. Jakie techniki są używane? (Pod względem regresji, struktura ANOVA).

Czy w powyższym przykładzie losowe wybranie mężczyzny i kobiety stanowi kontrolę? Czy „przypadkowość” jest jedną z technik kontrolowania innych efektów?

lewiatan
źródło
3
Pod względem regresji i ANOVA kontrolowanie zmiennej zwykle oznacza, że ​​zmienna została uwzględniona w modelu.
Glen
Jak mówi Glen, włączenie go do modelu jest właściwą drogą. Jednak randomizacja jest stosowana, aby zapobiec błędom wynikającym z efektów nieuwzględnionych w modelu. Po wygenerowaniu projektu często ludzie równoważą się, aby mieć pewność, że w przypadku każdego zabiegu będzie mniej więcej tyle samo osób każdej płci. Problem polegający na poleganiu wyłącznie na randomizacji i przeciwwadze polega na tym, że przekształcają to odchylenie w wariancję i dlatego trudniej jest zaobserwować, który z twoich czynników jest aktywny.
neverKnowsBest

Odpowiedzi:

16

Jak już powiedziano, kontrolowanie zwykle oznacza włączenie zmiennej do regresji (jak wskazał @EMS, nie gwarantuje to żadnego sukcesu w osiągnięciu tego, łączy się z tym ). Istnieje już kilka wysoko głosowanych pytań i odpowiedzi na ten temat, takich jak:

Przyjęte odpowiedzi na te pytania są bardzo dobrym traktowaniem pytania, które zadajesz w ramach obserwacyjnych (powiedziałbym, że korelacyjne), więcej takich pytań można znaleźć tutaj .

Jednak zadajesz swoje pytanie konkretnie w ramach eksperymentalnej lub ANOVA, możesz podać więcej przemyśleń na ten temat.

W ramach eksperymentu kontrolujesz zmienną, losowo pojedynczo (lub inne jednostki obserwacji) w różnych warunkach eksperymentalnych. Podstawowym założeniem jest, że w konsekwencji jedyną różnicą między warunkami jest leczenie eksperymentalne. Przy prawidłowym losowaniu (tj. Każda osoba ma taką samą szansę na spełnienie każdego warunku) jest to rozsądne założenie. Co więcej, tylko randomizacja pozwala wyciągnąć wnioski przyczynowe z obserwacji, ponieważ jest to jedyny sposób, aby upewnić się, że za wyniki nie odpowiadają inne czynniki.

Może być jednak konieczne kontrolowanie zmiennych w ramach eksperymentu, a mianowicie, gdy istnieje inny znany czynnik, który wpływa również na tę zmienną zależną. Aby zwiększyć moc statystyczną, dobrym pomysłem może być kontrolowanie tej zmiennej. Zwykle stosowaną w tym celu procedurą statystyczną jest analiza kowariancji (ANCOVA), która w zasadzie dodaje również zmienną do modelu.

Teraz pojawia się sedno: aby ANCOVA była rozsądna, absolutnie kluczowe jest, aby przypisanie do grup było losowe i aby zmienna towarzysząca, dla której jest kontrolowana, nie była skorelowana ze zmienną grupującą.
Jest to niestety często ignorowane, co prowadzi do niemożliwych do interpretacji wyników. Naprawdę czytelne wprowadzenie do tego dokładnego problemu (tj. Kiedy używać ANCOVA, czy nie) podaje Miller i Chapman (2001) :

Pomimo licznych technicznych zabiegów w wielu miejscach, analiza kowariancji (ANCOVA) pozostaje powszechnie niewłaściwie stosowanym podejściem do radzenia sobie z istotnymi różnicami grupowymi dotyczącymi potencjalnych zmiennych towarzyszących, szczególnie w badaniach psychopatologicznych. Opublikowane artykuły prowadzą do nieuzasadnionych wniosków, a niektóre teksty statystyczne zaniedbują ten problem. Problem z ANCOVA w takich przypadkach jest weryfikowany. W wielu przypadkach nie ma możliwości osiągnięcia powierzchownie atrakcyjnego celu „korekty” lub „kontrolowania” rzeczywistych różnic grupowych na potencjalnej zmiennej towarzyszącej. W nadziei na ograniczenie niewłaściwego użycia ANCOVA i promowanie właściwego stosowania, zapewniona jest nietechniczna dyskusja, podkreślająca merytoryczny zamęt rzadko wyrażany w podręcznikach i innych ogólnych prezentacjach, w celu uzupełnienia już dostępnych krytyków matematycznych.


Miller, GA i Chapman, JP (2001). Niezrozumienie analizy kowariancji. Journal of Abnormal Psychology , 110 (1), 40–48. doi: 10.1037 / 0021-843X.110.1.40

Henrik
źródło
Aby podkreślić punkt tego pytania (które jest bardzo często zadawane), dobrze jest wziąć pod uwagę, że po prostu włączenie zmiennej do modelu nie gwarantuje „kontroli” jej efektu, nawet przy bardzo silnych założeniach, że zmienna jest monotonicznie związany ze zmienną zależną. Zobacz artykuł, do którego link znajduje się w moim innym komentarzu.
ely
1
@EMS Dobra uwaga. Dodałem ostrzeżenie i link do początku tekstu. Edytuj tekst, jeśli uważasz, że jest więcej do dodania.
Henrik,
0

Aby kontrolować zmienną, można wyrównać dwie grupy dla odpowiedniej cechy, a następnie porównać różnicę w badanym problemie. Mogę to wyjaśnić jedynie przykładem, a nie formalnie, szkoła B to lata, więc tak.

Gdybyś powiedział:

Brazylia jest bogatsza niż Szwajcaria, ponieważ Brazylia ma dochód narodowy w wysokości 3524 miliardów dolarów, a Szwajcaria zaledwie 551 miliardów

miałbyś rację w kategoriach bezwzględnych, ale każdy, kto ukończył 12 lat i miałby wiedzę o świecie, podejrzewałby, że z tym stwierdzeniem jest coś nie tak.

Lepiej byłoby podnieść populację Switzerlands do populacji Brazylii, a następnie ponownie porównać dochód. Tak więc, gdyby populacja Switzerlands była wielkości Brazils, ich dochód wyniósłby:

(210 milionów / 8,5 milionów) * 551 miliardów dolarów = 13612 miliardów dolarów

To czyni je około 4 razy bogatszymi niż Brazylia z 3524 miliardami dolarów.

I tak, możesz również zastosować podejście per capita, w którym porównujesz średnie dochody. Ale powyższe podejście można zastosować kilka razy.

Heccate Newb
źródło
1
Wydaje się, że opisujesz jakąś formę normalizacji zamiast „kontroli” w sensie, o którym mowa w pytaniu.
whuber
Właściwie myślę, że są takie same. Jeśli tak nie uważasz, nie krępuj się
wyjaśnić
Nie sądzę, że muszę dodawać do innych odpowiedzi już pojawiających się w tym wątku.
whuber