Zmienna wskaźnikowa dla danych binarnych: {-1,1} vs {0,1}

10

Ja zainteresowany interakcji leczeniem współzmienną w kontekście doświadczeń / randomizacją z binarnego przypisywania traktowania wskaźnik T .

W zależności od konkretnej metody / źródła widziałem zarówno T={1,0} i dla leczonych i nieleczonych pacjentów.T={1,1}

Czy jest jakaś reguła, kiedy używać lub ?{1,0}{1,1}

Czym różni się interpretacja?

cecefuss
źródło
FWIW ... Ten pierwszy link zapewnia dość kompleksowy przegląd różnych schematów kodowania ... ats.ucla.edu/stat/r/library/contrast_coding.htm Ten drugi link omawia kodowanie ( pozorne ), efektowe i ortogonalne (kontrastowe) ... faculty.cas.usf.edu/mbrannick/regression/anova1.html
Mike Hunter

Odpowiedzi:

10

Interpretacja zarówno estymatora zmiennej wskaźnikowej, jak i przecięcia jest różna. Zacznijmy od :{1,0}

Powiedz, że masz następujący model

yi=β0+treatmentβ1

gdzie

treatment={0if placebo1if drug

W takim przypadku można skończyć z następujących wzorów dla :yi

yja={β0+0β1=β0jeśli placeboβ0+1β1=β0+β1jeśli lek

Tak więc interpretacja jest efektem placebo, a interpretacja β 1 jest różnicą między efektem placebo a działaniem leku. W efekcie można interpretować β 1 jako ulepszenie oferowane przez lek.β0β1β1


Spójrzmy teraz na :{-1,1}

Następnie masz następujący model (ponownie):

yja=β0+trmizatmmintβ1

ale gdzie

treatment={1if placebo1if drug

W takim przypadku można skończyć z następujących wzorów dla :yi

yi={β0+1β1=β0β1if placeboβ0+1β1=β0+β1if drug

Interpretacja jest tutaj taka, że jest średnią efektu placebo i działania leku, a β 1 jest różnicą między dwoma terapiami w stosunku do tej średniej.β0β1


Więc którego używasz?

Interpretacja w { 0 , 1 } jest zasadniczo punktem odniesienia. Ustawiasz pewne standardowe leczenie, a wszystkie inne zabiegi (może być ich wiele) są porównywane z tym standardem / linią bazową. Zwłaszcza, gdy zaczynasz dodawać inne zmienne towarzyszące, łatwo jest to zinterpretować w odniesieniu do standardowego pytania medycznego: jak te leki różnią się od placebo lub ustalonego leku?β0{0,1}

Ale ostatecznie wszystko jest kwestią interpretacji, którą wyjaśniłem powyżej. Powinieneś więc ocenić swoje hipotezy i sprawdzić, która interpretacja sprawia, że ​​wyciąganie wniosków jest najprostsze.

JAD
źródło
6
Stała przy stosowaniu kodowania -1, 1 jest średnią, gdy liczba respondentów w grupie leczonej jest taka sama jak liczba respondentów w grupie kontrolnej.
Maarten Buis,
@MaartenBuis Jest średnią wtw konstrukcja jest zrównoważony, ale poza tym to nadal jest średnią z tych dwóch środków Group, który jest co miałem na myśli. Zmieniłem sformułowanie, aby to odzwierciedlić. y
JAD
9
Pomocny. Zawsze staram się zachęcać do używania wskaźnika słowa zamiast manekina (jak w pierwotnym pytaniu!) Z co najmniej dwóch powodów. Po pierwsze, słyszałem zbyt wiele historii, w których prezentacje poszły bardzo źle, ponieważ terminy takie jak „obojętny płeć” były bardzo źle interpretowane jako dyskredytujące lub obraźliwe przez mniej techniczne osoby. Po drugie, pojęcie manekin sprawia, że ​​całe urządzenie przypomina trochę krówki lub unik, podczas gdy jest to metoda idealnie czysta i elegancka. Nie mam wielkiej szansy na zmianę zakorzenionych praktyk w niektórych dziedzinach, ale tutaj próbuję.
Nick Cox,
Zgadzam się, brzmi również bardziej profesjonalnie. Ponadto jest to lepszy opis tego, co faktycznie robi.
JAD
2
Cieszę się, że się zgadzasz. Oto prosty sposób na wyjaśnienie: nazywa się go wskaźnikiem, ponieważ wskazuje!
Nick Cox,
6

W kontekście regresji liniowej jest bardziej naturalną (i standardową) metodą kodowania zmiennych binarnych (umieszczając je po lewej stronie prawej strony regresji). Jak wyjaśnia @Jarko Dubbeldam, możesz oczywiście użyć innej interpretacji, a znaczenie współczynników będzie inne.xi{0,1}

Dla przykładu, kodowanie zmiennych wyjściowych jest standardem podczas programowania lub wyprowadzania matematyki leżącej u podstaw maszyn wektorów wsparcia . (Wywołując biblioteki, chcesz przekazać dane w formacie, którego oczekuje biblioteka, prawdopodobnie jest to sformułowanie 0, 1).yi{1,1}

Spróbuj użyć notacji, która jest standardowa dla tego, co robisz / używasz.


Dla każdego rodzaju modelu liniowego z terminem przechwytującym obie metody będą równoważne w tym sensie, że są powiązane prostą transformacją liniową. Matematycznie nie ma znaczenia, czy używasz macierzy danych czy macierzy danych ˜ X = X A, gdzie A ma pełną rangę. W ogólny model liniowy, szacunkowe współczynniki albo sposób będą związane przez liniowej transformacji A i dopasowanymi wartościami y będą takie same.XX~=XAAAy^

Matthew Gunn
źródło
+1, nie mogłem wymyślić ustawienia, w którym użyto . {1,1}
JAD
Adaboost jest kolejny przykład, że zastosowania yi{1,1}
Francis
5
Ogólnie można powiedzieć, że jest używane głównie w klasyfikacji, ponieważ sprawia, że ​​zastosowanie funkcji znaku jest możliwym sposobem klasyfikacji. {1,1}
JAD
@matthewgunn Autor mówi o zmiennych towarzyszących, tj. danych wejściowych, a nie wyjściowych. {-1, 1} ma sens dla wektorów wsparcia dla danych wyjściowych, ale nie ma znaczenia dla danych wejściowych. Zobacz tutaj: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM
Francisco Arceo
@FranciscoArceo Punkt zajęty; Zredagowałem, by być bardziej precyzyjnym.
Matthew Gunn,
2

Jest to bardziej abstrakcyjne (i być może bezużyteczne), ale zauważę, że te dwie reprezentacje są w sensie matematycznym faktycznie reprezentacjami grupowymi i istnieje między nimi izomorfizm.

Znaczenie zmiennej wskaźnikowej , w sercu boolowskiej, brzmi „czynnik jest prawdziwy” lub „czynnik jest fałszywy”. Biorąc pod uwagę dwa zdarzenia T 1 i T 2 , możesz zapytać „czy czynniki tych dwóch zdarzeń są równoważne, np. Czy oba są prawdziwe, czy oba fałszywe?” W logice boolowskiej jest to T 1T 2 . Definiuje to strukturę grupy Z 2 . Teraz 1 ,TT1T2T1T2Z2 i 1 , - 1 oba tworzą reprezentacje tej grupy, z operacjami grupy a b = 1 - ( a1,01,1 i odpowiednio b = a b . Izomorfizm od pierwszej reprezentacji do drugiej jest wyrażony przez ϕ ( a ) = 2 a - 1 .ab=1(a+b)ab=abϕ(a)=2a1

pTTTpp=pp+(1p)(1p)t(p)=2p1tt=ttt

jwimberley
źródło
To imponujące, ale uważam, że wystarczy zauważyć, że wszelka prawidłowa korespondencja między {-1, 1} a {0, 1} musi być bezpośrednia: nie ma potrzeby powoływania się na nic poza matematyką w szkole średniej. Koniecznie mówimy o tych samych informacjach, tylko inaczej zakodowanych.
Nick Cox,