Zmienna wskaźnikowa dla danych binarnych: {-1,1} vs {0,1}

Ja zainteresowany interakcji leczeniem współzmienną w kontekście doświadczeń / randomizacją z binarnego przypisywania traktowania wskaźnik $T$ .

W zależności od konkretnej metody / źródła widziałem zarówno $T=\{1,0\}$ i dla leczonych i nieleczonych pacjentów. $T=\{1, -1\}$

Czy jest jakaś reguła, kiedy używać lub ? $\{1,0\}$ $\{1, -1\}$

Czym różni się interpretacja?

binary-data categorical-encoding cecefuss
źródło

FWIW ... Ten pierwszy link zapewnia dość kompleksowy przegląd różnych schematów kodowania ... ats.ucla.edu/stat/r/library/contrast_coding.htm Ten drugi link omawia kodowanie ( pozorne ), efektowe i ortogonalne (kontrastowe) ... faculty.cas.usf.edu/mbrannick/regression/anova1.html

Mike Hunter

Odpowiedzi:

Interpretacja zarówno estymatora zmiennej wskaźnikowej, jak i przecięcia jest różna. Zacznijmy od : $\{1,0\}$

Powiedz, że masz następujący model

y_{i} = β_{0} + t r e a t m e n t \cdot β_{1}

$y_i = \beta_0 + treatment\cdot\beta_1$

gdzie

t r e a t m e n t = {\begin{cases} 0 & if placebo \\ 1 & if drug \end{cases}

$treatment = \begin{cases} 0 & \text{if placebo} \\ 1 & \text{if drug} \end{cases}$

W takim przypadku można skończyć z następujących wzorów dla : $y_i$

y_{ja} = {\begin{cases} β_{0} + 0 \cdot β_{1} = β_{0} & jeśli placebo \\ β_{0} + 1 \cdot β_{1} = β_{0} + β_{1} & jeśli lek \end{cases}

$y_i = \begin{cases} \beta_0 + 0\cdot\beta_1 = \beta_0 & \text{if placebo} \\ \beta_0 + 1\cdot\beta_1 = \beta_0 + \beta_1 & \text{if drug} \end{cases}$

Tak więc interpretacja jest efektem placebo, a interpretacja jest różnicą między efektem placebo a działaniem leku. W efekcie można interpretować jako ulepszenie oferowane przez lek. $\beta_0$ $\beta_1$ $\beta_1$

Spójrzmy teraz na : $\{-1,1\}$

Następnie masz następujący model (ponownie):

y_{ja} = β_{0} + t r mi za t m mi n t \cdot β_{1}

$y_i = \beta_0 + treatment\cdot\beta_1$

ale gdzie

t r e a t m e n t = {\begin{cases} - 1 & if placebo \\ 1 & if drug \end{cases}

$treatment = \begin{cases} -1 & \text{if placebo} \\ 1 & \text{if drug} \end{cases}$

W takim przypadku można skończyć z następujących wzorów dla : $y_i$

y_{i} = {\begin{cases} β_{0} + - 1 \cdot β_{1} = β_{0} - β_{1} & if placebo \\ β_{0} + 1 \cdot β_{1} = β_{0} + β_{1} & if drug \end{cases}

$y_i = \begin{cases} \beta_0 + -1\cdot\beta_1 = \beta_0 - \beta_1& \text{if placebo} \\ \beta_0 + 1\cdot\beta_1 = \beta_0 + \beta_1 & \text{if drug} \end{cases}$

Interpretacja jest tutaj taka, że jest średnią efektu placebo i działania leku, a jest różnicą między dwoma terapiami w stosunku do tej średniej. $\beta_0$ $\beta_1$

Więc którego używasz?

Interpretacja w jest zasadniczo punktem odniesienia. Ustawiasz pewne standardowe leczenie, a wszystkie inne zabiegi (może być ich wiele) są porównywane z tym standardem / linią bazową. Zwłaszcza, gdy zaczynasz dodawać inne zmienne towarzyszące, łatwo jest to zinterpretować w odniesieniu do standardowego pytania medycznego: jak te leki różnią się od placebo lub ustalonego leku? $\beta_0$ $\{0,1\}$

Ale ostatecznie wszystko jest kwestią interpretacji, którą wyjaśniłem powyżej. Powinieneś więc ocenić swoje hipotezy i sprawdzić, która interpretacja sprawia, że wyciąganie wniosków jest najprostsze.

JAD
źródło

Stała przy stosowaniu kodowania -1, 1 jest średnią, gdy liczba respondentów w grupie leczonej jest taka sama jak liczba respondentów w grupie kontrolnej.

Maarten Buis,

@MaartenBuis Jest średnią

wtw konstrukcja jest zrównoważony, ale poza tym to nadal jest średnią z tych dwóch środków Group, który jest co miałem na myśli. Zmieniłem sformułowanie, aby to odzwierciedlić.

y

$y$

JAD

Pomocny. Zawsze staram się zachęcać do używania wskaźnika słowa zamiast manekina (jak w pierwotnym pytaniu!) Z co najmniej dwóch powodów. Po pierwsze, słyszałem zbyt wiele historii, w których prezentacje poszły bardzo źle, ponieważ terminy takie jak „obojętny płeć” były bardzo źle interpretowane jako dyskredytujące lub obraźliwe przez mniej techniczne osoby. Po drugie, pojęcie manekin sprawia, że całe urządzenie przypomina trochę krówki lub unik, podczas gdy jest to metoda idealnie czysta i elegancka. Nie mam wielkiej szansy na zmianę zakorzenionych praktyk w niektórych dziedzinach, ale tutaj próbuję.

Nick Cox,

Zgadzam się, brzmi również bardziej profesjonalnie. Ponadto jest to lepszy opis tego, co faktycznie robi.

JAD

Cieszę się, że się zgadzasz. Oto prosty sposób na wyjaśnienie: nazywa się go wskaźnikiem, ponieważ wskazuje!

Nick Cox,

W kontekście regresji liniowej jest bardziej naturalną (i standardową) metodą kodowania zmiennych binarnych (umieszczając je po lewej stronie prawej strony regresji). Jak wyjaśnia @Jarko Dubbeldam, możesz oczywiście użyć innej interpretacji, a znaczenie współczynników będzie inne. $x_i \in \{0, 1\}$

Dla przykładu, kodowanie zmiennych wyjściowych jest standardem podczas programowania lub wyprowadzania matematyki leżącej u podstaw maszyn wektorów wsparcia . (Wywołując biblioteki, chcesz przekazać dane w formacie, którego oczekuje biblioteka, prawdopodobnie jest to sformułowanie 0, 1). $y_i \in \{-1, 1\}$

Spróbuj użyć notacji, która jest standardowa dla tego, co robisz / używasz.

Dla każdego rodzaju modelu liniowego z terminem przechwytującym obie metody będą równoważne w tym sensie, że są powiązane prostą transformacją liniową. Matematycznie nie ma znaczenia, czy używasz macierzy danych czy macierzy danych gdzie ma pełną rangę. W ogólny model liniowy, szacunkowe współczynniki albo sposób będą związane przez liniowej transformacji i dopasowanymi wartościami będą takie same. $X$ $\tilde{X} = XA$ $A$ $A$ $\hat{y}$

Matthew Gunn
źródło

+1, nie mogłem wymyślić ustawienia, w którym użyto

{- 1, 1}

$\{-1,1\}$

JAD

Adaboost jest kolejny przykład, że zastosowania

y_{i} \in {- 1, 1}

$y_i\in\{-1,1\}$

Francis

Ogólnie można powiedzieć, że

jest używane głównie w klasyfikacji, ponieważ sprawia, że zastosowanie funkcji znaku jest możliwym sposobem klasyfikacji.

{- 1, 1}

$\{-1,1\}$

JAD

@matthewgunn Autor mówi o zmiennych towarzyszących, tj. danych wejściowych, a nie wyjściowych. {-1, 1} ma sens dla wektorów wsparcia dla danych wyjściowych, ale nie ma znaczenia dla danych wejściowych. Zobacz tutaj: en.wikipedia.org/wiki/Support_vector_machine#Linear_SVM

Francisco Arceo

@FranciscoArceo Punkt zajęty; Zredagowałem, by być bardziej precyzyjnym.

Matthew Gunn,

Jest to bardziej abstrakcyjne (i być może bezużyteczne), ale zauważę, że te dwie reprezentacje są w sensie matematycznym faktycznie reprezentacjami grupowymi i istnieje między nimi izomorfizm.

Znaczenie zmiennej wskaźnikowej , w sercu boolowskiej, brzmi „czynnik jest prawdziwy” lub „czynnik jest fałszywy”. Biorąc pod uwagę dwa zdarzenia i , możesz zapytać „czy czynniki tych dwóch zdarzeń są równoważne, np. Czy oba są prawdziwe, czy oba fałszywe?” W logice boolowskiej jest to . Definiuje to strukturę grupy . Teraz $T$ $T_1$ $T_2$ $T_1 \Leftrightarrow T_2$ $\mathbb{Z}_2$ i oba tworzą reprezentacje tej grupy, z operacjami grupy ${1,0}$ ${1,-1}$ i . Izomorfizm od pierwszej reprezentacji do drugiej jest wyrażony przez . $a \Leftrightarrow b = 1 - (a+b)$ $a \Leftrightarrow b = ab$ $\phi(a) = 2*a-1$

$p$ $T$ $T \Leftrightarrow T'$ $p' \Leftrightarrow p = pp' + (1-p)(1-p')$ $t(p) = 2p-1$ $t \Leftrightarrow t' = tt'$ $t$

jwimberley
źródło

To imponujące, ale uważam, że wystarczy zauważyć, że wszelka prawidłowa korespondencja między {-1, 1} a {0, 1} musi być bezpośrednia: nie ma potrzeby powoływania się na nic poza matematyką w szkole średniej. Koniecznie mówimy o tych samych informacjach, tylko inaczej zakodowanych.

Nick Cox,