„Zmienna manekina” i „zmienna wskaźnika” to często używane etykiety, aby opisać członkostwo w kategorii z kodowaniem 0/1; zazwyczaj 0: nie należy do kategorii, 1: należy do kategorii.
W dniu 26.11.2014 r. Szybkie wyszukiwanie na scholar.google.com (wraz z cytatami) ujawnia, że „zmienna fikcyjna” jest używana w około 318 000 artykułów, a „zmienna wskaźnikowa” jest używana w około 112 000 artykułów. Termin „zmienna fikcyjna” ma również znaczenie w matematyce niestatystycznej „ zmienna związana ”, co prawdopodobnie przyczynia się do większego wykorzystania „zmiennej fikcyjnej” w artykułach indeksowanych.
Moje tematycznie powiązane pytania:
- Czy te warunki są zawsze synonimami (w ramach statystyk)?
- Czy którykolwiek z tych warunków nigdy zadowalająco zastosować do innych form kategoryczny kodowania (np efekt kodowania , Helmert kodowania, itp )?
- Jakie są przyczyny statystyczne lub dyscyplinarne, aby preferować jeden termin nad drugim?
male
przypadku wartości1
lub0
. Jeśli istnieje zmienna kategorialna z więcej niż 2 kategoriami, która jest następnie rozszerzana na zmienne wskaźnikowe dla członkostwa na każdym poziomie, użyłbym „zmiennych zastępczych” do opisania tego zestawu zmiennych wskaźnikowych.sex
.male
, gdzie 1 oznacza prawda (w tym przypadku mężczyzna), a 0 oznacza fałsz (w tym przypadku kobieta). Jeśli użyję nazwy zmiennejsex
, będę musiał sprawdzić, jak zakodowałem tę zmienną za każdym razem, gdy wracam do tego zestawu danych.Odpowiedzi:
Powiedziałbym, że „zmienna fikcyjna” jest bardziej ogólnym sposobem na odniesienie do (jednej) zmiennych numerycznych, które reprezentują (razem reprezentują) predyktor jakościowy; dlatego termin ten ma również zastosowanie do tych używanych w kodowaniu Helmerta i efektach † . Wynika to głównie z ogólnego użycia „manekina” w znaczeniu „stand-in”. „Zmienna wskaźnika” Odnoszę się do funkcji wskaźnika ‡ - więc mogą one wynosić tylko jeden lub zero, co oznacza posiadanie lub brak właściwości; dlatego termin ten ma zastosowanie tylko do tych używanych w kodowaniu na poziomie odniesienia ※ . Oczywiście niektórzy ludzie używają „fałszywego kodowania” w znaczeniu „kodowania na poziomie odniesienia”; prawdopodobnie mają bardziej ograniczoną definicję „zmiennych fikcyjnych”, a przynajmniej tak powinno być.
† A jeśli nie nazywają te „manekiny”, co należy do nich zadzwonić?
‡ Tak więc np. Manekin jest zmienną wskaźnikową, gdy i- ta osoba u i jest mężczyzną (członek zbioru M ): x i = 1 M ( u i ) = { 1 w h e n u i ∈ M 0 w h e n u i ∉ Mxja ja uja M.
gdzie jest funkcją wskaźnik przynależności M .1M.( ⋅ ) M.
※ Lub, jak wskazał @gung, kodowanie oznacza poziom.
źródło
źródło