Jaki jest przykład idealnej kolinearności pod względem macierzy projektowej ?
Chciałbym przykład, w którym nie można oszacować, ponieważ nie jest odwracalny.
regression
multicollinearity
matrix
matrix-inverse
TsTeaTime
źródło
źródło
Odpowiedzi:
Oto przykład z 3 zmiennymi, , i , powiązanymi równaniemy x1 x2
gdzieε∼N(0,1)
Konkretne dane to
Jest więc oczywiste, że jest wielokrotnością stąd mamy idealną kolinearność.x2 x1
Możemy napisać model jako
gdzie:
Więc mamy
Teraz obliczamy wyznacznikXX′ :
W R możemy to pokazać w następujący sposób:
utworzyć
x2
wielokrotnośćx1
tworzyć Y, liniowej kombinacji
x1
,x2
a niektóre losowościobseruj to
nie można oszacować wartości
x2
współczynnika:Matryca modelu to:X
Więc jestXX′
który nie jest odwracalny, jak pokazuje
Lub:
źródło
Oto kilka dość powszechnych scenariuszy zapewniających doskonałą wielokoliniowość, tj. Sytuacje, w których kolumny macierzy projektowej są liniowo zależne. Przypomnijmy z algebry liniowej, że oznacza to liniową kombinację kolumn macierzy projektowej (których współczynniki nie są równe zeru), która jest równa zeru. Podałem kilka praktycznych przykładów, które pomagają wyjaśnić, dlaczego ta pułapka tak często się zdarza - napotkałem prawie wszystkie!
Jedna zmienna jest wielokrotnością drugiej , niezależnie od tego, czy istnieje termin przechwytujący: być może dlatego, że dwukrotnie zarejestrowałeś tę samą zmienną przy użyciu różnych jednostek (np. „Długość w centymetrach” jest dokładnie 100 razy większa niż „długość w metrach”) lub ponieważ zarejestrowałeś zmienną raz jako liczbę surową i raz jako proporcję lub procent, gdy mianownik jest stały (np. „obszar skolonizowanej szalki Petriego” i „procent skolonizowanej szalki Petriego” będą dokładnymi wielokrotnościami, jeśli obszar każdej szalki Petriego jest taka sama). Mamy kolinearność, ponieważ jeśli gdzie w i x są zmiennymi (kolumny macierzy projektu) i awja= a xja w x za jest stałą skalarną, a następnie jest liniową kombinacją zmiennych równą zero.1 ( w⃗ ) - a ( x⃗ )
Jest to termin przechwytują i jedna zmienna różni się od innej poprzez stałą : to się stanie, jeśli centrum zmienną ( ) i obejmują zarówno surowego X i skoncentrowane w w regresji. Stanie się tak również, jeśli twoje zmienne są mierzone w różnych układach jednostek, które różnią się stałą, np. Jeśli w to „temperatura w stopniach Kelvina”, a x jako „temperatura w ° C”, to w i = x i + 273,15 . Jeśli uznamy termin przechwytywania za zmienną, która zawsze ma wartość 1 (reprezentowana jako kolumna jedności,wja= xja- x¯ x w w x wi=xi+273.15 1 , w macierzy obliczeniowej), wówczas posiadaniewi=xi+kdla pewnej stałejkoznacza, że1( → w )-1( → x )-k( → 1 n)jest kombinacją liniowąw,xi1kolumny macierzy projektu, która jest równa zero.1⃗ n wi=xi+k k 1(w⃗ )−1(x⃗ )−k(1⃗ n) w x 1
Istnieje wyraz przechwytujący, a jedna zmienna jest dana przez afiniczną transformację innej : tzn. Masz zmienne i x , powiązane przez w i = a x i + b, gdzie a i b są stałymi. Dzieje się tak na przykład, jeśli znormalizujesz zmienną jako z i = x i - ˉ xw x wi=axi+b a b i obejmują zarówno surowiecXi znormalizowanychZzmiennych w regresji. Dzieje się tak również wtedy, gdy zapisujeszwjako „temperaturę w ° F” ixjako „temperaturę w ° C”, ponieważ te układy jednostek nie mają wspólnego zera, ale są powiązane przezwi=1,8xi+32. Lub w kontekście biznesowym, załóżmy, że istnieje stały kosztb(np obejmujące dostawę) dla każdego zamówienia, a także koszt$na jednostkę sprzedanego; a następnie, jeśli$wagito koszt rzęduIixizi=xi−x¯sx x z w x wi=1.8xi+32 b $a $wi i xi jest liczbą zamówionych jednostek, mamy . Liniowa kombinacja odsetek wynosi 1 ( → w ) - a ( → x ) - b ( → 1 n ) = → 0 . Zauważ, że jeśli a = 1 , to (3) obejmuje (2) jako szczególny przypadek; jeśli b = 0 , to (3) obejmuje (1) jako szczególny przypadek.wi=axi+b 1(w⃗ )−a(x⃗ )−b(1⃗ n)=0⃗ a=1 b=0
Istnieje pojęcie przechwytywania i suma kilku zmiennych jest stała (np. W słynnej „sztucznej pułapce zmiennych”) : na przykład, jeśli masz „odsetek zadowolonych klientów”, „odsetek niezadowolonych klientów” i „odsetek klientów niezadowolonych ani niezadowolony ”, wówczas te trzy zmienne będą zawsze (z wyjątkiem błędu zaokrąglania) sumować do 100. Jedna z tych zmiennych - lub alternatywnie termin przechwytujący - musi zostać usunięta z regresji, aby zapobiec kolinearności. „Sztuczna pułapka zmiennej” występuje, gdy używasz zmiennych wskaźnikowych (częściej, ale rzadziej nazywanych „manekinami”) dla każdego możliwego poziomu zmiennej kategorialnej. Załóżmy na przykład, że wazony są produkowane w kolorach czerwonym, zielonym lub niebieskim. Jeśli zarejestrowałeś zmienną kategorialną „
red
green
iblue
byłyby zmiennymi binarnymi, przechowywanymi jak1
dla „tak” i0
dla „nie”), to dla każdej wazy tylko jedna ze zmiennych byłaby jedna, a zatemred + green + blue = 1
. Ponieważ dla terminu przecięcia istnieje wektor jedynek, kombinacja liniowa1(red) + 1(green) + 1(blue) - 1(1) = 0
. Zwykle lekarstwem tutaj jest albo upuścić punkt przechwytywania, albo upuścić jeden ze wskaźników (np. Pominąćred
), który staje się poziomem odniesienia lub odniesienia. W tym przypadku współczynnik regresji dlagreen
oznaczałby zmianę średniej odpowiedzi związanej z przejściem z czerwonego wazonu na zielony, utrzymując stałe inne zmienne objaśniające.large + medium + small = 1
1(large) + 1(medium) + 1(small) - 1(red) - 1(green) - 1(blue) = 0
red=0
green=1
blue = 1(1) - 1(red) - 1(green) = 1 - 0 - 1 = 0
Jedna zmienna jest stała i zerowa , niezależnie od tego, czy istnieje termin przechwytujący: w badaniu obserwacyjnym zmienna będzie stała, jeśli twoja próbka nie wykazuje wystarczającej (żadnej!) Zmienności. Mogą występować różnice w populacji, które nie są rejestrowane w próbie, np. Jeśli istnieje bardzo powszechna wartość modalna: być może wielkość próbki jest zbyt mała i dlatego jest mało prawdopodobne, aby zawierała jakiekolwiek wartości, które różniłyby się od trybu, lub twoje pomiary były niewystarczająco dokładne, aby wykryć małe różnice w trybie. Alternatywnie mogą istnieć teoretyczne powody braku zmienności, szczególnie jeśli studiujesz subpopulację. W badaniu właściwości nowo budowanych w Los Angeles nie byłoby zaskoczeniem, że każdy punkt danych max 1(x⃗ ) 0⃗
AgeOfProperty = 0
iState = California
Przykłady danych z kodem R.
(1) Jedna kolumna jest wielokrotnością drugiej
(2) Pojęcie przechwytywania i jedna zmienna różni się od drugiej stałą
(3) Pojęcie przechwytywania i jedna zmienna jest transformacją afiniczną drugiej
(4) Pojęcie przechwytywania i suma kilku zmiennych jest stała
(4a) Pojęcie przechwytywania za pomocą sztucznej zmiennej pułapki
(5) Dwa podzbiory zmiennych o ustalonej sumie
(6) Jedna zmienna jest liniową kombinacją innych
(7) Jedna zmienna jest stała i zero
(8) Pojęcie przechwytywania i jedna zmienna stała
(9) Dwie stałe zmienne
źródło
Kilka trywialnych przykładów pomocnych w intuicji:
Istnieje wiele sposobów, dzięki którym jedna kolumna danych będzie liniową funkcją innych danych. Niektóre z nich są oczywiste (np. Metry vs. centymetry), podczas gdy inne mogą być bardziej subtelne (np. Wiek i lata nauki dla młodszych dzieci).
źródło