W wielu pakietach statystycznych, w tym SAS, SPSS i może więcej, istnieje opcja „stłumienia przechwytywania”. Dlaczego chcesz to zrobić?
regression
użytkownik333
źródło
źródło
Rozważ przypadek 3-poziomowego współzmiennika jakościowego. Jeśli ktoś ma przecięcie, wymagałoby to 2 zmiennych wskaźnikowych. Stosując zwykłe kodowanie zmiennych wskaźnikowych, współczynnik dla każdej zmiennej wskaźnikowej jest średnią różnicą w porównaniu z grupą odniesienia. Tłumiąc punkt przecięcia, otrzymalibyśmy 3 zmienne reprezentujące zmienną zmienną jakościową, a nie tylko 2. Współczynnik jest wówczas średnim oszacowaniem dla tej grupy. Bardziej konkretnym przykładem tego, gdzie można to zrobić, jest nauka o polityce, w której można studiować 50 stanów USA. Zamiast posiadania przecięcia i 49 zmiennych wskaźnikowych dla stanów, często lepiej jest tłumić przecięcie i zamiast tego mieć 50 zmiennych.
źródło
Aby zilustrować punkt @Nick Sabbe konkretnym przykładem.
Kiedyś widziałem, jak badacz przedstawił model wieku drzewa w funkcji jego szerokości. Można założyć, że gdy drzewo osiąga wiek zerowy, ma szerokość równą zero. Dlatego przechwytywanie nie jest wymagane.
źródło