Podczas przeprowadzania regresji wielomianowej dla na ludzie czasami używają surowych wielomianów, czasem ortogonalnych wielomianów. Ale kiedy używają tego, co wydaje się całkowicie arbitralne.X
Tu i tutaj używane są surowe wielomiany. Ale tu i tutaj wydaje się, że ortogonalne wielomiany dają prawidłowe wyniki. Co, jak, dlaczego ?!
W przeciwieństwie do tego, gdy uczymy się o regresji wielomianowej z podręcznika (np. ISLR ), który nawet nie wspomina o surowych lub ortogonalnych wielomianach - podaje się tylko model, który należy dopasować.
Kiedy więc musimy korzystać z czego?
I dlaczego poszczególne wartości p dla , itd. Różnią się znacznie między tymi dwiema wartościami?X 2
regression
polynomial
l7ll7
źródło
źródło
Odpowiedzi:
Zmienne i X 2 nie są liniowo niezależne. Więc nawet jeśli nie ma efektu kwadratowa, dodając X 2 do modelu zmodyfikuje szacowany efekt X .X X2) X2) X
Spójrzmy na bardzo prostą symulację.
Teraz z kwadratowym terminem w modelu, aby pasował.
Oczywiście test zbiorczy jest nadal znaczący, ale myślę, że wynik, którego szukamy, nie jest ten. Rozwiązaniem jest użycie wielomianów ortogonalnych.
Zauważ, że współczynniki
x
w pierwszym modelu ipoly(x,2)1
w drugim modelu nie są równe, a nawet przecięcia są różne. Jest tak, ponieważpoly
dostarcza wektory ortonormalne, które są również ortogonalne względem wektorarep(1, length(x))
. Takpoly(x,2)1
nie jest,x
ale raczej(x -mean(x))/sqrt(sum((x-mean(x))**2))
...Ważną kwestią jest to, że testy Walda w tym ostatnim modelu są niezależne. Możesz użyć ortogonalnych wielomianów, aby zdecydować, do jakiego stopnia chcesz przejść, po prostu patrząc na test Walda: tutaj decydujesz się zachować ale nie X 2 . Oczywiście można znaleźć ten sam model, porównując dwa pierwsze dopasowane modele, ale w ten sposób jest to prostsze - jeśli weźmiesz pod uwagę wyższe stopnie, jest to o wiele prostsze.X X2)
Gdy już zdecydujesz, które warunki zachować, możesz wrócić do surowych wielomianów i X 2 w celu interpretacji lub prognozowania.X X2)
źródło
Aby naiwnie ocenić sytuację:
Dlatego pod względem przewidywania nie ma (w tym przypadku) różnicy.
Naturalne pytanie powstaje, jeśli istnieje najlepszy skrócony system podstawowy. Jednak odpowiedź na to pytanie nie jest ani prosta, ani niepowtarzalna i zależy na przykład od definicji słowa „najlepszy”, tj. Od tego, co próbujesz zarchiwizować.
źródło