Dopasowuję model o współczynniku z wieloma poziomami i dopasowanie R zajmuje naprawdę dużo czasu. Dlaczego to?
Na przykład, jeśli dopasuję regresję do przewidywania wynagrodzeń graczy i dołączę czynnik prognostyczny dla wszystkich narodowości graczy, zajęłoby to więcej czasu niż dopasowanie modelu wynagrodzeń graczy z ciągłym predyktorem, np. wysokości.
regression
categorical-data
Goldisfine
źródło
źródło
Odpowiedzi:
R jest typowy - podobnie jak większość pakietów statystycznych, wykorzystuje dekompozycję QR do regresji.
Dla stałej , gdzie , samo obliczenie samego rozkładu jest efektywnie kwadratowe w - podwojenie liczby predyktorów pomnoży czas obliczeń przez około 4.n s < < n p
Więc jeśli przejdziesz od (regresja liniowa) do powiedzenia , możesz oczekiwać, że zajmie to coś w obszarze 600 razy dłuższym (w rzeczywistości prawdopodobnie nieco mniejszym, z różnych powodów).p = 2 p = 50
Dodanie wielu predyktorów będzie oznaczało znacznie dłuższe oczekiwanie.
źródło
To dlatego, że przy współczynniku mającymk k - 1 k = 50 49
źródło