Rozważ regresję liniową z pewną regularyzacją: Np. Znajdź który minimalizuje | | A x - b | | 2 + λ | | x | | 1
Zwykle kolumny A są znormalizowane, aby miały średnią zerową i normę jednostkową, podczas gdy jest wyśrodkowany, aby mieć średnią zerową. Chcę się upewnić, czy moje rozumienie przyczyny standaryzacji i centrowania jest prawidłowe.
Przez zastosowanie średnich kolumn i B zero, nie potrzebujemy już terminu przechwytywania. W przeciwnym razie celem byłby | | A x - x 0 1 - b | | 2 + λ | | x | | 1 . Ustawiając normy kolumn A na 1, usuwamy możliwość przypadku, w którym tylko dlatego, że jedna kolumna A ma bardzo wysoką normę, otrzymuje niski współczynnik x , co może prowadzić do błędnego wniosku, że ta kolumna A nie „ dobrze wyjaśnia” x .
To rozumowanie nie jest dokładnie rygorystyczne, ale intuicyjne, czy to właściwy sposób myślenia?
$x$ does not ''explain'' $A$ well
i masz na myślix does not ''explain'' $A$ at all
? to dane, podczas gdy x to model w tym przypadku.