Mam trochę danych i chcę zbudować model (powiedzmy model regresji liniowej) z tych danych. W następnym kroku chcę zastosować weryfikację krzyżową Leave-One-Out (LOOCV) na modelu, aby zobaczyć, jak dobrze sobie radzi.
Jeśli dobrze zrozumiałem LOOCV, buduję nowy model dla każdej z moich próbek (zestaw testowy), używając każdej próbki oprócz tej próbki (zestaw treningowy). Następnie używam modelu do przewidywania zestawu testowego i obliczania błędów .
W następnym kroku agreguję wszystkie błędy wygenerowane przy użyciu wybranej funkcji, na przykład średni błąd kwadratu. Mogę wykorzystać te wartości do oceny jakości (lub dobrego dopasowania) modelu.
Pytanie: Który model jest modelem, do którego odnoszą się te wartości jakości, więc który model powinienem wybrać, jeśli uznaję wskaźniki wygenerowane z LOOCV za odpowiednie dla mojego przypadku? LOOCV przyjrzał się różnym modelom (gdzie jest wielkością próby); który model powinienem wybrać?n
- Czy to model, który wykorzystuje wszystkie próbki? Ten model nigdy nie został obliczony podczas procesu LOOCV!
- Czy to model ma najmniejszy błąd?
źródło
Odpowiedzi:
Najlepiej jest myśleć o walidacji krzyżowej jako sposobie szacowania wydajności generalizacji modeli generowanych przez określoną procedurę, a nie samego modelu. Weryfikacja krzyżowa z pominięciem jednego z nich jest zasadniczo oszacowaniem wydajności uogólnienia modelu wyuczonego na próbkach danych, co ogólnie jest nieco pesymistycznym oszacowaniem wydajności modelu wyuczonego na próbkach.nn - 1 n
Zamiast wybierać jeden model, należy dopasować model do wszystkich danych i użyć LOO-CV, aby zapewnić nieco konserwatywne oszacowanie wydajności tego modelu.
Zauważ jednak, że LOOCV ma dużą wariancję (wartość, którą otrzymasz, różni się bardzo, jeśli użyjesz innej losowej próbki danych), co często sprawia, że jest to zły wybór estymatora do oceny wydajności, nawet jeśli jest w przybliżeniu bezstronny. Używam go cały czas do wyboru modelu, ale tak naprawdę tylko dlatego, że jest tani (prawie darmowy dla modeli jądra, nad którymi pracuję).
źródło