Chcę wygenerować fabułę opisaną w książce ElemStatLearn „Elementy statystycznego uczenia się: eksploracja danych, wnioskowanie i przewidywanie. Drugie wydanie” Trevora Hastiego i Roberta Tibshirani i Jerome Friedmana. Fabuła jest:
Zastanawiam się, jak mogę stworzyć ten dokładny wykres R
, szczególnie zwróć uwagę na grafikę i obliczenia siatki, aby pokazać granicę.
r
data-visualization
k-nearest-neighbour
littleEinstein
źródło
źródło
Odpowiedzi:
Aby odtworzyć tę liczbę, musisz mieć zainstalowany pakiet ElemStatLearn w systemie. Sztuczny zestaw danych został wygenerowany
mixture.example()
zgodnie ze wskazaniami @StasK.Wszystkie trzy ostatnie polecenia pochodzą z pomocy online dla
mixture.example
. Zauważ, że wykorzystaliśmy fakt, żeexpand.grid
ustawimy jego wynik, zmieniającx
najpierw, co pozwala dodatkowo indeksować (według kolumny) kolory wprob15
macierzy (o wymiarze 69x99), która przechowuje proporcję głosów dla zwycięskiej klasy dla każdej współrzędnej sieci (px1
,px2
).źródło
mixture.example
? Spójrz na konfigurację symulacji poniżej linii, zaczynając od# Reproducing figure 2.4, page 17 of the book:
w sekcji przykładowej.help(mixture.example)
lubexample(mixture.example)
polecenia R (po załadowaniu wymaganego pakietu za pomocąlibrary(ElemStatLearn)
). Kod do generowania sztucznego zestawu danych (nie do generowania ryc. 2.4) jest zapisany zwykłym literą R w sekcji Przykład.ggplot
w podobnym celu. Sprawdź to: ESL 2.1: Regresja liniowa vs. KNN .Uczę się języka angielskiego i staram się przeanalizować wszystkie przykłady podane w książce. Właśnie to zrobiłem i możesz sprawdzić kod R poniżej:
źródło
5>>
itp.