Czytam tutaj artykuł z Wikipedii na temat modeli statystycznych i jestem nieco zaniepokojony znaczeniem „nieparametrycznych modeli statystycznych”, a konkretnie:
Model statystyczny jest nieparametryczny, jeśli zestaw parametrów ma nieskończony wymiar. Model statystyczny jest semiparametryczny, jeśli ma zarówno parametry skończone, jak i nieskończenie wymiarowe. Formalnie, jeśli jest wymiarem a jest liczbą próbek, zarówno modele półparametryczne, jak i nieparametryczne mają wartość jako . Jeśli jako n \ rightarrow \ infty , wówczas model jest półparametryczny; w przeciwnym razie model jest nieparametryczny.Θ n d → ∞ n → ∞ d / n → 0 n → ∞
Rozumiem, że jeśli wymiar (rozumiem to dosłownie liczbę parametrów) modelu jest skończony, to jest to model parametryczny.
Dla mnie nie ma sensu to, w jaki sposób możemy stworzyć model statystyczny, który ma nieskończoną liczbę parametrów, tak że możemy go nazwać „nieparametrycznym”. Co więcej, nawet jeśli tak było, dlaczego „nie”, skoro w rzeczywistości istnieje nieskończona liczba wymiarów? Wreszcie, skoro przychodzę do tego z podstaw uczenia maszynowego, czy jest jakaś różnica między tym „nieparametrycznym modelem statystycznym” a powiedzmy „nieparametrycznymi modelami uczenia maszynowego”? Wreszcie, jakie mogą być konkretne przykłady takich „nieparametrycznych nieskończonych modeli wymiarowych”?
źródło
Odpowiedzi:
Jak odpowiedział Johnnyboycurtis, metody nieparametryczne to te, które nie zakładają rozkładu populacji ani wielkości próby w celu wygenerowania modelu.
Model k-NN jest przykładem modelu nieparametrycznego, ponieważ nie uwzględnia on żadnych założeń do opracowania modelu. Naiwne Bayesa lub K-średnie jest przykładem parametrycznym, ponieważ zakłada rozkład do tworzenia modelu.
Na przykład, K-oznacza zakłada, że do opracowania modelu Wszystkie klastry są sferyczne (iid Gaussa). Wszystkie osie mają taki sam rozkład, a tym samym wariancję. Wszystkie klastry mają równe rozmiary.
Jeśli chodzi o k-NN, wykorzystuje on kompletny zestaw treningowy do przewidywania. Oblicza najbliższych sąsiadów z punktu testowego do prognozowania. Zakłada brak dystrybucji do tworzenia modelu.
Po więcej informacji:
źródło
Myślę, że brakuje ci kilku punktów. Po pierwsze i najważniejsze
Oto prosty (zastosowany) samouczek dotyczący niektórych modeli nieparametrycznych: http://www.r-tutor.com/elementary-statistics/non-parametric-methods
Badacz może zdecydować się na zastosowanie modelu niepolarnego w porównaniu z modelem parametrycznym, powiedzmy, regresja nieparamtryczna vs regresja liniowa, ponieważ dane naruszają założenia przyjęte przez model parametryczny. Ponieważ pochodzisz z ML, założę się, że nigdy nie nauczyłeś się typowych założeń modelu regresji liniowej. Oto odniesienie: https://statistics.laerd.com/spss-tutorials/linear-regression-using-spss-statistics.php
Naruszenie założeń może wypaczyć szacunki parametrów i ostatecznie zwiększyć ryzyko nieprawidłowych wniosków. Model nieparametryczny jest bardziej odporny na wartości odstające, relacje nieliniowe i nie zależy od wielu założeń dotyczących rozkładu populacji, a zatem może zapewnić więcej godnych zaufania wyników podczas próby wyciągania wniosków lub prognoz.
Aby uzyskać krótki samouczek na temat regresji nieparametrycznej, polecam te slajdy: http://socserv.socsci.mcmaster.ca/jfox/Courses/Oxford-2005/slides-handout.pdf
źródło
Obecnie biorę udział w kursie uczenia maszynowego, w którym stosujemy następującą definicję modeli nieparametrycznych: „Modele nieparametryczne stają się coraz bardziej skomplikowane wraz z rozmiarem danych”.
Model parametryczny
Aby zobaczyć, co to znaczy, spójrzmy na regresję liniową, model parametryczny: tam staramy się przewidzieć funkcję sparametryzowaną w : w jest niezależne od liczby obserwacji lub rozmiar twoich danych. f ( x ) = w T xw∈Rd
Modele nieparametryczne
Zamiast tego regresja jądra próbuje przewidzieć następującą funkcję: gdzie mamy punktów danych, to wagi i to funkcja jądra. Tutaj liczba parametrów jest zależna od liczby punktów danych .n α i k ( x i , x ) α i n
To samo dotyczy jądra perceptronu:
Wróćmy do twojej definicji i powiedzmy, że d to liczba . Jeśli pozwolimy to . Właśnie tego wymaga definicja wikipedii. n → ∞ d → ∞αi n→∞ d→∞
Wziąłem funkcję regresji jądra z moich slajdów i funkcję perceptronu z jądra z wikipedii: https://en.wikipedia.org/wiki/Kernel_method
źródło