Co to jest „jądro” w prostym języku angielskim?

73

Istnieje kilka różnych zastosowań:

  • Szacowanie gęstości jądra
  • sztuczka jądra
  • wygładzanie jądra

Wyjaśnij, co znaczy „jądro” w nich, zwykłym angielskim, własnymi słowami.

Neil McGuigan
źródło
3
Nie chcę być niegrzeczny, ale czy nie jest to pytanie, na które już udzielono odpowiedzi na nudności w Wikipedii i tym podobnych? Google dał mi odpowiedź w ciągu 15 sekund ...
Joris Meys,
46
Absolutnie nie znoszę odpowiedzi na wikipedię dla statystyk. Są chaotyczne, symboliczne bałagany. Szukam klejnotu odpowiedzi, który może wyjaśnić odpowiedź zwykłym angielskim, ponieważ uważam, że pokazuje to głębszy poziom zrozumienia niż równanie matematyczne. Istnieje wiele popularnych pytań „po angielsku” i nie bez powodu.
Neil McGuigan,

Odpowiedzi:

39

Zarówno w statystyce (szacowanie gęstości jądra lub wygładzanie jądra), jak i literaturze dotyczącej uczenia maszynowego (metody jądra), jądro jest stosowane jako miara podobieństwa. W szczególności funkcja jądra Określa rozkład podobieństw punktów wokół danego punktu . oznacza podobieństwo punktu do innego podanego punktu .k(x,.)xk(x,y)xy

ebony1
źródło
To dobry sposób na wyrażenie tego. Zastanawiam się, czy możesz uogólnić ten opis, aby zastosować go również do jądra „szacowania gęstości jądra”.
shabbychef
2
W pewnym sensie tak. Jednym ze sposobów zrozumienia szacowania gęstości jądra jest przybliżenie gęstości punktu z pewnego rozkładu jako średniej ważonej jego podobieństw z zestawem punktów z rozkładu. Pojęcie podobieństwa również odgrywa tutaj pewną rolę.
ebony1
1
Rozumiem „jądro” w statystykach, które pierwotnie zapożyczono z żargonu używanego w dyskusji na temat równań całkowych.
Nick Cox,
42

Wydaje się, że istnieją co najmniej dwa różne znaczenia „jądra”: jedno częściej używane w statystykach; drugi w uczeniu maszynowym.

W statystykach „jądro” jest najczęściej używane w odniesieniu do szacowania gęstości jądra i wygładzania jądra .

Proste wyjaśnienie jądra w szacowaniu gęstości można znaleźć ( tutaj ).

W uczeniu maszynowym „jądro” jest zwykle używane w odniesieniu do sztuczki jądra , metody wykorzystującej klasyfikator liniowy do rozwiązania problemu nieliniowego „poprzez mapowanie oryginalnych obserwacji nieliniowych w przestrzeń o wyższych wymiarach”.

Prostą wizualizacją może być wyobrażenie sobie, że wszystkie klasy znajdują się w promieniu źródła w płaszczyźnie x, y (klasa : ); a wszystkie klasy znajdują się poza promieniem w tej płaszczyźnie (klasa : ). Nie jest możliwy separator liniowy, ale wyraźnie okrąg o promieniu doskonale oddzieli dane. Możemy przekształcić dane w trójwymiarową przestrzeń, obliczając trzy nowe zmienne , i0r0x2+y2<r21r1x2+y2>r2rx2y22xy. Dwie klasy będą teraz rozdzielane płaszczyzną w tej trójwymiarowej przestrzeni. Równanie tej optymalnie oddzielającej hiperpłaszczyzny, gdzie i to , w tym przypadku pomijając . (Jeśli okrąg jest przesunięty względem początku, optymalna oddzielająca hiperpłaszczyzna również będzie się różnić w .) Jądro jest funkcją mapowania, która oblicza wartość danych dwuwymiarowych w przestrzeni trójwymiarowej.z1=x2,z2=y2z1+z2=1z3z3z3=2xyz1+z2=1z3z3

W matematyce istnieją inne zastosowania „jąder” , ale wydają się one być głównymi w statystykach.

Thylacoleo
źródło
1
Bardzo dobrze! Użyję twojego przykładu z kółkiem, aby wyjaśnić metody jądra, ponieważ jest to najlepsza wizualizacja, jaką do tej pory spotkałem. Dzięki!
Joris Meys,
1
Idąc za przykładem Thylacoleo, używając koła do wyjaśnienia sztuczki jądra (nie mam wystarczającej reputacji, aby dodać komentarz bezpośrednio do jego odpowiedzi) Czy w równaniu była oddzielna prosta literówka? i powinno to być z1 + z2 = r ^ 2, zamiast z1 + z2 = 1? A może źle zrozumiałem? Zgadzam się, że to ładny prosty przykład ilustrujący tę koncepcję. Dzięki. Chociaż definicja Z3 wciąż wydaje się nieco tajemnicą, ale najwyraźniej nie ma to znaczenia dla przykładu skoncentrowanego na początku.
Alex Blakemore,
Tak, była literówka. Dzięki za to Alex. Nie zawsze poprawiam :-)
Thylacoleo,
1
Poniższy film został zaproponowany przez anonimowego potencjalnego redaktora jako „świetna wizualizacja tego, co wyjaśnił Thylacoleo:” youtube.com/watch?v=3liCbRZPrZA
gung
Czy używamy produktów wewnętrznych do mapowania danych dwuwymiarowych na trójwymiarowe?
SmallChess