Definicja modelu w uczeniu maszynowym

11

Ta definicja nie do końca się stosuje, ponieważ nie zawsze przyjmujemy rozkład podstawowy. Czym więc tak naprawdę jest model? Czy GBM z określonymi hiperparametrami można uznać za model? Czy model to zbiór reguł?

organiczna agawa
źródło
2
Możesz po prostu pójść o krok dalej generyczności i spojrzeć na en.wikipedia.org/wiki/Mathematical_model - większość modeli ML będzie pasować do tej definicji, nawet jeśli nie będą pasować do „modelu statystycznego” (chociaż myślę, że prawie wszyscy są przeszkoleni bez nadzoru lub nadzorowane modele ML byłyby uważane za modele statystyczne).
Neil Slater

Odpowiedzi:

7

Ostatnio zainteresowałem się tym samym pytaniem i zdałem sobie sprawę, że nie ma jednej definicji „modelu” w uczeniu maszynowym. Jest to w dużej mierze zależne od źródeł, z którymi się konsultujesz, którymi mogą być dokumentacja konkretnego programu, slang przyjęty przez społeczność użytkowników lub definicje stosowane w publikowanych artykułach naukowych, które mogą się znacznie różnić w zależności od czasopisma. Ponadto musiałem nauczyć się pamiętać, że takie artykuły są pisane nie tylko przez specjalistów w dziedzinie uczenia maszynowego, ale przez ekspertów z innych dyscyplin, którzy potrzebują zastosowania technik uczenia maszynowego (takich jak obrazowanie, różne dziedziny medycyny itp.) . Wiele z nich nie definiuje jednoznacznie terminu „model”, który jest często używany luźno. Oto tylko kilka różnych definicji „modelu” I

• Modele statystyczne, w szczególności statystyki związane z rozkładami prawdopodobieństwa.

• Dane regresji i powiązane statystyki.

• Modele matematyczne wspomniane powyżej przez Neila Slatera.

• Modele danych stosowane w uczeniu maszynowym, takie jak zaangażowane kolumny, ich typy danych, źródła danych i inne metadane. Jest to szczególnie trudne, ponieważ w tej definicji nie ma nic matematycznego, w przeciwieństwie do pierwszych trzech, które wymieniłem. Na przykład zobacz całą dokumentację dotyczącą „modeli wyszukiwania” programu SQL Server, które służą podwójnemu obciążeniu do celów uczenia maszynowego.

• Czasami wszystkie powyższe definicje są rozszerzane o struktury uczenia maszynowego zbudowane na podstawie równań i metadanych, takie jak specyfikacje sieci neuronowych. W innych przypadkach są to osobne podmioty.

Wszystkie powyższe są czasami mieszane i dopasowywane razem, w zależności od źródła. Jestem pewien, że istnieją inne definicje „modelu”, które pominąłem z tej listy, co jeszcze bardziej skomplikuje sprawę. Aby poradzić sobie z tą dwuznacznością, staram się wyćwiczyć, aby odgadnąć intencje autora, ilekroć używają terminu „model”. Czasami łatwo jest to ustalić na podstawie kontekstu lub dziedziny, w której pracuje autor, ale innym razem muszę głęboko przeczytać artykuł lub dokumentację, zanim się zorientuję. Chciałbym być bardziej jednoznaczny, ale tak naprawdę jest to naturalnie niewyraźne określenie; nigdy nie będzie prostej, uniwersalnej odpowiedzi na to pytanie. Mam nadzieję że to pomogło.

SQLServerSteve
źródło
1
Podczas gdy termin „model” może rzeczywiście mieć zastosowanie do wielu rzeczy, w kontekście uczenia maszynowego, model jest artefaktem stworzonym przez uczenie się / szkolenie - np. W przypadku sieci neuronowych wagi i tendencje tej sieci.
Syzygy
5

Podoba mi się definicja uczenia maszynowego podana przez Toma Mitchella .

Mówi się, że program komputerowy uczy się na podstawie doświadczenia E w odniesieniu do pewnej klasy zadań T i pomiaru wydajności P, jeżeli jego wydajność na zadaniach w T, mierzona przez P, poprawia się wraz z doświadczeniem E.

Biorąc pod uwagę tę definicję, powinienem powiedzieć, że modelem jest nabyte doświadczenie po wykonaniu klasy T.

omar
źródło
Czy doświadczenie E nie jest ustawione na trening?
Itamar Mushkin
4

Z artykułu na temat Amazon Machine Learning

Proces szkolenia modelu ML wymaga dostarczenia algorytmowi ML (czyli algorytmowi uczenia się) danych treningowych do nauki. The term ML model refers to the model artifact that is created by the training process.

Vlad Bezden
źródło
2

Model, mówiąc luźno, jest uproszczeniem jakiejś rzeczy lub procesu. Na przykład kształt Ziemi nie jest tak naprawdę kulą, ale możemy ją potraktować jako jedną, jeśli projektujemy kulę ziemską. Podobnie, zakładając, że wszechświat jest deterministyczny, istnieje pewien naturalny proces, który określa, czy klient kupi produkt na stronie internetowej. Możemy skonstruować coś zbliżonego do tego procesu, które możemy przekazać trochę informacji o kliencie i które mówi nam, czy sądzi, że klient kupi produkt.

„Model uczenia maszynowego” jest zatem modelem zbudowanym przez system uczenia maszynowego.

(Przepraszamy za to, że nie jest to rygorystyczna odpowiedź, ale mam nadzieję, że jest to nadal przydatne).

Ceasar Bautista
źródło
1

W paradygmacie uczenia maszynowego model odnosi się do matematycznego wyrażenia parametrów modelu wraz z wejściowymi symbolami zastępczymi dla każdej prognozy, klasy i akcji odpowiednio dla kategorii regresji, klasyfikacji i wzmocnienia.

To wyrażenie jest osadzone w pojedynczym neuronie jako model.

W przypadku perceptronu jednowarstwowego i modelu głębokiego uczenia należy wyodrębnić ten model, ostrożnie spacerując po neuronach i warstwach, aby zebrać i zszyć funkcję aktywacji w uporządkowany sposób.

cppRohit
źródło
0

W uczeniu maszynowym model jest środkiem ciężkości i wszystko obraca się wokół modelu. Chociaż różni ludzie mają różne definicje modelu. Ale moim zdaniem tutaj możemy najlepiej zdefiniować model „model uczenia maszynowego to hipoteza, która próbuje dopasować dane i nauczyć się przewidywać niewidoczne dane”.

Awais Bajwa
źródło
0

W uczeniu maszynowym model jest abstrakcją, która może wykonać przewidywanie, (ponowne) działanie lub transformację do lub w odniesieniu do wystąpienia wartości wejściowych. Model może być pojedynczą liczbą, taką jak średnia wartość zestawu obserwacji, która jest często wykorzystywana jako model podstawowy, wyrażenie wielomianowe lub zestaw reguł (np. Drzewo decyzyjne), które określają sposób generowania wyniku.

Zasadniczo model jest definiowany przez zestaw reguł i hiperparametrów, które określają strukturę modelu i jego zdolność do optymalizacji w celu wykonania danego zadania. Hiperparametrem może być stopień wielomianu lub głębokość drzewa decyzyjnego. Model można poddać procesowi optymalizacji, w którym parametry są optymalizowane pod kątem określonego celu.

Proces optymalizacji jest często określany jako szkolenie w zakresie dopasowania i daje wynik w dopasowanym modelu, który można również po prostu nazwać modelem. Jeśli model został przeszkolony lub nie trzeba go często wywnioskować z kontekstu.

Sören
źródło
0

To jest fajna dyskusja! Moje dwa centy to to, że w modelu przechowywane są informacje, które komputer może zinterpretować w celu oszacowania odwzorowań z pewnego zestawu możliwych danych wejściowych na zestaw odpowiednich wyników. Model jest niczym więcej niż mniej niż definicją prostej funkcji, która przybliża bardziej złożoną funkcję. Nie jest konieczne, aby funkcja złożona była fenomenem w świecie rzeczywistym, tylko aby model aproksymował funkcję złożoną bez przechowywania wystarczającej ilości informacji do jej doskonałego odtworzenia.

Nicholas James Bailey
źródło