Co to jest mieszanie danych?

Odpowiedzi:

10

http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml04.icdm06long.pdf Niektóre dokumenty, które pomogą ci lepiej zrozumieć, czym jest mieszanie. Myślę, że możesz także wyszukiwać w zespole / uczyć się, a także układać w stosy.

Twoje ogólne zrozumienie „mieszania wyników z wielu modeli i uzyskiwania lepszych wyników” jest jednak poprawne.

Król
źródło
Link ten został również wzięty gdzieś na forum kaggle. Zapisałem tylko link do pliku pdf, ale nie dyskusję ...
King
12

Wzmocnienie (jak wspomniano w połączonej dyskusji) to metoda, która łączy zestaw algorytmów, aby uzyskać wynik lepszy niż w przypadku dowolnego pojedynczego algorytmu. Na przykład losowe lasy to metoda łączenia różnych drzew klasyfikacyjnych dla algorytmu klasyfikacyjnego. Takie podejście jest formalnie nazywane uśrednianiem zespołu (chociaż algorytm zwykle stosuje zasadę większości). Mieszanie wydaje się słowem, które niektórzy używają do opisania udoskonalonego podejścia do klasyfikacji.

Michael R. Chernick
źródło
Czy można to nazwać mieszaniem, jeśli zastąpię drzewa klasyfikacji w normalnym modelu Adaboost innym zestawem algorytmów?
TomHall,
Cześć, Michael. Twoja odpowiedź jest naprawdę pomocna, ale szkoda, że ​​jestem nowy w statystykach i nie mam wystarczającej reputacji, aby głosować na twoją odpowiedź.
TomHall,
1
Pamiętaj więc, aby to zrobić po uzyskaniu kilku punktów powtórzeń.
Michael R. Chernick
0

W branży mieszanie danych nie dotyczy modeli, ale przetwarzania wstępnego : to kiedy dane są scalane, pochodzą z różnych źródeł, takich jak baza danych i inne dane z plików CSV.

Make42
źródło