Natknąłem się na pogłoskę, że niektóre badania wykazały, że wydajność modeli predykcyjnych zależy bardziej od wiedzy specjalisty analityka danych w zakresie wybranej metody niż od wyboru metody.
Innymi słowy, twierdzenie jest takie, że ważniejsze jest, aby analityk danych znał wybraną metodę, niż to, jak „odpowiednia” metoda wydaje się dla problemu z bardziej teoretycznego punktu widzenia.
Zostało to wspomniane w kontekście chemometrii, która wiąże się zazwyczaj z problemami wielu zmiennych (100–1000), wielokrotnej kolinearności i oczywiście zbyt małej liczby próbek. Prognozą mogła być klasyfikacja lub regresja.
Moje osobiste doświadczenie sugeruje, że jest to prawdopodobne , ale wspomniano o badaniu (zapytałem osobę, która wspomniała o tym e-mailem po szybkim, ale nieudanym wyszukiwaniu, ale nigdy nie otrzymała żadnej odpowiedzi). Jednak również przy bardziej szczegółowym wyszukiwaniu nie udało mi się wyśledzić żadnych dokumentów.
Czy ktoś jest świadomy takich ustaleń? Jeśli nie, co mówią osobiste doświadczenia Big Guys?
źródło
Odpowiedzi:
W rzeczywistości słyszałem pogłoskę, że przyzwoite maszyny edukacyjne są zwykle lepsze niż eksperci, ponieważ ludzka skłonność polega na minimalizowaniu wariancji kosztem stronniczości (oversmooth), co prowadzi do słabej wydajności predykcyjnej w nowym zbiorze danych. Maszyna jest skalibrowana w celu zminimalizowania MSE, a zatem lepiej radzi sobie z prognozowaniem w nowym zestawie danych .
źródło