Użyłem regresji logistycznej. Mam sześć funkcji, chcę poznać ważne cechy tego klasyfikatora, które wpływają na wynik bardziej niż inne cechy. Użyłem Information Gain, ale wygląda na to, że nie zależy to od zastosowanego klasyfikatora. Czy istnieje metoda uszeregowania cech według ich ważności na podstawie określonego klasyfikatora (np. Regresji logistycznej)? każda pomoc byłaby bardzo mile widziana.
logistic
feature-selection
ranking
regression-strategies
Niebieska dziewczyna
źródło
źródło
Odpowiedzi:
Myślę, że odpowiedzią, której szukasz, może być algorytm Boruta . Jest to metoda otoki, która bezpośrednio mierzy znaczenie funkcji w sensie „wszystkie trafności” i jest zaimplementowana w pakiecie R , który wytwarza ładne wykresy, takie jak tam, gdzie ważność dowolnej cechy jest na osi y i jest porównywana z null narysowano tutaj na niebiesko. Ten post na blogu opisuje to podejście i polecam przeczytanie go jako bardzo przejrzystego wstępu.
źródło
Nie ma zbyt dużej zgody co do tego, jak uszeregować zmienne pod kątem regresji logistycznej. Dobry przegląd tego tematu znajduje się w [ 1 ], opisuje on adaptacje technik regresji liniowej względnej ważności za pomocą Pseudo- do regresji logistycznej.R2)
Lista popularnych podejść do oceny znaczenia funkcji w modelach regresji logistycznej to:
Bibliografia:
źródło
Mam nadzieję, że to pomoże. Zapytaj, czy masz dodatkowe pytania.
źródło