Jestem bardzo nowy w R. Teraz uczę się uczenia maszynowego. Bardzo przepraszam, jeśli to pytanie wydaje się bardzo proste. Próbuję znaleźć dobry pakiet wyboru funkcji w R. Przeszedłem przez pakiet Boruta. Jest to dobry pakiet, ale czytam, że jest on przydatny tylko do klasyfikacji.
Chcę dokonać wyboru funkcji implementacji w R dla zadań regresji. Przejrzałem dokumentację pakietu karetki, ale na moim poziomie jest to bardzo trudne do zrozumienia.
Czy ktoś może wskazać mi dobry samouczek lub wymienić jakieś dobre pakiety lub najczęściej używane pakiety w języku R do wyboru funkcji.
Każda pomoc będzie mile widziana. Z góry dziękuję.
r
feature-selection
użytkownik1787687
źródło
źródło
Odpowiedzi:
Możesz także rzucić okiem FSelector , varSelRF . FSelector zawiera wiele funkcji do wyboru cech opartych na przykład na teście chi kwadrat, teorii informacji (entropia, informacja wzajemna, współczynnik wzmocnienia, ...), korelacji między cechą, spójnością itp ... varSelRF jest użytecznym pakietem do wyboru obiektów za pomocą losowych lasów z eliminacją zmiennych zmiennych wstecznych i ze spektrum ważności.
źródło
Czy spojrzałeś na widok CRAN zadania uczenia maszynowego i uczenia statystycznego, w którym oprócz Careta i Boruty wymieniono kilka innych pakietów?
Ogólnie rzecz biorąc, jeśli nie rozumiesz konkretnej procedury statystycznej dotyczącej wyboru funkcji, może być lepiej zadać ukierunkowane pytanie na jej temat. Następujący link CV może okazać się tak przydatny na początek: Algorytmy automatycznego wyboru modelu .
źródło
Proponuję Grzechotkę, która ma losowy wybór cech lasu (i wiele więcej). Ma ładny GUI i bardzo łatwy w użyciu.
źródło
GLMNET z regresją lasso ma wybór funkcji.
źródło
Dodatkowo
Caret
pakiet zapewnia również metody wyboru funkcji. Tutaj i tutaj jest kilka samouczków na temat korzystania z wyboru funkcji wCaret package
. Niedawno w CRAN dostępny jest pakiet wyboru funkcji oparty na algorytmie SISAL Tikka i Hollmén .źródło