Częściowo nadzorowane uczenie się, aktywne uczenie się i głębokie uczenie się w celu klasyfikacji

19

Ostateczna edycja ze zaktualizowanymi wszystkimi zasobami:

W przypadku projektu stosuję algorytmy uczenia maszynowego do klasyfikacji.

Wyzwanie: Dość ograniczone dane oznaczone i znacznie więcej danych nieznakowanych.

Cele:

  1. Zastosuj klasyfikację częściowo nadzorowaną
  2. Zastosuj w jakiś sposób częściowo nadzorowany proces etykietowania (znany jako aktywne uczenie się)

Znalazłem wiele informacji z prac naukowych, takich jak stosowanie EM, Transductive SVM lub S3VM (Semi Supervised SVM), lub w jakiś sposób korzystanie z LDA itp. Nawet niewiele książek na ten temat.

Pytanie: Gdzie są wdrożenia i źródła praktyczne?


Ostatnia aktualizacja (na podstawie pomocy dostarczonej przez mpiktas, bayer i Dikran Marsupial)

Nauka częściowo nadzorowana:

Aktywne uczenie się:

  • Dualist : implementacja aktywnego uczenia się z kodem źródłowym do klasyfikacji tekstu
  • Ta strona internetowa stanowi doskonały przegląd aktywnego uczenia się.
  • Eksperymentalne warsztaty projektowe: tutaj .

Głęboka nauka:

Płatek
źródło
Istnieje pakiet R RTextTools . Jeśli się nie mylę, implementuje kilka wymienionych przez ciebie metod.
mpiktas,
Cześć mpikta, dziękuję za miłą pomoc. To ciekawy zestaw narzędzi. Wydaje się jednak, że zajmuje się wyłącznie uczeniem nadzorowanym, ponieważ czytam „TextTools to darmowy pakiet uczenia maszynowego typu open source do automatycznej klasyfikacji tekstu, który ułatwia początkującym i zaawansowanym użytkownikom rozpoczęcie nauki pod nadzorem. dziewięć algorytmów klasyfikacji zestawu (svm, slda, boosting, spakowanie, losowe lasy, glmnet, drzewa decyzyjne, sieci neuronowe, maksymalna entropia) ”
Flake
Ok, oto kolejna próba: Weka . Autorzy napisali książkę, a jej spis treści wspomina o częściowo nadzorowanym nauczaniu. Mam szczerą nadzieję, że rozdział nie kończy się na „... niestety żaden z tych algorytmów nie jest zaimplementowany w Weka” :)
mpiktas,
Cholera, mam starszą wersję książki! Wielkie dzięki za wskazanie tego źródła!
Flake

Odpowiedzi:

8

Wydaje się, że głębokie uczenie się może być dla Ciebie bardzo interesujące. Jest to najnowsza dziedzina modeli głębokiego połączenia, które są wstępnie szkolone w sposób nienadzorowany, a następnie dopracowywane pod nadzorem. Precyzyjne strojenie wymaga znacznie mniej próbek niż wstępne szkolenie.

Aby zwilżyć język, polecam [Semantig Hashing Salakhutdinov, Hinton . Spójrz na kody znalezione dla odrębnych dokumentów korpusu Reutersa: (bez nadzoru!)

wprowadź opis zdjęcia tutaj

Jeśli potrzebujesz zaimplementowanego kodu, sprawdź deeplearning.net . Jednak nie sądzę, że istnieją gotowe rozwiązania.

bayerj
źródło
To dla mnie całkiem interesujące i nowe informacje. Oczywiście lepsze byłyby implementacje od razu po wyjęciu z pudełka, ale to naprawdę pomaga mi dowiedzieć się czegoś bliższego temu, czego chcę. Dzięki.
Flake
5

Isabelle Guyon (wraz z kolegami) zorganizowała jakiś czas wyzwanie aktywnego uczenia się, a postępowanie jest publikowane tutaj (otwarty dostęp). Ma to tę zaletę, że jest całkiem praktyczne i można bezpośrednio porównać wyniki różnych podejść w ramach obiektywnego (w potocznym znaczeniu) protokołu (losowy wybór wzorców jest zaskakująco trudny do pokonania).

Dikran Torbacz
źródło