Ostateczna edycja ze zaktualizowanymi wszystkimi zasobami:
W przypadku projektu stosuję algorytmy uczenia maszynowego do klasyfikacji.
Wyzwanie: Dość ograniczone dane oznaczone i znacznie więcej danych nieznakowanych.
Cele:
- Zastosuj klasyfikację częściowo nadzorowaną
- Zastosuj w jakiś sposób częściowo nadzorowany proces etykietowania (znany jako aktywne uczenie się)
Znalazłem wiele informacji z prac naukowych, takich jak stosowanie EM, Transductive SVM lub S3VM (Semi Supervised SVM), lub w jakiś sposób korzystanie z LDA itp. Nawet niewiele książek na ten temat.
Pytanie: Gdzie są wdrożenia i źródła praktyczne?
Ostatnia aktualizacja (na podstawie pomocy dostarczonej przez mpiktas, bayer i Dikran Marsupial)
Nauka częściowo nadzorowana:
Aktywne uczenie się:
- Dualist : implementacja aktywnego uczenia się z kodem źródłowym do klasyfikacji tekstu
- Ta strona internetowa stanowi doskonały przegląd aktywnego uczenia się.
- Eksperymentalne warsztaty projektowe: tutaj .
Głęboka nauka:
- Film wprowadzający tutaj .
- Ogólna strona .
- Samouczek funkcji uczenia się i głębokiego uczenia się bez nadzoru Stanforda .
Odpowiedzi:
Wydaje się, że głębokie uczenie się może być dla Ciebie bardzo interesujące. Jest to najnowsza dziedzina modeli głębokiego połączenia, które są wstępnie szkolone w sposób nienadzorowany, a następnie dopracowywane pod nadzorem. Precyzyjne strojenie wymaga znacznie mniej próbek niż wstępne szkolenie.
Aby zwilżyć język, polecam [Semantig Hashing Salakhutdinov, Hinton . Spójrz na kody znalezione dla odrębnych dokumentów korpusu Reutersa: (bez nadzoru!)
Jeśli potrzebujesz zaimplementowanego kodu, sprawdź deeplearning.net . Jednak nie sądzę, że istnieją gotowe rozwiązania.
źródło
Isabelle Guyon (wraz z kolegami) zorganizowała jakiś czas wyzwanie aktywnego uczenia się, a postępowanie jest publikowane tutaj (otwarty dostęp). Ma to tę zaletę, że jest całkiem praktyczne i można bezpośrednio porównać wyniki różnych podejść w ramach obiektywnego (w potocznym znaczeniu) protokołu (losowy wybór wzorców jest zaskakująco trudny do pokonania).
źródło
Oto ładna lista bibliotek.
http://www.infoworld.com/article/2608742/predictive-analytics/5-ways-to-add-machine-learning-to-java--javascript--and-more.html
źródło