Nauka danych

10
Jak zakodować klasę z 24 000 kategorii?

Obecnie pracuję nad modelem regresji logistycznej dla genomiki. Jednym z pól wejściowych, które chcę uwzględnić jako zmienną towarzyszącą, jest genes. Istnieje około 24 000 znanych genów. Istnieje wiele funkcji o tym poziomie zmienności w biologii obliczeniowej i potrzebne są setki tysięcy...

9
Relacyjne wyszukiwanie danych bez ILP

Mam ogromny zestaw danych z relacyjnej bazy danych, dla którego muszę utworzyć model klasyfikacji. Zwykle w tej sytuacji używałbym programowania logiki indukcyjnej (ILP), ale ze względu na szczególne okoliczności nie mogę tego zrobić. Innym sposobem rozwiązania tego problemu jest próba agregacji...

9
Zmiana kariery na Big Data Analytics

Jestem 35-letnim specjalistą IT, który jest czysto techniczny. Jestem dobry w programowaniu, uczeniu się nowych technologii, ich zrozumieniu i wdrażaniu. Nie lubiłem matematyki w szkole, więc nie osiągałem dobrych wyników w matematyce. Jestem bardzo zainteresowany karierą w analityce Big Data....

9
Korzystanie z Vowpal Wabbit dla NER

Vowpal Wabbit (VW) najwyraźniej obsługuje funkcję znakowania sekwencji za pośrednictwem SEARN . Problem polega na tym, że nie mogę znaleźć nigdzie szczegółowej listy parametrów z objaśnieniami i przykładami. Najlepsze, co mogłem znaleźć, to wpis na blogu Zinkova z bardzo krótkim przykładem. Główną...

9
Czy istnieje metoda przeciwna redukcji wymiarów?

Jestem nowy w dziedzinie uczenia maszynowego, ale zrobiłem swój udział w przetwarzaniu sygnałów. Daj mi znać, jeśli to pytanie zostało błędnie oznaczone. Mam dwuwymiarowe dane, które są zdefiniowane przez co najmniej trzy zmienne, z wysoce nieliniowym modelem, który jest zbyt skomplikowany, aby...

9
Wybór funkcji dla maszyn wektorowych wsparcia

Moje pytanie jest trzykrotne W kontekście „jądra” obsługują maszyny wektorowe Czy pożądany jest wybór zmiennych / cech - zwłaszcza, że ​​regulujemy parametr C, aby zapobiec nadmiernemu dopasowaniu, a głównym motywem wprowadzenia jądra do SVM jest zwiększenie wymiarów problemu, w takim przypadku...

9
Klasyfikacja sekwencji wektorowych

Mój zestaw danych składa się z sekwencji wektorowych. Każdy wektor ma 50 rzeczywistych wymiarów. Liczba wektorów w sekwencji wynosi od 3-5 do 10-15. Innymi słowy, długość sekwencji nie jest stała. Pewna spora liczba sekwencji (nie wektorów!) Jest opatrzona etykietą klasy. Moim zadaniem jest...