Nauka danych

14
Liczba epok w implementacji Gensim Word2Vec

W implementacji Word2Vec znajduje się iterparametrgensim klasa gensim.models.word2vec.Word2Vec (zdania = brak, rozmiar = 100, alfa = 0,025, okno = 5, liczba_minimalna = 5, max_vocab_size = brak, próbka = 0, seed = 1, pracownicy = 1, min_alpha = 0,0001, sg = 1, hs = 1, ujemny = 0, cbow_mean = 0,...

14
Jak pasują modele rankingowe w xgBoost?

O ile mi wiadomo, aby trenować naukę rangowania modeli, musisz mieć w zestawie danych trzy rzeczy: etykieta lub trafność identyfikator grupy lub zapytania wektor funkcji Na przykład zestaw danych Microsoft Learning to Rank korzysta z tego formatu (etykieta, identyfikator grupy i funkcje). 1...

14
Doc2vec (gensim) - Jak wywnioskować etykietę zdań niewidocznych?

https://radimrehurek.com/gensim/models/doc2vec.html Na przykład, jeśli przeszkoliliśmy doc2vec „aaaaaAAAAAaaaaaa” - „etykieta 1” „BbbbbbBBBBBbbbb” - „etykieta 2” czy możemy wywnioskować, że „aaaaAAAAaaaaAA” oznacza etykietę 1 za pomocą Doc2vec? Wiem, że Doc2vec może trenować wektory słów i...

14
Jak wykonać dopasowanie rozmyte adresów pocztowych?

Chciałbym wiedzieć, jak dopasować adresy pocztowe, gdy ich format różni się lub gdy jeden z nich jest źle zapisany. Do tej pory znalazłem różne rozwiązania, ale myślę, że są one dość stare i niezbyt wydajne. Jestem pewien, że istnieją lepsze metody, więc jeśli masz dla mnie referencje, jestem...

14
Pandas Dataframe do DMatrix

Próbuję uruchomić xgboost w scikit learn. I używam tylko Pand do ładowania danych do ramki danych. Jak mam używać pand df z xgboost. Jestem zdezorientowany procedurą DMatrix wymaganą do uruchomienia xgboost

14
Mapa termiczna na mapie w Pythonie

Mode Analytics ma fajną funkcję mapy cieplnej ( https://community.modeanalytics.com/gallery/geographic-heat-map/ ). Ale nie sprzyja to porównywaniu map (tylko jedna na raport). Pozwalają na łatwe pobieranie danych do zapakowanego notatnika Pythona. A następnie dowolny obraz w pythonie można łatwo...