Nauka danych

22
Czy Data Science to to samo, co Data Mining?

Jestem pewien, że nauka o danych, która będzie omawiana na tym forum, ma kilka synonimów lub przynajmniej powiązanych dziedzin, w których analizowane są duże dane. Moje szczególne pytanie dotyczy eksploracji danych. Kilka lat temu wziąłem udział w zajęciach z Data Mining. Jakie są różnice między...

22
Jaki jest lepszy wkład w Word2Vec?

To jest bardziej ogólne pytanie NLP. Jaki jest odpowiedni wkład, aby nauczyć się osadzania słów, a mianowicie Word2Vec? Czy wszystkie zdania należące do artykułu powinny być osobnym dokumentem w korpusie? A może każdy artykuł powinien być dokumentem we wspomnianym korpusie? To tylko przykład użycia...

22
Jak radzisz sobie z oczekiwaniami w pracy?

Biorąc pod uwagę całą naukę związaną z badaniami danych, uczeniem maszynowym i wszystkimi historiami sukcesu, istnieje wiele uzasadnionych, a także zawyżonych oczekiwań ze strony naukowców danych i ich modeli predykcyjnych. Moje pytanie do praktykujących statystyk, ekspertów ds. Uczenia...

22
Obliczanie dywergencji KL w Pythonie

Jestem raczej nowy i nie mogę powiedzieć, że mam pełne zrozumienie teoretycznych pojęć. Próbuję obliczyć dywergencję KL między kilkoma listami punktów w Pythonie. Korzystam z http://scikit-learn.org/stable/modules/generated/sklearn.metrics.mutual_info_score.html, aby spróbować to zrobić. Problem,...

22
Udostępnianie notatników Jupyter w zespole

Chciałbym skonfigurować serwer, który mógłby wspierać zespół zajmujący się badaniami danych w następujący sposób: być centralnym punktem do przechowywania, wersjonowania, udostępniania i ewentualnego wykonywania notatników Jupyter. Niektóre pożądane właściwości: Różni użytkownicy mogą uzyskać...