Nauka danych

12
Wystąpienia a rdzenie podczas korzystania z EC2

Pracując nad czymś, co często można nazwać projektami „średnich danych”, byłem w stanie zrównoleglać mój kod (głównie do modelowania i prognozowania w Pythonie) na jednym systemie w dowolnym miejscu od 4 do 32 rdzeni. Teraz patrzę na skalowanie do klastrów w EC2 (prawdopodobnie z StarCluster /...

12
Algorytm dopasowywania preferencji

Pracuję nad tym projektem pobocznym, w którym muszę opracować rozwiązanie następującego problemu. Mam dwie grupy osób (klientów). Grupa Azamierza kupić, a grupa Bzamierza sprzedać określony produkt X. Produkt ma szereg atrybutów x_i, a moim celem jest ułatwienie transakcji Ai Bdopasowanie ich...

12
Dane sentymentalne dla Emoji

Do eksperymentów chcielibyśmy użyć Emoji osadzonego w wielu tweetach jako podstawowych danych o prawdzie / treningu do prostej ilościowej analizy wrażliwości. Tweety są zwykle zbyt nieustrukturyzowane, aby NLP działało dobrze. W każdym razie w Unicode 6.0 jest 722 Emoji, a prawdopodobnie kolejne...