Nauka danych

12
Pomoc dotycząca NER w NLTK

Od jakiegoś czasu pracuję w NLTK, używając Pythona. Problem, z którym się zmagam, polega na tym, że nie ma pomocy w szkoleniu NER w NLTK z moimi niestandardowymi danymi. Wykorzystali MaxEnt i wyszkolili go na korpusie ACE. Dużo szukałem w Internecie, ale nie mogłem znaleźć sposobu, który mógłby...

12
Jaka jest „stara nazwa” naukowca danych?

W dzisiejszych czasach coraz częściej używa się terminów takich jak „nauka danych” i „naukowiec danych”. Wiele firm zatrudnia „naukowca danych”. Ale nie sądzę, że to zupełnie nowa praca. Dane istniały w przeszłości i ktoś musiał się nimi zajmować. Wydaje mi się, że termin „naukowiec danych” staje...

12
Pobieranie dużego zestawu danych z Internetu bezpośrednio do AWS S3

Czy ktoś wie, czy można zaimportować duży zestaw danych do Amazon S3 z adresu URL? Zasadniczo chcę uniknąć pobierania dużego pliku, a następnie ponownego ładowania go do S3 za pośrednictwem portalu internetowego. Chcę tylko podać adres URL pobierania do S3 i poczekać, aż ściągną go do swojego...

12
Taryfy lotnicze - Jaką analizę należy zastosować, aby wykryć konkurencyjne zachowanie przy ustalaniu cen i korelacje cenowe?

Chcę zbadać zachowanie linii lotniczych w zakresie ustalania cen - w szczególności sposób, w jaki linie lotnicze reagują na ceny konkurentów. Ponieważ powiedziałbym, że moja wiedza na temat bardziej złożonych analiz jest dość ograniczona, zrobiłem głównie wszystkie podstawowe metody, aby zebrać...

12
MinHashing vs SimHashing

Załóżmy, że mam pięć zestawów, które chciałbym połączyć. Rozumiem, że opisana tutaj technika SimHashing: https://moultano.wordpress.com/2010/01/21/simple-simhashing-3kbzhsxyg4467-6/ może przynieść trzy klastry ( {A}, {B,C,D}i {E}), na przykład, gdy jego wyniki: A -> h01 B -> h02 C ->...

12
Jak scalić dwie ramki danych w pandach Pythona?

Mam dwie ramki danych df1 i df2 i chciałbym je połączyć w jedną ramkę danych. To tak, jakby df1 i df2 zostały utworzone przez podzielenie pojedynczej ramki danych pionowo w dół na środku, jak rozerwanie kawałka papieru zawierającego listę na pół, tak aby połowa kolumn była na jednym papierze, a...

12
Jak korzystać z RBM do klasyfikacji?

W tej chwili gram z Restricted Boltzmann Machines i skoro już to robię, chciałbym spróbować sklasyfikować za nim ręcznie pisane cyfry. Model, który stworzyłem, jest teraz dość fantazyjnym modelem generatywnym, ale nie wiem, jak dalej z nim iść. W tym artykule autor mówi, że po stworzeniu dobrego...