Pytania oznaczone «data-analysis»

11
Najszybszy algorytm PCA dla danych wielowymiarowych

Chciałbym wykonać PCA na zestawie danych złożonym z około 40 000 próbek, z których każda zawiera około 10 000 funkcji. Używanie funkcji princomp Matlaba konsekwentnie zajmuje ponad pół godziny, w którym to momencie zabijam proces. Chciałbym znaleźć implementację / algorytm, który działa w mniej...

11
Ograniczenia pand i ich alternatywy w Pythonie

Czytałem gdzieś, że Pandy po raz pierwszy opracowano dla świata finansów, a przynajmniej nie dla nauk przyrodniczych (fizyki, biologii itd.), Więc czy jest jakiś podobny pakiet do analizy danych Pythona bardziej „zorientowany na nauki przyrodnicze”? Właśnie zacząłem używać Pand i napotkałem już...

10
Dopasowywanie podobnych elementów z zestawu

Próbuję dopasować przedmioty. Biorąc pod uwagę zestaw przedmiotów, mogę uszeregować w skali od 0 do 100, jak są do siebie podobne. Na przykład, jeśli pozycja to mleko, a pozycja jest również mlekiem, wówczas podobieństwo między i wynosi 100%. Jeśli to soda, wówczas podobieństwo między i może...