Pytania oznaczone «data-mining»

10

Najlepsze języki do obliczeń naukowych [zamknięte]

Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 5 lat temu . Wydaje się, że w...

efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

10

Jak debugować analizę danych?

Natknąłem się na następujący problem, który uznaję za raczej typowy. Mam kilka dużych danych, powiedzmy, kilka milionów wierszy. Przeprowadzam na nim kilka nietrywialnych analiz, np. Zapytanie SQL składające się z kilku pod-zapytań. Otrzymuję pewien wynik, stwierdzając na przykład, że właściwość X...

data-mining sql experiments

10

Wizualizacja przedmiotów często kupowanych razem

Mam zestaw danych w następującej strukturze wstawiony do pliku CSV: Banana Water Rice Rice Water Bread Banana Juice Każdy wiersz wskazuje kolekcję przedmiotów, które zostały zakupione razem. Na przykład, pierwszy wiersz oznacza, że przedmioty Banana, Wateri Ricezostały zakupione razem. Chcę...

python r data-mining visualization association-rules

10

Skalowalne wykrywanie wartości odstających / anomalii

Usiłuję skonfigurować infrastrukturę dużych zbiorów danych za pomocą Hadoop, Hive, Elastic Search (między innymi) i chciałbym uruchomić niektóre algorytmy dla niektórych zestawów danych. Chciałbym, aby same algorytmy były skalowalne, więc wyklucza to używanie takich narzędzi, jak Weka, R, a nawet...

data-mining bigdata algorithms outlier

10

Jak zeskrobać stronę IMDB?

Próbuję nauczyć się skrobania stron internetowych przy użyciu Pythona jako część wysiłku uczenia się analizy danych. Próbuję zeskrobać stronę internetową imdb, której adres URL jest następujący:

data-mining python scraping

10

Dostępne pozytywne produkty użytkownika (dane kliknięcia). Jak wygenerować negatywne (dane bez kliknięcia)?

Bardzo często w polecającym mamy dane użytkownika, które mają etykietę np. „Kliknięcie”. Aby poznać model, potrzebuję danych dotyczących kliknięć i braku kliknięć. Najprostszym podejściem do generowania jest pobranie par produktów użytkownika, których nie ma w danych kliknięć. Może to jednak...

machine-learning data-mining

10

Co jest szybsze: PostgreSQL vs MongoDB na dużych zestawach danych JSON?

Mam duży zestaw danych z 9-metrowymi obiektami JSON o wielkości ~ 300 bajtów każdy. Są to posty z agregatora linków: w zasadzie linki (adres URL, tytuł i identyfikator autora) oraz komentarze (tekst i identyfikator autora) + metadane. Mogą to być rekordy relacyjne w tabeli, z wyjątkiem tego, że...

data-mining bigdata databases sql mongodb

9

Jak stworzyć dobrą listę haseł

Szukam wskazówek, jak stworzyć listę haseł. Czy ktoś wie / czy ktoś może zalecić dobrą metodę wyodrębnienia list słów-słów z samego zbioru danych w celu wstępnego przetwarzania i filtrowania? Dane: ogromna ilość tekstu ludzkiego o zmiennej długości (wyszukiwarki i całe zdania (do 200 znaków))...

data-mining nlp information-retrieval language-model

9

Jak modelować zachowania zakupowe użytkownika w Amazon?

W naszym ostatnim projekcie kursu z Data Science zaproponowaliśmy następujące- Daj opinie Amazon zestawu danych , planujemy wymyślić algorytm (to z grubsza na podstawie spersonalizowanej PageRank), który określa strategiczne położenie na umieszczanie reklam na Amazon. Na przykład w Amazon są...

machine-learning data-mining dataset recommender-system

9

Rozpoznawanie działalności człowieka za pomocą problemu z zestawem danych smartfona

Jestem nowy w tej społeczności i mam nadzieję, że moje pytanie będzie tutaj pasować. W ramach mojego studiów licencjackich z zakresu analizy danych postanowiłem wykonać projekt dotyczący rozpoznawania działalności człowieka za pomocą zestawów danych ze smartfona. Jeśli chodzi o mnie, ten temat...

bigdata machine-learning databases clustering data-mining

9

Relacyjne wyszukiwanie danych bez ILP

Mam ogromny zestaw danych z relacyjnej bazy danych, dla którego muszę utworzyć model klasyfikacji. Zwykle w tej sytuacji używałbym programowania logiki indukcyjnej (ILP), ale ze względu na szczególne okoliczności nie mogę tego zrobić. Innym sposobem rozwiązania tego problemu jest próba agregacji...

data-mining classification relational-dbms

9

Uczenie się kodowania sygnału

Mam dużą liczbę próbek, które reprezentują strumienie bitów zakodowane w Manchesterze jako sygnały audio. Częstotliwość, z jaką są one kodowane, jest głównym składnikiem częstotliwości, gdy jest wysoka, a w tle występuje stała ilość białego szumu. Ręcznie zdekodowałem te strumienie, ale...

machine-learning data-mining scalability algorithms feature-selection