Chociaż zostałem przeszkolony jako inżynier, odkryłem, że coraz bardziej interesuję się eksploracją danych. W tej chwili próbuję dokładniej zbadać tę dziedzinę. W szczególności chciałbym zrozumieć różne kategorie narzędzi programowych, które istnieją i które narzędzia są godne uwagi w każdej kategorii i dlaczego. (Zauważ, że nie powiedziałem „najlepszych” narzędzi, tylko te godne uwagi, abyśmy nie rozpoczęli wojny z płomieniami.) Szczególnie zwróć uwagę na narzędzia o otwartym kodzie źródłowym i swobodnie dostępne - chociaż nie rozumiem tego, że to oznacza Interesuje mnie tylko oprogramowanie open source i bezpłatne.
data-mining
John Berryman
źródło
źródło
Odpowiedzi:
To prawdopodobnie najbardziej wyczerpująca lista, którą znajdziesz: mloss.org
źródło
Spójrz na
oraz repozytorium uczenia maszynowego UCI dla zestawów danych.
źródło
Rattle to graficzny interfejs użytkownika do eksploracji danych, który zapewnia interfejs dla szerokiej gamy pakietów R.
źródło
Zobacz KNIME .
Bardzo łatwa do nauczenia. Z dużą ilością miejsca na dalsze postępy. Ładnie integruje się z Weka i R.
źródło
Z punktu widzenia popularności niniejszy artykuł (2008) analizuje 10 najważniejszych algorytmów w eksploracji danych .
źródło
RapidMiner (Java) [open source]
źródło
Istnieje ELKI , projekt uniwersytecki typu open source, nieco podobny do WEKA, ale znacznie silniejszy, jeśli chodzi o tworzenie klastrów i wykrywanie wartości odstających. WEKA nie jest tak naprawdę eksploracją danych, ale oprogramowaniem do uczenia maszynowego.
źródło
Jest ten Red-R, który ma ładny GUI i wizualny interfejs programowania. Wykorzystuje R do przetwarzania różnych analiz danych.
źródło
Rexer Anlaytics co roku przeprowadza ankietę dotyczącą zestawu narzędzi. KDnuggets ma opisy oprogramowania według branży, a także intencji.
źródło
SQL Server Data Mining (SSDM) nie był aktualizowany od dawna, ale nadal jest dość konkurencyjny, jeśli wydobywasz duże relacyjne bazy danych i kostki. Powoli, ale systematycznie prześlizguję się przez testy tak wielu narzędzi górniczych, jak to tylko możliwe, a interfejs Windows Servera do SQL Servera jest najbardziej produktywny i stabilny do tej pory (szczególnie jeśli chodzi o bazy danych dla przedsiębiorstw, z których niektóre zaskakująco niechlujne interfejsy) pomimo swojego wieku. Wolałbym nowoczesny interfejs Windows Presentation Foundation (WPF), ale jest to najlepsza rzecz.
Napisałem na nim całą serię szczegółowych amatorskich samouczków zatytułowanych Chwiejne schody do eksploracji danych SQL Server , kiedy próbowałem zdobyć podstawowe umiejętności wydobywcze. Pomimo mojego niedoświadczenia są one nadal przydatne, pomagając z wyprzedzeniem zidentyfikować niektóre „gotchas”.
źródło