Biorę udział w kursie dla absolwentów statystyki stosowanej, który wykorzystuje następujący podręcznik (aby poczuć poziom badanego materiału): koncepcje i metody statystyczne , prowadzone przez GK Bhattacharyya i RA Johnsona.
Profesor wymaga od nas korzystania z SAS do odrabiania lekcji.
Moje pytanie brzmi: czy istnieje biblioteka (y) Java, której można używać zamiast SAS w przypadku problemów typowo spotykanych w takich klasach?
Obecnie próbuję zadowolić się Apache Math Commons i chociaż jestem pod wrażeniem biblioteki (jest łatwa w użyciu i zrozumiała), wydaje się, że brakuje w niej nawet prostych rzeczy, takich jak umiejętność rysowania histogramów (myślę o połączeniu jej z biblioteką wykresów) ).
Spojrzałem na Colta, ale moje początkowe zainteresowanie szybko wygasło.
Byłbym wdzięczny za każdy wkład - i przeglądałem podobne pytania na Stackoverflow, ale nie znalazłem nic przekonującego.
UWAGA: Zdaję sobie sprawę z bibliotek R, SciPy i Octave oraz java, które do nich dzwonią - szukam rodzimej biblioteki Java lub zestawu bibliotek, które mogą razem zapewniać funkcje, których szukam.
UWAGA: Tematy omawiane w takiej klasie zwykle obejmują: testy na jednej próbce i na dwóch próbkach oraz przedziały ufności dla średnich i median, statystyki opisowe, testy dobroci dopasowania, ANOVA jedno- i dwukierunkowe, jednoczesne wnioskowanie, testowanie wariancje, analiza regresji i analiza danych kategorycznych.
Odpowiedzi:
Kiedy jestem zmuszony używać java do podstawowych statystyk, apache commons matematyka jest właściwą drogą. Do wykresów używam i polecam JFreeChart . Ta ostatnia jest szeroko rozpowszechniona, więc przepełnienie stosu ma nawet zapełniony znacznik .
Edytować
Jeśli ktoś szuka pakietu, to może Deducer jest opcją. GUI opiera się na JGR, podczas gdy części statystyczne są wywoływane w R. Wydaje się, że można je rozszerzać zarówno przez R, jak i Java . Można np. Pominąć wywołania Rengine, ale zamiast tego odwołać się do bibliotek Java. Ale przyznaję, że jeszcze tego nie próbowałem.
O ile rozumiem OP, optymalne byłoby coś w rodzaju Rapidminer for Statistics , ponieważ Rapidminer jest czystym frameworkiem Java, który obsługuje dostęp do GUI (w tym wizualizacje), wykorzystanie jako biblioteki i tworzenie niestandardowych wtyczek. Według mojej najlepszej wiedzy, coś takiego w statystyce nie istnieje. Nie polecam Rapidminer do tego konkretnego zadania , ponieważ według mojej najlepszej wiedzy zawiera on tylko najbardziej podstawowe testy statystyczne. Wizualizacje zostały ostatnio rozszerzone, ale nie mogę oszacować, jak można je teraz dostosowywać.
źródło
Sprawdź Suan Shu: NumericalMethod.com . Ogólnie nie jest bezpłatny, ale jest bezpłatny do użytku akademickiego.
źródło
Podobnie do sugestii steffen dotyczącej RapidMiner, możesz rozważyć Weka . Może być bardziej ukierunkowany na uczenie maszynowe, niż się spodziewasz. Ma wiele algorytmów do zadań takich jak grupowanie, klasyfikacja i regresja. Weka ma GUI, ale może być również używany jako biblioteka oprogramowania. Widziałem histogramy w GUI, ale nie jestem pewien, czy łatwo jest je ponownie użyć w bibliotece, czy nie.
źródło
Wypróbuj http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.html
Jest dobrze udokumentowany i zapewnia wiele przydatnych funkcji statystycznych i matematycznych. Ale niestety nie jest to oprogramowanie typu open source. Więc jeśli to ci nie przeszkadza, biblioteka powinna być w porządku.
Nie wiem jednak, czy zapewnia wyjście graficzne.
źródło
Środowisko obliczeniowe DataMelt ma wiele bibliotek statystycznych Java prawie na każdy temat. Możesz go używać za pomocą Jython, jak zalecono na stronie internetowej, ale ja używam go z Javą i Groovy.
Mogę powiedzieć więcej: projekt DataMelt obejmuje następujące tematy statystyczne:
Oto przykład regresji nieliniowej wykorzystujący metodę logarytmu prawdopodobieństwa w celu dopasowania danych do błędów:
Pakiet jest bezpłatny.
źródło