Jako inżynier oprogramowania interesuję się takimi tematami, jak algorytmy statystyczne, eksploracja danych, uczenie maszynowe, sieci bayesowskie, algorytmy klasyfikacji, sieci neuronowe, łańcuchy Markowa, metody Monte Carlo i generowanie liczb losowych.
Osobiście nie miałem przyjemności pracy z żadną z tych technik, ale musiałem pracować z oprogramowaniem, które pod maską je zastosowało i chciałoby dowiedzieć się o nich więcej na wysokim poziomie. Szukam książek, które obejmują szeroki wachlarz - w tym momencie nie jest potrzebna duża głębokość. Myślę, że mogę się wiele nauczyć na temat tworzenia oprogramowania, jeśli rozumiem matematyczne podstawy zastosowanych algorytmów i technik.
Czy społeczność Analizy Statystycznej może polecać książki, których mogę użyć, aby dowiedzieć się więcej na temat wdrażania różnych elementów statystycznych w oprogramowaniu?
źródło
Oto bardzo ładna książka Jamesa E. Gentle'a, Statystyka obliczeniowa (Springer, 2009), która obejmuje zarówno obliczeniowe, jak i statystyczne aspekty analizy danych. Gentle jest także autorem innych świetnych książek, sprawdź swoje publikacje.
Inną świetną książką jest Handbook of Computational Statistics , autorstwa Gentle i in. (Springer, 2004); krąży gdzieś w Internecie jako plik PDF, więc po prostu spójrz na to w Google.
źródło
Wspomniałeś o kilku technikach ML, więc dwie całkiem fajne książki (ponieważ niestety mój ulubiony jest po polsku):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html
W przypadku danych liczbowych, takich jak generowanie liczb losowych:
http://www.nr.com/
źródło
Wziąłem kopię prawdopodobieństwa i statystyki dla informatyków - Michaela Barona w sprzedaży z inną książką statystyczną (uczciwie kupiłem ją z powodu nazwy - chciałem książki, która spojrzałaby na statystyki z perspektywy informatyki, nawet jeśli nie był idealny). Nie miałem jeszcze okazji go przeczytać ani rozwiązać żadnych problemów, ale wydaje się, że to solidna książka.
Przedmowa książki mówi, że jest ona przeznaczona dla studentów pierwszego stopnia i początkujących, i zgodziłbym się z tym. Aby zrozumieć treść tej książki, konieczne jest zrozumienie prawdopodobieństwa i statystyki.
Tematy obejmują prawdopodobieństwo, dyskretne zmienne losowe, rozkłady ciągłe, metody Monte Carlo, procesy stochastyczne, systemy kolejkowania, wnioskowanie statystyczne i regresję.
źródło
Chociaż nie jest to konkretnie statystyka obliczeniowa, Podręcznik analiz statystycznych wykorzystujących R - Briana S. Everitta i Torstena Hothorna obejmuje wiele tematów, które widziałem w książkach statystyki podstawowej i pośredniej - wnioskowanie, ANOVA, regresja liniowa, regresja logistyczna, estymacja gęstości, partycjonowanie rekurencyjne, analiza głównych składników i analiza skupień - przy użyciu języka R. Może to być interesujące dla osób zainteresowanych programowaniem.
Jednak, w przeciwieństwie do innych książek, nacisk kładziony jest na użycie języka R do wykonywania tych funkcji statystycznych. Inne książki, które widziałem, używają kombinacji algebry i rachunku różniczkowego i całkowego w celu zademonstrowania statystyki. Ta książka koncentruje się na analizie danych przy użyciu języka R. Aby uczynić go jeszcze bardziej użytecznym, zestawy danych używane przez autorów znajdują się w CRAN - repozytorium R.
źródło
Obliczenia statystyczne z R - Maria L. Rizzo obejmuje wiele tematów w Prawdopodobieństwo i statystyka dla informatyków - podstawowe prawdopodobieństwo i statystyka, zmienne losowe, statystyki bayesowskie, łańcuchy Markowa, wizualizacja danych wielowymiarowych, metody Monte Carlo, testy permutacyjne, prawdopodobieństwo szacowanie gęstości i metody numeryczne.
Zastosowane równania i wzory są przedstawione zarówno jako wzory matematyczne, jak i w kodzie R. Powiedziałbym, że podstawowa wiedza na temat prawdopodobieństwa, statystyki, rachunku różniczkowego i matematycznego, może być wskazana dla każdego, kto chce przeczytać tę książkę. Pomocne byłoby również tło programowania, ale istnieją pewne odniesienia do języka R, operatorów i składni.
źródło
Jako inżynier komputerowy, który sam analizuje dane, naprawdę czytelną książką, która obejmuje rzeczy z dość niezbyt zachęcającej i czytelnej perspektywy (kosztem nie tyle, ile innych sugerowanych tutaj książek) było Programowanie Kolektywnej Inteligencji Toby'ego Segarana. Uważam, że jest o wiele bardziej przystępna niż, na przykład, książka Bishopa, która jest świetnym odniesieniem, ale zagłębia się w to, czego prawdopodobnie chcesz od pierwszego przejścia. W amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325
źródło
CRAN ma kilka dobrych przykładów książek dotyczących programowania statystycznego. Niektóre z nich nie dotyczą uczenia maszynowego i MCMC, ale każdy wpis jest opatrzony adnotacjami, więc powinieneś mieć ogólne pojęcie o zawartości każdej książki, aby zanurkować nieco dalej. http://www.r-project.org/doc/bib/R-books.html
źródło