Jakie książki zawierają przegląd statystyk obliczeniowych dotyczących informatyki?

15

Jako inżynier oprogramowania interesuję się takimi tematami, jak algorytmy statystyczne, eksploracja danych, uczenie maszynowe, sieci bayesowskie, algorytmy klasyfikacji, sieci neuronowe, łańcuchy Markowa, metody Monte Carlo i generowanie liczb losowych.

Osobiście nie miałem przyjemności pracy z żadną z tych technik, ale musiałem pracować z oprogramowaniem, które pod maską je zastosowało i chciałoby dowiedzieć się o nich więcej na wysokim poziomie. Szukam książek, które obejmują szeroki wachlarz - w tym momencie nie jest potrzebna duża głębokość. Myślę, że mogę się wiele nauczyć na temat tworzenia oprogramowania, jeśli rozumiem matematyczne podstawy zastosowanych algorytmów i technik.

Czy społeczność Analizy Statystycznej może polecać książki, których mogę użyć, aby dowiedzieć się więcej na temat wdrażania różnych elementów statystycznych w oprogramowaniu?

Thomas Owens
źródło

Odpowiedzi:

3

Możesz przeczytać niezwykle popularne pytanie na temat przepełnienia stosu, które statystyki powinien wiedzieć programista lub informatyk .

Jeromy Anglim
źródło
Dobra decyzja. Używam SO i nie wiedziałem, że to pytanie w ogóle istnieje. Dobrze jest mieć linkowanie w sytuacjach, gdy pytania mogą pojawiać się na wielu giełdach.
Thomas Owens,
3

Oto bardzo ładna książka Jamesa E. Gentle'a, Statystyka obliczeniowa (Springer, 2009), która obejmuje zarówno obliczeniowe, jak i statystyczne aspekty analizy danych. Gentle jest także autorem innych świetnych książek, sprawdź swoje publikacje.

Inną świetną książką jest Handbook of Computational Statistics , autorstwa Gentle i in. (Springer, 2004); krąży gdzieś w Internecie jako plik PDF, więc po prostu spójrz na to w Google.

chl
źródło
2

Wspomniałeś o kilku technikach ML, więc dwie całkiem fajne książki (ponieważ niestety mój ulubiony jest po polsku):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

W przypadku danych liczbowych, takich jak generowanie liczb losowych:
http://www.nr.com/

użytkownik88
źródło
+1 książka Marsland jest całkiem dobra i wypełniła dużą lukę w istniejącym wyborze książek ML.
ars
1

Wziąłem kopię prawdopodobieństwa i statystyki dla informatyków - Michaela Barona w sprzedaży z inną książką statystyczną (uczciwie kupiłem ją z powodu nazwy - chciałem książki, która spojrzałaby na statystyki z perspektywy informatyki, nawet jeśli nie był idealny). Nie miałem jeszcze okazji go przeczytać ani rozwiązać żadnych problemów, ale wydaje się, że to solidna książka.

Przedmowa książki mówi, że jest ona przeznaczona dla studentów pierwszego stopnia i początkujących, i zgodziłbym się z tym. Aby zrozumieć treść tej książki, konieczne jest zrozumienie prawdopodobieństwa i statystyki.

Tematy obejmują prawdopodobieństwo, dyskretne zmienne losowe, rozkłady ciągłe, metody Monte Carlo, procesy stochastyczne, systemy kolejkowania, wnioskowanie statystyczne i regresję.

Thomas Owens
źródło
1

Chociaż nie jest to konkretnie statystyka obliczeniowa, Podręcznik analiz statystycznych wykorzystujących R - Briana S. Everitta i Torstena Hothorna obejmuje wiele tematów, które widziałem w książkach statystyki podstawowej i pośredniej - wnioskowanie, ANOVA, regresja liniowa, regresja logistyczna, estymacja gęstości, partycjonowanie rekurencyjne, analiza głównych składników i analiza skupień - przy użyciu języka R. Może to być interesujące dla osób zainteresowanych programowaniem.

Jednak, w przeciwieństwie do innych książek, nacisk kładziony jest na użycie języka R do wykonywania tych funkcji statystycznych. Inne książki, które widziałem, używają kombinacji algebry i rachunku różniczkowego i całkowego w celu zademonstrowania statystyki. Ta książka koncentruje się na analizie danych przy użyciu języka R. Aby uczynić go jeszcze bardziej użytecznym, zestawy danych używane przez autorów znajdują się w CRAN - repozytorium R.

Thomas Owens
źródło
1

Obliczenia statystyczne z R - Maria L. Rizzo obejmuje wiele tematów w Prawdopodobieństwo i statystyka dla informatyków - podstawowe prawdopodobieństwo i statystyka, zmienne losowe, statystyki bayesowskie, łańcuchy Markowa, wizualizacja danych wielowymiarowych, metody Monte Carlo, testy permutacyjne, prawdopodobieństwo szacowanie gęstości i metody numeryczne.

Zastosowane równania i wzory są przedstawione zarówno jako wzory matematyczne, jak i w kodzie R. Powiedziałbym, że podstawowa wiedza na temat prawdopodobieństwa, statystyki, rachunku różniczkowego i matematycznego, może być wskazana dla każdego, kto chce przeczytać tę książkę. Pomocne byłoby również tło programowania, ale istnieją pewne odniesienia do języka R, operatorów i składni.

Thomas Owens
źródło
1

Jako inżynier komputerowy, który sam analizuje dane, naprawdę czytelną książką, która obejmuje rzeczy z dość niezbyt zachęcającej i czytelnej perspektywy (kosztem nie tyle, ile innych sugerowanych tutaj książek) było Programowanie Kolektywnej Inteligencji Toby'ego Segarana. Uważam, że jest o wiele bardziej przystępna niż, na przykład, książka Bishopa, która jest świetnym odniesieniem, ale zagłębia się w to, czego prawdopodobnie chcesz od pierwszego przejścia. W amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325

użytkownik1076
źródło
1

CRAN ma kilka dobrych przykładów książek dotyczących programowania statystycznego. Niektóre z nich nie dotyczą uczenia maszynowego i MCMC, ale każdy wpis jest opatrzony adnotacjami, więc powinieneś mieć ogólne pojęcie o zawartości każdej książki, aby zanurkować nieco dalej. http://www.r-project.org/doc/bib/R-books.html

Christopher Aden
źródło