Jestem bardzo zainteresowany potencjałem analizy statystycznej do symulacji / prognozowania / szacowania funkcji itp.
Jednak niewiele wiem na ten temat, a moja wiedza matematyczna jest wciąż dość ograniczona - jestem młodym studentem inżynierii oprogramowania.
Szukam książki, w której zacznę od pewnych rzeczy, o których wciąż czytam: regresji liniowej i innych rodzajów regresji, metod bayesowskich, metod monte carlo, uczenia maszynowego itp. Chciałbym też zacząć od R, więc jeśli istniała książka, która połączyła oba te elementy, byłoby świetnie.
Wolałbym, żeby książka wyjaśniała wszystko pojęciowo i nie zawierała zbyt wielu szczegółów technicznych - chciałabym, aby statystyki były dla mnie bardzo intuicyjne, ponieważ rozumiem, że w statystykach istnieje wiele ryzykownych pułapek.
Jestem oczywiście gotów przeczytać więcej książek, aby lepiej zrozumieć tematy, które uważam za wartościowe.
źródło
Aby połączyć R z wieloma opisanymi metodami, oprócz tekstu Maindonald i Braun wspomnianego przez @Jeromy Anglim, proponuję rzucić okiem na te dwie książki Juliana Faraway:
Obie mają dość proste wprowadzenie do różnych tematów, ta ostatnia obejmuje szeroki zakres bardziej nowoczesnych podejść do regresji, w tym wiele technik uczenia maszynowego, ale robi to w szybszym tempie z mniejszym opisem, i oba ilustrują techniki za pomocą kodu R.
Możesz pobrać kod z sekcji Książki na stronie R, aby uzyskać 20% rabatu na RRP, jeśli kupujesz bezpośrednio w Chapman & Hall / CRC Press, ale sprawdzaj cenę Amazon lub podobną dla swojego regionu, ponieważ często obniżka na Amazon jest konkurencyjna z ceną wydawcy po rabacie.
Jedną z dobrych rzeczy w tej parze książek jest to, że dają one dobry smak nowoczesnych metod z wystarczającą ilością szczegółów, aby następnie zbadać obszary, które chcesz bardziej szczegółowo z bardziej specjalistycznymi tekstami.
Niektóre treści, które trafiły do tych książek, są dostępne w internetowym pliku PDF autorstwa Juliana, za pośrednictwem sekcji Dokumenty na stronie R. Zachęcam do przejrzenia tej sekcji, aby sprawdzić, czy istnieją inne dokumenty, które mogą pomóc Ci zacząć bez konieczności wydawania gotówki. W tej sekcji można również znaleźć wczesną wersję tekstu, który stał się pierwszym wydaniem tekstu Maindonalda i Brauna.
źródło
Cóż, jeśli chcesz przegląd większości metod statystycznych oraz kod R dla nich, nie można zajść daleko nie tak z Venables i Ripley nowoczesnych Applied Statistics in s .
Jest prosty, przejrzysty i ma wystarczającą ilość kodu R, aby zacząć od praktycznie każdego statystycznego tematu, który chcesz nazwać.
Kupiłem tę książkę i uważałem na cenę w stosunku do liczby stron, ale warto było zainwestować. Zakładają rachunek różniczkowy i algebrę liniową, ale biorąc pod uwagę, że jesteś inżynierem, nie powinno to stanowić większego problemu.
Ich programowanie S jest również wspaniałe, ale prawdopodobnie nie to, czego teraz szukasz.
źródło
Elementy uczenia statystycznego mogą być nieco zastraszające dla początkujących. Poleciłbym przeczytać „ Wprowadzenie do statystycznego uczenia się za pomocą aplikacji w języku R ”, które można pobrać bezpłatnie stąd -> http://www-bcf.usc.edu/~gareth/ISL/ Opracowano również przykłady w języku R na końcu każdego rozdziału.
„ Uczenie maszynowe: perspektywa algorytmiczna ” Stephena Marslanda obejmuje również szerszy zakres tematów, nie zagłębiając się w matematykę.
źródło
Poprzednie odpowiedzi mają wiele po stronie aplikacji. Jeśli chodzi o materiał konceptualny i dobre myślenie statystyczne, poleciłbym Teorię prawdopodobieństwa: logikę nauki Edwina Jaynesa. Pierwsze trzy rozdziały są dostępne za darmo tutaj
Nie ma to jednak wielkiego wpływu na programy komputerowe, więc strona aplikacji dotyczy bardziej stylizowanych problemów. Ma genialny rozdział na temat paradoksów teorii prawdopodobieństwa, z jednym wyjątkiem, „paradoksem marginalizacji”, który jest tutaj właściwie rozwiązany (chociaż Jaynes zasadniczo „wyciąga lekcję”, ponieważ niewłaściwy uprzedni powinien być granicą sekwencji właściwych priorytetów) .
źródło
Dotychczasowe sugestie są doskonałe, ale koncentrują się na najbardziej zaawansowanych i wyrafinowanych technikach wykorzystujących oprogramowanie R. Aby uzyskać doskonały i intuicyjny przegląd klasycznych technik wielowymiarowych, podstawowe ramy dla najbardziej aktualnych podejść, w tym regresji, ANOVA, analizy czynnikowej, analizy skupień, analizy dyskryminacyjnej, analizy tabeli awaryjnej i analizy równań strukturalnych, wielowymiarowej Dillona i Goldsteina Statystyki opublikowane przez Wiley w latach 80. pozostają klasykiem. Jest przejrzysty i zastosowany w swoich przykładach, nie będąc zbyt teoretycznym ani przywiązanym do oprogramowania.
Dillon i Goldstein to książka, którą poleciłbym każdemu, kto chce zrozumieć, skąd się wzięły nowoczesne metody uczenia maszynowego.
źródło
Poleciłbym „Analiza szeregów czasowych i jej zastosowania z przykładami R” Shumwaya i Stoffera
Trzecie wydanie: http://www.stat.pitt.edu/stoffer/tsa3/
Kliknij i kup http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
źródło
Książka kucharska R to świetny sposób, aby wskoczyć do R i nauczyć się z niej korzystać. Jest bardzo praktyczny, więc świetnie nadaje się do nauki posługiwania się językiem, ale powinieneś również poszukać dobrej książki teoretycznej.
źródło