Jaka książka jest godna polecenia, aby rozpocząć naukę statystyki za pomocą R w tym samym czasie?

50

Książki do nauki statystyki za pomocą R.

Jakiej dokładnie książki szukam.

To, czego szukam, to książka, która uczy statystyk podczas korzystania z R, aby dać ci praktyczne doświadczenie, a tym samym pomaga ci razem uczyć się R. Widziałem na Amazon wiele książek, które próbują to zrobić, ale nie z R. Przykładami są Minitab i SAS.

Czy książka R i obliczenia statystyczne są opcją? - Wciąż brak odpowiedzi .

Książka R i obliczenia statystyczne: wprowadzenie do analizy danych za pomocą S-Plus wydaje się realne, ale opinia czytelnika tutaj byłaby pomocna i mile widziana.

Jak książka odnosi się do kursów statystyki?

Aby być bardziej precyzyjnym w kwestii tego, czego szukałem, rozważ te dwa kursy efekty uczenia się statystyki z wydziału matematyki na uniwersytecie. Obecnie jestem studentem:

Statystyki pośrednie oraz prawdopodobieństwo i statystyka , to znaczy szukam w książce normalnego kursu statystyki przechodzącego na poziom średniozaawansowany, ale zamiast zwykłej tablicy i papieru, zamiast tego musisz uczyć się i używać R. Oznacza to również, że szukam książki, która zakłada, że ​​chcę uczyć się statystyki od samego początku.

Ta książka jest również dla badaczy.

Jestem również inżynierem oprogramowania, ale sądzę, że obecna sytuacja jest pełna gór danych i chcę uczyć się statystyki, aby pisać kod do automatyzacji, który ma zastosowanie w wielu innych dziedzinach.

Oznacza to, że nie jestem zainteresowany poznawaniem każdego szczegółu każdej właściwości dla każdej krzywej, ale bardziej zależy mi na zrozumieniu danych dla mojej dziedziny badań, chociaż nie miałbym nic przeciwko, gdyby książka chciała wniknąć głęboko w to .

Ostatnią motywacją jest czytanie prac naukowych w różnych społecznościach, które twierdzą, że wyniki oparte są na wnioskach statystycznych, podczas gdy nie ma czytelnego dowodu na to, że założenia / ograniczenia statystyki są naruszane, czy nie.

Książka AR, która nie jest zbytnio poświęcona statystykom, nie zapewni, że nie będę kontynuowała tej praktyki, dlatego też postanowiłam poszukać książki podobnej do kursu statystyki, używając R, zamiast bawić się książką przeglądową.

Powiązane pytania w Cross Validated.

Odpowiedzi i opinie dotyczące tego pytania.

@Julie

Sugerowanych książek było kilka, z którymi się już spotkałem, ale są przykładem, który niestety mi nie odpowiada:

Statystyka wprowadzająca z R , korzystanie z R do statystyk wprowadzających , statystyka: Wprowadzenie z użyciem R to kilka książek, które już przeglądałem na Amazon, ale dotyczą przeglądu statystyk lub przyjmują założenia, które wymagają wcześniejszej wiedzy statystycznej. Problem z książkami poglądowymi polega głównie na tym, że nie zwraca się uwagi na założenia, ograniczenia i nie zapewnia wystarczającego wyjaśnienia, aby uzyskać sens informacji.

Jeśli uważasz, że nie ma książki, która pasowałaby do tej potrzeby, lub uważasz, że książka R lub Statystyka komputerowa: wprowadzenie do analizy danych za pomocą S-Plus pasowałoby do tego, doceniłbym również tego rodzaju odpowiedź.

@Christopher Aden

Wprowadzenie do prawdopodobieństwa i statystyki Używanie R wydaje się być najbliższe, ale nadal ogólne w stosunku do tego, czego szukałem.

Spodziewałem się książki takiej jak David S. Moore, The Basics of Statistics, ponieważ:

  • Obejmuje wszystkie przedmioty statystyki.
  • Wykorzystuje dwa narzędzia, miniTab i inne, do praktycznego uczenia się na właśnie wyjaśnionej metodzie.
  • To bardzo podkreśla założenia i ograniczenia. Jest to bardzo ważne dla naukowca, który nie odbył szczegółowego kursu statystycznego i chce korzystać ze statystyk. Prawie nie obejrzą ich książki przeglądowe, co jest niebezpieczne dla badaczy.
    • Spis treści książki można zobaczyć tutaj . Zauważ, że skupiamy się na statystykach, a użycie narzędzia ma na celu lepsze zrozumienie i sprawienie, aby uczeń wiedział, jak używać narzędzi do wykonywania statystyk po nauce w łatwiejszy sposób. Nie chodzi o narzędzie, chodzi o statystyki!

Chcę dokładnie tego samego, ale używając R.

@Gregory Demin

Wykorzystuje R jako przykłady pedagogiczne, zakłada, że ​​chcesz nauczyć się statystyki, a co najważniejsze, jest to oprogramowanie typu open source. Niestety nie obejmuje ANOVA ani ANCOVA ani bardziej zaawansowanych przedmiotów.

@Peter Ellis

Dobra propozycja dla podręcznika, który omawia to, czego pragniemy w tym pytaniu.

Książki w opinii pytającego, które odpowiadają na pytanie.

@Peter Ellis i @Gregory Demin.

Zbiór książek R na Amazon

Dyskusję Amazon na temat książek R dla różnych studentów można znaleźć tutaj .

Wykłady wideo nauczające statystyki z wykorzystaniem R.

Google Tech Talks z 2007 r., Które również motywowały to pytanie i obejmują więcej informacji na temat eksploracji danych niż statystyk, ale używania R razem tutaj .

rev Oeufcoque Penteano
źródło

Odpowiedzi:

15

Myślę, że jednym z powodów, dla których tak trudno jest odpowiedzieć na to, jest fakt, że R jest tak potężny i elastyczny, że prawdziwe wprowadzenie do programowania w języku R znacznie wykracza poza to, co zwykle jest potrzebne we wprowadzeniu do statystyki. Książki, które uczą statystyki za pomocą MiniTab, JMP lub SPSS, robią stosunkowo proste rzeczy z oprogramowaniem, które ledwo zarysowuje powierzchnię tego, co R jest zdolny do manipulacji danymi, symulacji, niestandardowych funkcji itp.

Powiedziawszy to, myślę, że Nowoczesne statystyki Wilcoxa dla nauk społecznych i behawioralnych: praktyczne wprowadzenie (2012) to genialna nowa książka. Zakłada brak wiedzy statystycznej i prowadzi od zera do szerokiej gamy nowoczesnych solidnych technik; i zakłada niewiele więcej wiedzy R niż umiejętność jej otwarcia i załadowania zestawu danych. Obejmuje on również wiele klasycznych technik, w tym ANOVA (wspomniane w PO).

Widziałbym tę książkę jako odpowiednik książek, które jednocześnie wprowadzają statystyki i pakiet statystyk, takich jak SPSS. Jednak nie nauczy Cię programowania w języku R - tylko jak zrobić z nim nowoczesną analizę statystyczną, z naciskiem na solidne techniki, które rozwiązują znane problemy klasycznej analizy, które są pomijane przez większość innych podejść do nauczania statystyki.

Trzy problemy z klasycznymi metodami, które szczególnie omawia ta książka od samego początku, to pobieranie próbek z dystrybucji o grubych ogonach; skośność; i heteroscedastyczność.

Wilcox używa R, ponieważ „Jeśli chodzi o wykorzystanie nowoczesnych technik statystycznych, R wyraźnie dominuje. Podczas analizy danych jest to bez wątpienia najważniejsze opracowanie oprogramowania w ostatnim ćwierćwieczu. I jest bezpłatne. Chociaż klasyczne metody mają fundamentalne wady , nie sugeruje się ich całkowitego porzucenia ... W związku z tym zamieszczono ilustracje, w jaki sposób stosować standardowe metody z R. Szczególnie ważne jest to, że dodatkowo przedstawiono ilustracje dotyczące stosowania nowoczesnych metod przy użyciu ponad 900 R funkcje napisane dla tej książki. ”

Ta książka jest tak doskonała, że ​​po zakupie kopii do pracy kupiłem własną kopię w domu.

Nagłówki rozdziałów to:

  1. numeryczne i graficzne podsumowania danych;
  2. prawdopodobieństwo i powiązane pojęcia;
  3. rozkłady próbkowania i przedziały ufności;
  4. testowanie hipotez;
  5. regresja i korelacja;
  6. metody ładowania początkowego;
  7. porównanie dwóch niezależnych grup;
  8. porównanie dwóch grup zależnych;
  9. jednokierunkowa ANOVA;
  10. projekty dwukierunkowe i trójdrożne;
  11. porównywanie więcej niż dwóch grup zależnych;
  12. wielokrotne porównania;
  13. niektóre metody wielowymiarowe;
  14. solidny regres i środki asocjacji;
  15. podstawowe metody analizy danych kategorycznych;

Dalsza edycja - po sprawdzeniu przykładu Davida Moore'a tego, czego szukasz, naprawdę uważam, że książka Wilcoxa spełnia tę potrzebę.

Peter Ellis
źródło
1
Dziękuję bardzo, cieszę się, że otrzymałem kolejny materiał referencyjny, który jest również dostępny jako tom do druku. Zmienię główny post później, aby dołączyć twoje odniesienie, jeśli do tego czasu nikt tego nie zrobi! Naprawdę bardzo mile widziane. Żeby to potwierdzić, masz na myśli, że uczysz kreślenia wspomnianej teorii? To dla mnie więcej niż dobrze! Proszę potwierdzić.
Oeufcoque Penteano
Nie jestem do końca pewien, co rozumiesz przez „wykreślić teorię” - ale z pewnością w dużym stopniu wykorzystuje wykresy i ma kod R do wykonywania wszystkich teorii, które obejmuje (zarówno wnioskowanie statystyczne, jak i wykreślanie). Wilcox zapewnia również własny pakiet funkcji lub odniesień do innych, przedstawiając najnowocześniejsze, solidne podejścia opracowane w ciągu ostatnich kilku dekad. Każda technika zawiera przykłady, w tym kod. Zredagowałem odpowiedź, aby uwzględnić nagłówki rozdziałów.
Peter Ellis,
Tak, masz całkowitą rację! Fragmenty kodu, które pomagają mi wykonać całą teorię na temat R, byłyby bardzo mile widziane i konieczne w tym, czego szukam. Dziękujemy za dostarczenie listy! Potrzebowałem też książki, która mówiłaby o bootstrapie. Już zamawiam tę książkę. Wkrótce zmodyfikuje główny post.
Oeufcoque Penteano
Przeglądam już tę książkę. +500 za tę sugestię, DOKŁADNIE to, czego szukałem: gruby tom pełen informacji o statystykach i odpowiedniej funkcji, aby użyć go na R (który jest darmowy i open source tak!). Jest bardzo tani jak na tę książkę i jej wyjątkowość. Nie obawiaj się być naukami behawioralnymi. Używam go, mimo że jestem studentem CS. Odkryłem, że książki ze statystykami behawioralnymi są dla mnie jeszcze bardziej pomocne niż te ze statystyk, aby zrozumieć, co się dzieje. Nie twierdzę, że czysta statystyka jest bezużyteczna, potrzebujesz jej. Użyłem Paula Meyera (1965).
Oeufcoque Penteano
6

Może być „Wprowadzenie do myśli statystycznej” ?

Gregory Demin
źródło
1
Świetna sugestia, uważam to za poprawną odpowiedź, jeśli nie ma już odpowiedzi na ten temat, ponieważ ta wciąż nie obejmuje bardziej zaawansowanych pojęć, takich jak ANOVA (a przynajmniej to, co sugeruje wyszukiwanie). Świetne również za bycie wolnym.
Oeufcoque Penteano
4

Post Julie w książce Verzani jest naprawdę dobrym wyborem dla kogoś, kto nie ma doświadczenia w statystyce ani R. Jest wystarczająco miękki zarówno dla R, jak i statystyk, że jest używany przez dział nauk politycznych w UC Davis, a ci studenci nie mają zajęć programistycznych ani matematyki wyższego poziomu. Jego prace są dostępne w pakiecie CRAN, simpleR .
Ponieważ pochodzisz z informatyki, nie sądzę, że potrzebujesz bardzo łagodnego wprowadzenia do R. Zakładam, że masz przyzwoitą wiedzę o strukturach danych, określaniu zakresu i dlaczego potrzebujesz debuggera. Aby uzyskać bardzo skoncentrowaną na komputerach perspektywę na R (więcej niż można zobaczyć nawet w klasie programowania statystycznego w dziale statystyki studiów licencjackich), sprawdź The Art of R Programming Norm Matloff. Aby sprawdzić, czy Cię to interesuje, Matloff ma na swojej stronie internetowej bardzo wstępną wersję wstępnego wydruku . Jeśli podoba Ci się jego styl, polecam zabranie gotowej kopii. Jest profesorem CS i pisze książkę bardziej dla odbiorców CS niż dla odbiorców statystyki.
G. Jay Kerns (częstym plakat tutaj) ma także książkę dostępną on-line o nazwie Wprowadzenie do rachunku prawdopodobieństwa i statystyki Korzystanie R . Osobiście uważam, że jest to wspaniała usługa do wprowadzenia odwagi R.
Zdaję sobie sprawę, że twoje pytanie jest skierowane na uzyskanie odpowiedzi skierowanych na kierunku CS, ale proszę również przejrzyj ten temat: Jaką książkę poleciłbyś naukowcom niepaństwowym?

Christopher Aden
źródło
1
Uważam, że wprowadzenie do prawdopodobieństwa i statystyki Korzystanie z R jest najbliższe, ale wciąż nie jest to, czego szukam. W ciągu sekundy edytuję pytanie, aby podać odniesienie do dokładnie tego, czego szukam, ale niestety używa miniTab zamiast R. Sztuka programowania R wydaje się bardziej zainteresowana R niż faktem uczenia się statystyki (popraw mnie, jeśli jestem źle), i znowu poprzednia książka niepokoi mnie o to, że jestem wystarczająco rygorystyczny w statystyce, aby przyjmować założenia statystyczne, których niestety mi brakuje. Podsumuję również główne punkty.
Oeufcoque Penteano
Masz rację co do TAoRP - kładzie on większy nacisk na programowanie niż na naukę statystyki. Jestem trochę zdezorientowany twoim pytaniem. O ile nie chcesz zacząć uczyć się statystyki matematycznej, musisz poczynić pewne założenia i przyjąć je wiary - przynajmniej krótko. Chcesz książkę, która wprowadza statystyki, czy przykłady w R i nie przeskakuje założeń? Większość książek wprowadzających zapewni intuicję przy modelowaniu założeń, ale może nie sformalizować logiki. Prawdopodobnie musisz do tego przeczytać książkę statystyk matematycznych.
Christopher Aden
Zobacz książkę, o której wspomniałem w mojej ostatniej edycji pytania. Robi dokładnie to, co chciałem. W rzeczywistości pytanie wynikało z czytania fragmentów tej książki. Chcę tego samego, ale wraz z R. podkreśliłem również punktami, co w książce jest tak ważne z ogromnej części motywacyjnej dla tych, którzy nigdy nie natknęli się na książkę. Mam nadzieję, że teraz jest jasne. Spis treści książki można również zobaczyć tutaj whfreeman.com/Catalog/product/…
Oeufcoque Penteano
3

Uważam, że ta książka jest bardzo przydatna, ale zakłada pewną znajomość podstawowych terminów statystycznych, takich jak wartość p, ANOVA i tak dalej.

Ta książka oferuje znacznie łagodniejsze wprowadzenie do samych pojęć statystycznych ...

Julie
źródło
+1. Książka Verzaniego jest bardzo delikatnym wprowadzeniem i jest również dostępna z jego pakietu CRAN. Książka Dalgaarda jest również miła i na pewno mówi jako ekspert, nie będąc obcą w świecie R.
Christopher Aden
@ChristopherAden - którą książkę poleciłbyś zbudować solidne podstawy do myślenia o statystykach koncepcyjnie, bez zagłębiania się (w ogóle, naprawdę) w samą matematykę?
Julie,
@Julie, jaki jest twój główny cel? Któregoś dnia dostałem książkę z 1979 roku o statystyki dla studentów socjologii od profesora społecznego. Czasami są bardziej pomocni, chociaż profesor wspomniany w Amazon komentuje, że zwykle popełniają więcej błędów, szczególnie w formułach, które są niebezpieczne dla profesorów, którzy nie są zbytnio w statystyki :(
Oeufcoque Penteano
Julie: To zdecydowanie pytanie, na które przyjrzę się, by dać lepsze rekomendacje. Nauczyłem się od Statistics: The Art and Science of Learning From Data, autorstwa Agresti i Franklin. Uważam, że to podejście oparte na aplikacji jest świetne. Nie oferuje podziału 50-50 statystyk-i-R, którego chciał PO, więc nie zawracałem sobie głowy wspominaniem o tym. Nadal jestem debiutantem w statystykach, więc weź moje rekiny z odrobiną soli.
Christopher Aden
1
Cześć Julie. Byłoby miło, gdybyś mógł podać pełne cytowanie każdej książki w swojej odpowiedzi. :)
kardynał
1

Dobra książka jest produkowana przez Adelaide University, jest dostępna bezpłatnie online i jako zakup w wersji drukowanej.

Nauka statystyk z R.

Jest bardzo dobrze rozbity w swojej strukturze i obejmuje wprowadzenie do R, a także podstawowe wprowadzenie do statystyki przed przejściem do bardziej szczegółowych tematów.

Istnieje bardzo głęboka lista książek na stronie R, podając ją jako odniesienie, jednak obecnie nie czytałem tytułów, będzie aktualizowana wraz z postępem.

https://www.r-project.org/doc/bib/R-books.html

powiedz
źródło
0

Nauka statystyk za pomocą R autorstwa Randall E. Schumacker wychodzi ze stycznia 2014 r. Z publikacji SAGE Publications. Zawiera cały materiał w poście.

Niespokojny
źródło
3
Ludzie mogą informować nas o swojej pracy. Bardzo cenimy sobie tego rodzaju wiedzę z pierwszej ręki. Potwierdzenie swojego związku z jakąkolwiek rekomendacją jest czymś więcej niż dobrym pomysłem: nadaje rekomendacji większą wiarygodność i zapewnia zasługę, na którą zasługujesz :-). Być może mógłbyś skorzystać z okazji, Randy, aby wzmocnić swoją odpowiedź, potwierdzić swoje autorstwo i powiedzieć więcej o tym, dlaczego twoja książka byłaby świetnym wyborem do celów określonych w pytaniu. Witamy na naszej stronie!
whuber