W latach szkolnych i na uniwersytecie miałem wystarczająco dużo kursów statystyki. Dobrze rozumiem pojęcia, takie jak CI, wartości p, interpretacja istotności statystycznej, testowanie wielokrotne, korelacja, prosta regresja liniowa (z najmniejszymi kwadratami) (ogólne modele liniowe) i wszystkie testy hipotezy. Poznałem go w większości wcześniejszych czasów głównie matematycznie. I ostatnio, dzięki książce Intuitive Biostatistics , zrozumiałem i bezprecedensowe zrozumienie faktycznej teorii konceptualnej.
Teraz brakuje mi zrozumienia dopasowania modeli (szacowanie parametrów do modelu) i tym podobnych. W szczególności pojęcia takie jak szacowanie maksymalnego prawdopodobieństwa, uogólnione modele liniowe, bayesowskie podejście do statystyki wnioskowania zawsze wydają mi się obce. Nie ma wystarczającej liczby przykładów, samouczków lub rozsądnych pod względem koncepcyjnym, jak można znaleźć na prostych modelach probabilistycznych lub na innych (podstawowych) tematach w Internecie.
Jestem bioinformatykiem i pracuję na danych RNA-Seq, które zajmują się nieprzetworzoną liczbą odczytów w kierunku znalezienia, powiedzmy, ekspresji genów (lub różnicowej ekspresji genów). Z mojego tła, nawet jeśli nie znam modeli statystycznych, jestem w stanie zrozumieć przyczynę założenia rozkładu Poissona i ujemnych dwumianów itd. Ale niektóre prace dotyczą uogólnionych modeli liniowych i szacują MLE itp., Które Uważam, że mam niezbędne przygotowanie do zrozumienia.
Myślę, że o to, o co proszę, jest podejście, które niektórzy eksperci uważają za przydatne i (a) książki, które pomagają mi zrozumieć te pojęcia w bardziej intuicyjny sposób (nie tylko rygorystyczną matematykę, ale teorię popartą matematyką). Ponieważ w większości zamierzam je zastosować, byłbym zadowolony (w tej chwili) ze zrozumienia, co jest, a później mogę wrócić do rygorystycznych dowodów matematycznych ... Czy ktoś ma jakieś zalecenia? Nie mam nic przeciwko kupowaniu więcej niż 1 książki, jeśli tematy, o które prosiłem, są rzeczywiście rozproszone, aby je omówić w książce.
Dziękuję Ci bardzo!
Odpowiedzi:
Znajdziesz tu wszystko, co nie bayesowskie, o które pytałeś . Strategie modelowania regresji Franka Harrella . Zalecenia bayesowskie zostawiłbym bardziej kompetentnym ludziom (chociaż mam na półce książki Gelmana, Carlina, Sterna i Rubina , a także Gilksa , Richardsona i Speigelhaltera ). Na rynku powinno być kilka książek o biostatach bayesowskich.
Aktualizacja: McCullach i Nelder (1989) to oczywiście klasyczna książka na temat GLM. To był przełomowy jak na swój czas, ale szczerze mówiąc, uważam to za nudne. Poza tym nie obejmuje późniejszych dodatków, takich jak diagnostyka resztkowa, modele z zerowym napełnieniem lub rozszerzenia wielopoziomowe / hierarchiczne. Hardin i Hilbe (2007) szczegółowo opisują niektóre z tych nowszych rzeczy w praktycznych przykładach w Stata (gdzie GLM i rozszerzenia są bardzo dobrze zaimplementowane; Hardin pracował w Stata Corp. pisząc wiele z tych poleceń, a także przyczyniając się do estymator kanapkowy).
źródło
Poleciłbym następujące dwie książki:
źródło