Jaka jest najbardziej wpływowa książka, którą powinien przeczytać każdy statystyk?

77

Gdybyś mógł cofnąć się w czasie i powiedzieć sobie, że na początku swojej kariery statystycznej chciałbyś przeczytać konkretną książkę, która to książka?

Neil McGuigan
źródło
1
Są tu naprawdę trzy osobne pytania! 1) Jaka jest najbardziej wpływowa książka w statystyce; 2) Jaką książkę powinien przeczytać każdy statystyk; 3) Jaką książkę przeczytałeś, którą najbardziej chciałbyś przeczytać dużo wcześniej. (2) i (3) prawdopodobnie mają znaczne nakładanie się; (1) może być dość wyraźny.
onestop
1
To pytanie jest innym sposobem spojrzenia na to pytanie. Mam nadzieję, że zapewni dobre uzupełnienie, gdy tylko otrzyma kilka dobrych odpowiedzi.
naught101

Odpowiedzi:

38

Oto dwa do umieszczenia na liście:

Tufte. Wizualne wyświetlanie informacji ilościowych
Tukey. Analiza danych rozpoznawczych

Rob Hyndman
źródło
10
Oba są warte okresowego ponownego czytania, może raz na dekadę, aby odświeżyć pomysły. Odnośnie Tukeya: wspaniale jest od czasu do czasu usiąść ołówkiem i papierem i przeprowadzić dogłębną analizę interesującego zestawu danych.
whuber
6
Jeśli chodzi o grafikę dla statystyki, wolę książki Williama Clevelanda od Tufte'a.
Peter Flom
1
Mam wrażenie, że te książki miały analizować dane nieliniowe, gdy metody nieliniowe nie były tak dostępne?
Robert Kubrick
34

Elementy uczenia statystycznego od Hastie, Tibshirani i Friedmana http://www-stat.stanford.edu/~tibs/ElemStatLearn/ powinny znajdować się w bibliotece każdego statystyki!

robin girard
źródło
6
Nie zgadzam się - ten jest ściśle związany z uczeniem maszynowym, a nie statystykami per se !
aL3xa
@ aL3xa: z pewnością koncentruje się na uczeniu maszynowym ... dlatego uważam, że statystycy powinni być na to wcześnie narażeni.
Cliff AB
Najwyraźniej jestem w mniejszości, sądząc, że ta książka jest przereklamowana. Wydaje się, że napisano go dla studenta, ale nie dbającego o szczegóły, jak coś działa.
Laconic
25

Nie jestem statystykiem i nie czytałem zbyt wiele na ten temat, ale być może

Lady Tasting Tea: Jak statystyki zrewolucjonizowały naukę w dwudziestym wieku

należy wspomnieć? To nie jest podręcznik, ale nadal warto go przeczytać.

Vivi
źródło
1
Popieram to. Ponadto istnieje wiele sugestii dotyczących dalszego czytania, które moim zdaniem są przydatne w książce.
Chris Beeley,
1
Myślę, że ta książka przemawia do tych, którzy na początku nie wiedzieli nic poza tępością języka i bagażem kulturowym związanym z polem. Ta książka dała skrzydłom umysłu - mówi, że statystyki dotyczą znalezienia użytecznej prawdy w morzu hałasu i nieporozumień.
EngrStudent
2
Wiele osób uważa to za zabawne, ale jest pełne niezwykłych błędów. Jeśli możesz go znaleźć, moja recenzja w Biometrics 57: 1273-1274 (2001) podaje daleką od pełnej listy. (Salsburg miesza różne Bernoullis, co jest łatwiejsze do zrobienia.)
Nick Cox
21

Teoria prawdopodobieństwa: logika nauki

Christopher D. Long
źródło
Ta książka jest trudna. Chodzi o podstawy prawdopodobieństwa, a nawet w tej części statystyk nie sądzę, że jest to tekst referencyjny. Wierzę, że na Ziemi może być 14 ludzi, którzy czytają i rozumieją jej pełne przesłanie, ale prawdopodobnie sklasyfikowałbym to jako lekturę obowiązkową dla probabilistów, ze względu na tysiące innych, którzy są głęboko w coś takiego jak GLM, GAM, Modele bayesowskie i inne rzeczy.
oznacza znaczący
1
Trochę smutne jest również to, że niektóre z późniejszych rozdziałów są zagubione i / lub niedopracowane - na przykład nie ma rozdziału o regresji, ale dostępny był szkic niepublikowanego manuskryptu z fascynującymi spostrzeżeniami na temat regresji „błędu pomiaru”. Jednak kilka bardzo fajnych rzeczy z seriali czasowych.
probabilityislogic
21

Darrell Huff - Jak kłamać ze statystykami

Rob Hyndman
źródło
5
Kiedy było to 3,95 $, a potem 4,95 $ w miękkiej oprawie, kupiłem kopie kilkunastu i rozdałem je znajomym, klientom i wszystkim innym, którzy mogą być zainteresowani.
whuber
To zasługuje na zapamiętanie. Ale nie-statystyczna treść datuje to niestety, szczególnie wyjątkowo dużą część kreskówek przedstawiających palących ludzi (a nawet dzieci). Ponad 60 lat, to już nie jest zabawne. (Niektóre przedruki, np. Jedna w Wielkiej Brytanii, zaktualizowały kreskówki.)
Nick Cox
14

Nie książka, ale niedawno odkryłem artykuł Jacoba Cohena w American Psychologist zatytułowany „Rzeczy, których się nauczyłem (do tej pory)”. Jest on dostępny w formacie pdf tutaj .

Freya Harrison
źródło
To wspaniały artykuł napisany w przejrzystym i konwersacyjnym stylu Cohena.
richiemorrisroe
12

Dawno temu mała monografia Jacka Kiefera „Wprowadzenie do wnioskowania statystycznego” odsłoniła tajemnicę wielu klasycznych statystyk i pomogła mi zacząć od reszty literatury. Nadal do niego nawiązuję i gorąco polecam silnym studentom na kursach z drugiego roku statystyki.

Rob Hyndman
źródło
2
Świetna rekomendacja, dziękuję - niedawno otrzymałem kopię na podstawie tego i naprawdę jest całkiem dobra.
ars
1
Cieszę się, że ktoś docenia tę książkę!
whuber
12

Nie twierdziłbym, że którąkolwiek z nich należy uznać za „najbardziej wpływową książkę ... [dla] statystyk”, ale dla tych, którzy dopiero zaczynają się uczyć na ten temat, dwie pomocne książki to:

  1. Robert Abelson, Statystyka jako argument zasadniczy
  2. Paul Murrell, Wprowadzenie do technologii danych
gung
źródło
Abelson przydałby się także wielu, którzy nie tylko zaczynają.
Peter Flom
11

Książka Williama Clevelanda „The Elements of Graphing Data” lub jego książka „Visualizing Data”

Robert Alberts
źródło
1
Obecnie czytam The Elements (wizualizacji danych nie ma w mojej obecnej bibliotece szkolnej). Jaka jest różnica między elementami a wizualizacją danych? Nie byłem w stanie znaleźć wystarczająco szczegółowych opisów, aby sformułować, jaka jest dokładnie różnica między nimi.
Andy W
2
Zgadzam się. Myślę, że dla statystów Cleveland jest lepszy niż Tufte.
Peter Flom
3
+1 do Roberta Albertsa i +1 do Petera Floma (książki Clevelanda są zdecydowanie lepsze dla statystyków, chociaż Tufte są również piękne i przeczytałem je wszystkie). @AndyW, Elements jest wprowadzający, np. Ma wytyczne dotyczące tworzenia grafiki informacyjnej. Wizualizacja pokazuje, jak skoncentrować proces eksploracji danych wokół grafiki; zaczyna się od wstępnej wizualizacji danych, mówi o bieżących problemach i przechodzi do oceny ostatecznego modelu (np. analizy resztkowej) za pomocą grafiki. Ten drugi jest znacznie bardziej pouczający niż ten pierwszy.
gung
@AndyW Jedna z nich jest nieco bardziej techniczna niż druga (nie pamiętam, która jest która jednak!)
Peter Flom
1
Jak mówi @gung, wizualizacja jest bardziej zaawansowaną kontynuacją elementów . Niektóre nakładają się, ale jest to raczej pomocne niż irytujące. Oba zdecydowanie zalecane. Ostatnia wersja pochodzi z 1993 i 1994 roku, ale wciąż są świeże ponad 20 lat później. Zwróć uwagę, że czytelnicy nietechniczni uzyskaliby wartość od obu: Mogę osobiście ręczyć, że matematyka w szkole średniej jest wystarczającym tłem.
Nick Cox
6

Po stronie matematyki / podstaw: Matematyczne metody statystyczne Haralda Craméra .

ars
źródło
Nawiasem mówiąc, jest to najwcześniejsze miejsce, w którym znalazłem wzmiankę o phi Cramera. Zadziwiające, jak urocza mała sidenotka w tej książce stała się znaną metodą wiele dziesięcioleci później.
Tal Galili
5

Dla jasnego przedstawienia tego, co powinno być w artykułach z czasopism nauk społecznych (pomoc, jeśli piszesz lub recenzujesz), podoba mi się Przewodnik recenzenta do metod ilościowych w naukach społecznych . W szczególności podoba mi się tabela desideratra jako streszczenie minimum, które powinien zawierać artykuł (artykuł, praca, rozprawa). Rozdziały są oddzielone techniką analizy, co jest miłe. Myślę, że książka ma szersze zastosowanie niż „tylko” nauki społeczne, ponieważ omawiane techniki są stosowane w wielu dziedzinach.

Dość wcześnie, więc być może nie ujęte w tym pytaniu, zapoznałem się z wprowadzeniem Ott'a do metod statystycznych i analizy danych . Jest to dość drogie, ale jest wspaniałym źródłem do pokazania podstawowych modeli statystycznych dla różnych metod GLM. Marzę o dniu, w którym czasopisma wymagają, aby artykuły zawierały formułę testowanego modelu statystycznego.

Do sprawdzania założeń testu, sprawdzania efektów różnych opcji w teście i tak dalej, jest to jedyna książka, którą chciałbym mieć podczas studiów . Mam poprzednią edycję i jest to jeden z najlepszych ogólnych zasobów, które kupiłem ze względu na przejrzysty i spójny sposób, w jaki przedstawione są informacje o testach. Zawiera ładne przykłady ilustrujące test (y) i nie wymaga od czytelnika określonego pakietu statystycznego, aby śledzić ekspozycje.

Michelle
źródło
4

Oszukani przez losowość Taleba

Taleb jest profesorem w Kolumbii i traderem opcji. W 2008 roku zarobił około 800 milionów dolarów, obstawiając przeciwko rynkowi. Napisał także Czarny Łabędź. Omawia absurdalność wykorzystania rozkładu normalnego do modelowania rynków i filozofuje na temat naszej zdolności do wykorzystania indukcji.

Neil McGuigan
źródło
8
Straszna książka napisana przez kogoś, kto nie rozumie statystyk ...
Xi'an
4
Xi'an, chcesz rozszerzyć lub podać linki do niektórych krytyków?
naught101
4
Istnieje wiele komentarzy na temat Czarnego łabędzia (i bardziej ogólnie Taleba) tutaj
Peter Flom
4

Przeczytałem powyższe zalecenia i zdziwiłem się, gdy stwierdziłem, że większość osób, które odpowiedziały na to pytanie, to osoby, które same nie są statystykami. Z 2 lub 3 wyjątkami ... Jako statystyczny pracownik, który również pracował z naukowcami społecznymi i pracownikami służby zdrowia, powiedziałbym, że gdybym mógł zabrać ze sobą tylko jedną książkę na bezludną wyspę, byłby to George EP Box, Statistics for Experimenters (Wiley). W swoim niepowtarzalnym humorystycznym i przejrzystym stylu wyjaśnia istotę i filozofię budowania modeli matematycznych dla prawdziwych danych. Rygorystyczne myślenie, bez matematycznych frywolności, bez bzdur, uczy nas myślenia statystycznego, kreślenia i wizualizowania wszystkiego, co się da. Arcydzieło kompetentnego naukowca stosowanego (inżynier chemik stał się statystykiem). Zawsze fajnie jest czytać ponownie.

jh
źródło
2
Dobry wybór! Jego współautor, zmarły William Hunter i J. Stuart Hunter, również przyczynili się do powstania książki.
Michael Chernick
Pierwsze wydanie jest czystsze i świeższe niż drugie. Box był świetnym statystykiem, ale w późniejszym życiu słabym korektorem.
Nick Cox
3

Sugerowano już wiele dobrych książek. Ale jest jeszcze jeden: „Rachunek z ryzykiem” Gerda Gigerenzera, ponieważ zrozumienie, w jaki sposób statystyki wpływają na decyzje, jest ważniejsze niż poprawienie całej teorii. W rzeczywistości grzech numer jeden, statystycy, nie komunikuje się wyraźnie. Jego książka mówi o konsekwencjach złej komunikacji i jak jej uniknąć.

czarny matowy
źródło
„zrozumienie, w jaki sposób statystyki wpływają na decyzje, jest ważniejsze niż zrozumienie całej teorii ...” Czy to nie prawda? Pochodzę z architektury i mogę powiedzieć, że czasem teoria
przeszkadza
2

Zamierzam zaproponować standardowy podręcznik w terenie. Mówię o prawdopodobieństwie i statystykach Degroota i Schervisha, opublikowanych po raz pierwszy w 1975 roku.

Ta książka służyła jako podręcznik dla wielu studentów i jest uważana za klasykę, słusznie, moim zdaniem. Obejmuje takie tematy, jak kombinatoryka, rozkłady, statystyki bayesowskie, wnioskowanie o prawdopodobieństwie i analiza regresji. O ile wiem, żaden inny podręcznik nie jest tak dokładny, więc uważam, że jest to obowiązkowy element.

JohnK
źródło
1

Niezbędny przewodnik po rozmiarach efektów: moc statystyczna, metaanaliza i interpretacja wyników badań Paula D. Ellisa

Ta książka jest obowiązkowa dla każdego, kto prowadzi jakiekolwiek badania naukowe, zwłaszcza takie, które nie pochodzą z czystych statystyk / matematyki. Poniższa książka rozszerza pierwszą dotyczącą przedziałów ufności.

Zrozumienie nowych statystyk: rozmiary efektów, przedziały ufności i metaanaliza autorstwa Geoffa Cumminga

Adam Przedniczek
źródło
1

„Najbardziej wpływowy” jest pojęciem zupełnie innym niż „każdy powinien przeczytać”. Nie mam kwalifikacji, aby odpowiedzieć na pierwsze - potrzebujesz kogoś, kto jest historykiem statystyki - ale po drugie, oto kilka:

  1. Statystyka jako argument zasadniczy Roberta Abelsona powinny być czytane przez każdego, kto robi lub używa statystyk w ramach nauki, nauk humanistycznych itp.

  2. Dwie książki Williama S. Clevelanda na temat grafiki: elementy grafowania danych i wizualizacji danych . Dla statystów postawiłbym je nawet przed pracą Tufte'a, bot, ponieważ Tufte nie jest opłacalny, ale ponieważ a) Cleveland pisał ze statystykami jako zamierzonymi odbiorcami oraz b) Cleveland oparł swoje rekomendacje na danych eksperymentalnych o tym, jak ludzie patrzą na wykresy, zamiast intuicji.

  3. Analiza danych eksploracyjnych autorstwa Johna Tukeya. Jest przestarzały, ale cenny - możesz dużo zrobić ołówkiem, papierem i mózgiem (przynajmniej jeśli twój mózg jest tak dobry jak mózg Tukeya!)

Peter Flom
źródło
1

Prawdopodobnie będzie to Bayesian Data Analysis firmy Gelman lub Deep Learning with Python . Ale to trochę jak przeniesienie streptomycyny do średniowiecza. Nie zostały one napisane, kiedy zaczynałem karierę, a sporo rzeczy z książek byłoby wtedy świetną wiadomością. Niektóre z najbardziej wpływowych rzeczy, o których wszyscy powinni wiedzieć, nie pochodzą z jednego źródła (być może powinny, ale ...).

Björn
źródło
0

Kennedy's Przewodnik po ekonometrii zawiera wiele praktycznych porad na temat szerokiego zakresu analiz statystycznych. Jest to jakoś niezwykle bogate w informacje i łatwe do odczytania, a ja wciąż uczę się czegoś nowego za każdym razem, gdy go wybieram.

Ekonometria wprowadzająca Wooldridge'a ma również sporo tego rodzaju dyskusji, ale jako podręcznik wprowadzający jest bardziej samodzielna. Żałuję, że nie miałem takiego kursu.

The Laconic
źródło