Słynne cytaty statystyczne

248

Jaki jest twój ulubiony cytat statystyczny?

To jest wiki społeczności, więc proszę o jeden cytat na odpowiedź.

robin girard
źródło
8
Czy to pytanie powinno być naprawdę „znanymi cytatami na temat statystyki”?
naught101

Odpowiedzi:

248

Wszystkie modele są błędne, ale niektóre są przydatne. (George EP Box)

Odniesienie: Box & Draper (1987), Empiryczne budowanie modeli i powierzchnie reakcji , Wiley, s. 1. 424.

Także: GEP Box (1979), „Solidność w strategii budowy modelu naukowego” w Solidarności w statystyce (red. Launer i Wilkinson), s. 1. 202

Rob Hyndman
źródło
3
Często
25
To zdanie samo w sobie jest modelem (epistemologicznym)
użytkownik603
6
ale zobacz miłą dyskusję wokół tego cytatu na blogu Gelmana, j.mp/9SgIBO
chl
14
I to jest prawdziwy cytat, w przeciwieństwie do czegoś, co „przypisuje się” Boxowi. Pojawia się np. W Box & Draper (1987), Empirical budowanie modelu i powierzchnie reakcji , Wiley, na stronie 424. Tak, poszedłem i poszukałem go, zanim użyłem go w pracy.
Stephan Kolassa
16
Niestety zbyt wiele osób korzysta z niego, aby usprawiedliwić się wadami swoich modeli. Z mojego osobistego doświadczenia wynika, że ​​jego użycie jest znakiem alarmowym.
JohnRos
206

„Przybliżona odpowiedź na odpowiedni problem jest warta znacznie więcej niż dokładna odpowiedź na przybliżony problem”. - John Tukey

John D. Cook
źródło
16
Podoba mi się ten, czy można doradzić, kiedy ludzie piszą pytania na tej stronie?
robin girard
7
Absolutnie ... zadawanie właściwych pytań jest jedną z najważniejszych umiejętności.
Shane
5
Pamiętam raz, kiedy prywatna firma z branży zleciła matematykowi rozwiązanie problemu routingu śmieci. Krótko mówiąc, matematyk narzekał, że firma była zainteresowana znalezieniem rozwiązania „wystarczająco blisko”, a nie rozwiązania optymalnego. Myślę, że ostatecznie został zwolniony i zamiast tego sprowadzono badacza operacji.
dassouki
2
@dassouki Myślę, że cytat dotyczy bardziej pytania… coś w nauce nie polega na znalezieniu dobrej odpowiedzi, ale na znalezieniu dobrych pytań!
robin girard
13
„O wiele lepsza jest przybliżona odpowiedź na właściwe pytanie, które jest często niejasne, niż dokładna odpowiedź na złe pytanie, które zawsze można uściślić.” John W. Tukey 1962 Przyszłość analizy danych. Annals of Mathematical Statistics 33: 1-67 (patrz str. 13-14) Bez wątpienia powiedział podobne rzeczy w innym czasie, ale jest to dokładne źródło i wersja, którą zwykle widzę cytowana.
Nick Cox
137

„Wezwanie statystyk po zakończeniu eksperymentu może być niczym więcej niż poproszeniem go o przeprowadzenie sekcji zwłok: może być w stanie powiedzieć, z czego umarł eksperyment”.

- Ronald Fisher (1938)

Cytat można przeczytać na stronie 17 artykułu.

RA Fisher. Przemówienie Prezydenta profesora RA Fishera, FR , Sankhyā: The Indian Journal of Statistics (1933–1960), t. 4, nr 1 (1938), s. 14–17. http://www.jstor.org/stable/40383882

nieznanych
źródło
Przeczytałem nieco inną wersję tego cytatu przez Fishera: „Zatrudnienie lekarza po zebraniu danych jest jak zatrudnienie lekarza, gdy pacjent jest w kostnicy. Może być w stanie powiedzieć ci, co poszło nie tak, ale jest mało prawdopodobne aby móc to naprawić ”.
Peter Flom
2
@Peter Czy to naprawdę „Zatrudnianie lekarza po danych ...”, czy też powinien gdzieś tam być „statystyka”?
Dason
3
@dason Masz rację! Chyba ktoś edytował mój post
Peter Flom
125

87% statystyk powstaje na miejscu

-Nieznany

Dilbert.com Dilbert.com

Henrik
źródło
4
imgur.com/0dsVC.gif
JM nie jest statystykiem
1
45,8% ludzi nie wierzy w te statystyki
prawdopodobieństwo jest
ROFL ROFL Scott Adams mnie zabija
Hack-R
Ha! Za każdym razem, gdy widzę prognozę, która zawiera zbyt wiele cyfr znaczących, myślę o tym cytacie. „Prognozuje się, że do roku 2020 liczba właścicieli telefonów komórkowych wyniesie 4 372 138 975”. Naprawdę? Jakby ktokolwiek mógł prognozować lepiej niż 4,3B lub 4,4B.
JoeTaxpayer
121

Statystycy, podobnie jak artyści, mają zły nawyk zakochiwania się w swoich modelach.

- George Box

shabbychef
źródło
121

Statystyki są jak bikini. To, co ujawniają, jest sugestywne, ale to, co ukrywają, jest niezbędne.

-Aaron Levenstein

jilles de wit
źródło
10
A życie bez nich sprawia więcej radości? Sądzę, że do tej pory możesz wziąć metaforę ...
naught101
To właśnie stał się moim ulubionym cytatem
Ali Turab Lotia
To może być? en.wikiquote.org/wiki/Statystyka nieco inne sformułowanie. Jeśli przeszukujesz cały cytat, nie jestem jedynym, który go używa, ale nie mam źródła.
jilles de wit
116

W Boga ufamy. Wszyscy inni muszą przynieść dane.

(W. Edwards Deming)

Harvey Motulsky
źródło
64
Bóg też musi przynieść dane.
KalEl,
9
Bóg może tworzyć dane.
Leo
6
@Leo Jakie dane masz na poparcie tej hipotezy? :)
probabilityislogic
2
Ooh, czy to nowa wersja Paradoksu Omnipotencji? Jeśli Bóg stworzył nowe dane, to jak mógłbyś udowodnić, że nie było ich od zawsze?
naught101
5
To prawda aksjomatyczna.
abaumann
105

Prognozy są bardzo trudne, szczególnie w odniesieniu do przyszłości.

- Niels Bohr

Meh
źródło
18
Prognozowanie przeszłości może być zaskakująco trudne!
walkytalky,
4
Ten został przypisany wielu różnym osobom larry.denenberg.com/predictions.html i jest kwestionowane, że będzie to Niels Bohr en.wikiquote.org/wiki/Niels_Bohr
gerrit
101

Wszystkie uogólnienia są fałszywe, włączając to.

Mark Twain

aL3xa
źródło
To jest genialne!
probabilityislogic
Chodzi o to, że są jakieś uogólnienia, które są całkowicie prawdziwe?
naught101
1
@ naught101 Definicje i prawa przyrody (gdy je znamy) są uogólnieniami, które uważam za prawdziwe. Chociaż te pierwsze nie są tak interesujące jak w: wszystkie „prawdziwe uogólnienia” są prawdziwe.
ziggystar
95

Jeśli wystarczająco torturujesz dane, natura zawsze się przyzna.

- Ronald Coase (cyt. Z Coase, RH 1982. Jak wybrać ekonomiści? American Enterprise Institute, Waszyngton, DC). Myślę, że większość, którzy słyszą ten cytat, nie rozumie jego głębokiego przesłania przeciwko pogłębianiu danych.

shabbychef
źródło
1
Tak, twoje wyjaśnienie jest bardzo potrzebne. Mogę sobie wyobrazić, że wielu usunęłoby całkowicie przeciwne znaczenie z cytatu. Uwaga dla mnie, nawet torturowanie pomysłów jest złem.
Aditya
91

Duży komputer, złożony algorytm i długi czas nie równa się nauce.

- Robert Gentleman

Paolo
źródło
50
Nadal wygląda obiecująco.
3
Ciekawe, gdzie to powiedział / napisał?
Hack-R
88

Myślenie statystyczne stanie się kiedyś tak niezbędną kwalifikacją do skutecznego obywatelstwa, jak umiejętność czytania i pisania.

--HG Wells

Michael Bishop
źródło
Na Boga miał rację!
KalEl,
12
Nie wiem, widziałeś ostatnio wielu sprawnych obywateli?
Raskolnikov,
2
Wciąż czekam ...
naught101
1
Anonimowy użytkownik poprosił o źródło tego „cytatu”; on / ona wskazała również, że Gigerenzer zauważył, że na próżno szukał publikacji Wellsa w poszukiwaniu oryginału.
chl
84

Połączenie niektórych danych i bolesne pragnienie odpowiedzi nie gwarantuje, że z danego zbioru danych można wydobyć rozsądną odpowiedź

Tukey

Robin Girard
źródło
5
Jako biolog-naukowiec mamroczę sobie to podczas wielu seminariów ...
N Brouwer
Tego powinno się uczyć w szkole zarządzania na długo przed rozdziałem dotyczącym obliczania KPI
rumtscho
83

Nie ma rutynowych pytań statystycznych, tylko wątpliwe rutyny statystyczne.

DR Cox

Tzippy
źródło
3
Rolf Sundberg przypisał ten cytat JM Hammersleyowi w artykule z 1994 roku: dx.doi.org/10.1016/0169-7439(93)E0041-2
onestop
1
Następująca próba edycji została przeprowadzona przez anonimowego użytkownika: „Komentarz: Po qoute powiedziano mi, że przypisałem ten (doskonały) cytat Hammersleyowi. Powodem mojego przypisania go Hammersleyowi było to, że zapytałem Davida Coxa przed użyciem cytat, a on odpowiedział, że pierwotnie nie był to jego, ale frazowanie Hammersleya. Rolf Sundberg ".
gung
To źle - dowód? - testy t wartości p! rutynowe obliczenia wykonywane przez cały czas. pewnie może to być „wątpliwe”, ale nadal jest rutyną!
probabilityislogic
76

Statystyka - temat, który dla większości statystyk jest trudny, ale w którym wielu lekarzy jest ekspertami. „Stephen S. Senn”

Kieran
źródło
3
Źródło : Stephen Senn, Problemy statystyczne w opracowywaniu leków , strona 4. media.wiley.com/product_data/excerpt/71/04700187/0470018771.pdf
onestop
2
Myślę, że dzieje się tak, ponieważ fizyka ma podobny poziom pedanterii wymagany w statystykach, a fizyk ma ogromną korzyść, że chce pozbyć się niepewności, statystyki po prostu chcą to opisać.
probabilityislogic
26
Lekarze fizycy
David Roberts
1
To może być mój nowy ulubiony
Fomite
1
Chociaż mogłem sobie wyobrazić, że dotyczy to również fizyków.
WetlabStudent
75

Dziwne wydarzenia pozwalają sobie na luksus występowania.

- Charlie Chan

ars
źródło
14
Nie przeszkadza mi głosowanie w dół, ale utrzymuję, że jest to głęboki punkt statystyczny, którego nie należy lekceważyć. ;-)
ars
Zwłaszcza jeśli jesteś w sektorze usług finansowych.
DW
2
Powiedziałbym, że kluczem do złamania znaczenia tego cytatu jest rozpoznanie, że słowo „dziwne” odnosi się do tego, jaki jest twój model „normalny”.
Prawdopodobieństwo
1
To tylko pełny sposób powiedzenia „zdarzają się wartości odstające”, czy też brakuje mi czegoś głębszego?
naught101
Podobny cytat, który mi się podoba, to: „Przy wystarczająco dużej próbce może się zdarzyć każda oburzająca rzecz” (Persi Diaconis i Frederick Mosteller).
MattBagg
75

Przyjemny, o którym pomyślałem:

Myślę, że o wiele bardziej interesujące jest życie nie wiedząc, niż mieć odpowiedzi, które mogą być błędne.

Autor Richard Feynman ( link )

Tal Galili
źródło
Gdybym był bukmacherem, powiedziałbym, że Richard Feynman był agnostykiem
prawdopodobieństwo jest
1
Czy Feynman kwalifikuje się jako statystyk?
Glen_b
Fajny, ale Thomas Gray lepiej to ujmuje: „Tam, gdzie ignorancja jest błogością, głupota jest mądra”.
Marco Stamazza,
@Glen_b Właściwie pytanie brzmi: „Jaki jest twój ulubiony cytat statystyczny?” nie „Jaki jest twój ulubiony cytat ze statystyki?”
maszyna
Z tego, co widzę, intencja cytatu też nie jest statystyczna.
Glen_b
70

Używa statystyk, tak jak pijany mężczyzna używa latarni, bardziej do wsparcia niż do oświetlenia.

- Andrew Lang

Neil McGuigan
źródło
67

Najlepszą rzeczą w byciu statystykami jest to, że możesz grać na podwórku każdego.

- John Tukey

(To jest mój ulubiony cytat z Tukeya)

shabbychef
źródło
4
Uwielbiam ten - wspaniały bonus bycia statystą.
Kingsford Jones,
Nie jestem pewien, co to oznacza. Czy to dlatego, że statystyki dotyczą prawie każdej dziedziny?
Ali Turab Lotia
@Ali, uważam, że taki jest ogólny zamiar. Statystyka może być bardzo potężną strukturą epistemologiczną, która znalazła zastosowanie w wielu dziedzinach o niezwykle złożonych systemach (biologia, ekonomia, epidemiologia, klimatologia itp.).
Ashe
Właśnie dlatego dostałem się w teren, jestem wścibski!
adunaic
63

Brak dowodów nie jest dowodem nieobecności.

- Martin Rees ( Wikipedia )

Jonik
źródło
67
Dobry cytat, ale to nieprawda! Brak dowodów nie jest dowodem nieobecności, ale z pewnością jest dowodem . Dlaczego uważamy, że magnetyczne monopole (lub jednorożce, jeśli o to chodzi) nie istnieją? Ponieważ szukaliśmy i nie znaleźliśmy żadnych.
John D. Cook
13
Poza tym Tzippy źle cytuje Sagana, ponieważ Sagan nigdy w to nie wierzył. W rzeczywistości wymienił to wśród błędów w swoim zestawie do wykrywania baloney .
Raskolnikov,
7
@ JohnD.Cook, +1. Jednak Twój komentarz opiera się na fakcie, że nie spojrzał, i że istniało uzasadnione prawdopodobieństwo urodzenia znaleźli dowody, czy rzeczywiście były tam; rozważmy na przykład różne „brakujące linki”, które zostały ostatecznie znalezione (i te, które jeszcze nie zostały).
gung
1
Wikipedia wydaje się przypisywać Martinowi Reesowi ... który również nie jest statystykiem.
Glen_b
1
@Glen_b Wygląda na to, że Sagan mógł powiedzieć, że w pewnym sensie ironia, jeśli w ogóle, krytyka cytatu Martina. Dla mnie jest to do rozważenia, ponieważ kosmologia jest pełna przykładów, w których dokonano prognoz, które uwzględniają niewytłumaczalne źródła błędów, które okazały się prawidłowe (lub niezupełnie obalone), np. Kosmiczne promieniowanie tła, ciemna materia i teoria wielkiego podrywu.
AdamO
54

Powiedzmy, że stałeś jedną stopą w piekarniku i jedną stopą w wiadrze z lodem. Według procentu osób powinieneś czuć się doskonale.

-Bobby Bragan, 1963

Albort
źródło
8
Źle: 200 ° C i 0 ° C średnio do około 100 ° C, co jest temperaturą wrzenia wody. Piekarniki obniżają się tylko do około 150 ° C, a 75 ° C jest nadal zbyt gorące. Teraz, jeśli masz jedną stopę w parzącej wodzie (około 55 ° C), a drugą w zimnej lodowatej wodzie ... to prawdopodobnie jesteś dziwną osobą.
alexfernandez
1
Podwójnie źle. Lód może znajdować się w niższych temperaturach.
Firebug
1
@alexfernandez Mój piekarnik zaczyna się w 50 ° C. Jest to standardowy piekarnik, a wszystkie piekarniki w mieszkaniach, w których mieszkałem, zaczęły się w tej temperaturze.
@ co przypuszczam, że gotowanie w niskiej temperaturze obniżyło minimalne temperatury, ale wątpię, by tak było w 1963 roku.
alexfernandez
Istnieje podobny rosyjski idiom, który tłumaczyłbym jako „Średnia temperatura pacjenta w szpitalu jest normalna”.
Eduard Gelman,
52

„Łatwo jest kłamać ze statystykami; łatwiej jest kłamać bez nich”.

- Frederick Mosteller

Buckminster
źródło
51

Tout le monde y croit cependant, ja disait un jour M. Lippmann, car les expérimentateurs s'obraz wyobrażony que c'est un théorème de matématiques, et les mathématiciens que c'est un fait expérimental.

Henri Poincaré, Calcul des probabilités (wyd. 2, 1912), s. 1. 171

Po angielsku:

Wszyscy wierzą w wykładnicze prawo błędów [ tj. Rozkład normalny]: eksperymentatorzy, ponieważ uważają, że można to udowodnić za pomocą matematyki; i matematyków, ponieważ wierzą, że zostało to ustalone przez obserwację.

Whittaker, ET i Robinson, G. „Normalny rozkład częstotliwości”. Ch. 8 w The Calculus of Observations: A Treatise on Numerical Mathematics , 4th ed. New York: Dover, ss. 164-208, 1967. s. 1. 179

Cytowany na Mathworld.com .

whuber
źródło
8
Jest to raczej bezpłatne tłumaczenie powiedzenia przypisywanego Gabrielowi Lippmannowi przez Henri Poincara w jego Calcul des probabilit (1896/1912). Oryginał był w języku francuskim, naturellement. Lippmann zdobył Nagrodę Nobla w dziedzinie fizyki w 1908 r.
Nick Cox
46

Moją największą troską było to, jak to nazwać. Myślałem o nazwaniu go „informacją”, ale słowo to było zbyt często używane, dlatego postanowiłem nazwać je „niepewnością”. Kiedy rozmawiałem o tym z Johnem von Neumannem, miał lepszy pomysł. Von Neumann powiedział mi: „Powinieneś nazwać to entropią z dwóch powodów. Po pierwsze, twoja funkcja niepewności została wykorzystana w mechanice statystycznej pod tą nazwą, więc ma już nazwę. Po drugie, a co ważniejsze, nikt tak naprawdę nie wie, czym jest entropia, więc w debacie zawsze będziesz miał przewagę.

Claude Elwood Shannon

Robin Girard
źródło
46

Nie wiem o sławnych, ale jedno z moich ulubionych to:

Przeprowadzanie analizy danych jest jak picie dobrego wina. Ważne jest, aby wirować i wąchać wino, rozpakować złożony bukiet i docenić to doświadczenie. Łykanie wina nie działa.

-Daniel B. Wright (2003), patrz artykuł w PDF .

Odniesienie : Wright, DB (2003). Zaprzyjaźnienie się z Twoimi danymi: Poprawa sposobu prowadzenia i raportowania statystyk 1. British Journal of Educational Psychology, 73 (1), 123–136.

Jeromy Anglim
źródło
Podoba mi się, choć przypomina mi en.wikipedia.org/wiki/Swiss_Toni
onestop
45

Wszystko, co wiemy o świecie, uczy nas, że skutki A i B są zawsze różne --- w pewnym miejscu po przecinku --- dla dowolnego A i B. W związku z tym pytanie „czy skutki są różne?” jest głupi.

Tukey (ponownie, ale ten jest moim ulubionym)

robin girard
źródło
Doprowadziło to do bardzo interesujących artykułów ... :)
Tal Galili
@Tal: Całkowicie się zgadzam! Myślę, że cały obszar optymalnej separacji w testach minimax zaczyna się od tego pomysłu ... i nadal jest bardzo zagmatwany dla wielu statystyk. Dla zainteresowanych zapoznaj się z artykułem donoho projecteuclid.org/… (i odnośnikami w artykule! Ponieważ rzeczy są znacznie starsze niż papier donoho)
Robin Girard
45

... z pewnością Bóg kocha 0,06 prawie tak bardzo, jak 0,05. Czy można mieć jakiekolwiek wątpliwości, że Bóg postrzega siłę dowodów na wartość zerową lub przeciw niej jako dość ciągłą funkcję wielkości p? (str.1277)

Rosnow, RL, i Rosenthal, R. (1989). Procedury statystyczne i uzasadnienie wiedzy w naukach psychologicznych. American Psychologist, 44 (10), 1276-1284. pdf

Henrik
źródło
Chciałbym wziąć to jako moją zaakceptowaną odpowiedź! zbyt dobre by było prawdziwe !
robin girard
W każdym razie mogę przytoczyć wypowiedź Lehmana na ten temat: „Taka standaryzacja jest wygodna, ponieważ pozwala na ograniczenie niektórych tabel potrzebnych do przeprowadzenia różnych testów”.
robin girard
Rosnow & Rosenthal's to bardzo przydatny, otwierający oczy cytat, który jest prawie poprawny.
rolando2
1
@ rolando2: proszę rozwinąć. Co w tym jest nie tak?
naught101
@ naught101 - W tym momencie nie mogę nic wymyślić :-)
rolando2
44

Dwukrotnie pytali [posłowie do Parlamentu]: „Módlcie się, panie Babbage, jeśli wprowadzicie do maszyny błędne liczby, czy wyjdą prawidłowe odpowiedzi?” Nie jestem w stanie właściwie zrozumieć pomieszania pomysłów, które mogłoby wywołać takie pytanie.

Charles Babbage

Frank Zafka
źródło
3
+1 Zapierający dech w piersiach zwiastun szaleństwa nadchodzącego wieku; „GIGO przed czasem”.
whuber
crap=crap
3
Żartujesz? Czy nie o to chodzi w ekonomii?
naught101
1
jeśli wpiszesz w Google „stick axchange crss vlidated”, to mnie to tu sprowadza!
Neil McGuigan
2
Miałem okazję użyć cudownego drugiego zdania Babbage'a w szerszym zakresie sytuacji.
Glen_b
40

Subiektywista (tj. Bayesian) stwierdza swoje osądy, podczas gdy obiektywista zamiata je pod dywan, nazywając założenia wiedzą, i pławi się w chwalebnej obiektywności nauki.

IJ Dobrze

ramhiser
źródło
oh bayesian jest bardzo dobry ...
robin girard
Kocham to. To jest wspaniałe !
steffen,
Dlaczego Bayesian zawsze utożsamia się z subiektywistami? - A co z ETJaynes i innymi „obiektywnymi Bayesianami”? A co z całą subiektywnością w ramach „obiektywizmu”?
gwr
2
@gwr Cóż, „obiektywizm” to konstrukt społeczny, który subiektywnie ocenia się jako doświadczenie, dlatego wzywanie Bayesian do subiektywizmu jest mniej bezwartościowe, ponieważ jest nieprawdziwe, i bardziej bezwartościowe, ponieważ mniej więcej wszyscy są subiektywistami. ;)
Alexis,
40

Nie ufaj statystykom, których sam nie sfałszowałeś.

- Winston Churchill

shabbychef
źródło
6
Ten cytat wydaje się znany tylko w Niemczech i istnieją wątpliwości, że jest on autentyczny, patrz poniższy link, na którym Urząd Statystyczny w Badenii-Wirtembergii pokazuje wyniki swoich badań nad tym cytatem (przepraszam, że jest dostępny tylko w języku niemieckim). Na przykład „Times” powiedział, że nigdy o tym nie słyszeli. statistik.baden-wuerttemberg.de/Veroeffentl/Monatshefte/…
psj
4
Alternatywna forma brzmi: „Wierzę tylko w statystyki, które sam udokumentowałem”. Czasami twierdził, że Goebbels włożył go w usta Churchilla podczas sporu propagandowego o straty wojenne.
Henry
Przyznaję, że nie badałem pochodzenia cytatu. Jednak rdzeń tego stwierdzenia pozostaje prawdziwy. Statystyki, szczególnie w środkach masowego przekazu, nigdy nie są przedstawiane informacji niezbędnych do oszacowania ich ważności lub poprawności.
ymihere
2
Czy Churchill kwalifikuje się jako statystyk?
Glen_b
1
@Glen_b Jeśli kiedykolwiek sfałszował jakieś dane, to na pewno!
Darren Cook