Jak opisać statystyki w jednym zdaniu?

27

Kiedy zacząłem uczyć się statystyki, procedury takie jak test t, ANOVA, chi-kwadrat i regresja liniowa wydawały się być bardzo różnymi stworzeniami. Ale teraz zdaję sobie sprawę, że te procedury robią mniej więcej to samo. Podobnie wartości takie jak wariancja, reszty, błąd standardowy i średnia również mierzą mniej więcej to samo.

Uważam więc, że wszystkie te procedury i wartości, a nawet wszystkie statystyki, można opisać w jednym prostym zdaniu:

Jaka jest oczekiwana wartość i jaka jest zmienność wokół tej wartości?

Słowo oczekiwane można zastąpić dowolnym z tych słów: hipotetycznym, przewidywanym lub centralnym.

Jak inni ludzie opisaliby statystyki w jednym zdaniu?

luciano
źródło
10
@Trynna Ten opis jest zdecydowanie zbyt wąski: charakteryzuje się tylko oszacowaniem punktowym. To tak, jakby opisywać matematykę jako dodawanie i mnożenie liczb - co może być perspektywą kogoś, kto studiował arytmetykę od kilku lat w szkole - ale daleko mu do tego, co obejmuje dziedzina.
whuber

Odpowiedzi:

26

Statystyki stanowią uzasadnienie i metody tworzenia i rozumienia danych.

Amerykańskie Stowarzyszenie Statystyczne

whuber
źródło
+1 Próbowałem wymyślić coś bardzo zbliżonego do tego pojęcia. Dodałbym coś o dochodzeniu do wniosków na podstawie danych, ale nie jest to tak zwięzłe.
Glen_b
3
@Glen Możesz powiedzieć, że w tę charakterystykę wiele uwagi poświęcono. Lubię mieć to gdzieś na naszej stronie. To i podobnie treściwy opis uczenia maszynowego powinien znaleźć się na naszych stronach pomocy.
whuber
2
Nie jestem pewien, czy zgadzam się z cytatem (choć jest to cudowna aspiracja). Jako epidemiolog wiem, że znam się na projektowaniu badań oraz tworzeniu danych i wnioskowania przyczynowego wokół tego samego, co jest poza zasięgiem wielu dobrych statystów wokół mnie. Rzeczywiście, fantazyjne wnioskowanie przyczynowe dla rekurencyjnych wykresów przyczynowych powstało w trzech dziedzinach, które nie są nazwane statystykami (epidemiologia, informatyka i socjologia, tak jak ja to rozumiem). Nie podnosząc to w duchu wojowniczej, ale dlatego, że cytowane zdanie opisuje dużo nauki , a nie gwóźdź w dół statystyki per se .
Alexis
3
Opis ASA dotyczy znacznie więcej statystyk jako dziedziny ludzkiej wiedzy i działalności, a nie wskazuje, kim może być „statystyka”. Do drugiej wojny światowej profesjonalni statystycy byli rzadkością, ale to nie znaczy, że statystyki nie były stosowane w środowisku komercyjnym i akademickim. Nie sądzę, aby dobra definicja statystyki mogła być ograniczona do tego, co robią zawodowi statystycy.
Silverfish,
1
@Alexis Być może występują pewne trudności z poziomem zrozumienia wynikającym ze słowa „zrozumienie”, które definicja ASA pozostawia dość dwuznaczna w swej zwięzłości. Szersza interpretacja może być nadmiernie obejmująca. Oczywiście, jeśli w ramach „zrozumienia” uwzględnimy materialną interpretację fizyczną lub społeczną oraz leżące u podstaw mechanizmy, wówczas wykracza ona poza „zwykłe” statystyki. Z drugiej strony nie jest dla mnie jasne, dlaczego wnioskowanie na podstawie danych, przyczynowe lub w inny sposób, nie może leżeć w zakresie badań naukowych i statystycznych.
Silverfish,
13

Statystyka zasadniczo dotyczy zrozumienia struktury danych.

Bill Venables i Brian Ripley, pierwsze zdanie w rozdziale 1 współczesnej statystyki stosowanej z S.

mark999
źródło
1
To interesujące spojrzenie na statystyki, choć ograniczone. Ujawniają się możliwe niejasności: informatyk zrozumiałby „strukturę danych” w sposób niestatystyczny. (Venables i Ripley pracują na styku statystyk i informatyki.)
whuber
@ whuber Zgadzam się z tobą. Nic nie sugeruje, że V&R zamierzał opisywać wszystkie statystyki jednym zdaniem, ale odkąd go przeczytałem, uważałem, że to dobry opis. Interpretuję „strukturę danych” jako „charakterystykę populacji, z której pobrano próbkę”.
mark999
10

Statystyki dostarczają uzasadnienia i metod przekształcania danych w istotne informacje.

IrishStat
źródło
8

Słowami zmarłego Leo Breimana:

Celem statystyki jest wykorzystanie danych do przewidywania i uzyskiwania informacji o podstawowym mechanizmie danych.

http://projecteuclid.org/euclid.ss/1009213726

Richard Border
źródło
5

Osobiście podoba mi się następujący cytat Stephena Senna w Dicing with death. Szansa, ryzyko i zdrowie (Cambridge University Press, 2003). Podkreśliłem jedno zdanie (lub dwa), które, jak sądzę, streszczają jego główną kwestię, chociaż cały akapit warto przeczytać.

Statystyki są, a statystyki są.
Statystyki, w liczbie pojedynczej, w przeciwieństwie do powszechnego postrzegania, tak naprawdę nie dotyczą faktów; chodzi o to, jak wiemy, podejrzewamy lub wierzymy, że coś jest faktem. Ponieważ wiedza o rzeczach polega na ich liczeniu i pomiarze, to prawda, że ​​liczba mnoga jest częścią problemu statystyki pojedynczej, czyli nauki rozumowania ilościowego. Ta nauka ma znacznie więcej wspólnego z filozofią (w szczególności z epistemologią) niż z rachunkowością. Statystycy są filozofami stosowanymi. Filozofowie spierają się, ilu aniołów może tańczyć na głowie igły; statystyki je liczą . Albo raczej, ilu może prawdopodobnie tańczyć.Prawdopodobieństwo jest sercem materii, sercem całej materii, jeśli można w to uwierzyć fizykom kwantowym. Jeśli chodzi o statystyki, jest to prawdą, niezależnie od tego, czy świat jest ściśle deterministyczny, jak sądził Einstein, czy też istnieje resztkowa nieunikniona nieokreśloność. Nie jesteśmy w stanie przewidzieć niczego z pewnością, ale możemy przewidzieć, jak niepewne będą nasze przewidywania. Statystyka to nauka, która mówi nam, jak to zrobić.

chl
źródło
5

Statystyka to nauka uczenia się na podstawie danych oraz mierzenia, kontrolowania i komunikowania niepewności.

Marie Davidian i Thomas Louis

Oni kontynuują:

; a tym samym zapewnia nawigację niezbędną do kontrolowania postępu naukowego i społecznego

Momo
źródło
Podoba mi się ta definicja, ponieważ wyróżnia aspekt „niepewności”. Druga część jest przyjemna, ponieważ mówi, że statystyki nie istnieją same z siebie, ale należy je postrzegać w szerszym kontekście. Aby być jednak w pełni usatysfakcjonowanym, być może połączyłbym to z ASA w celu:
Momo
1
Statystyka jako nauka uczenia się na podstawie danych oraz pomiaru, kontroli i komunikowania niepewności stanowi uzasadnienie i metody tworzenia i rozumienia danych.
Momo
2

Statystyka to zestaw metod i sposobów myślenia, które pomagają ludziom wyciągać jasne wnioski z hałaśliwych informacji.

Michael Lew
źródło
2

Ponieważ nie jesteśmy boskim wszechwiedzącym stworzeniem, musimy zmierzyć się z niepewnością, a Statystyka zapewnia metody uwzględnienia i odzwierciedlenia tej niepewności.

jedenastoletni
źródło
2

statystyka to podpola filozofii, która zajmuje się następującym pytaniem „jak uczymy się na podstawie obserwacji” przy użyciu rygorystycznych pojęć matematycznych.

tylko notatkę boczną, którą można zrobić „jednym zdaniem” bardzo długo, jest książka napisana przez B. Hrabala, która składa się z jednego długiego zdania, patrz: Lekcje tańca dla zaawansowanych w wieku

pes
źródło
2

Statystyka to zarówno nauka niepewności, jak i technologia pozyskiwania informacji z danych

David J. Hand

Momo
źródło
2

Statystyka to zbiór logicznych zasad i matematycznych metod podsumowywania informacji ilościowych w dokładny, odpowiedni sposób.

SQLServerSteve
źródło
1

W moich własnych słowach

Statistics is the science of what might be

To coś w rodzaju policzków .

MCP_infiltrator
źródło
1
Jeśli zamaskujesz pierwsze słowo i poprosisz ludzi o wypełnienie pustego pola, podejrzewam, że „statystyki” nie byłyby pierwszą rzeczą, jaką wymyślą - a być może nie drugą lub trzecią. „Futurologia”, „spekulacje”, „science fiction” i być może - przybliżając się nieco do swoich intencji - „przewidywania” i „prognozowania” - prawdopodobnie byłyby popularnymi wyborami. Nawet „oneirologia” i „apotropizm” byłyby możliwościami. :-)
whuber
1

Fisher ( 1922 ) wypowiedział się na temat istoty statystyki w następującym cytacie (pogrubiona czcionka dodana przeze mnie dla wymogu jednego zdania ):

Aby dojść do wyraźnego sformułowania problemów statystycznych, konieczne jest zdefiniowanie zadania, które stawia sobie statystyki: krótko, iw najbardziej konkretnej formie, przedmiotem metod statystycznych jest redukcja danych . Ilość danych, które zwykle ze względu na swoją masę nie są w stanie wejść do umysłu, należy zastąpić stosunkowo niewielką ilością, która odpowiednio reprezentuje całość lub, innymi słowy, powinna zawierać jak najwięcej, najlepiej całość , odpowiednich informacji zawartych w oryginalnych danych.

ekvall
źródło
0

Zorientowany na wyniki (a więc niezbyt opisowy ) linijka byłaby dla mnie

Statystyki sprawiają, że ludzki świat krąży, niezależnie od tego, co robi to samo dla Natury.

Alecos Papadopoulos
źródło
3
Czy mylisz statystyki z polityką? A może z miłością?
whuber
@whuber (+1) Nie. Obaj podejmują większość swoich decyzji na podstawie statystyk, niezależnie od tego, czy zdają sobie z tego sprawę.
Alecos Papadopoulos,
2
Widzę to teraz, w nadchodzącym filmie, kiedy męski bohater klęka i proponuje: „Kochanie, jesteś moją UMVUE, wyjdziesz za mnie?” :-) (Użyjmy estymatora skurczu i
połączmy
@ whuber (+2) ... to jest część „nie zdawaj sobie sprawy”: dokładnie to oznacza męski trop , mimo że nie używa języka! (Przyznaję, że mogę tu być winny filozoficznego imperializmu).
Alecos Papadopoulos,
2
Twoje głęboko szanowane pochodzenie kulturowe (o ile twoje imię i lokalizacja pozwalają na wywnioskowanie tego), które można prześledzić co najmniej do wczesnych sofistów, pozwala ci na dość szeroką swobodę w tym zakresie. :-)
whuber
0

Statystyka to narzędzie do modelowania generowania danych za pomocą niepewnych i / lub probabilistycznych procesów.

thecity2
źródło
-1

Statystyki dotyczą torturowania danych wystarczająco długo, dopóki nie przyznają się do niczego, co chcesz pokazać.

Parafrazuję Ronalda Coase'a, patrz link

xeon
źródło
-1, czy miał to być język w policzek?
gung - Przywróć Monikę
@ gung tak i nie, cytowałem Ronalda Coase'a.
Vladislavs Dovgalecs
3
W oparciu o wersję tutaj jest to w najlepszym razie zła parafraza. To nie jest dobre 1-zdaniowe podsumowanie statystyk.
Gung - Przywróć Monikę
3
@ dobrze, PO zapytał, jak opisaliby to różni ludzie. Zawsze będzie to jego punkt widzenia lub opinia. Będzie różnie dla różnych ludzi. OP próbował zebrać różne opinie IMHO.
Vladislavs Dovgalecs
2
xeon byłoby wielką uprzejmością, gdyby Coase zredagował twoją odpowiedź, aby odpowiednio zacytować i podać źródło uznania.
Alexis
-2

Statystyka to matematyka, która pozwala dowiedzieć się, czy różnica między zestawami obserwacji jest przypadkowa, czy nie.

Sympa
źródło
1
Opisuje wąski podzbiór tego, czym jest pole.
rolando2
Widzę to inaczej. Ostatecznie, niezależnie od tego, czy przeprowadzasz testy hipotez, modelowanie regresji lub inne oszacowania, zawsze mierzysz, czy różnica między twoim oszacowaniem a modelem naiwnym, czy różnica w obserwacjach jest statystycznie znacząca. Moje zdanie oddaje istotę istotności statystycznej vs. losowości. Jeśli inni się zgadzają, czy możesz oddać mi trochę głosów, więc mój komentarz, który jest łatwo uzasadniony, nie jest traktowany jako zwykła błędna odpowiedź tylko z powodu subiektywnej interpretacji wąskości przez jedną osobę.
Sympa,
2
proszę rozważyć tego rodzaju pytania, na które często próbuje się odpowiedzieć za pomocą statystyk: Jaki jest kształt tego rozkładu? Jaki jest charakter związku między tymi 2 zmiennymi? Jak można zgrupować te wiele zmiennych, abyśmy mogli zobaczyć typowe problemy / tematy / tematy / wymiary? Jak można zgrupować tak wiele przypadków, abyśmy mogli zobaczyć typowe typy / profile? Jaki jest najlepszy sposób na opisanie tej sieci relacji z myślą o przyczynowości? Co oddaje trend tej zmiennej w czasie? Jaki jest najlepszy sposób prognozowania przyszłych wartości?
rolando2
W każdym z tych przypadków odpowiedź na te pytania ma silny element statystyczny i to, czy to, na co patrzysz w jakiejkolwiek formie lub formie, jest inne niż to, co mogłoby się zdarzyć z powodu losowości. Dla większości z nas głos negatywny oznacza wyraźnie złą odpowiedź. Nie rozumiem, w jaki sposób moją odpowiedź można by zaklasyfikować jako taką.
Sympa,
1
Tekst najechania kursorem nad strzałką w dół mówi „ta odpowiedź nie jest przydatna”. Uważam to za interesujące - i dlatego nie jest bezużyteczne - ponieważ prowokuje do myślenia, ale nie głosowałem za nim z kilku powodów. Pierwszym z nich jest twierdzenie, że statystyki są „nauką matematyczną”: zbliża się nieprzyjemnie do błędnego przekonania (szczególnie wśród niektórych matematyków), że statystyki są tylko gałęzią matematyki. Po drugie, wydaje się, że charakteryzuje on jedynie testowanie dwóch prób hipotez, które jest bardzo wąską (choć wszechobecną) częścią statystyki.
whuber