Statystyka jest wszędzie; powszechne stosowanie terminów statystycznych jest jednak często niejasne.
Terminy prawdopodobieństwo i szanse są używane zamiennie w świeckim języku angielskim, pomimo ich dobrze zdefiniowanych i różnych wyrażeń matematycznych.
Nie oddzielanie terminu prawdopodobieństwo od rutynowo dezorientuje lekarzy próbujących oszacować prawdopodobieństwo raka piersi, biorąc pod uwagę pozytywną mammografię: „Och, jakie bzdury. Nie mogę tego zrobić Powinieneś przetestować moją córkę; ona studiuje medycynę. ”
Równie rozpowszechnione jest użycie korelacji zamiast asocjacji . Lub korelacja sugerująca związek przyczynowy .
W słynnym dokumencie Al Gore An Inconvenient Truth slajd ilustruje korelację rdzenia lodowego i temperatur, pozostawiając bardziej techniczne prace, aby udowodnić związek przyczynowy z dyskusją:
PYTANIE: Które terminy statystyczne stwarzają problemy interpretacyjne, gdy są stosowane bez matematycznego rygoru, i dlatego warto je poprawić?
źródło
Odpowiedzi:
Walka ze zmianami języka może być daremna. Ale
parametr nie oznacza zmiennej
W statystyce klasycznej, która w tym przypadku zaczyna się dokładnie od RA Fishera, który jako pierwszy użył tego terminu, parametr jest nieznaną stałą do oszacowania, powiedzmy średnią populacji lub korelację. W matematyce istnieją powiązane, ale nie identyczne znaczenia, tak jak w przypadku parametrycznej krzywej. W wielu naukach parametr jest po prostu innym słowem dla miary (sam termin gęsty o znaczeniu matematycznym), właściwości lub zmiennej, na przykład długości lub przewodności lub porowatości lub cnoty, w zależności od przypadku. Oczywiście długość lub cnota osoby nie jest znana przed jej pomiarem. ale statystycznie nastawieni ludzie mogą być oszołomieni jego użyciem do zestawu takich pomiarów. W zwykłym lub wulgarnym języku, parametry(prawie zawsze w liczbie mnogiej) często oznaczają granice czegoś, powiedzmy osobisty związek lub politykę polityczną, być może wynikającą z oryginalnego pomieszania z obwodem . Z dużym prawdopodobieństwem należy przypuszczać, że Bayesianie będą mówić za siebie na podstawie własnych zwyczajów (wdzięczny ukłon w stronę @conjugateprior).
przekrzywiony nie oznacza stronniczości
Od stulecia lub dłużej skośność ma specyficzne znaczenie statystyczne odnoszące się do asymetrii rozkładów, czy to ocenianych graficznie, mierzonych numerycznie, czy też zakładanych teoretycznie jako kwestia wiary lub nadziei. O wiele dłużej, a przynajmniej tak można się domyślać, stronniczość oznaczała średnio błąd, który - o ile znamy prawdę, czyli prawdziwą lub poprawną wartość - można określić ilościowo jako błąd systematyczny. Przekrzywiony w zwykłym języku ma powszechne poczucie bycia wypaczonym lub zniekształconym, a zatem niepoprawnym, niewłaściwym, a więc także stronniczym. Ten zmysł (o ile zauważyłem, dopiero niedawno) zaczął filtrować z powrotem do dyskusji statystycznych, tak że pierwotne znaczenie skośności grozi rozmyciem lub zanurzeniem.
korelacja nie oznacza zgody
Korelacja przyciągnęła kilka precyzyjnych zmysłów w statystykach, które mają wspólną ideę idealnej relacji dwuwymiarowej w pewnym precyzyjnym sensie: wiodącymi przypadkami są relacje liniowe i monotoniczne. Często jest rozcieńczany, nawet w dyskusjach statystycznych, aby oznaczać prawie każdy rodzaj związku lub stowarzyszenia. Korelacja niekoniecznie oznacza zgodność: zatem oznacza korelację Pearsona lub , o ile , ale zgodność wymaga bardzo ścisłego warunku .y= a + b x 1 - 1 b ≠ 0 y= x a = 0 , b = 1
niepowtarzalny nie oznacza wyraźny
Dość często mówi się o odrębnych wartościach danych jako unikalnych , ale unikatowe jest idealnie lepiej zachowane, ponieważ znaczenie występuje tylko raz. Domyślam się, że część winy wynika z narzędzia uniksowego [sic]
uniq
i jego naśladowców, które redukują ewentualnie powtarzane wartości do zbioru, w którym każda wartość jest naprawdę unikalna. Użycie, w tym przypadku, łączy dane wejściowe i wyjściowe programu. (I odwrotnie, jeśli mówimy o duplikatach danych, rzadko ograniczamy się do dubletów, które występują dokładnie dwa razy. Termin ten się powielamiałoby większy sens językowy, ale uprzedzono go o celową replikację kontroli w eksperymentach; wynikowe wartości odpowiedzi zwykle nie są wcale identyczne, co jest w dużej mierze istotne).próbki są rzadko powtarzane
W statystyce próbka zawiera kilka wartości, a powtarzanie próbkowania jest wysoką zaletą teoretyczną, ale jedną rzadko praktykowaną, z wyjątkiem symulacji, która jest naszym zwyczajowym terminem na wszelkiego rodzaju fałszowanie in silico . W wielu naukach próbka jest pojedynczym przedmiotem, składającym się z bryły, kawałka lub kupy wody, gleby, osadu, skały, krwi, tkanek lub innych substancji, od atrakcyjnych przez łagodne do obrzydliwych; nie jest wyjątkowy, pobieranie wielu próbek może być niezbędne do każdej poważnej analizy. Tutaj terminologia każdej dziedziny ma dla ludzi doskonały sens, ale czasem potrzebne jest tłumaczenie.
błąd zwykle nie oznacza błędu; jak zauważył Harold Jeffreys, pierwotny zmysł jest nieobliczalny, a nie błędny.
Niemniej jednak powinniśmy uważać na własne grzechy lub dziwactwa terminologiczne:
regresja nie idzie wstecz
stacjonarne nie oznacza nieruchome lub nieruchome
zaufanie nie ma nic wspólnego z czyimś stanem psychicznym lub psychicznym
znaczenie ma czasem tylko codzienne znaczenie
dokładny jest często terminem honorowym, odnoszącym się do dogodnego rozwiązania lub obliczenia, a nie odpowiedniego do problemu
prawym przekrzywionymi Rozkłady wielu wyglądać przekrzywiony w lewo i odwrotnie
lognormal jest tzw ponieważ jest to normalne potęgowania
ale lognormal jest bardziej normalny niż normalny
Gaussa została odkryta przez De Moivre
Poisson nie odkrył Poissona , nie mówiąc już o regresji Poissona
bootstrap nie pomoże ci w obuwiu
jackknife nie tnie
kurtoza nie jest stanem medycznym
wykresy łodyg i liści nie odnoszą się do roślin
zmienna manekin jest przydatna, nie bezcelowe lub głupi
kto na Ziemi (lub gdziekolwiek indziej) uważa, że heteroscedastyczność jest naprawdę lepszym terminem niż nierówna zmienność ?
solidny ma teraz co najmniej dwa główne znaczenia techniczne dla różnych grup, z których żadna nie powstrzymuje jego częstego używania, nawet w dyskusjach technicznych, co oznacza jedynie coś w rodzaju „zapewniono, że zachowuje się dobrze”
IV ma teraz co najmniej dwa główne znaczenia dla różnych grup
czynnik ma teraz co najmniej dwa główne znaczenia dla różnych grup
normalizacja i standaryzacja mają niepoliczalnie wiele znaczeń (naprawdę musimy tam znormalizować)
kontra opis wykresu oznacza zmienną pionową w porównaniu do zmiennej poziomej , chyba że oznacza to odwrotnie
oraz (wreszcie, żeby nadać frazę) statystyki mają co najmniej trzy główne znaczenia.
Uwagi:
Mimo wszelkich przeciwnych poglądów uważam, że jest to dobre, poważne pytanie.
Zmiana mody. Już w XX wieku wydaje się, że wiele osób (bez nazwisk, bez wiertła do paczki, ale można wymienić Karla Pearsona) mogło wymyślić terminy, sięgając po greckie i łacińskie słowniki. (Byłoby niesprawiedliwie nie uznawać go za spisek .) Ale RA Fisher porwał wiele wcześniej istniejących angielskich słów, w tym wariancję , wystarczalność , skuteczność i prawdopodobieństwo . Niedawno JW Tukey był mistrzem w posługiwaniu się domowymi terminami, ale niewielu powinno odczuwać niepokój, że nie doszło do załamań i złych uczynków .
Jeden komentarz opiera się na wspomnieniu „Życie jest [...] multiplikatywne, a nie addytywne: rozkład normalny dziennika jest bardziej normalny niż normalny”. Zaraz. 1962. Zasady pracy Bloggins. W Good, IJ (red.) Naukowiec spekuluje: antologię częściowo upieczonych pomysłów. Londyn: Heinemann, 212-213 (cytat na str. 213).
źródło
Niektóre rzeczy, które spotykam:
Traktowanie poziomu istotności i prawdopodobieństwa pokrycia CI jako wymienne, tak że ludzie w końcu robią takie rzeczy, jak mówienie o „95% istotności”.
[Gorzej jest, gdy ludzie, którzy popełniają takie błędy, wskazują na notatki z wykładów - a nawet podręcznik - na poparcie tego; innymi słowy, błąd nie jest ich, ale jest stokrotnie lub wiele razy krotszy, a co gorsza, nawet jeśli dobrze to rozumieją, może i tak trzeba powtórzyć błąd, aby zaliczyć przedmiot.]
Istnieje również powszechna tendencja do myślenia, że „znaczenie” istnieje w jakiś sposób poza konkretną hipotezą / pytaniem (co prowadzi do pytań typu „czy moje dane są znaczące” bez wyraźnego pojęcia, jakie pytanie należy rozwiązać). [Powiązanym problemem jest „jaki test powinienem zastosować dla tych danych?” jak gdyby były to dane - a nie pytanie, na które należy odpowiedzieć - to podstawa wyboru analizy. (Chociaż „projekt” badania może mieć wpływ na zastosowane testy, ważniejsze jest pytanie dotyczące zainteresowania - na przykład, jeśli masz trzy grupy, ale twoje pytanie dotyczy tylko porównania dwóch z nich, fakt, że masz trzy, nie zmusza cię do analizy jednokierunkowej, a nie do prostego porównania dwóch grup zainteresowań ... o ile wybór analizy nie wynika z tego, co pokazują dane. Idealnie byłoby zaplanować pytania i analizy, zanim będziesz mieć dane, zamiast rzucać analizą danych i zobaczyć, jakie drążki, jak się wydaje, pytania do analizy post-hoc - w tym „jaki test powinienem zastosować dla tych danych?” - zwykle prowadzą do.)
Sporadyczna tendencja do określania uzupełnienia wartości p jako pewnego rodzaju „pewności” lub „prawdopodobieństwa” alternatywy.
„dane nieparametryczne”; kolejna niestety znaleziona w kilku książkach (i, niestety, w artykule, który ma na celu naprawienie typowego błędu), ta pojawia się tak często, że znajduje się na mojej krótkiej liście automatycznie generowanych komentarzy (która rozpoczyna się: „Dane nie są parametryczne ani nieparametryczne; są to przymiotniki, które dotyczą modeli lub technik ... ”) (dzięki Nick Cox za przypomnienie mi o tym szczególnym błędzie)
Zwykle zamierzone są „nienormalne dane”, ale parametryczne nie implikują normalności, a posiadanie przybliżonej normalności nie oznacza, że potrzebujemy procedur parametrycznych. Podobnie, nienormalność nie oznacza, że potrzebujemy procedur nieparametrycznych. Czasami zamierzone są „dane porządkowe” lub „dane nominalne”, ale w żadnym przypadku nie oznacza to, że modele skończone parametryczne są nieodpowiednie.
Powszechna tendencja do błędnego rozumienia znaczenia „liniowy” w „modelu liniowym” w sposób, który byłby niezgodny z użyciem terminu „liniowy” w „uogólnionym modelu liniowym”. Jest to częściowo wina sposobu, w jaki używamy terminologii.
łączenie skośności średniej-minus-mediany ze skośnością w trzeciej chwili i łączenie zera w jednym (lub nawet w obu) z symetrią. Oba błędy są często spotykane w podstawowych tekstach szeroko używanych w niektórych konkretnych obszarach zastosowań. [Występuje błąd związany z traktowaniem zerowej skośności i zerowej kurtozy jako sugerującej normalność]
ten jest tak powszechny, że coraz trudniej jest nazwać go błędem (częściowo z powodu wysiłków konkretnego programu) - nazywając nadmierną kurtozę po prostu „kurtozą”; błąd prawie na pewno prowadzi do problemów komunikacyjnych.
źródło
„ Dane ” są w liczbie mnogiej . (Liczba pojedyncza to „punkt odniesienia”).
źródło
Chociaż nie jest to termin ściśle statystyczny, głosuję za wycofaniem endogeniczności . Używa się go w odniesieniu do wszystkiego, od odwrotnego związku przyczynowego, przez mylące, do selekcji i stronniczości, gdy wszyscy ludzie naprawdę chcą to powiedzieć: „Nie zidentyfikowano tego efektu”.
źródło
„Regresja w kierunku średniej” nie oznacza, że jeśli zaobserwujemy pewną liczbę próbek iid poniżej wartości oczekiwanej, następne próbki iid prawdopodobnie będą wyższe niż wartość oczekiwana.
źródło
Procent vs. Punkty procentowe : Jeśli coś wzrośnie z 1% do 2%, wzrośnie o 100%. Lub: można powiedzieć, że wzrosła o 1 punkt procentowy.
Stwierdzenie, że wzrost wyniósł 1%, jest bardzo mylące.
źródło
Uważam, że skróty, które nie są wyraźnie wskazane, stanowią prawdziwy problem. Na przykład widzę takie rzeczy jak GLM i nigdzie nie jest określone, czy oznacza to ogólny model liniowy czy uogólniony model liniowy. Kiedyś zwykle mogę dowiedzieć się, do czego się odwołuje po wkopaniu w kontekst, ale uważam, że jest to szczególnie kłopotliwe dla studentów, którzy dopiero zaczynają uczyć się o modelach statystycznych.
Innym tego przykładem jest IV. Czy to oznacza zmienną instrumentalną czy zmienną niezależną? Często nie jest to jasne, dopóki nie przyjrzysz się kontekstowi.
Coś jeszcze, co widzę w zamieszaniu, to „moderator” i „interakcja”. Również populacja (jak w populacji ogółem) i populacja zainteresowań wydają się wprowadzać nowych studentów w błąd, chyba że zostanie to wyjaśnione bardzo wyraźnie.
źródło
Ten, który jest powszechny w codziennym języku:
średni
Dla przeciętnej osoby (gorzka ironia w pełni zamierzona) średnia, mediana, tryb i oczekiwana wartość czegokolwiek wydają się takie same. Mają naturalną tendencję do dokonywania oceny punktowej, przy nieświadomym i niepodważalnym założeniu, że istnieje podstawowy rozkład normalny. I równie nieświadome założenie bardzo małej wariancji. Wiara w to, że takie oszacowanie 1) istnieje i 2) będzie dla nich bardzo przydatna, ponieważ mogą one potraktować to jako praktycznie pewien predyktor, jest tak zakorzeniona, że w zasadzie nie można ich przekonać inaczej.
Na przykład w prawdziwym świecie spróbuj porozmawiać z kucharzem, który pyta „jaki jest ziemniak średniej wielkości”, absolutnie pewien, że jeśli podasz mu liczbę, będzie mógł użyć tego do dowolnego przepisu, który określa liczbę ziemniaków i niech za każdym razem wyjdzie idealnie. I złość się na ciebie za próbę powiedzenia mu „nie ma takiej liczby”. Niestety dzieje się tak w sytuacjach, w których stawka jest znacznie wyższa niż przy zupie.
źródło
Kurtosis nie mierzy „szczytowości”.
* Odejmij 3 lub nie; do tego momentu nie ma znaczenia.
źródło
Liniowy oznacza:
źródło
Pytanie dotyczyło użycia terminów statystycznych, które powinniśmy DOKONAĆ, aby je poprawić. Poprawiam użycie przez moje tysiącletnie dzieci terminu „losowy”, aby oznaczać rzeczy, które są przeciwieństwem losowości od 10 lat. Biorąc pod uwagę, ilu moich stażystów ma trudności z wytworzeniem losowej próbki danych, która jest rzeczywiście losowa, co zdarzyło się jeszcze przed użyciem tego słowa, zaciemnianie tego terminu w codziennym slangu jest kryzysem.
Z OnlineSlangDictionary:
źródło
Jest już zbyt wiele wspaniałych przykładów, o których wspominali Glen i Nick ... niewiele zostało!
Niektóre aspekty regresji
termin błędu i resztkowe (to jest trochę zabawne, gdy ludzie są dumni, ich resztki nie są powiązane z regresorami)
przewidywanie i szacowanie (czy powinniśmy nawet przestać robić rozróżnienie, jeśli chodzi o przewidywane efekty losowe?)
przedział prognozy / prognozy a przedział ufności. Myślę, że istnieje prawdopodobieństwo> 0,5, aby podać niewłaściwy.
regresor (kolumna w macierzy obliczeniowej) w porównaniu z zmienną kowariancyjną i in. Zwłaszcza w sytuacjach technicznych, w których rozróżnienie jest niezbędne, wiele osób (w tym ja) ma tendencję do nieprecyzyjności.
źródło
Zwłaszcza w środowiskach ubezpieczeniowych powszechne jest stosowanie wariancji w odniesieniu do jakiejkolwiek różnicy, a nie średniej kwadratowych różnic między każdym punktem danych a średnią zestawu danych.
źródło
Bayesian
Uczniowie, którzy się tego nauczą, mogą nie mieć problemów z określeniem, czy coś „wygląda” na bayesowski, ale poproś ich o rozwiązanie problemu z częstym i bayesowskim podejściem i prawdopodobnie się nie uda.
Z mojego doświadczenia wynika, że uczniowie uczą się, że jest to tylko filozoficzna różnica, bez konkretnego przykładu, który pokazuje, że ten sam problem jest atakowany za pomocą obu podejść.
Teraz zapytaj ich, dlaczego ktoś może tak często przyjmować takie podejście; są szanse, że ich najlepszym wytłumaczeniem byłoby coś takiego: „w dawnych czasach komputery nie istniały…”
źródło
Ryzyko
Ryzyko nie oznacza prawdopodobieństwa
Ryzyko to suma kosztów wszystkich wyników, każdy z tych kosztów pomnożony przez prawdopodobieństwo ich wystąpienia.
Ryzyko jest zwykle porównywane z nagrodą, którą jest zysk, który chcemy osiągnąć.
Oto jeden przykład: How Deadly Is Your Kilowatt . Tutaj ryzyko - liczba zmarłych osób dla różnych źródeł energii - jest porównywane z nagrodą - terawatogodzin energii wytwarzanej przez te źródła energii.
Na przykład: ryzyko związane z energią jądrową nie jest prawdopodobieństwem krachu; jest to prawdopodobieństwo, że nastąpi krach, pomnożone przez liczbę umierających z niego osób, zsumowane z liczbą osób umierających z powodu normalnych operacji pomnożone przez prawdopodobieństwo, że operacje pozostaną normalne.
źródło
Naprawione efekty i efekty losowe mogą oznaczać różne rzeczy dla różnych osób. W ekonometrii ustalone efekty są w rzeczywistości losowe, a kiedy się nad tym zastanowić, każdy efekt w statystykach jest losowy, więc nazywanie czegoś losowego nie daje żadnych znaczących dodatkowych informacji.
źródło