Typowe słowa, które mają szczególne znaczenie statystyczne

12

Nie jestem statystykiem, ale moje prace badawcze obejmują statystyki (analizowanie danych, czytanie literatury itp.). Ponownie przypomniano mi z komentarza do jednego z moich zamieszczonych tutaj pytań , że istnieją pewne popularne słowa, które mają szczególne znaczenie lub konotacje dla tych, którzy są dobrze wyćwiczeni w dziedzinie statystyki.

Pomocna będzie lista takich słów i mogą to być frazy wraz z komentarzami.

4045
źródło
1
Brzmi jak kandydat na Wiki Wiki .
Glen_b
@Glen_b Może stać się szczególnie duży, biorąc pod uwagę, że kwalifikuje się prawie każdy termin w statystyce lub matematyce. Czy jest jakiś sposób na znaczące zawężenie zakresu tego pytania?
whuber
3
@whuber Tak, istnieje niebezpieczeństwo, że stanie się ono zbyt szerokie. Czy coś takiego jak „które zwykle powodują zamieszanie” wystarczy, by zawęzić zakres?
Glen_b
Myślę, że kompetentni statystycy zazwyczaj dobrze władają swoim językiem ojczystym i byliby świadomi, kiedy używają żargonu, który należy odpowiednio wyjaśnić świeckim odbiorcom.
Robert Jones
@Glen_b Nie jestem pewien. Jest tak szeroki, że ledwo mogę zacząć listę słów, które powinny zostać uwzględnione: dokładność, błąd, kalibracja, dyskryminacja, ciągłość, rozkład, ryzyko, przeżycie, splajn, model, odpowiedź, bootstrap, dostosowanie, klaster, warunkowe, pewność, gęstość , oszacowanie, zmienna, kanoniczna, korelacja, przewidywanie, wnioskowanie, cenzura, ryzyko, zgodność, logistyka, limit, zasięg, mylące, nieprzewidziane, zbieżność, korespondencja, wolność, dewiacja, wykładniczy, ekstremalny, zakres, normalny, drop-in, manekin , wyjaśniono [wariacja], czynnik, błąd, wypełnienie, dopasowanie, dopasowanie, funkcja, ...
whuber

Odpowiedzi:

12

znaczący ” - tutaj powszechne użycie tego słowa w znaczeniu oznacza coś w rodzaju „ważnego” lub „znaczącego”. Znaczenie statystyczne jest nieformalnie bliższe „można je odróżnić od przypadkowej zmienności o wartości zerowej”; nie oznacza to, że różnica jest wystarczająco duża, aby mieć znaczenie.

Oto kilka przykładów, w których to rozróżnienie mogło być przyczyną pewnych nieporozumień: 1 2

parametr ” - często zdarza się - szczególnie w eksperymentach naukowych - że słowo „parametr” jest używane w sposób, w jaki statystycy użyliby słowa „zmienna”. Wikipedia tak to ujmuje:

Parametr statystyczny jest parametrem indeksującym rodzinę rozkładów prawdopodobieństwa. Można to uznać za liczbową charakterystykę populacji lub modelu

Przykład, w którym może to stanowić problem: 1 - prawdopodobnie stanowisko, które doprowadziło do tego pytania. (Ostatnio widziałem inny, ale nie mogę go teraz znaleźć)

Glen_b
źródło
11

„Błąd” - w statystykach często oznacza każde odchylenie między obserwowaną a przewidywaną wartością. W prawdziwym życiu oznacza to błąd.

Harvey Motulsky
źródło
11

Znalazłem recenzowany artykuł z 2010 r., Który dotyczy tego pytania.

Anderson-Cook CM. Ukryty żargon: codzienne słowa o znaczeniu specyficznym dla statystyki. ICOTS8, Międzynarodowa konferencja nt. Statystyki nauczania, Lublana, Słowenia, 11-17 lipca 2010 r.

Artykuł jest dostępny bezpłatnie w Internecie , dlatego podaję tylko częściową listę terminów, które autor omawia:

 confounding, control, factor, independent, random, uniform
użytkownik4045
źródło
10

Natknąłem się na problem z użyciem „fałszowania” jak w „fałszowaniu hipotezy”, podczas gdy inni myśleli, że mam na myśli „tworzenie danych”. Również „ stronnicze ” jest prawie niemożliwe do wspomnienia bez powodowania zamieszania.

Kolba
źródło
6

„normalny” - w mowie zwykłej normalny oznacza zgodnie z oczekiwaniami, a nie niezwykły. W statystyce, jeśli zmienna jest normalnie rozkładana, odnosi się to do rozkładu Gaussa. Nie wydaje mi się, aby standardem było słowo „normalne”, aby odróżnić je od wspólnego znaczenia mowy.

„normalizacja / standaryzacja” - w statystyce normalizacja zmiennej oznacza odjęcie średniej i podzielenie przez odchylenie standardowe.

„odchylenie standardowe a błąd standardowy” - odchylenie standardowe jest zwykle obliczane na podstawie całej populacji, podczas gdy błąd standardowy jest obliczany na podstawie próby.

Rocinante
źródło
1
Naprawdę wątpię, aby „błąd standardowy” był „wspólnym [konwencjonalnym, niestatystycznym] słowem” o specjalnym znaczeniu statystycznym, różniącym się od innych zastosowań tego słowa (fraza, naprawdę). To samo dotyczy „normalizacji” i „odchylenia standardowego”.
whuber
Być może nie „normalizacja”, ale „normalność” jest dobrym punktem, a więc „standaryzacja”, która jest również używana do opisywania testów mających na celu ustanowienie standardów krajowych (np. W edukacji, np. W USA po No Child Left) Za). Zgadzam się, że „odchylenie standardowe” raczej nie spowoduje zamieszania, chociaż „odchylenie” samo w sobie może być bardziej negatywne (zwłaszcza jako synonim „odchylenia”).
Nick Stauner,
Oto inny sposób na rozróżnienie SD i SEM. Odchylenie standardowe określa zmienność lub rozproszenie. Błąd standardowy określa dokładność obliczonej wartości.
Harvey Motulsky
@HarveyMotulsky Myślę, że najlepszym sposobem jest pomyślenie o asteroidzie (nieregularny kształt). Jaki jest środek masy asteroidy? Jest to punkt, który jest w równej odległości od wszystkich innych punktów. To znaczy Jakie jest odchylenie standardowe? Jest to „średnia” odległość każdego punktu od centrum, miara wielkości. Co to jest SEM? Mówi ci, jak jesteś pewny co do lokalizacji centrum asteroidy.
Flask
Uważam, że powiedzenie, że błąd standardowy jest odchyleniem standardowym obliczonym przy użyciu „próbki”, jest trochę niefortunne. Byłby to dla mnie pierwiastek kwadratowy wariancji próbki, podczas gdy błąd standardowy jest standardowym odchyleniem statystyki testowej. Ponadto z powyższych terminów tylko „normalny” wydaje się bardzo powszechny. Ale myślę, że to normalne ...
znaczy
2

„Parametryczne” a „nieparametryczne”: kategorie testów, które wymagają danych „normalnych” lub „nie normalnych”. Testy parametryczne są lepsze niż nieparametryczne.

Typowe testy: test T (sparowany), Mann-Whitney U, ANOVA, Anderson-Darling itp.

Inne terminy obejmują „znaczący”. Jest to miara tego, czy dane wskazują, że twoja hipoteza jest ważna, czy nie. Gdy testujesz swoją hipotezę z pewnym prawdopodobieństwem (zwykle 95%), „wartość p” mniejsza niż 0,05 oznaczałaby, że odrzuciłbyś „hipotezę zerową” (tj. Zbiory danych nie są różne) i zaakceptowałbyś „ alternatywna hipoteza ”(tzn. zestawy danych są różne).

użytkownik 36904
źródło
2

Przekrzywiony w statystykach sugeruje asymetrię w rozkładzie.

W zwykłym języku, a nawet w nauce, przekrzywienie jest często używane (i coraz częściej?) W celu oznaczenia tego, co ludzie statystyczni nazywaliby stronniczymi , jak w „Wyniki dla średniej wysokości są wypaczone przez włączenie tak wielu koszykarzy”.

Nick Cox
źródło
2

Oszacowanie - w statystykach jest to wynik obliczeń. Na przykład średnia próbki jest oszacowaniem średniej populacji, a przedział ufności średniej jest oszacowaniem przedziału średniej populacji. Są to oba wyniki dokładnych obliczeń. „Szacowanie” jest dokładnym uogólnieniem próby wnioskowania na temat populacji na podstawie danych w próbie.

W zwykłym użyciu słowo oszacowanie oznacza świadome domysły lub przeczucie albo wynik przybliżonego obliczenia.

Harvey Motulsky
źródło
2

θXL(θ|X)=Pr(X|θ)

Przedstawiciel - ma wiele czasami sprzecznych znaczeń zarówno w języku potocznym, jak i naukowym. Patrz Kruskal i Mosteller 1979a , 1979b , 1979c i 1980 . Większość statystów, których znam, uznałaby próbkę za reprezentatywną, gdyby próbka została pobrana ze znanym prawdopodobieństwem; większość świeckich ludzi, których znam, uznałaby to za reprezentatywne, gdyby rozkład krańcowy był zbliżony do populacji.

abaumann
źródło
2
  • Próbka : podczas gdy w statystykach odnosi się to do zestawu przypadków , w wielu innych dyscyplinach próbka jest jedną próbką fizyczną . Oczywiście wielkość próbki jest również niejednoznaczna, odnosząc się albo do liczby przypadków w próbce statystycznej, albo do wielkości fizycznej (masa, objętość, ...) próbki.

  • Czułość : w przypadku diagnostyki medycznej rozpoznawana jest część chorych przypadków. W chemii analitycznej: nachylenie krzywej kalibracji (patrz poniżej).

  • Specyficzność : w diagnostyce medycznej odsetek przypadków innych niż choroby prawidłowo rozpoznano w teście. W chemii analitycznej metoda jest specyficzna, jeśli nie ma wrażliwości krzyżowej.

  • Kalibracja : w rzeczywistości w artykule Wiki wymieniono już dwa znaczenia dla statystyk. W chemii i fizyce znaczenie regresji odwrotnej jest zwykle stosowane. Powstaje jednak zamieszanie:

    • W chemometrycznych modelach kalibracji (do przodu) zmierzony sygnał zależy od stężenia : . Przewidywanie następnie rozwiązuje się dla stężenia : . Modele odwrotnej kalibracji . Tak więc model do przodu zgadza się z przyczynowością (koncentracja analitu powoduje sygnał, a nie na odwrót), ale model odwrotny kieruje się do prognoz. (W praktyce często można powiedzieć, że błąd na lub błąd na jest znacznie większy niż drugi i należy wybrać / należy wybrać odpowiedni kierunek modelowania)c I = f ( c ) c c = f - 1 ( I ) c = f ( I ) c IIcI=f(c)cc=f1(I)c=f(I)
      cI
    • Widziałem wykresy przewidywanego prawdopodobieństwa w porównaniu z rzeczywistym prawdopodobieństwem zwane „wykresami kalibracyjnymi” (statystyki osób). W chemii analitycznej odpowiadający wykres kalibracji byłby przewidziany na podstawie zmierzonego sygnału (zwykle jakiejś innej jednostki). Wykres przewidywanej w stosunku do rzeczywistej zmiennej zależnej byłby zwykle nazywany krzywą odzyskiwania .
  • Zestaw walidacyjny : tutaj chciałbym zwrócić uwagę na potencjalnie niejasne użycie terminów, które, jak sądzę, pojawiają się już w różnych polach związanych ze statystykami, mimo że znów się kontrastuję. W kontekście zagnieżdżania / podwójnej walidacji lub optymalizacji kontra walidacja / testowanie, jedna linia terminologii dzieli szkolenie - walidację - test i wykorzystuje zestaw „walidacji” do optymalizacji hiperparametrów.
    Np. W elementach statystycznego uczenia się, str. 222 w 2 wyd. :

    ... podziel zestaw danych na trzy części: zestaw szkoleniowy, zestaw sprawdzania poprawności i zestaw testowy. Zestaw treningowy służy do dopasowania modeli; zestaw walidacyjny służy do oszacowania błędu prognozowania przy wyborze modelu; zestaw testowy służy do oceny błędu uogólnienia wybranego ostatecznie modelu.

    Dla kontrastu, np. W walidacji chemii analitycznej jest to procedura, która pokazuje, że model (tak naprawdę ocena modelu końcowego jest tylko częścią walidacji metody analitycznej) działa dobrze dla aplikacji i mierzy jej wydajność, patrz np. John K. Taylor: Walidacja metod analitycznych, Analytical Chemistry 1983 55 (6), 600A-608A lub wytycznych przez instytucje takie jak FDA. Byłoby to „testowanie” w innej linii terminologii, gdzie „walidacja” jest faktycznie używana do optymalizacji.
    Zasadnicza różnica polega na tym, że wyniki „optymalizacji i walidacji optymalizacji” należy wykorzystać do zmiany (wyboru) modelu, podczas gdy zmiany w zwalidowanej metodzie analitycznej (w tym modelu analitycznym danych) oznaczają konieczność ponownej walidacji (tj. udowodnij, że metoda nadal działa tak, jak powinna działać).


Jeśli zdarzy ci się rozmawiać z chemikami, dobrym odniesieniem do terminologii chemii analitycznej jest Danzer: Analytical Chemistry - Theoretical and Metrological Fundamentals, DOI 10.1007 / b103950

cbeleites
źródło