Nie jestem statystykiem, ale moje prace badawcze obejmują statystyki (analizowanie danych, czytanie literatury itp.). Ponownie przypomniano mi z komentarza do jednego z moich zamieszczonych tutaj pytań , że istnieją pewne popularne słowa, które mają szczególne znaczenie lub konotacje dla tych, którzy są dobrze wyćwiczeni w dziedzinie statystyki.
Pomocna będzie lista takich słów i mogą to być frazy wraz z komentarzami.
terminology
4045
źródło
źródło
Odpowiedzi:
„ znaczący ” - tutaj powszechne użycie tego słowa w znaczeniu oznacza coś w rodzaju „ważnego” lub „znaczącego”. Znaczenie statystyczne jest nieformalnie bliższe „można je odróżnić od przypadkowej zmienności o wartości zerowej”; nie oznacza to, że różnica jest wystarczająco duża, aby mieć znaczenie.
Oto kilka przykładów, w których to rozróżnienie mogło być przyczyną pewnych nieporozumień: 1 2
„ parametr ” - często zdarza się - szczególnie w eksperymentach naukowych - że słowo „parametr” jest używane w sposób, w jaki statystycy użyliby słowa „zmienna”. Wikipedia tak to ujmuje:
Przykład, w którym może to stanowić problem: 1 - prawdopodobnie stanowisko, które doprowadziło do tego pytania. (Ostatnio widziałem inny, ale nie mogę go teraz znaleźć)
źródło
„Błąd” - w statystykach często oznacza każde odchylenie między obserwowaną a przewidywaną wartością. W prawdziwym życiu oznacza to błąd.
źródło
Znalazłem recenzowany artykuł z 2010 r., Który dotyczy tego pytania.
Anderson-Cook CM. Ukryty żargon: codzienne słowa o znaczeniu specyficznym dla statystyki. ICOTS8, Międzynarodowa konferencja nt. Statystyki nauczania, Lublana, Słowenia, 11-17 lipca 2010 r.
Artykuł jest dostępny bezpłatnie w Internecie , dlatego podaję tylko częściową listę terminów, które autor omawia:
źródło
Natknąłem się na problem z użyciem „fałszowania” jak w „fałszowaniu hipotezy”, podczas gdy inni myśleli, że mam na myśli „tworzenie danych”. Również „ stronnicze ” jest prawie niemożliwe do wspomnienia bez powodowania zamieszania.
źródło
„normalny” - w mowie zwykłej normalny oznacza zgodnie z oczekiwaniami, a nie niezwykły. W statystyce, jeśli zmienna jest normalnie rozkładana, odnosi się to do rozkładu Gaussa. Nie wydaje mi się, aby standardem było słowo „normalne”, aby odróżnić je od wspólnego znaczenia mowy.
„normalizacja / standaryzacja” - w statystyce normalizacja zmiennej oznacza odjęcie średniej i podzielenie przez odchylenie standardowe.
„odchylenie standardowe a błąd standardowy” - odchylenie standardowe jest zwykle obliczane na podstawie całej populacji, podczas gdy błąd standardowy jest obliczany na podstawie próby.
źródło
„Parametryczne” a „nieparametryczne”: kategorie testów, które wymagają danych „normalnych” lub „nie normalnych”. Testy parametryczne są lepsze niż nieparametryczne.
Typowe testy: test T (sparowany), Mann-Whitney U, ANOVA, Anderson-Darling itp.
Inne terminy obejmują „znaczący”. Jest to miara tego, czy dane wskazują, że twoja hipoteza jest ważna, czy nie. Gdy testujesz swoją hipotezę z pewnym prawdopodobieństwem (zwykle 95%), „wartość p” mniejsza niż 0,05 oznaczałaby, że odrzuciłbyś „hipotezę zerową” (tj. Zbiory danych nie są różne) i zaakceptowałbyś „ alternatywna hipoteza ”(tzn. zestawy danych są różne).
źródło
Przekrzywiony w statystykach sugeruje asymetrię w rozkładzie.
W zwykłym języku, a nawet w nauce, przekrzywienie jest często używane (i coraz częściej?) W celu oznaczenia tego, co ludzie statystyczni nazywaliby stronniczymi , jak w „Wyniki dla średniej wysokości są wypaczone przez włączenie tak wielu koszykarzy”.
źródło
Oszacowanie - w statystykach jest to wynik obliczeń. Na przykład średnia próbki jest oszacowaniem średniej populacji, a przedział ufności średniej jest oszacowaniem przedziału średniej populacji. Są to oba wyniki dokładnych obliczeń. „Szacowanie” jest dokładnym uogólnieniem próby wnioskowania na temat populacji na podstawie danych w próbie.
W zwykłym użyciu słowo oszacowanie oznacza świadome domysły lub przeczucie albo wynik przybliżonego obliczenia.
źródło
Przedstawiciel - ma wiele czasami sprzecznych znaczeń zarówno w języku potocznym, jak i naukowym. Patrz Kruskal i Mosteller 1979a , 1979b , 1979c i 1980 . Większość statystów, których znam, uznałaby próbkę za reprezentatywną, gdyby próbka została pobrana ze znanym prawdopodobieństwem; większość świeckich ludzi, których znam, uznałaby to za reprezentatywne, gdyby rozkład krańcowy był zbliżony do populacji.
źródło
Próbka : podczas gdy w statystykach odnosi się to do zestawu przypadków , w wielu innych dyscyplinach próbka jest jedną próbką fizyczną . Oczywiście wielkość próbki jest również niejednoznaczna, odnosząc się albo do liczby przypadków w próbce statystycznej, albo do wielkości fizycznej (masa, objętość, ...) próbki.
Czułość : w przypadku diagnostyki medycznej rozpoznawana jest część chorych przypadków. W chemii analitycznej: nachylenie krzywej kalibracji (patrz poniżej).
Specyficzność : w diagnostyce medycznej odsetek przypadków innych niż choroby prawidłowo rozpoznano w teście. W chemii analitycznej metoda jest specyficzna, jeśli nie ma wrażliwości krzyżowej.
Kalibracja : w rzeczywistości w artykule Wiki wymieniono już dwa znaczenia dla statystyk. W chemii i fizyce znaczenie regresji odwrotnej jest zwykle stosowane. Powstaje jednak zamieszanie:
Zestaw walidacyjny : tutaj chciałbym zwrócić uwagę na potencjalnie niejasne użycie terminów, które, jak sądzę, pojawiają się już w różnych polach związanych ze statystykami, mimo że znów się kontrastuję. W kontekście zagnieżdżania / podwójnej walidacji lub optymalizacji kontra walidacja / testowanie, jedna linia terminologii dzieli szkolenie - walidację - test i wykorzystuje zestaw „walidacji” do optymalizacji hiperparametrów.
Np. W elementach statystycznego uczenia się, str. 222 w 2 wyd. :
Dla kontrastu, np. W walidacji chemii analitycznej jest to procedura, która pokazuje, że model (tak naprawdę ocena modelu końcowego jest tylko częścią walidacji metody analitycznej) działa dobrze dla aplikacji i mierzy jej wydajność, patrz np. John K. Taylor: Walidacja metod analitycznych, Analytical Chemistry 1983 55 (6), 600A-608A lub wytycznych przez instytucje takie jak FDA. Byłoby to „testowanie” w innej linii terminologii, gdzie „walidacja” jest faktycznie używana do optymalizacji.
Zasadnicza różnica polega na tym, że wyniki „optymalizacji i walidacji optymalizacji” należy wykorzystać do zmiany (wyboru) modelu, podczas gdy zmiany w zwalidowanej metodzie analitycznej (w tym modelu analitycznym danych) oznaczają konieczność ponownej walidacji (tj. udowodnij, że metoda nadal działa tak, jak powinna działać).
Jeśli zdarzy ci się rozmawiać z chemikami, dobrym odniesieniem do terminologii chemii analitycznej jest Danzer: Analytical Chemistry - Theoretical and Metrological Fundamentals, DOI 10.1007 / b103950
źródło