Czy istnieje bardziej naukowy sposób określania liczby cyfr znaczących, które należy zgłosić dla średniej lub przedziału ufności w sytuacji, która jest dość standardowa - np. Klasa pierwszego roku na studiach.
Widziałem liczbę znaczących cyfr do umieszczenia w tabeli , dlaczego nie używamy znaczących cyfr i liczbę znaczących cyfr w dopasowaniu chi-kwadrat , ale wydaje się, że nie dotykają problemu.
Na moich zajęciach staram się wyjaśnić moim uczniom, że marnotrawstwo atramentu polega na zgłaszaniu 15 cyfr znaczących, gdy mają tak szeroki standardowy błąd w swoich wynikach - miałem przeczucie, że powinno się je zaokrąglać mniej więcej do około . Nie różni się to zbytnio od tego, co mówi ASTM - raportowanie wyników testu odnoszących się do E29, gdzie, jak twierdzą, powinno ono wynosić od 0,05 σ do 0,5 σ .
EDYTOWAĆ:
Kiedy mam zestaw liczb takich jak x
poniżej, ile cyfr powinienem użyć, aby wydrukować średnią i odchylenie standardowe?
set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109
PYTANIE: Podaj szczegółowo, jaka jest precyzja (gdy istnieje wektor liczb podwójnej precyzji) dla średniej i odchylenia standardowego, i napisz prostą funkcję pedagogiczną R, która wypisze średnią i odchylenie standardowe na znaczną liczbę cyfr, które znajduje odzwierciedlenie w wektorze x
.
R
(podobnie jak prawie w każdym oprogramowaniu) drukowanie jest kontrolowane przez wartość globalną (patrzoptions(digits=...)
), a nie przez jakiekolwiek uwzględnienie precyzji.Odpowiedzi:
W Przewodniku po niepewności pomiaru (GUM) zaleca się zgłaszanie niepewności nie więcej niż 2 cyframi i zgłaszanie wyniku wraz z liczbą cyfr znaczących potrzebnych do zapewnienia zgodności z niepewnością. Sekcja 7.2.2 poniżej
http://www.bipm.org/utils/common/documents/jcgm/JCGM_100_2008_E.pdf
Poniższy kod był moją próbą zaimplementowania tego zalecenia w R. Noe, że R może nie współpracować z próbami zachowania końcowych zer na wyjściu, nawet jeśli są znaczące.
źródło
> gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
val = 8165.666
iunc = 338.9741
, pomiar należy podać jakoval = 8.17(34)*10^3
(a nieval = 8170
zunc = 340
podanym), aby wyjaśnić, że tylko dwie cyfry niepewności są znaczące.Jeśli pokazuje się przedział ufności, a także wartość statystyki, nie ma problemu z podaniem tylu znaczących liczb, ile się chce, ponieważ w tym przypadku duża liczba znaczących liczb nie oznacza fałszywej precyzji, ponieważ przedział ufności daje wskazanie prawdopodobnego rzeczywistej precyzji (wiarygodny przedział byłoby lepiej). Zasadniczo chodzi o to, aby stół był schludny, zwięzły i czytelny, więc zasadniczo nie jest prawdopodobne, aby istniała prosta zasada, która pasowałaby na każdą okazję.
Powtarzalność jest ważna w badaniach naukowych, dlatego idealnie powinna być możliwa reprodukcja wyników na dowolną liczbę znaczących cyfr (niezależnie od tego, czy mają one znaczenie praktyczne, czy nie). Zaokrąglenie do niewielkiej liczby znaczących liczb może zmniejszyć zaufanie do replikacji badania, ponieważ błędy mogą być maskowane przez zaokrąglanie wyników, więc w niektórych okolicznościach może wystąpić wada.
Innym powodem, dla którego nie można zaokrąglić za daleko, jest to, że może uniemożliwić innym rozszerzenie badania bez jego powtórzenia. Na przykład mógłbym opublikować artykuł porównujący różne algorytmy uczenia maszynowego przy użyciu testu Friedmana, który zależy od rankingu różnych algorytmów w zestawie zestawów danych testowych. Jeśli statystyki dla poszczególnych klasyfikatorów w każdym zbiorze danych zostaną podane wielu znaczącym liczbom w zależności od ich standardowych błędów, niewątpliwie stworzy to wiele widocznych powiązań w rankingach. Oznacza to, że (i) czytelnik / recenzent pracy nie będzie w stanie powtórzyć testu Friedmana z wyników podanych w pracy oraz (ii) ktoś inny nie będzie w stanie ocenić swojego algorytmu w zestawach danych porównawczych i użyje Friedmana test, aby umieścić go w kontekście wyników z moich badań.
źródło
Z pewnością każda decyzja, podjęta obiektywnie lub subiektywnie, będzie silnie zależeć od tego, co mierzysz i od tego, jak precyzyjny jest twój przyrząd pomiarowy. Ta ostatnia jest tylko częścią obserwowanej odmiany i nie zawsze jest łatwa do rozpoznania lub znalezienia istniejących dowodów. Dlatego mocno podejrzewam, że nie ma obiektywnej, powszechnie stosowanej decyzji. Musisz tylko użyć swojego mózgu i dokonać najlepszego osądu w każdej sytuacji.
źródło