Masz pojęcie, dlaczego nie używamy znaczących cyfr w statystykach? Coś w tym stylu używamy szacunków, więc zasady dotyczące precyzji nie mają zastosowania;)?
Przykład, w którym zwracanie uwagi na znaczące cyfry naprawdę ma znaczenie, znajduje się na stronie stats.stackexchange.com/questions/113314 , gdzie PO uzyskał zauważalnie różne wyniki regresji, które można powiązać z różnicami w precyzji, z jaką dane były wprowadzane do procedur regresji.
whuber
Odpowiedzi:
19
Znaczące cyfry są używane w niektórych dziedzinach (dowiedziałem się o nich w chemii), aby wskazać stopień znaczącej precyzji, jaki istnieje w liczbie. Jest to również ważny temat w statystykach, więc w rzeczywistości zgłaszamy to stale - po prostu zgłaszamy to w innej formie. W szczególności zgłaszamy przedziały ufności , które wskazują poziom dokładności oszacowania (np. Średniej).
Po podaniu szacunkowej wartości 95% CI, takiej jak , możesz podać dowolną liczbę cyfr średniej, na przykład 0,50129519823975923 , i nie ma problemu. W rzeczywistości statystyk Andrew Gelman zalecił, aby wymienić(−0.12,1.12)0.50129519823975923 co najmniej cztery (2009, s. 4) .
(Ostatnia część to język w policzek, przepraszam za moją niechęć ;-).
gung - Przywróć Monikę
2
+1. Wydaje się, że duża liczba cyfr generuje bezbożne odpowiedzi: patrz kilka ostatnich wierszy mojej odpowiedzi na podobne pytanie na innej stronie SE.
whuber
@gung Jak zdecydujesz się reprezentować punkty końcowe elementu CI z dwoma miejscami po przecinku?
user765195,
@ user765195, stworzyłem te liczby. Nie odnoszą się do niczego.
gung - Przywróć Monikę
@gung Chciałem zapytać, jaka jest dokładność punktów końcowych elementu CI? Ile cyfr jest poprawnych, powiedzmy, podczas obliczania CI Wilsona dla proporcji dwumianowej?
user765195
12
Jednym z powodów ograniczenia liczby cyfr zgłaszanych w wielu szacunkach, wartościach p, itp. Jest oparta na postrzeganiu. Zgłaszanie czegoś takiego jak p = 0,04872429 implikuje poziom precyzji wyników, który powoduje, że są one postrzegane jako bardziej dokładniejsze .
Zasadniczo użycie dużej liczby cyfr w raportowaniu wyników statystycznych smakuje zbyt wiele prób ukrycia swoich ustaleń w niezasłużonym autorytecie.
Myślę, że to naprawdę zależy od wymaganego poziomu ufności, mniej cyfr istotności jest odpowiednich dla 95%, w przeciwieństwie do 99,999% lub więcej, na przykład, jak CERN wykorzystał dla wielu swoich wyników.
W celu dalszego wyjaśnienia artykuł Wikipedii na temat dokładności i precyzji byłby dobrym lektorem oryginalnego plakatu.
Robert Jones
to dobra uwaga, ale nawet gdy 𝛂 = .05 zaokrąglenie w niektórych obliczeniach może mieć duży wpływ na wynik.
timothy.s.lau
1
Czy mówisz o zaokrągleniu danych do pewnej liczby cyfr znaczących lub zaokrągleniu ostatecznej odpowiedzi? Jeśli zaokrąglisz swoje dane, możesz znaleźć się w sytuacji, w której wyrzucisz hałas, którego potrzebują obliczenia statystyczne.
Odpowiedzi:
Znaczące cyfry są używane w niektórych dziedzinach (dowiedziałem się o nich w chemii), aby wskazać stopień znaczącej precyzji, jaki istnieje w liczbie. Jest to również ważny temat w statystykach, więc w rzeczywistości zgłaszamy to stale - po prostu zgłaszamy to w innej formie. W szczególności zgłaszamy przedziały ufności , które wskazują poziom dokładności oszacowania (np. Średniej).
Po podaniu szacunkowej wartości 95% CI, takiej jak , możesz podać dowolną liczbę cyfr średniej, na przykład 0,50129519823975923 , i nie ma problemu. W rzeczywistości statystyk Andrew Gelman zalecił, aby wymienić(−0.12,1.12) 0.50129519823975923 co najmniej cztery (2009, s. 4) .
źródło
Jednym z powodów ograniczenia liczby cyfr zgłaszanych w wielu szacunkach, wartościach p, itp. Jest oparta na postrzeganiu. Zgłaszanie czegoś takiego jak p = 0,04872429 implikuje poziom precyzji wyników, który powoduje, że są one postrzegane jako bardziej dokładniejsze .
Zasadniczo użycie dużej liczby cyfr w raportowaniu wyników statystycznych smakuje zbyt wiele prób ukrycia swoich ustaleń w niezasłużonym autorytecie.
źródło
Myślę, że to naprawdę zależy od wymaganego poziomu ufności, mniej cyfr istotności jest odpowiednich dla 95%, w przeciwieństwie do 99,999% lub więcej, na przykład, jak CERN wykorzystał dla wielu swoich wyników.
źródło
Czy mówisz o zaokrągleniu danych do pewnej liczby cyfr znaczących lub zaokrągleniu ostatecznej odpowiedzi? Jeśli zaokrąglisz swoje dane, możesz znaleźć się w sytuacji, w której wyrzucisz hałas, którego potrzebują obliczenia statystyczne.
źródło