Czy ktoś może mi powiedzieć różnicę między marginesami błędu a przedziałami ufności? W Internecie widzę, że te dwa znaczenia są używane zamiennie.
Czy dobrze jest powiedzieć
„Przedziały ufności są wyświetlane jako 1,96 i wyświetlane na wykresach jako marginesy błędów”?
confidence-interval
survey
polling
Mintuz
źródło
źródło
Odpowiedzi:
Internet jest pełen śmieci, jak wszyscy wiemy. Pomaga znaleźć wiarygodne źródła i skupić się na nich, aby pomóc w rozwiązaniu takich problemów. Broszura wydana przez Amerykańskie Stowarzyszenie Statystycznego (nadana Fritz Scheuren i „gruntownie zaktualizowane około 1997”) określa margines błędu jako przedział ufności 95% (str. 64, po prawej stronie).
W świetle powyższego zaskakujące jest to, że artykuł w Wikipedii na temat marginesu błędu używa innej definicji, mimo że odwołuje się do tej broszury! Wikipedia pisze,
Innymi słowy, Wikipedia MŚ jest połowa maksymalna szerokość zestawu przedziałów ufności (które mogą mieć relacje różniące się od 95%).
Omówiliśmy to zamieszanie (lub przynajmniej brak standaryzacji) w komentarzach w innych miejscach na tej stronie. Doszliśmy do wniosku, że za każdym razem, gdy używasz tego terminu , musisz wyjaśnić, co rozumiesz przez „margines błędu”.
źródło
Nie ma powszechnie stosowanej konwencji dotyczącej tego, czym jest „margines błędu”, ale myślę, że (jak zauważyłeś) jest on najczęściej używany jako oznaczający promień przedziału ufności , albo w pierwotnej skali oszacowania, albo jako procent oszacowania. Czasami jest on używany jako synonim „standardowego błędu”, więc musisz uważać, aby inni zrozumieli, co masz na myśli, gdy go używasz.
A „przedział ufności” ma mieć uniwersalną konwencję o jego znaczeniu. Zasadniczo jest to zakres możliwych oszacowań generowanych przez proces szacowania, który X% czasu (95% jest najczęściej stosowanym) zawiera prawdziwą wartość szacowanego parametru. Ta koncepcja „procesu”, który generowałby prawdziwą wartość X% czasu, jest nieco sprzeczna z intuicją i nie należy jej mylić z „przedziałem wiarygodności” z wnioskowania bayesowskiego, który ma znacznie bardziej intuicyjną definicję, ale jest to nie to samo, co szeroko stosowany przedział ufności.
Twoja aktualna wycena jest trochę nieporządna i wymaga drobnych poprawek zgodnie z opisem. Unikałbym tego dodatkowego użycia słowa „margines” i preferowałbym „słupki błędów”. Więc:
„Przedziały ufności są szacowane jako 1,96 pomnożone przez odpowiednie błędy standardowe i pokazane na wykresach jako słupki błędów.”
(To odsuwa na bok pytanie, czy jest to dobry sposób obliczania przedziałów ufności, który zależy od modelu itp. I nie jest istotny).
Ostatni komentarz do terminologii - nie podoba mi się „błąd standardowy”, co oznacza po prostu „odchylenie standardowe oszacowania”; lub „błąd próbkowania w ogóle” - wolę myśleć w kategoriach losowości i wariancji statystyk niż „błędów”. Ale wpadłem na użycie powyższego terminu „błąd standardowy”, ponieważ, jak sądzę, jest on tak powszechnie używany.
źródło