W jaki sposób marginesy błędu są powiązane z przedziałami ufności?

11

Czy ktoś może mi powiedzieć różnicę między marginesami błędu a przedziałami ufności? W Internecie widzę, że te dwa znaczenia są używane zamiennie.

Czy dobrze jest powiedzieć

„Przedziały ufności są wyświetlane jako 1,96 i wyświetlane na wykresach jako marginesy błędów”?

Mintuz
źródło
1
Przydatne dyskusje na ten temat można znaleźć, przeszukując naszą stronę .
whuber

Odpowiedzi:

13

Internet jest pełen śmieci, jak wszyscy wiemy. Pomaga znaleźć wiarygodne źródła i skupić się na nich, aby pomóc w rozwiązaniu takich problemów. Broszura wydana przez Amerykańskie Stowarzyszenie Statystycznego (nadana Fritz Scheuren i „gruntownie zaktualizowane około 1997”) określa margines błędu jako przedział ufności 95% (str. 64, po prawej stronie).

W świetle powyższego zaskakujące jest to, że artykuł w Wikipedii na temat marginesu błędu używa innej definicji, mimo że odwołuje się do tej broszury! Wikipedia pisze,

Margines błędu jest zwykle definiowany jako „promień” (lub połowa szerokości) przedziału ufności dla określonej statystyki z ankiety. ... Kiedy pojedynczy ankietowy globalny margines błędu jest zgłaszany w ankiecie, odnosi się to do maksymalnego marginesu błędu dla wszystkich zgłoszonych wartości procentowych z wykorzystaniem pełnej próbki z ankiety.

Innymi słowy, Wikipedia MŚ jest połowa maksymalna szerokość zestawu przedziałów ufności (które mogą mieć relacje różniące się od 95%).

Omówiliśmy to zamieszanie (lub przynajmniej brak standaryzacji) w komentarzach w innych miejscach na tej stronie. Doszliśmy do wniosku, że za każdym razem, gdy używasz tego terminu , musisz wyjaśnić, co rozumiesz przez „margines błędu”.

Whuber
źródło
7

Nie ma powszechnie stosowanej konwencji dotyczącej tego, czym jest „margines błędu”, ale myślę, że (jak zauważyłeś) jest on najczęściej używany jako oznaczający promień przedziału ufności , albo w pierwotnej skali oszacowania, albo jako procent oszacowania. Czasami jest on używany jako synonim „standardowego błędu”, więc musisz uważać, aby inni zrozumieli, co masz na myśli, gdy go używasz.

A „przedział ufności” ma mieć uniwersalną konwencję o jego znaczeniu. Zasadniczo jest to zakres możliwych oszacowań generowanych przez proces szacowania, który X% czasu (95% jest najczęściej stosowanym) zawiera prawdziwą wartość szacowanego parametru. Ta koncepcja „procesu”, który generowałby prawdziwą wartość X% czasu, jest nieco sprzeczna z intuicją i nie należy jej mylić z „przedziałem wiarygodności” z wnioskowania bayesowskiego, który ma znacznie bardziej intuicyjną definicję, ale jest to nie to samo, co szeroko stosowany przedział ufności.

Twoja aktualna wycena jest trochę nieporządna i wymaga drobnych poprawek zgodnie z opisem. Unikałbym tego dodatkowego użycia słowa „margines” i preferowałbym „słupki błędów”. Więc:

„Przedziały ufności są szacowane jako 1,96 pomnożone przez odpowiednie błędy standardowe i pokazane na wykresach jako słupki błędów.”

(To odsuwa na bok pytanie, czy jest to dobry sposób obliczania przedziałów ufności, który zależy od modelu itp. I nie jest istotny).

Ostatni komentarz do terminologii - nie podoba mi się „błąd standardowy”, co oznacza po prostu „odchylenie standardowe oszacowania”; lub „błąd próbkowania w ogóle” - wolę myśleć w kategoriach losowości i wariancji statystyk niż „błędów”. Ale wpadłem na użycie powyższego terminu „błąd standardowy”, ponieważ, jak sądzę, jest on tak powszechnie używany.

Peter Ellis
źródło