Wąski przedział ufności - większa dokładność?

18

Mam dwa pytania dotyczące przedziałów ufności:

Najwyraźniej wąski przedział ufności oznacza, że ​​istnieje mniejsza szansa na uzyskanie obserwacji w tym przedziale, dlatego nasza dokładność jest wyższa.

Również przedział ufności 95% jest węższy niż przedział ufności 99%, który jest szerszy.

Przedział ufności 99% jest dokładniejszy niż 95%.

Czy ktoś może podać proste wyjaśnienie, które pomoże mi zrozumieć różnicę między dokładnością a zawężeniem?

powyżej
źródło
2
Myślę, że masz na myśli „istnieje mniejsza szansa na uzyskanie obserwacji poza tym przedziałem”. Niestety przedział ufności może nie oznaczać tego, co wydaje się oznaczać, ze względów technicznych, statystycznych, ale ogólnie im węższy przedział (na danym poziomie ufności), tym mniej niepewności co do wyników. Na tej stronie znajduje się wiele wątków omawiających, co oznacza przedział ufności (w przeciwieństwie do, powiedzmy, przedziału wiarygodności). Nie wchodzimy nawet w przewidujące interwały ...
Wayne,
@Wayne Dlaczego stwierdzenie nie brzmi „istnieje mniejsza szansa na uzyskanie obserwacji w tym przedziale czasowym”? Ponieważ w wąskim przedziale występuje duży błąd typu 1, bardziej prawdopodobne jest odrzucenie hipotezy prawdziwej wartości zerowej, to znaczy moja prawdziwa wartość zerowa nie jest zawarta w tym przedziale. Wydaje mi się więc, że a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervaljest poprawny. Czy mógłbyś mi wyjaśnić, gdzie popełniam błąd?
użytkownik 31466,

Odpowiedzi:

19

95% w ogóle nie jest związane liczbowo z tym, jak pewny jesteś, że wykorzystałeś prawdziwy efekt eksperymentu. Być może uznanie tego „interwału za pomocą obliczania zakresu zasięgu 95%” może być dla niego bardziej dokładne. Możesz wybrać, czy przedział zawiera prawdziwą wartość; i masz rację, jeśli robisz to konsekwentnie przez 95% czasu. Ale tak naprawdę nie wiesz, jak prawdopodobne jest to dla twojego eksperymentu bez dodatkowych informacji.

P1: Twoje pierwsze zapytanie łączy dwie rzeczy i niewłaściwie używa terminu. Nic dziwnego, że jesteś zdezorientowany. Węższy przedział ufności może być bardziej precyzyjny, ale przy obliczeniu w ten sam sposób, np. W metodzie 95%, wszystkie mają tę samą dokładność. Przechwytują prawdziwą wartość w tej samej proporcji czasu.

Również dlatego, że jest wąski, nie oznacza, że ​​mniej prawdopodobne jest napotkanie próbki mieszczącej się w tym wąskim przedziale ufności. Wąski przedział ufności można osiągnąć na jeden z trzech sposobów. Metoda eksperymentalna lub charakter danych może mieć bardzo małą wariancję. Przedział ufności wokół punktu wrzenia wody z kranu na poziomie morza jest dość mały, niezależnie od wielkości próbki. Przedział ufności wokół średniej masy ludzi może być dość duży, ponieważ ludzie są bardzo zmienni, ale można zmniejszyć ten przedział ufności, po prostu uzyskując więcej obserwacji. W takim przypadku, ponieważ zyskujesz większą pewność co do prawdziwej wartości, poprzez zebranie większej liczby próbek i zawężenie przedziału ufności, wówczas prawdopodobieństwo spotkania danej osoby w tym przedziale ufności maleje. (zmniejsza się w każdym przypadku, gdy zwiększasz wielkość próbki, ale nie możesz zawracać sobie głowy pobieraniem dużej próbki w skrzynce z wrzącą wodą). Wreszcie może być wąska, ponieważ twoja próbka jest niereprezentatywna. W takim przypadku istnieje większe prawdopodobieństwo, że jeden z 5% przedziałów nie zawiera prawdziwej wartości. To trochę paradoks dotyczący szerokości CI i coś, co powinieneś sprawdzić, znając literaturę i jak zwykle zmienne są te dane. W takim przypadku istnieje większe prawdopodobieństwo, że jeden z 5% przedziałów nie zawiera prawdziwej wartości. To trochę paradoks dotyczący szerokości CI i coś, co powinieneś sprawdzić, znając literaturę i jak zwykle zmienne są te dane. W takim przypadku istnieje większe prawdopodobieństwo, że jeden z 5% przedziałów nie zawiera prawdziwej wartości. To trochę paradoks dotyczący szerokości CI i coś, co powinieneś sprawdzić, znając literaturę i jak zwykle zmienne są te dane.

Ponadto należy wziąć pod uwagę, że przedział ufności polega na próbie oszacowania prawdziwej średniej wartości populacji. Gdybyś znał to miejsce, byłbyś jeszcze bardziej precyzyjny (i dokładny), a nawet nie miałbyś zakresu szacunków. Ale prawdopodobieństwo napotkania obserwacji o dokładnie takiej samej wartości byłoby znacznie niższe niż znalezienie jej w obrębie konkretnego CI opartego na próbce.

Q2 : 99% przedział ufności jest szerszy niż 95%. Dlatego bardziej prawdopodobne jest, że będzie zawierać prawdziwą wartość. Zobacz powyższe rozróżnienie między precyzją a dokładnością, łączysz je ze sobą. Jeśli zmniejszy się przedział ufności przy mniejszej zmienności i większej wielkości próbki, staje się on bardziej precyzyjny, prawdopodobne wartości obejmują mniejszy zakres. Jeśli zwiększę zasięg za pomocą obliczenia 99%, staje się on bardziej dokładny, bardziej prawdopodobne jest, że prawdziwa wartość będzie w zakresie.

Jan
źródło
2
Zmienność średniej (= tego, co próbujesz oszacować) w populacji wynosi zero.
Nick Sabbe,
10

W przypadku danego zestawu danych zwiększenie poziomu ufności przedziału ufności spowoduje jedynie zwiększenie przedziałów (lub przynajmniej nie mniejszych ). Nie chodzi o dokładność ani precyzję, ale o to, ile ryzyka jesteś gotów podjąć, tracąc prawdziwą wartość.

Jeśli porównujesz przedziały ufności dla tego samego rodzaju parametru z wielu zestawów danych, a jeden jest mniejszy od drugiego, możesz powiedzieć, że mniejszy jest bardziej precyzyjny . W tej sytuacji wolę mówić o precyzji niż o dokładności (zobacz odpowiedni artykuł w Wikipedii ).

Karl
źródło
Co należy rozumieć przez „ten sam rodzaj parametru” i „wiele zestawów danych”? Powiedzmy, że ankieta na temat analfabetyzmu i ankieta są przeprowadzane w innym czasie, 1995, 1998 itd. Czy zatem „wskaźnik analfabetyzmu” jest tego samego rodzaju parametrem i czy zestawy danych z lat 1995, 1998 itd. Wskazują na wiele zbiorów danych?
użytkownik 31466,
Na przykład zestaw przedziałów ufności, każdy dla średniej populacji. Twój przykład też pasuje.
Karl
3

Po pierwsze, CI dla danego procentu ufności (np. 95%) oznacza, dla wszystkich praktycznych celów (choć technicznie nie jest poprawne), że masz pewność, że prawdziwa wartość znajduje się w przedziale.

Jeśli ten przedział jest „wąski” (zwróć uwagę, że można to rozpatrywać tylko w sposób względny, więc dla porównania z tym, co następuje, powiedzmy, że ma szerokość 1 jednostki), oznacza to, że nie ma zbyt wiele miejsca do grania: dowolna wartość wybierzemy, że ten przedział będzie zbliżony do prawdziwej wartości (ponieważ przedział jest wąski) i jesteś tego pewien (95%).

Porównaj to do względnie szerokiego 95% CI (aby pasować do poprzedniego przykładu, powiedzmy, że ma szerokość 100 jednostek): tutaj nadal masz 95% pewności, że prawdziwa wartość będzie w tym przedziale, ale to nie mówi zbyt wiele dużo, ponieważ w przedziale jest stosunkowo wiele wartości (około 100 w przeciwieństwie do 1 - i ponownie pytam purystów, aby zignorowali uproszczenie).

Zazwyczaj potrzebujesz dłuższego interwału, jeśli chcesz mieć 99% pewności, że zawiera się w nim prawdziwa wartość, niż gdy musisz mieć tylko 95% pewności (uwaga: może to nie być prawdą, jeśli interwały nie są zagnieżdżone ), więc im więcej potrzebujesz pewności, tym szerszy przedział czasu będziesz musiał wybrać.

Z drugiej strony, bardziej pewne z wyższego przedziału ufności. Tak więc, jeśli dam ci 2 przedziały o tej samej szerokości i powiem, że jeden to 95% CI, a drugi 99% CI, mam nadzieję, że wolisz 99%. W tym sensie 99% CI jest bardziej dokładne: masz mniej wątpliwości, że przegapisz prawdę.

Nick Sabbe
źródło
dzięki! więc kiedy mówią, że nowe badania nad neutrinami, które są szybsze od światła, mają bardzo mały przedział ufności (myślę, że to oznacza wąski), oznacza to, że są bardziej prawdopodobne, że będą dokładne, jeśli byłby to szeroki przedział ufności? (pomijając wszystkie inne aspekty)
powyżej
10
Nick, twoje pierwsze stwierdzenie jest błędne. To nie jest „problem techniczny”, to po prostu nieprawda. Przedział ufności jest stwierdzeniem o tym, co stanie się w powtarzanych eksperymentach, że obejmą one prawdziwą wartość w 95% przypadków. Stwierdzenie o pewności, że prawdziwa wartość mieści się w podanym przedziale stwierdzonym w danym eksperymencie, nie jest wcale takie samo. Jeśli usuniesz „to” w „tym pewnym siebie” i nawiasową liczbę liczbową, będziesz bliżej prawdy. Można po prostu powiedzieć, że oznacza to, że uważasz, że prawdziwa wartość może spaść w tym przedziale czasowym.
Jan
w przeciwnym razie odpowiedź jest całkiem dobra ...
Jan
4
@John: W szczególności unikałem mówienia, że ​​sam przedział jest zmienną losową, chociaż moje zdanie nie sugeruje, że tak nie jest (co prawda, sugeruje to). Znam związane z tym problemy, ale uznałem, że nie mają one znaczenia dla pytania. Nigdy nie widziałem praktycznej sytuacji, w której różnica też się liczyła, stąd „do wszystkich praktycznych celów”.
Nick Sabbe
4
Nie napotkałeś problemu? To tak, jakby powiedzieć wartość p = prawdopodobieństwo zera, a następnie powiedzieć, że nigdy nie spotkałeś się z tym problemem. Nie będziesz, jeśli pozostaniesz we właściwych czasopismach. Po prostu błędne jest twierdzenie, że masz 95% pewności, że prawdziwa wartość znajduje się w twoim bieżącym zakresie. Traktowanie tego jako jakiejś ezoterycznej sprawy oznacza po prostu, że teraz (przynajmniej) jedna osoba będzie chodzić i mówić: „Jestem w 95% pewien, że wartość mieści się w tym zakresie”. Prawie nie zmieniłoby to twojej odpowiedzi, aby to poprawić. Inne problemy, które omijasz, można zignorować, jeśli zmienisz to jedno zdanie.
Jan
3

Dodam tutaj kilka dobrych odpowiedzi, na które oddałem głos. Myślę, że należy powiedzieć coś więcej, aby całkowicie wyjaśnić wniosek. Lubię terminy dokładne i poprawne, ponieważ Efron je definiuje. Niedawno przeprowadziłem długą dyskusję na ten temat na inne pytanie. Umiarkowanemu fanowi naprawdę podobała się ta odpowiedź. Nie pójdę do tego samego miejsca, żeby to powtórzyć tutaj. Jednak dokładność Efron odnosi się do poziomu ufności i poprawności do szerokości lub szczelności przedziału. Ale nie można mówić o szczelności bez uprzedniego rozważenia dokładności. Niektóre przedziały ufności są dokładne, te są dokładne, ponieważ mają faktyczny zasięg, który reklamują. 95% przedział ufności może być również przybliżony, ponieważ wykorzystuje rozkład asymptotyczny. Przybliżone przedziały oparte na asymptotyce są dla skończonej wielkości próby n, która nie będzie miała reklamowanego zasięgu, który byłby zasięgiem, który uzyskałbyś, gdyby rozkład asymptotyczny był dokładnym rozkładem. A zatem przybliżony przedział czasu może być tajny (tj. Reklamować 95%, gdy jego rzeczywisty zasięg wynosi tylko 91%) lub w rzadkich, ale mniej poważnych przypadkach overcover (tj. Reklamowany zasięg wynosi 95%, ale faktyczny w 98%). W pierwszym przypadku martwimy się, jak blisko faktycznego zasięgu jest zasięg reklamowany). Miarą bliskości jest rząd dokładności, który można powiedzieć 1 / √n lub 1 / n. Jeśli faktyczny poziom ufności jest bliski, nazywamy go dokładnym. Dokładność jest ważna w przypadku przedziałów ufności ładowania początkowego, które nigdy nie są dokładne, ale niektóre warianty są dokładniejsze niż inne.

Ta definicja dokładności może być inna niż ta, do której odnosi się PO, ale teraz powinno być jasne, jaka jest definicja Efron i dlaczego ważna jest dokładność. Teraz, jeśli masz dwie metody, które są dokładne, możemy preferować jedną z nich, jeśli dla dowolnego poziomu ufności ma ona mniejszą oczekiwaną szerokość. Najlepszym w tym sensie przedziałem ufności (czasami nazywanym najkrótszym) byłby ten, który wybierzesz. Ale to wymagało dokładności. Gdyby poziom ufności był tylko przybliżony, moglibyśmy porównać jabłka i pomarańcze. Jeden może być węższy od drugiego tylko dlatego, że jest mniej dokładny, a zatem ma mniejszy rzeczywisty zasięg niż jego zasięg reklamowany.

Jeśli oba przedziały ufności są bardzo dokładne lub jeden jest dokładny, a drugi bardzo dokładny porównując oczekiwaną szerokość może być w porządku, ponieważ przynajmniej teraz patrzymy tylko na dwie dwie odmiany jabłek.

Michael R. Chernick
źródło