Mam dwa pytania dotyczące przedziałów ufności:
Najwyraźniej wąski przedział ufności oznacza, że istnieje mniejsza szansa na uzyskanie obserwacji w tym przedziale, dlatego nasza dokładność jest wyższa.
Również przedział ufności 95% jest węższy niż przedział ufności 99%, który jest szerszy.
Przedział ufności 99% jest dokładniejszy niż 95%.
Czy ktoś może podać proste wyjaśnienie, które pomoże mi zrozumieć różnicę między dokładnością a zawężeniem?
confidence-interval
powyżej
źródło
źródło
a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that interval
jest poprawny. Czy mógłbyś mi wyjaśnić, gdzie popełniam błąd?Odpowiedzi:
95% w ogóle nie jest związane liczbowo z tym, jak pewny jesteś, że wykorzystałeś prawdziwy efekt eksperymentu. Być może uznanie tego „interwału za pomocą obliczania zakresu zasięgu 95%” może być dla niego bardziej dokładne. Możesz wybrać, czy przedział zawiera prawdziwą wartość; i masz rację, jeśli robisz to konsekwentnie przez 95% czasu. Ale tak naprawdę nie wiesz, jak prawdopodobne jest to dla twojego eksperymentu bez dodatkowych informacji.
P1: Twoje pierwsze zapytanie łączy dwie rzeczy i niewłaściwie używa terminu. Nic dziwnego, że jesteś zdezorientowany. Węższy przedział ufności może być bardziej precyzyjny, ale przy obliczeniu w ten sam sposób, np. W metodzie 95%, wszystkie mają tę samą dokładność. Przechwytują prawdziwą wartość w tej samej proporcji czasu.
Również dlatego, że jest wąski, nie oznacza, że mniej prawdopodobne jest napotkanie próbki mieszczącej się w tym wąskim przedziale ufności. Wąski przedział ufności można osiągnąć na jeden z trzech sposobów. Metoda eksperymentalna lub charakter danych może mieć bardzo małą wariancję. Przedział ufności wokół punktu wrzenia wody z kranu na poziomie morza jest dość mały, niezależnie od wielkości próbki. Przedział ufności wokół średniej masy ludzi może być dość duży, ponieważ ludzie są bardzo zmienni, ale można zmniejszyć ten przedział ufności, po prostu uzyskując więcej obserwacji. W takim przypadku, ponieważ zyskujesz większą pewność co do prawdziwej wartości, poprzez zebranie większej liczby próbek i zawężenie przedziału ufności, wówczas prawdopodobieństwo spotkania danej osoby w tym przedziale ufności maleje. (zmniejsza się w każdym przypadku, gdy zwiększasz wielkość próbki, ale nie możesz zawracać sobie głowy pobieraniem dużej próbki w skrzynce z wrzącą wodą). Wreszcie może być wąska, ponieważ twoja próbka jest niereprezentatywna. W takim przypadku istnieje większe prawdopodobieństwo, że jeden z 5% przedziałów nie zawiera prawdziwej wartości. To trochę paradoks dotyczący szerokości CI i coś, co powinieneś sprawdzić, znając literaturę i jak zwykle zmienne są te dane. W takim przypadku istnieje większe prawdopodobieństwo, że jeden z 5% przedziałów nie zawiera prawdziwej wartości. To trochę paradoks dotyczący szerokości CI i coś, co powinieneś sprawdzić, znając literaturę i jak zwykle zmienne są te dane. W takim przypadku istnieje większe prawdopodobieństwo, że jeden z 5% przedziałów nie zawiera prawdziwej wartości. To trochę paradoks dotyczący szerokości CI i coś, co powinieneś sprawdzić, znając literaturę i jak zwykle zmienne są te dane.
Ponadto należy wziąć pod uwagę, że przedział ufności polega na próbie oszacowania prawdziwej średniej wartości populacji. Gdybyś znał to miejsce, byłbyś jeszcze bardziej precyzyjny (i dokładny), a nawet nie miałbyś zakresu szacunków. Ale prawdopodobieństwo napotkania obserwacji o dokładnie takiej samej wartości byłoby znacznie niższe niż znalezienie jej w obrębie konkretnego CI opartego na próbce.
Q2 : 99% przedział ufności jest szerszy niż 95%. Dlatego bardziej prawdopodobne jest, że będzie zawierać prawdziwą wartość. Zobacz powyższe rozróżnienie między precyzją a dokładnością, łączysz je ze sobą. Jeśli zmniejszy się przedział ufności przy mniejszej zmienności i większej wielkości próbki, staje się on bardziej precyzyjny, prawdopodobne wartości obejmują mniejszy zakres. Jeśli zwiększę zasięg za pomocą obliczenia 99%, staje się on bardziej dokładny, bardziej prawdopodobne jest, że prawdziwa wartość będzie w zakresie.
źródło
W przypadku danego zestawu danych zwiększenie poziomu ufności przedziału ufności spowoduje jedynie zwiększenie przedziałów (lub przynajmniej nie mniejszych ). Nie chodzi o dokładność ani precyzję, ale o to, ile ryzyka jesteś gotów podjąć, tracąc prawdziwą wartość.
Jeśli porównujesz przedziały ufności dla tego samego rodzaju parametru z wielu zestawów danych, a jeden jest mniejszy od drugiego, możesz powiedzieć, że mniejszy jest bardziej precyzyjny . W tej sytuacji wolę mówić o precyzji niż o dokładności (zobacz odpowiedni artykuł w Wikipedii ).
źródło
Po pierwsze, CI dla danego procentu ufności (np. 95%) oznacza, dla wszystkich praktycznych celów (choć technicznie nie jest poprawne), że masz pewność, że prawdziwa wartość znajduje się w przedziale.
Jeśli ten przedział jest „wąski” (zwróć uwagę, że można to rozpatrywać tylko w sposób względny, więc dla porównania z tym, co następuje, powiedzmy, że ma szerokość 1 jednostki), oznacza to, że nie ma zbyt wiele miejsca do grania: dowolna wartość wybierzemy, że ten przedział będzie zbliżony do prawdziwej wartości (ponieważ przedział jest wąski) i jesteś tego pewien (95%).
Porównaj to do względnie szerokiego 95% CI (aby pasować do poprzedniego przykładu, powiedzmy, że ma szerokość 100 jednostek): tutaj nadal masz 95% pewności, że prawdziwa wartość będzie w tym przedziale, ale to nie mówi zbyt wiele dużo, ponieważ w przedziale jest stosunkowo wiele wartości (około 100 w przeciwieństwie do 1 - i ponownie pytam purystów, aby zignorowali uproszczenie).
Zazwyczaj potrzebujesz dłuższego interwału, jeśli chcesz mieć 99% pewności, że zawiera się w nim prawdziwa wartość, niż gdy musisz mieć tylko 95% pewności (uwaga: może to nie być prawdą, jeśli interwały nie są zagnieżdżone ), więc im więcej potrzebujesz pewności, tym szerszy przedział czasu będziesz musiał wybrać.
Z drugiej strony, są bardziej pewne z wyższego przedziału ufności. Tak więc, jeśli dam ci 2 przedziały o tej samej szerokości i powiem, że jeden to 95% CI, a drugi 99% CI, mam nadzieję, że wolisz 99%. W tym sensie 99% CI jest bardziej dokładne: masz mniej wątpliwości, że przegapisz prawdę.
źródło
Dodam tutaj kilka dobrych odpowiedzi, na które oddałem głos. Myślę, że należy powiedzieć coś więcej, aby całkowicie wyjaśnić wniosek. Lubię terminy dokładne i poprawne, ponieważ Efron je definiuje. Niedawno przeprowadziłem długą dyskusję na ten temat na inne pytanie. Umiarkowanemu fanowi naprawdę podobała się ta odpowiedź. Nie pójdę do tego samego miejsca, żeby to powtórzyć tutaj. Jednak dokładność Efron odnosi się do poziomu ufności i poprawności do szerokości lub szczelności przedziału. Ale nie można mówić o szczelności bez uprzedniego rozważenia dokładności. Niektóre przedziały ufności są dokładne, te są dokładne, ponieważ mają faktyczny zasięg, który reklamują. 95% przedział ufności może być również przybliżony, ponieważ wykorzystuje rozkład asymptotyczny. Przybliżone przedziały oparte na asymptotyce są dla skończonej wielkości próby n, która nie będzie miała reklamowanego zasięgu, który byłby zasięgiem, który uzyskałbyś, gdyby rozkład asymptotyczny był dokładnym rozkładem. A zatem przybliżony przedział czasu może być tajny (tj. Reklamować 95%, gdy jego rzeczywisty zasięg wynosi tylko 91%) lub w rzadkich, ale mniej poważnych przypadkach overcover (tj. Reklamowany zasięg wynosi 95%, ale faktyczny w 98%). W pierwszym przypadku martwimy się, jak blisko faktycznego zasięgu jest zasięg reklamowany). Miarą bliskości jest rząd dokładności, który można powiedzieć 1 / √n lub 1 / n. Jeśli faktyczny poziom ufności jest bliski, nazywamy go dokładnym. Dokładność jest ważna w przypadku przedziałów ufności ładowania początkowego, które nigdy nie są dokładne, ale niektóre warianty są dokładniejsze niż inne.
Ta definicja dokładności może być inna niż ta, do której odnosi się PO, ale teraz powinno być jasne, jaka jest definicja Efron i dlaczego ważna jest dokładność. Teraz, jeśli masz dwie metody, które są dokładne, możemy preferować jedną z nich, jeśli dla dowolnego poziomu ufności ma ona mniejszą oczekiwaną szerokość. Najlepszym w tym sensie przedziałem ufności (czasami nazywanym najkrótszym) byłby ten, który wybierzesz. Ale to wymagało dokładności. Gdyby poziom ufności był tylko przybliżony, moglibyśmy porównać jabłka i pomarańcze. Jeden może być węższy od drugiego tylko dlatego, że jest mniej dokładny, a zatem ma mniejszy rzeczywisty zasięg niż jego zasięg reklamowany.
Jeśli oba przedziały ufności są bardzo dokładne lub jeden jest dokładny, a drugi bardzo dokładny porównując oczekiwaną szerokość może być w porządku, ponieważ przynajmniej teraz patrzymy tylko na dwie dwie odmiany jabłek.
źródło