Jeśli dobrze rozumiem, przedział ufności parametru to przedział skonstruowany metodą, która daje przedziały zawierające prawdziwą wartość dla określonej proporcji próbek. „Pewność” dotyczy więc metody, a nie przedziału, który obliczam na podstawie konkretnej próbki.
Jako użytkownik statystyk zawsze czułem się przez to oszukany, ponieważ przestrzeń wszystkich próbek jest hipotetyczna. Mam tylko jedną próbkę i chcę wiedzieć, co ta próbka mówi mi o parametrze.
Czy ten wyrok jest błędny? Czy istnieją sposoby spojrzenia na przedziały ufności, przynajmniej w niektórych okolicznościach, które byłyby przydatne dla użytkowników statystyk?
[To pytanie powstaje z drugiej myśli po obaleniu przedziałów ufności w matematyce. Odpowiedź https://math.stackexchange.com/questions/7564/calculating-a-sample-size-based-on-a-confidence-level/7572 # 7572 ]
źródło
Alternatywne podejście dotyczące drugiego pytania: „Czy istnieją sposoby spojrzenia na przedziały ufności, przynajmniej w niektórych okolicznościach, które byłyby przydatne dla użytkowników statystyk?”:
Powinieneś spojrzeć na wnioskowanie bayesowskie i wynikające z tego wiarygodne odstępy czasu . 95% wiarygodny przedział można interpretować jako przedział, który Twoim zdaniem ma 95% prawdopodobieństwa włączenia prawdziwej wartości parametru. Cena, którą płacisz, polega na tym, że musisz ustalić wcześniejszy rozkład prawdopodobieństwa dla wartości, które według ciebie prawdopodobnie przyjmie prawdziwy parametr przed zebraniem danych. A swoją przed mogą różnić się od kogoś innego przed, dzięki czemu uzyskane wiarygodne przedziały mogą także różnić się nawet podczas korzystania z tych samych danych.
To tylko moja szybka i prymitywna próba podsumowania! Dobry niedawny podręcznik z praktycznym naciskiem to:
Andrew Gelman, John B. Carlin, Hal S. Stern i Donald B. Rubin. „Analiza danych bayesowskich” (wydanie drugie). Chapman & Hall / CRC, 2003. ISBN 978-1584883883
źródło
Myślę, że przesłanka tego pytania jest błędna, ponieważ zaprzecza rozróżnieniu między niepewnym a znanym .
Opisanie rzutu monetą stanowi dobrą analogię. Przed rzutem monety wynik jest niepewny; potem nie jest już „hipotetyczny”. Mylenie tego faktu z rzeczywistą sytuacją, którą chcemy zrozumieć (zachowanie monety lub decyzje, które należy podjąć w wyniku jej wyniku) zasadniczo zaprzecza roli prawdopodobieństwa w zrozumieniu świata.
Kontrast ten rzuca się z wyraźną ulgą na arenie eksperymentalnej lub regulacyjnej. W takich przypadkach naukowiec lub organ regulacyjny wiedzą, że staną w obliczu sytuacji, których wyniki w dowolnym momencie są nieznane, ale muszą dokonać ważnych ustaleń, takich jak sposób zaprojektowania eksperymentu lub ustalenia kryteriów, które należy zastosować przy określaniu zgodności z przepisami (w zakresie testowania narkotyków, bezpieczeństwa w miejscu pracy, norm środowiskowych itp.). Ci ludzie i instytucje, dla których pracują, potrzebują metod i wiedzy na temat probabilistycznych cech tych metod , aby opracować optymalne i możliwe do obrony strategie, takie jak dobre projekty eksperymentalne i uczciwe procedury decyzyjne, które jak najmniej popełniają błędy.
Przedziały ufności, pomimo ich klasycznie słabego uzasadnienia, mieszczą się w tych teoretycznych ramach decyzyjnych. Gdy metoda konstruowania losowego przedziału ma kombinację dobrych właściwości, takich jak zapewnienie minimalnego oczekiwanego pokrycia przedziału i minimalizowanie oczekiwanej długości przedziału - obie właściwości a priori , a nie a posteriori - to ponad długą karierę w stosowaniu tej metody możemy zminimalizować koszty związane z działaniami wskazywanymi przez tę metodę.
źródło
Masz rację mówiąc, że 95% przedziały ufności to rzeczy, które wynikają z zastosowania metody, która działa w 95% przypadków, a nie jakikolwiek pojedynczy przedział mający 95% prawdopodobieństwo zawarcia oczekiwanej wartości.
„Logiczna podstawa i interpretacja granic zaufania są, nawet teraz, kwestią kontrowersyjną”. {David Colquhoun, 1971, Lectures on Biostatistics}
Cytat ten pochodzi z podręcznika statystycznego opublikowanego w 1971 r., Ale twierdzę, że nadal jest to prawdą w 2010 r. Kontrowersja jest prawdopodobnie najbardziej ekstremalna w przypadku przedziałów ufności dla proporcji dwumianowych. Istnieje wiele konkurencyjnych metod obliczania tych przedziałów ufności, ale wszystkie one są niedokładne w jednym lub większej liczbie zmysłów, a nawet najgorsza metoda ma zwolenników wśród autorów podręczników. Nawet tak zwane przedziały „dokładne” nie dają oczekiwanych właściwości przedziałów ufności.
W artykule napisanym dla chirurgów (powszechnie znanym z zainteresowania statystykami) John i Ludbrook argumentowali za rutynowym stosowaniem przedziałów ufności obliczonych przy użyciu jednolitego Bayesa wcześniej, ponieważ takie przedziały mają właściwości częstokształtne tak dobre jak każda inna metoda (średnio dokładnie 95% pokrycia we wszystkich prawdziwych proporcjach), ale, co ważne, znacznie lepszy zasięg we wszystkich zaobserwowanych proporcjach (dokładnie 95% pokrycia). Artykuł, ze względu na grupę docelową, nie jest zbyt szczegółowy i dlatego może nie przekonać wszystkich statystyk, ale pracuję nad dokumentem uzupełniającym z pełnym zestawem wyników i uzasadnień.
Jest to przypadek, w którym podejście bayesowskie ma właściwości częstokroć tak dobre jak podejście częstokroć, co zdarza się dość często. Założenie jednolitego przeora nie jest problematyczne, ponieważ równomierny rozkład proporcji populacji jest wbudowany w każde obliczenie częstego pokrycia, z jakim się spotkałem.
Pytasz: „Czy istnieją sposoby spojrzenia na przedziały ufności, przynajmniej w niektórych okolicznościach, które byłyby przydatne dla użytkowników statystyk?” Moja odpowiedź brzmi zatem, że dla dwumianowych przedziałów ufności można uzyskać przedziały, które zawierają odsetek populacji dokładnie w 95% przypadków dla wszystkich zaobserwowanych proporcji. To jest tak. Jednak konwencjonalne stosowanie przedziałów ufności oczekuje zasięgu dla wszystkich proporcji populacji i dlatego odpowiedź brzmi „Nie!”
Długość odpowiedzi na twoje pytanie i różne odpowiedzi na nie sugerują, że przedziały ufności są powszechnie źle rozumiane. Jeśli zmienimy nasz cel z pokrycia dla wszystkich prawdziwych wartości parametrów na pokrycie prawdziwej wartości parametru dla wszystkich wartości próbek, może to być łatwiejsze, ponieważ interwały zostaną wówczas ukształtowane tak, aby były bezpośrednio związane z obserwowanymi wartościami, a nie z wydajnością metoda per se.
źródło
To świetna dyskusja. Uważam, że należy postępować zgodnie z wiarygodnymi przedziałami bayesowskimi i przedziałami wsparcia prawdopodobieństwa, a także późniejszymi prawdopodobieństwami interesujących zdarzeń bayesowskich (np. Skuteczny jest lek). Ale zastąpienie wartości P za pomocą przedziałów ufności jest dużym zyskiem. Praktycznie w każdym wydaniu najlepszych czasopism medycznych, takich jak NEJM i JAMA, w ich streszczeniach znajduje się artykuł o „braku dowodów nie jest dowodem nieobecności”. Zastosowanie przedziałów ufności w dużej mierze zapobiegnie takim błędom. Świetny mały tekst to http://www.amazon.com/Statistics-Confidence-Intervals-Statistic-Guidelines/dp/0727913751
źródło
Aby odpowiedzieć bezpośrednio na twoje pytanie: Załóżmy, że zastanawiasz się nad użyciem maszyny do napełnienia skrzynki zbożowej pewną ilością płatków. Oczywiście nie chcesz przepełniać / wypełniać pola. Chcesz ocenić niezawodność maszyny. Wykonujesz serię testów takich jak: (a) Użyj maszyny do wypełnienia pudełka i (b) Zmierz ilość płatków zbożowych, które są wypełnione w pudełku.
Korzystając z zebranych danych, konstruujesz przedział ufności dla ilości zbóż, które maszyna może wypełnić w polu. Ten przedział ufności mówi nam, że uzyskany przedział ma 95% prawdopodobieństwo, że będzie zawierał prawdziwą ilość zbóż, które maszyna umieści w pudełku. Jak mówisz, interpretacja przedziału ufności opiera się na hipotetycznych, niewidzialnych próbkach wygenerowanych przez rozważaną metodę. Ale właśnie tego chcemy w naszym kontekście. W powyższym kontekście, będziemy używać maszyny wielokrotnie wypełnić pola, a tym samym dbamy o hipotetycznych, niewidocznych realizacjami ilości zboża te wypełnia urządzenie w pudełku.
Abstrahując od powyższego kontekstu: przedział ufności daje nam gwarancję, że jeśli będziemy wielokrotnie używać badanej metody (w powyższym przykładzie metoda = maszyna), istnieje 95% prawdopodobieństwo, że przedział ufności będzie miał prawdziwy parametr .
źródło