Po natknięciu się na tę koncepcję w podręczniku statystycznym, próbowałem ją owinąć głową i ostatecznie doszedłem do wniosku, który wydaje się pasować do wszystkich wyjaśnień, które do tej pory widziałem: wiarygodny przedział jest tym, co statystycy uważają za pewną interwał wynosi.
Dygresja dla osób takich jak ja sprzed godziny, które nie znają różnicy
Jeśli zaobserwowaliśmy dane i przewidzieliśmy z nich jakiś parametr, powiedzmy średnią , wiarygodny przedział to przedział dla których jesteśmy w 95% pewni, że mu mieści się w środku (lub pewna liczba inna niż 95%, jeśli użyliśmy innego poziomu). Przedział ufności nauczany w klasach statystyki wprowadzającej może pokrywać się z przedziałem wiarygodności, ale nie zawsze będzie się dobrze nakładał. Jeśli chcesz odważnie wyjaśnić, spróbuj przeczytać to i to pytanie w Cross Validated; to, co pomogło mi w końcu zrozumieć, po wielu podrapaniach w głowę, była ta odpowiedź .
Czy to oznacza, że naukowo lepiej byłoby zastosować wiarygodny przedział niż przedział ufności w moich wynikach? Jeśli tak, dlaczego nie widziałem żadnych publikacji, które z niego korzystają?
- Czy dlatego, że należy zastosować tę koncepcję , ale naukowcy zajmujący się pomiarami jeszcze nie dogonili właściwych metod statystycznych?
- Czy też znaczenie pierwotnego przedziału ufności lepiej nadaje się do wyjaśnienia wyników badań empirycznych?
- A może w praktyce tak często się pokrywają, że nie ma to żadnego znaczenia?
- Czy wybór zależy od rozkładu statystycznego, który zakładamy dla naszych danych? Może z rozkładem Gaussa zawsze pokrywają się liczbowo, więc nikt poza czystą statystyką nie dba o różnicę (wiele badań, które przeczytałem, nawet nie zadaje sobie trudu, aby obliczyć dowolny przedział, a może około 1% kiedykolwiek daje miejsce na myśl że ich dane mogą nie być normalnie dystrybuowane).
- Czy to zależy od naszej pozycji w teorii naukowej? Na przykład wydaje się, że przedział ufności powinien być stosowany w pracy pozytywistycznej, a wiarygodny przedział w pracy interpretatywistycznej, ale nie jestem pewien, czy to uczucie jest prawidłowe.
Odpowiedzi:
Rodzaj interwału wskazuje, jakiego rodzaju metody użyłeś. Jeśli wiarygodny przedział (lub wariant bayesowski), oznacza to, że zastosowano metodę bayesowską. Jeśli przedział ufności, zastosowano metodę częstokierunkową.
Re: A może w praktyce tak często się pokrywają, że to nie ma żadnego znaczenia? Tak długo jak
wiarygodne i przedziały ufności będą blisko siebie. Powód: prawdopodobieństwo zdominuje przeora Bayesa, a prawdopodobieństwo jest zwykle stosowane w metodach częstych.
Sugerowałbym nie przejmować się tym, którego użyć. Jeśli chcesz uzyskać informacje z wyprzedzeniem, pamiętaj o zastosowaniu metody bayesowskiej. Jeśli nie, wybierz odpowiednią metodę i kontekst (częsty lub bayesowski), sprawdź, czy warunki wymagane do zastosowania metody są odpowiednio spełnione (tak ważne, ale tak rzadko wykonywane!), A następnie przejdź do przodu, jeśli metoda jest odpowiednia dla rodzaj danych.
źródło