Patrzyłem na wiele pytań na tej stronie dotyczących ładowania początkowego i przedziałów ufności, ale nadal jestem zdezorientowany. Jednym z powodów mojego zamieszania jest prawdopodobnie to, że nie jestem wystarczająco zaawansowany w mojej wiedzy statystycznej, aby zrozumieć wiele odpowiedzi. Jestem mniej więcej w połowie kursu wprowadzającego, a mój poziom matematyki dotyczy tylko połowy Algebry II, więc wszystko, co przekroczy ten poziom, tylko mnie dezorientuje. Gdyby jedna z kompetentnych osób na tej stronie mogła wyjaśnić ten problem na moim poziomie, byłoby to niezwykle pomocne.
Nauczyliśmy się w klasie, jak pobierać próbki za pomocą metody ładowania początkowego i używać ich do budowania przedziału ufności dla niektórych statystyk, które chcielibyśmy zmierzyć. Załóżmy na przykład, że pobieramy próbkę z dużej populacji i stwierdzamy, że 40% twierdzi, że zagłosuje na kandydata A. Zakładamy, że ta próbka jest dość dokładnym odzwierciedleniem pierwotnej populacji, w którym to przypadku możemy pobrać próbki z odkryć coś o populacji. Więc bierzemy próbki i stwierdzamy (przy 95% poziomie ufności), że wynikowy przedział ufności wynosi od 35% do 45%.
Moje pytanie brzmi: co tak naprawdę oznacza ten przedział ufności ?
Ciągle czytam, że istnieje różnica między (częstymi) przedziałami ufności i (bayesowskimi) wiarygodnymi przedziałami. Jeśli dobrze zrozumiałem, wiarygodny przedział byłoby powiedzieć, że istnieje 95% szans, że w naszej sytuacji prawdziwym parametrem jest w zadanym przedziale (35% -45%), natomiast przedział ufności byłoby powiedzieć, że tam jest 95%, że to rodzaj sytuacji (ale niekoniecznie w naszej konkretnej sytuacji) zastosowana metoda dokładnie zgłosi, że prawdziwy parametr mieści się w podanym przedziale czasowym.
Zakładając, że ta definicja jest poprawna, moje pytanie brzmi: jaki jest „prawdziwy parametr”, o którym mówimy, gdy używa się przedziałów ufności zbudowanych za pomocą metody bootstrap? Czy mówimy o (a) prawdziwym parametrze pierwotnej populacji , czy (b) prawdziwym parametrze próby ? Jeśli (a), to powiedzielibyśmy, że w 95% przypadków metoda ładowania początkowego dokładnie zgłasza prawdziwe stwierdzenia o oryginalnej populacji. Ale skąd możemy to wiedzieć? Czy cała metoda bootstrap nie opiera się na założeniuczy oryginalna próbka jest dokładnym odzwierciedleniem populacji, z której została pobrana? Jeśli (b) to w ogóle nie rozumiem znaczenia przedziału ufności. Czy nie znamy już prawdziwego parametru próbki? To prosty pomiar!
Rozmawiałem o tym z moją nauczycielką i była bardzo pomocna. Ale wciąż jestem zdezorientowany.
źródło
Mówisz, że nie ma potrzeby znajdowania przedziału ufności na podstawie próbek rozruchowych. Jeśli jesteś zadowolony ze statystyki (średnia próbki lub proporcja próbki) uzyskanej z próbek ładowanych ponownie, nie znajdź żadnego przedziału ufności, a zatem nie ma wątpliwości co do interpretacji. Ale jeśli nie jesteś zadowolony ze statystyki uzyskanej z próbek ładowanych ponownie lub jesteś zadowolony, ale nadal chcesz znaleźć przedział ufności, wówczas interpretacja takiego przedziału ufności jest taka sama, jak każdego innego przedziału ufności. Dzieje się tak dlatego, że gdy twoje bootstrapowane próbki dokładnie reprezentują (lub zakładają, że tak) oryginalną populację, to gdzie jest potrzeba przedziału ufności? Statystyka z bootstrapowanych próbek jest samym pierwotnym parametrem populacji, ale jeśli nie uważa się statystyki za oryginalny parametr populacji, wówczas należy znaleźć przedział ufności. Wszystko zależy od tego, jak myślisz. Powiedzmy, że obliczyłeś 95% przedział ufności na podstawie próbek rozruchowych. Teraz interpretacja brzmi: „95% razy ta metoda ładowania początkowego dokładnie daje przedział ufności zawierający prawdziwy parametr populacji”.
(Tak myślę. Popraw mnie, jeśli są jakieś błędy).
źródło
Mamy na myśli prawdziwy parametr pierwotnej populacji. Można to zrobić, zakładając, że dane zostały losowo pobrane z pierwotnej populacji - w takim przypadku istnieją argumenty matematyczne wskazujące, że procedury ładowania początkowego zapewnią prawidłowy przedział ufności, przynajmniej gdy rozmiar zestawu danych stanie się wystarczająco duży .
źródło