Mam 383 próbki, które mają duże odchylenie dla niektórych wspólnych wartości, jak obliczyć 95% CI dla średniej? Obliczony przeze mnie wskaźnik CI wydaje się bardzo odległy, co zakładam, ponieważ moje dane nie wyglądają jak krzywa podczas tworzenia histogramu. Myślę więc, że muszę użyć czegoś takiego jak ładowanie systemu, którego nie rozumiem zbyt dobrze.
confidence-interval
mean
IhaveCandy
źródło
źródło
Odpowiedzi:
Tak, bootstrap jest alternatywą dla uzyskania przedziałów ufności dla średniej (i musisz trochę wysiłku, jeśli chcesz zrozumieć metodę).
Pomysł jest następujący:
Jeśli chodzi o ostatni krok, istnieje kilka rodzajów przedziału ufności ładowania początkowego (BCI). Poniższe odniesienia przedstawiają dyskusję na temat właściwości różnych rodzajów BCI:
http://staff.ustc.edu.cn/~zwp/teach/Stat-Comp/Efron_Bootstrap_CIs.pdf
http://www.tau.ac.il/~saharon/Boot/10.1.1.133.8405.pdf
Dobrą praktyką jest obliczanie kilku BCI i próba zrozumienia możliwych rozbieżności między nimi.
W R możesz łatwo wdrożyć ten pomysł, używając pakietu „boot” w następujący sposób:
źródło
Inną standardową alternatywą jest obliczanie CI za pomocą testu Wilcoxona. W R.
Niestety daje CI CI wokół (pseudo) mediany, a nie średniej, ale jeśli dane są bardzo nietypowe, być może mediana jest miarą bardziej informacyjną.
źródło
W przypadku danych logarytmiczno-normalnych Olsson (2005) sugeruje „zmodyfikowaną metodę Coxa”
Funkcja R znajduje się poniżej:
Powtarzając przykład z pracy Olssona
źródło
źródło