Słyszałem / widziałem w kilku miejscach, że możesz przekształcić zestaw danych w coś o rozkładzie normalnym, biorąc logarytm każdej próbki, oblicz przedział ufności dla przekształconych danych i przekształcaj przedział ufności z powrotem za pomocą operacji odwrotnej (np. podnieś 10 do potęgi dolnej i górnej granicy odpowiednio dla ).
Jednak jestem nieco podejrzliwy wobec tej metody, po prostu dlatego, że nie działa ona dla samego środka:
Jaki jest właściwy sposób to zrobić? Jeśli to nie działa dla samego środka, to jak może działać dla przedziału ufności dla środka?
confidence-interval
mean
lognormal
Vegard
źródło
źródło
Odpowiedzi:
Istnieje kilka sposobów obliczania przedziałów ufności dla średniej rozkładu logarytmicznego. Przedstawię dwie metody: Bootstrap i prawdopodobieństwo profilu. Przedstawię również dyskusję na temat przeora Jeffreysa.
Bootstrap
Dla MLE
W tym przypadku MLE dla próbki wynosi( μ , σ) ( x1, . . . , xn)
Zatem MLE średniej to . Przez resampling możemy otrzymać próbkę bootstrap z i za pomocą tego, możemy obliczyć kilka bootstrap przedziały ufności. Poniższe kody pokazują, jak je uzyskać.δ^= exp( μ^+ σ^2)/ 2) δδ^
R
Dla próbki średniej
Teraz, biorąc pod uwagę estymator zamiast MLE. Można również rozważyć inny rodzaj estymatorów.δ~= x¯
Prawdopodobieństwo profilu
Aby zapoznać się z definicją funkcji wiarygodności i funkcji wiarygodności profilu, patrz . Korzystając z właściwości niezmienniczości prawdopodobieństwa, możemy ponownie sparametryzować w następujący sposób , gdzie a następnie obliczyć numerycznie prawdopodobieństwo profilu .( μ , σ) → ( δ, σ) δ= exp( μ + σ2)/ 2) δ
Ta funkcja przyjmuje wartości w ; przedział poziomu ma przybliżoną pewność . Będziemy używać tej właściwości do konstruowania przedziału ufności dla . Poniższe kody pokazują, jak uzyskać ten przedział .( 0 , 1 ] 0,147 95 % δ95 % δ
R
W tej sekcji przedstawiono alternatywny algorytm oparty na próbkowaniu Metropolis-Hastings i wykorzystaniu wcześniejszych Jeffreysów do obliczania przedziału wiarygodności dla .δ
Przypomnijmy, że w Jeffreys przed o w modelu logarytmiczno-normalnego jest( μ , σ)
i że ten przełożony jest niezmienny podczas reparametryzacji. To wcześniejsze jest niewłaściwe, ale tylna część parametrów jest właściwa, jeśli wielkość próbki . Poniższy kod pokazuje, jak uzyskać 95% przedział wiarygodności za pomocą tego modelu Bayesa.n ≥ 2
R
Zauważ, że są bardzo podobne.
źródło
Możesz spróbować podejścia bayesowskiego z przeorem Jeffreysa. Powinien dawać przedziały wiarygodności z poprawną właściwością dopasowania częstości: poziom ufności przedziału wiarygodności jest zbliżony do jego poziomu wiarygodności.
źródło
Masz rację - to wzór na średnią geometryczną, a nie średnią arytmetyczną. Średnia arytmetyczna jest parametrem z rozkładu normalnego i często nie ma większego znaczenia dla danych logarytmicznych. Średnia geometryczna jest odpowiednim parametrem z rozkładu logarytmicznego, jeśli chcesz bardziej sensownie mówić o centralnej tendencji dla twoich danych.
I rzeczywiście obliczalibyśmy CI względem średniej geometrycznej, biorąc logarytmy danych, obliczając średnią i CI jak zwykle i przekształcając wstecz. Masz rację, że tak naprawdę nie chcesz mieszać swoich rozkładów, umieszczając CI dla średniej geometrycznej wokół średniej arytmetycznej ... tak!
źródło