Problem: Parametryzuję rozkłady do wykorzystania jako priorytety i dane w metaanalizie bayesowskiej. Dane są przedstawione w literaturze jako statystyki podsumowujące, prawie wyłącznie zakłada się, że są normalnie rozłożone (chociaż żadna ze zmiennych nie może być <0, niektóre są stosunkami, niektóre są masą itp.).
Natknąłem się na dwa przypadki, dla których nie mam rozwiązania. Czasami parametr będący przedmiotem zainteresowania jest odwrotnością danych lub stosunkiem dwóch zmiennych.
Przykłady:
- stosunek dwóch normalnie rozłożonych zmiennych:
- dane: średnia i sd dla procentu azotu i procentu węgla
- parametr: stosunek węgla do azotu.
- odwrotność normalnie dystrybuowanej zmiennej:
- dane: masa / powierzchnia
- parametr: powierzchnia / masa
Moje obecne podejście polega na użyciu symulacji:
np. dla zestawu procentowych danych dotyczących węgla i azotu ze średnimi: xbar.n, c, wariancja: se.n, c i wielkość próbki: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Chcę sparametryzować ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Następnie wybierz najlepiej pasujące rozkłady z zakresem dla mojego wcześniejszego
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Pytanie: Czy to prawidłowe podejście? Czy istnieją inne / lepsze podejścia?
Z góry dziękuję!
Aktualizacja: rozkład Cauchy'ego, który jest zdefiniowany jako stosunek dwóch normalnych z , ma ograniczoną użyteczność, ponieważ chciałbym oszacować wariancję. Być może mógłbym obliczyć wariancję symulacji n losowań z Cauchy'ego?
Znalazłem następujące przybliżone formularze, ale nie testowałem, czy dają one takie same wyniki ... Hayya i in., 1975 σ 2 y : x =σ 2 x ×μy/mu 4
Hayya, J. i Armstrong, D. i Gressis, N., 1975. Uwaga na stosunek dwóch normalnie rozłożonych zmiennych. Management Science 21: 1338--1341
źródło
Odpowiedzi:
Warto zapoznać się z niektórymi źródłami w artykule w Wikipedii dotyczącym podziału współczynników . Możliwe, że znajdziesz lepsze przybliżenia lub rozkłady do użycia. W przeciwnym razie twoje podejście wydaje się zdrowe.
Aktualizacja Myślę, że lepszym odniesieniem może być:
Zobacz wzory 2-4 na stronie 195.
Aktualizacja 2
Na twoje zaktualizowane pytanie dotyczące wariancji z Cauchy'ego - jak zauważył John Cook w komentarzach, wariancja nie istnieje. Zatem pobranie wariancji próbki po prostu nie będzie działać jako „estymator”. W rzeczywistości przekonasz się, że wariancja próbki w ogóle się nie zbiega i waha się gwałtownie w miarę pobierania próbek.
źródło
Moja sugestia poniżej, aby użyć Cauchy'ego, nie działa, jak wskazano w komentarzach arsa i Jana.
Stosunek dwóch normalnie losowych zmiennych jest zgodny z rozkładem Cauchy'ego . Możesz użyć tego pomysłu do zidentyfikowania parametrów cauchy, które najbardziej pasują do twoich danych.źródło