Jak sparametryzować stosunek dwóch normalnie rozłożonych zmiennych lub odwrotność jednej?

Problem: Parametryzuję rozkłady do wykorzystania jako priorytety i dane w metaanalizie bayesowskiej. Dane są przedstawione w literaturze jako statystyki podsumowujące, prawie wyłącznie zakłada się, że są normalnie rozłożone (chociaż żadna ze zmiennych nie może być <0, niektóre są stosunkami, niektóre są masą itp.).

Natknąłem się na dwa przypadki, dla których nie mam rozwiązania. Czasami parametr będący przedmiotem zainteresowania jest odwrotnością danych lub stosunkiem dwóch zmiennych.

Przykłady:

stosunek dwóch normalnie rozłożonych zmiennych:
- dane: średnia i sd dla procentu azotu i procentu węgla
- parametr: stosunek węgla do azotu.
odwrotność normalnie dystrybuowanej zmiennej:
- dane: masa / powierzchnia
- parametr: powierzchnia / masa

Moje obecne podejście polega na użyciu symulacji:

np. dla zestawu procentowych danych dotyczących węgla i azotu ze średnimi: xbar.n, c, wariancja: se.n, c i wielkość próbki: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Chcę sparametryzować ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Następnie wybierz najlepiej pasujące rozkłady z zakresem dla mojego wcześniejszego $0 \rightarrow \infty$

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Pytanie: Czy to prawidłowe podejście? Czy istnieją inne / lepsze podejścia?

Z góry dziękuję!

Aktualizacja: rozkład Cauchy'ego, który jest zdefiniowany jako stosunek dwóch normalnych z , ma ograniczoną użyteczność, ponieważ chciałbym oszacować wariancję. Być może mógłbym obliczyć wariancję symulacji n losowań z Cauchy'ego? $\mu=0$

Znalazłem następujące przybliżone formularze, ale nie testowałem, czy dają one takie same wyniki ... Hayya i in., 1975

{\hat{μ}}_{y : x} = μ_{y} / m u_{x} + σ_{x}^{2} * μ_{y} / μ_{x}^{3} + c o v (x, y) * σ_{x}^{2} * σ_{y}^{2} / μ_{x}^{2}

$\hat{\mu}_{y:x} = \mu_y/mu_x + \sigma^2_x * \mu_y / \mu_x^3 + cov(x,y) * \sigma^2_x * \sigma^2_y / \mu_x^2$

{\hat{σ}}_{y : x}^{2} = σ_{x}^{2} \times μ_{y} / m u_{x}^{4} + σ_{y}^{2} / m u_{x}^{2} - 2 * c o v (x, y) * σ_{x}^{2} * σ_{y}^{2} / m u_{x}^{3}

$\hat{\sigma}^2_{y:x} = \sigma^2_x\times\mu_y / mu_x^4 + \sigma^2_y / mu_x^2 - 2 * cov(x,y) * \sigma^2_x * \sigma^2_y / mu_x^3$

Hayya, J. i Armstrong, D. i Gressis, N., 1975. Uwaga na stosunek dwóch normalnie rozłożonych zmiennych. Management Science 21: 1338--1341

distributions bayesian variance random-variable meta-analysis David LeBauer
źródło

powinienem zadać pytanie o aktualizację dotyczące obliczania wariancji losowych losowań z Cauchy jako osobne pytanie?

David LeBauer,

μ = 0

$\mu = 0$

μ

$\mu$

X

$X$

Y

$Y$

Z = \frac{X}{Y}

$Z = \frac{X}{Y}$

\int \int \frac{x}{y} p (x, y) d x d y

$\int \int \frac{x}{y} p \left( x, y \right) dx dy$

Odpowiedzi:

Warto zapoznać się z niektórymi źródłami w artykule w Wikipedii dotyczącym podziału współczynników . Możliwe, że znajdziesz lepsze przybliżenia lub rozkłady do użycia. W przeciwnym razie twoje podejście wydaje się zdrowe.

Aktualizacja Myślę, że lepszym odniesieniem może być:

Stosunki zmiennych normalnych i stosunki sum zmiennych zmiennych jednolitych (Marsaglia, 1965)

Zobacz wzory 2-4 na stronie 195.

Aktualizacja 2

Na twoje zaktualizowane pytanie dotyczące wariancji z Cauchy'ego - jak zauważył John Cook w komentarzach, wariancja nie istnieje. Zatem pobranie wariancji próbki po prostu nie będzie działać jako „estymator”. W rzeczywistości przekonasz się, że wariancja próbki w ogóle się nie zbiega i waha się gwałtownie w miarę pobierania próbek.

ars
źródło

Dzięki za odniesienie, tam znalazłem odniesienie Haaya 1975 i równania w moim pytaniu, chociaż doceniłbym zapewnienie, że równania są odpowiednie dla mojego problemu.

David LeBauer,

Po krótkim spojrzeniu na Haaya wydaje się, że ich celem jest uzyskanie normalnego przybliżenia stosunku i użycie symulacji w celu ustalenia, kiedy ma to zastosowanie (przy użyciu współczynnika zmienności, cv). Czy cv w twoim przypadku spełnia kryteria? Jeśli tak, obowiązują przybliżenia.

ars

@ David: użyj Marsaglia 1965 zamiast zaktualizowanej w odpowiedzi.

ars

Uwaga: Marsaglia opublikowała aktualizację w JSS w 2004 roku .

David LeBauer,

X

$X$

Y

$Y$

Z = \frac{X}{Y}

$Z = \frac{X}{Y}$

\int \int \frac{x}{y} p (x, y) d x d y

$\int \int \frac{x}{y} p \left( x, y \right) dx dy$

$y^{-1} \sim N(.,.)$

Moja sugestia poniżej, aby użyć Cauchy'ego, nie działa, jak wskazano w komentarzach arsa i Jana.

~~Stosunek dwóch normalnie losowych zmiennych jest zgodny z rozkładem Cauchy'ego . Możesz użyć tego pomysłu do zidentyfikowania parametrów cauchy, które najbardziej pasują do twoich danych.~~

źródło

za. Muszę oszacować wariancję, a wariancja rozkładu Cauchy'ego nie jest zdefiniowana.

David LeBauer,

b. Jeśli rozumiem twój drugi punkt, tak, mógłbym założyć, że y-1 ~ N (mu, sigma), ale nadal muszę obliczyć mu i sigma ze statystyk podsumowujących podanych dla y; postanowiłem też nie brać pod uwagę rozkładów o wartości <0 tylko dla zmiennych zdefiniowanych> 0 (chociaż w wielu przypadkach p (X <0 | X ~ N (mu, s)) -> 0)

David LeBauer

Czy Cauchy nie stosuje się do zerowych średnich normalnych?

ars

@ars Masz rację. Cauchy może więc mieć ograniczone zastosowanie.

Ars: Tak, uważam, że wynik Cauchy'ego wymaga zerowych środków. Ale to wciąż oznacza, że przynajmniej w tym szczególnym przypadku wariancja, którą David próbuje oszacować, NIE JEST.

John D. Cook