Jak sparametryzować stosunek dwóch normalnie rozłożonych zmiennych lub odwrotność jednej?

12

Problem: Parametryzuję rozkłady do wykorzystania jako priorytety i dane w metaanalizie bayesowskiej. Dane są przedstawione w literaturze jako statystyki podsumowujące, prawie wyłącznie zakłada się, że są normalnie rozłożone (chociaż żadna ze zmiennych nie może być <0, niektóre są stosunkami, niektóre są masą itp.).

Natknąłem się na dwa przypadki, dla których nie mam rozwiązania. Czasami parametr będący przedmiotem zainteresowania jest odwrotnością danych lub stosunkiem dwóch zmiennych.

Przykłady:

  1. stosunek dwóch normalnie rozłożonych zmiennych:
    • dane: średnia i sd dla procentu azotu i procentu węgla
    • parametr: stosunek węgla do azotu.
  2. odwrotność normalnie dystrybuowanej zmiennej:
    • dane: masa / powierzchnia
    • parametr: powierzchnia / masa

Moje obecne podejście polega na użyciu symulacji:

np. dla zestawu procentowych danych dotyczących węgla i azotu ze średnimi: xbar.n, c, wariancja: se.n, c i wielkość próbki: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Chcę sparametryzować ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Następnie wybierz najlepiej pasujące rozkłady z zakresem dla mojego wcześniejszego0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Pytanie: Czy to prawidłowe podejście? Czy istnieją inne / lepsze podejścia?

Z góry dziękuję!

Aktualizacja: rozkład Cauchy'ego, który jest zdefiniowany jako stosunek dwóch normalnych z , ma ograniczoną użyteczność, ponieważ chciałbym oszacować wariancję. Być może mógłbym obliczyć wariancję symulacji n losowań z Cauchy'ego?μ=0

Znalazłem następujące przybliżone formularze, ale nie testowałem, czy dają one takie same wyniki ... Hayya i in., 1975 σ 2 y : x =σ 2 x ×μy/mu 4

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. i Armstrong, D. i Gressis, N., 1975. Uwaga na stosunek dwóch normalnie rozłożonych zmiennych. Management Science 21: 1338--1341

David LeBauer
źródło
powinienem zadać pytanie o aktualizację dotyczące obliczania wariancji losowych losowań z Cauchy jako osobne pytanie?
David LeBauer,
μ=0
μ
XYZ=XYxyp(x,y)dxdy

Odpowiedzi:

6

Warto zapoznać się z niektórymi źródłami w artykule w Wikipedii dotyczącym podziału współczynników . Możliwe, że znajdziesz lepsze przybliżenia lub rozkłady do użycia. W przeciwnym razie twoje podejście wydaje się zdrowe.

Aktualizacja Myślę, że lepszym odniesieniem może być:

Zobacz wzory 2-4 na stronie 195.

Aktualizacja 2

Na twoje zaktualizowane pytanie dotyczące wariancji z Cauchy'ego - jak zauważył John Cook w komentarzach, wariancja nie istnieje. Zatem pobranie wariancji próbki po prostu nie będzie działać jako „estymator”. W rzeczywistości przekonasz się, że wariancja próbki w ogóle się nie zbiega i waha się gwałtownie w miarę pobierania próbek.

ars
źródło
Dzięki za odniesienie, tam znalazłem odniesienie Haaya 1975 i równania w moim pytaniu, chociaż doceniłbym zapewnienie, że równania są odpowiednie dla mojego problemu.
David LeBauer,
Po krótkim spojrzeniu na Haaya wydaje się, że ich celem jest uzyskanie normalnego przybliżenia stosunku i użycie symulacji w celu ustalenia, kiedy ma to zastosowanie (przy użyciu współczynnika zmienności, cv). Czy cv w twoim przypadku spełnia kryteria? Jeśli tak, obowiązują przybliżenia.
ars
1
@ David: użyj Marsaglia 1965 zamiast zaktualizowanej w odpowiedzi.
ars
Uwaga: Marsaglia opublikowała aktualizację w JSS w 2004 roku .
David LeBauer,
XYZ=XYxyp(x,y)dxdy
0

y1N(.,.)

Moja sugestia poniżej, aby użyć Cauchy'ego, nie działa, jak wskazano w komentarzach arsa i Jana.

Stosunek dwóch normalnie losowych zmiennych jest zgodny z rozkładem Cauchy'ego . Możesz użyć tego pomysłu do zidentyfikowania parametrów cauchy, które najbardziej pasują do twoich danych.


źródło
za. Muszę oszacować wariancję, a wariancja rozkładu Cauchy'ego nie jest zdefiniowana.
David LeBauer,
b. Jeśli rozumiem twój drugi punkt, tak, mógłbym założyć, że y-1 ~ N (mu, sigma), ale nadal muszę obliczyć mu i sigma ze statystyk podsumowujących podanych dla y; postanowiłem też nie brać pod uwagę rozkładów o wartości <0 tylko dla zmiennych zdefiniowanych> 0 (chociaż w wielu przypadkach p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer
Czy Cauchy nie stosuje się do zerowych średnich normalnych?
ars
@ars Masz rację. Cauchy może więc mieć ograniczone zastosowanie.
Ars: Tak, uważam, że wynik Cauchy'ego wymaga zerowych środków. Ale to wciąż oznacza, że ​​przynajmniej w tym szczególnym przypadku wariancja, którą David próbuje oszacować, NIE JEST.
John D. Cook