Przedział ufności dla iloczynu dwóch parametrów

11

Załóżmy, że mamy dwa parametry, i . Mamy również dwa estymatory maksymalnego prawdopodobieństwa i oraz dwa przedziały ufności dla tych parametrów. Czy istnieje sposób na zbudowanie przedziału ufności dla ?p 2 ^ p 1 ^ p 2 p 1 p 2p1p2p1^p2^p1p2

Gość
źródło

Odpowiedzi:

13

Możesz użyć metody Delta, aby obliczyć standardowy błąd . Metoda delta stwierdza, że ​​przybliżenie wariancji funkcji jest podane przez: Z drugiej strony przybliżenie oczekiwania na podano przez: Zatem oczekiwanie jest po prostu funkcją. Twoja funkcja to: . Oczekiwanie na byłoby po prostu:p1^p2^g(t)

Var(g(t))i=1kgi(θ)2Var(ti)+2i>jgi(θ)gj(θ)Cov(ti,tj)
g(t)
E(g(t))g(θ)
g(t)g(p1,p2)=p1p2g(p1,p2)=p1p2p1p2 . Do wariancji potrzebujemy częściowych pochodnych : g(p1,p2)
p1g(p1p2)=p2p2g(p1p2)=p1

Korzystając z funkcji dla powyższej wariancji, otrzymujemy:

Var(p1^p2^)=p2^2Var(p1^)+p1^2Var(p2^)+2p1^p2^Cov(p1^,p2^)
^ p 1 Standardowym błędem byłby zatem po prostu katalog główny powyższego wyrażenia. Po uzyskaniu standardowego błędu można łatwo obliczyć 95% przedział ufności dla :p1^p2^p1^p2^±1.96SE^(p1^p2^)

Aby obliczyć standardowy błąd , potrzebujesz wariantu i który zwykle możesz uzyskać przez macierz wariancji-kowariancji która w twoim przypadku byłaby macierzą 2x2, ponieważ masz dwa oszacowania. Elementami diagonalnymi w macierzy wariancji-kowariancji są wariancje i podczas gdy elementy nie-diagonalne to kowariancja i (matryca jest symetryczna). Jak wspomina @gung w komentarzach, macierz wariancji-kowariancji może być wyodrębniona przez większość programów statystycznych. Czasami algorytmy szacowania zapewniająp1^p2^p1^p2^ Σ ^ p 1 ^ p 2 ^ p 1 ^ p 2 Σp1^p2^p1^p2^Macierz Hesji (nie będę wchodził w szczegóły na ten temat tutaj), a macierz wariancji-kowariancji można oszacować na podstawie odwrotności ujemnego Hesji (ale tylko jeśli zmaksymalizujesz prawdopodobieństwo logarytmiczne !; zobacz ten post ). Ponownie zapoznaj się z dokumentacją oprogramowania statystycznego i / lub Internetu, w jaki sposób wyodrębnić Hesję i jak obliczyć odwrotność macierzy.

Alternatywnie możesz uzyskać warianty i z przedziałów ufności w następujący sposób (dotyczy to 95% -CI): . Dla -CI szacowany błąd standardowy to: , gdzie to kwantyl standardowego rozkładu normalnego (dla , ). Następniep1^p2^SE(p1^)=(upper limitlower limit)/3.92100(1α)%SE(p1^)=(upper limitlower limit)/(2z1α/2)z1α/2(1α/2)α=0.05z0.9751.96Var(p1^)=SE(p1^)2. To samo dotyczy wariantu . Potrzebujemy również kowariancji i (patrz akapit powyżej). Jeśli i są niezależne, kowariancja wynosi zero i możemy usunąć ten termin.p2^p1^p2^p1^p2^

Ten dokument może zawierać dodatkowe informacje.

COOLSerdash
źródło
4
+1. Wariancje parametrów i ich kowariancję można znaleźć, badając macierz wariancji-kowariancji , którą może zapewnić większość programów statystycznych. Np. W R jest to ? Vcov ; i w SAS, jest dodawany jako opcja do instrukcji modelu w PROC REG . βcovb
gung - Przywróć Monikę
1
@gung W kwestii pedanterii warto zwrócić uwagę (bo wiem, że to myli niektórych ludzi), że tak naprawdę jest to macierz wariancji-kowariancji zamiast (a tak naprawdę to wcale , ponieważ odchylenie standardowe należy oszacować na podstawie próbki, więc tak naprawdę jest to szacunkowa macierz wariancji-kowariancji ..) betaβ^β
Silverfish,
3
@Silverfish, należycie ukarany. Następnym razem powiem „macierz szacowanej wariancji-kowariancji ”. β^
Gung - Przywróć Monikę
1
Możesz spróbować zbudować funkcję wiarygodności profilu! i skonstruuj z tego przedział ufności.
kjetil b halvorsen 30.09.17
Czy ponieważ jest to parametr? var(p1)=0
użytkownik0
1

Znalazłem inne równanie do obliczania wariancji produktu.

Jeśli xiy są niezależnie rozłożone, wariancja produktu jest stosunkowo prosta: V (x * y) = V (y) * E (x) ^ 2 + V (x) * E (y) ^ 2 + V ( x) * V (y) Wyniki te uogólniają się również na przypadki obejmujące trzy lub więcej zmiennych (Goodman 1960). Źródło: Regulating Pesticides (1980), załącznik F.

Coolserdash: Brakuje ostatniego składnika V (x) * V (y) w twoim równaniu. Czy przywołana książka (regulacja pestycydów) jest nieprawidłowa?

Oba równania mogą również nie być idealne. „ ... pokazujemy, że rozkład iloczynu trzech niezależnych zmiennych normalnych nie jest normalny ”. ( źródło ). Spodziewałbym się pewnego pozytywnego wypaczenia nawet w wyniku dwóch normalnie rozłożonych zmiennych.

Marek Čierny
źródło
0
  1. Długość CI / 2 / 1,96 = se, tj. Błąd standardowy A lub B
  2. se ^ 2 = var, tj. wariancja oszacowania A lub B
  3. Użyj oszacowanego A lub B jako środka A lub B, tj. E (A) lub E (B)
  4. Postępuj zgodnie z tą stroną http://falkenblog.blogspot.se/2008/07/formula-for-varxy.html, aby uzyskać var ​​(A * B), tj. Var (C)
  5. Pierwiastek kwadratowy var (C) jest se C
  6. (C - 1,96 * se (C), C + 1,96 * se (C)) to 95% CI dla C

Zauważ, że jeśli twoje A i B są skorelowane, musisz również wziąć pod uwagę ich kowariancję.

Mrożona kawa
źródło