Różnica między nieinformacyjnymi a niewłaściwymi Przełożonymi

10

Zastanawiam się, jaka jest różnica między tymi dwoma rodzajami priorytetów:

  • Nieinformacyjny
  • Niewłaściwy
Bram
źródło
4
Pomocne może być podanie tutaj kontekstu. Co już o nich wiesz? Czy jest jakiś szczególny punkt zamieszania?
gung - Przywróć Monikę
@Tim dziękuję. Szukałem nieinformacyjnego zamiast słabo informacyjnego .
Bram

Odpowiedzi:

17

Niepoprawnymi priorytetami są skończone nieujemne miary d π w przestrzeni parametrów Θ takie, że Θ d π ( θ ) = + Jako takie uogólniają pojęcie wcześniejszego rozkładu, który jest rozkładem prawdopodobieństwa w przestrzeni parametrów Θ takie, że Θ d π ( θ ) = 1 Są użyteczne na kilka sposobów do scharakteryzowaniaσdπΘ

Θdπ(θ)=+
Θ
Θdπ(θ)=1
  1. zestaw limitów właściwych procedur bayesowskich, które nie są wszystkimi właściwymi procedurami bayesowskimi;
  2. częste optymalne procedury jak w (dopuszczalności) kompletnych twierdzeniach klasowych, takich jak Wald;
  3. najlepsze estymatory niezmiennicze częste (ponieważ mogą być wyrażone jako szacunki Bayesa w ramach odpowiedniej prawej miary Haara, zwykle niewłaściwe);
  4. priory pochodzące z kształtu funkcji wiarygodności, takie jak nieinformacyjne priory (np. Jeffreys).

Ponieważ nie integrują się one do liczby skończonej, nie pozwalają na interpretację probabilistyczną, ale mimo to mogą być stosowane do wnioskowania statystycznego, jeśli krańcowe prawdopodobieństwo jest skończone ponieważ rozkład tylny ( θ | x ) d π ( θ )

Θ(θ|x)dπ(θ)<+
(θ|x)dπ(θ)Θ(θ|x)dπ(θ)

Ostrzeżenie: Jedna gałąź wnioskowania bayesowskiego nie radzi sobie zbyt dobrze z niewłaściwymi priory, mianowicie podczas testowania ostrych hipotez. Rzeczywiście, te hipotezy wymagają konstrukcji dwóch wcześniejszych rozkładów, jednego pod zerą i drugiego pod alternatywą, które są ortogonalne. Jeśli jeden z tych priorytetów jest niewłaściwy, nie można go znormalizować, a wynikowy współczynnik Bayesa nie jest określony.

δL(d,θ)dπL ( d , θ ) d π ( θ )

argmindΘL(d,θ)(θ|x)dπ(θ)
L(d,θ)dπ(θ)ϖ ( θ ) L ( d , θ ) d π ( θ ) = L ( d , θ )ϖ(θ)ϖ(θ)
L(d,θ)dπ(θ)=L(d,θ)ϖ(θ)×ϖ(θ)dπ(θ)

Nieinformacyjne priory są klasami (właściwych lub niewłaściwych) wcześniejszych dystrybucji, które są określone w kategoriach pewnego kryterium informacyjnego dotyczącego funkcji prawdopodobieństwa, takiego jak

  1. Niewystarczający powód Laplace'a poprzednio;
  2. Jeffreys (1939) niezmienni priory;
  3. maksymalne entropie (lub MaxEnt) priors (Jaynes, 1957);
  4. minimalna długość opisu priors (Rissanen, 1987; Grünwald, 2005);
  5. odniesienia priors (Bernardo, 1979, 1781; Berger i Bernardo, 1992; Bernardo i Sun, 2012)
  6. priory dopasowanie prawdopodobieństwa (Welsh & Peers, 1963; Scricciolo, 1999; Datta, 2005)

i kolejne klasy, z których niektóre są opisane w Kass i Wasserman (1995). Nazwa nieinformacyjna jest mylącą nazwą, ponieważ żaden przeor nigdy nie jest całkowicie nieinformacyjny. Zobacz moją dyskusję na tym forum. Lub Larry Wasserman za diatribe . (Nieinformacyjne priory są najczęściej niewłaściwe).

Xi'an
źródło
9

Przekaz nieinformacyjny, ściśle mówiąc, nie jest wcześniejszym rozpowszechnieniem. Jest to funkcja taka, że ​​jeśli uznamy to za rozkład i zastosujemy formułę Bayesa, otrzymamy pewien rozkład tylny, który ma na celu jak najlepsze odzwierciedlenie informacji zawartych w danych i tylko w danych, lub w celu uzyskania dobrej właściwości dopasowania częstości (tj. wiarygodny przedział czasu to około przedział ufności).95 %95%95%

Przekaz nieinformacyjny jest często „niewłaściwy”. Rozkład ma dobrze znaną właściwość: jego całka jest równa jedności. Mówi się, że nieinformacyjny przeor jest niewłaściwy, gdy jego całka jest nieskończona (dlatego w takim przypadku jasne jest, że nie jest to rozkład).

Stéphane Laurent
źródło
3
Uważam tę definicję pojęcia „nieinformacyjnego” za zbyt restrykcyjną!
Xi'an
@ Xi'an Z uwagi na brak PO uważam, że ta krótka odpowiedź jest raczej odpowiednia.
Stéphane Laurent,
@ Xi'an To cytat z Bernardo (mniej więcej). Ja się zgadzam ^^
Stéphane Laurent,
1
@ Xi'an Nie jestem jeszcze w domu, ale np. Tutaj Referencyjne plakaty tylne uzyskuje się przez formalne użycie twierdzenia Bayesa z referencyjną wcześniejszą funkcją . Benardo mówi, że poprzednia funkcja odwołuje się , a nie rozkład.
Stéphane Laurent,
2
Mówiąc poważniej @ Xi'an, masz na myśli, że ogranicza się to do bernardyjskich nieinformacyjnych priorów? Zgadza się, a może niektórzy inni. Wiem, że masz więcej wiedzy niż ja w tym temacie. Ale jestem zorientowany na Bernardo (i pasujące do siebie priory).
Stéphane Laurent,