Co to jest identyfikowalność modelu?

38

Wiem, że w przypadku modelu, którego nie można zidentyfikować, można powiedzieć, że dane są generowane przez wiele różnych przypisań do parametrów modelu. Wiem, że czasami można ograniczyć parametry, aby wszystkie były identyfikowalne, jak w przykładzie w wydaniu Cassella i Berger, wyd. 2, sekcja 11.2.

Biorąc pod uwagę konkretny model, jak mogę ocenić, czy można go zidentyfikować?

Jack Tanner
źródło

Odpowiedzi:

45

W celu zidentyfikowania mówimy o parametrze (który może być wektorem), który rozciąga się na przestrzeń parametrów Θ , i rodzinie rozkładów (dla uproszczenia, pomyśl PDF) indeksowanej przez θ, którą zwykle piszemy jak { f θ |θΘθ . Na przykład θ może być θ = β, a f może być{fθ|θΘ}θθ=βf

co oznaczałoby, żeΘ=(0,). Aby model był identyfikowalny, transformacja odwzorowującaθnafθpowinna byćjeden na jeden. Biorąc pod uwagę model w kolanach, najprostszym sposobem na sprawdzenie tego jest zacząć równaniefθ 1 =fθ 2 , (równość ta powinna posiadać dla (prawie) wszystkichxw

fθ(x)=1βex/β, x>0, β>0,
Θ=(0,)θfθfθ1=fθ2xwsparcie ) i spróbować użyć algebry (lub innego argumentu), aby pokazać, że właśnie takie równanie implikuje, że w rzeczywistości .θ1=θ2

Jeśli odniesiesz sukces z tym planem, twój model jest możliwy do zidentyfikowania; kontynuuj swoją działalność. Jeśli nie, to albo twój model nie jest identyfikowalny, albo musisz znaleźć inny argument. Intuicja jest taka sama, niezależnie od tego: w możliwym do zidentyfikowania modelu dwa różne parametry (które mogą być wektorami) nie mogą dać tej samej funkcji prawdopodobieństwa.

Ma to sens, ponieważ jeśli dla stałych danych dwa unikalne parametry spowodowałyby takie samo prawdopodobieństwo, wówczas niemożliwe byłoby rozróżnienie dwóch parametrów kandydujących na podstawie samych danych. W takim przypadku niemożliwe byłoby zidentyfikowanie prawdziwego parametru.

fθ1=fθ2

1β1ex/β1=1β2ex/β2,
x>0
lnβ1xβ1=lnβ2xβ2
x>0
(1β11β2)x(lnβ1lnβ2)

f(y)=y2y[1,1]y[0,1]


źródło
2
(+1) Ładne, wyczerpujące, praktyczne wyjaśnienie. Rysowane przez ciebie analogie wyjaśniają pojęcia.
kardynał
Z pewnością odpowiedziałeś na pytanie, które zadałem, ale jestem zbyt początkującym, aby naprawdę zrozumieć twoją odpowiedź. Jeśli znasz wyjaśnienie, które jest lepsze dla początkującego, daj mi znać.
Jack Tanner
1
@cardinal, dzięki. Do Jacka, w porządku, rozumiem. A co powiesz na to: jeśli jest coś powyżej, co nie jest jeszcze jasne, a jeśli mi to wskazujesz, to mogę spróbować go jeszcze bardziej rozwinąć. Lub, jeśli wolisz, możesz napisać kolejne pytanie, które wymaga wyjaśnienia „laika” lub przykładów tych pomysłów. Myślę, że można śmiało powiedzieć, że identyfikowalność jest tematem, który zwykle pojawia się po typowym wstępnym okresie studiów, więc jeśli chcesz podać kontekst, z jakiego powodu się z nim spotkałeś, może pomóc potencjalnym odbiorcom.
2
yij=μ+α1+α2++αk+εi
23

ΣΣΣ

Σ

Jeśli robisz problem z maksymalnym prawdopodobieństwem, wiesz, że asymptotyczna macierz kowariancji twoich szacunków jest równa odwrotności informacji Fishera ocenianych w MLE. Zatem sprawdzenie matrycy informacji Fishera pod kątem (przybliżonej) osobliwości jest również rozsądnym sposobem oceny identyfikowalności. Działa to również tam, gdzie trudno jest obliczyć teoretyczną informację o rybaku, ponieważ często możliwe jest bardzo dokładne przybliżenie liczbowe spójnego estymatora macierzy informacji o rybach, na przykład poprzez oszacowanie oczekiwanego zewnętrznego produktu funkcji wyniku przez zaobserwowany średni produkt zewnętrzny .

Σ

Makro
źródło
2
(+1) Dobra robota. Nawet nie pomyślałem o podejściu do tego pytania z tego kierunku.
1
Jednym z powodów, dla których pomysł obliczenia macierzy kowariancji w oparciu o symulowane dane jest szczególnie schludny, jest to, że należy mimo wszystko symulować dane, aby wykonać kontrolę Cooka-Gelmana-Rubina .
Jack Tanner