Prawdziwe znaczenie elipsy zaufania

12

Czytając o prawdziwym znaczeniu elipsy 95% pewności, spotykam 2 wyjaśnienia:

  1. Elipsa, która zawiera 95% danych
  2. Nie powyższe, ale elipsa, która wyjaśnia wariancję danych. Nie jestem pewien, czy rozumiem poprawnie, ale wydaje się, że oznaczają one, że jeśli pojawi się nowy punkt danych, istnieje 95% szans, że nowa wariancja pozostanie w elipsie.

Czy możesz rzucić trochę światła?

Kenny
źródło

Odpowiedzi:

15

W rzeczywistości żadne wyjaśnienie nie jest poprawne.

Elipsa ufności ma związek z nieobserwowanymi parametrami populacji , takimi jak prawdziwa średnia populacji twojego dwuwymiarowego rozkładu. Elipsa 95% ufności dla tej średniej jest tak naprawdę algorytmem o następującej właściwości: jeśli wielokrotnie powielasz próbkowanie z rozkładu podstawowego i za każdym razem obliczasz elipsę zaufania, to 95% tak zbudowanych elips zawierałoby podstawę oznaczać. (Zauważ, że każda próbka dałaby oczywiście inną elipsę).

Zatem elipsa zaufania zwykle nie będzie zawierać 95% obserwacji. W rzeczywistości, wraz ze wzrostem liczby obserwacji, średnia będzie zwykle coraz lepiej szacowana, co prowadzi do coraz mniejszych elips ufności, które z kolei zawierają coraz mniejszą część rzeczywistych danych. (Niestety, niektórzy ludzie obliczają najmniejszą elipsę, która zawiera 95% ich danych, przypominającą kwantyl, co samo w sobie jest całkiem OK ... ale potem nazywają tę „elipsę kwantylową” „elipsą zaufania”, która, jak widzisz, prowadzi do zamieszania).

Wariancja populacji bazowej odnosi się do elipsy zaufania. Wysoka wariancja oznacza, że ​​dane są wszędzie, więc średnia nie jest dobrze oszacowana, więc elipsa ufności będzie większa niż gdyby wariancja była mniejsza.

Oczywiście możemy obliczać elipsy ufności również dla każdego innego parametru populacji, który chcielibyśmy oszacować. Lub możemy spojrzeć na inne obszary pewności niż elipsy, szczególnie jeśli nie znamy szacowanego parametru (asymptotycznie) normalnie rozłożonego.

Jednowymiarowym analogiem elipsy zaufania jest , a przeglądanie poprzednich pytań w tym znaczniku jest pomocne. Nasze obecnie najczęściej zadawane pytanie w tym tagu jest szczególnie miłe: Dlaczego 95% CI nie implikuje 95% szansy na zawarcie średniej? Większość dyskusji dotyczy również wyższych wymiarów analogów jednowymiarowego przedziału ufności.

Stephan Kolassa
źródło
1

Zależy to od obszaru, którego dotyczy ta koncepcja. To, co powiedziano powyżej, dotyczy statystyk, ale kiedy stosujemy statystyki do innych przedmiotów, sytuacja wygląda nieco inaczej. Na przykład w biomechanice używamy terminu elipsa ufności (choć toczy się debata, czy powinna to być elipsa predykcyjna) jako techniki pomiaru środka przemieszczenia ciśnienia, gdy podmiot stoi na platformie sił. Następnie elipsa narysowana wokół dwóch osi (główna i pomniejsza) powinna zawierać 95% punktów danych, które reprezentują środek przemieszczenia ciśnienia w czasie próby.

Cathrine Katsigianni
źródło