Wystarczające statystyki dla laika

23

Czy ktoś może wyjaśnić wystarczające statystyki w bardzo podstawowych terminach? Pochodzę z inżynierii i przeszedłem wiele rzeczy, ale nie znalazłem intuicyjnego wyjaśnienia.

użytkownik1343318
źródło

Odpowiedzi:

33

Wystarczająca statystyka podsumowuje wszystkie informacje zawarte w próbce, abyś mógł oszacować ten sam parametr niezależnie od tego, czy daliśmy ci próbkę, czy tylko samą statystykę. To redukcja danych bez utraty informacji.

Oto jeden przykład. Załóżmy, że ma rozkład symetryczny około zera. Zamiast dać ci próbkę, wręczam ci próbkę wartości bezwzględnych (to jest statystyka). Nie zobaczysz znaku. Ale wiesz, że rozkład jest symetryczny, więc dla danej wartości , i są jednakowo prawdopodobne (prawdopodobieństwo warunkowe wynosi ). Możesz rzucić uczciwą monetą. Jeśli pojawi się głowa, spraw, aby ujemne. Jeśli ogony, zrób to pozytywnie. To daje próbkę z , który ma taki sam rozkład jak dane oryginalnego . Zasadniczo byłeś w stanie zrekonstruować dane ze statystyki. To wystarcza.x - x x 0,5 x X XXxxx0.5xXX

Dimitriy V. Masterov
źródło
Aby wyjaśnić / potwierdzić: statystyki są wystarczające dla parametru. W tym przykładzie nie wymieniono żadnego parametru, ale przypuszczam, że statystyka byłaby wystarczająca dla dowolnego parametru dowolnego wybranego rozkładu parametrycznego X? Jest to więc niezwykły przykład - ale nadal pomocny dla intuicji.
Denziloe
2
@Denziloe Wystarczający dla dowolnego parametru tego rozkładu, przy silnych założeniach symetrii około 0. To zabawkowy przykład zaprojektowany do budowania intuicji.
Dimitriy V. Masterov,
13

W kategoriach bayesowskich masz pewną obserwowalną właściwość X i parametr Θ . Rozkład łączny dla X,Θ jest określony, ale uwzględniany jako rozkład warunkowy XΘ i wcześniejszy rozkład Θ . Statystyka T jest wystarczająca dla tego modelu wtedy i tylko wtedy, gdy rozkład tylny ΘX jest taki sam jak ΘT(X) , dla każdego wcześniejszego rozkładu Θ . Innymi słowy, twoja zaktualizowana niepewność dotycząca Θ po znajomości wartościX jest tym samym, co zaktualizowana niepewność dotyczącaΘ po znajomości wartościT(X) ,bez względu na wcześniejsze informacje o Θ . Należy pamiętać, że wystarczalność jest koncepcją zależną od modelu.

Zen
źródło
1

Powiedz, że masz monetę i nie wiesz, czy jest to uczciwe, czy nie. Innymi słowy, ma prawdopodobieństwo p zbliżających się głów ( H ) i 1p nadchodzących ogonów ( T ) i nie znasz wartości p .

Próbujesz zrozumieć wartość p , rzucając monetą kilka razy, powiedzmy n razy.

Powiedzmy, że n=5 a wynikiem jest sekwencja (H,H,T,H,T) .

p

(H,H,T,H,T)

(H,H,T,T,H)

Wyrażamy to, mówiąc, że liczba głów jest wystarczającą statystyką dla p .

Ten przykład nadaje smak koncepcji. Czytaj dalej, jeśli chcesz zobaczyć, jak łączy się z definicją formalną.

Formalnie statystyka jest wystarczająca dla parametru, jeżeli biorąc pod uwagę wartość statystyki, rozkład prawdopodobieństwa wyników nie obejmuje parametru.

pnumber of heads(1p)n - number of headsp

(H,H,T,H,T)(H,H,T,T,H)...1/10ppp

pnumber of headsnumber of headsp

Denziloe
źródło