Czy ktoś może wyjaśnić wystarczające statystyki w bardzo podstawowych terminach? Pochodzę z inżynierii i przeszedłem wiele rzeczy, ale nie znalazłem intuicyjnego wyjaśnienia.
źródło
Czy ktoś może wyjaśnić wystarczające statystyki w bardzo podstawowych terminach? Pochodzę z inżynierii i przeszedłem wiele rzeczy, ale nie znalazłem intuicyjnego wyjaśnienia.
Wystarczająca statystyka podsumowuje wszystkie informacje zawarte w próbce, abyś mógł oszacować ten sam parametr niezależnie od tego, czy daliśmy ci próbkę, czy tylko samą statystykę. To redukcja danych bez utraty informacji.
Oto jeden przykład. Załóżmy, że ma rozkład symetryczny około zera. Zamiast dać ci próbkę, wręczam ci próbkę wartości bezwzględnych (to jest statystyka). Nie zobaczysz znaku. Ale wiesz, że rozkład jest symetryczny, więc dla danej wartości , i są jednakowo prawdopodobne (prawdopodobieństwo warunkowe wynosi ). Możesz rzucić uczciwą monetą. Jeśli pojawi się głowa, spraw, aby ujemne. Jeśli ogony, zrób to pozytywnie. To daje próbkę z , który ma taki sam rozkład jak dane oryginalnego . Zasadniczo byłeś w stanie zrekonstruować dane ze statystyki. To wystarcza.x - x x 0,5 x X ′ X
W kategoriach bayesowskich masz pewną obserwowalną właściwośćX i parametr Θ . Rozkład łączny dla X,Θ jest określony, ale uwzględniany jako rozkład warunkowy X∣Θ i wcześniejszy rozkład Θ . Statystyka T jest wystarczająca dla tego modelu wtedy i tylko wtedy, gdy rozkład tylny Θ∣X jest taki sam jak Θ∣T(X) , dla każdego wcześniejszego rozkładu Θ . Innymi słowy, twoja zaktualizowana niepewność dotycząca Θ po znajomości wartościX jest tym samym, co zaktualizowana niepewność dotyczącaΘ po znajomości wartościT(X) ,bez względu na wcześniejsze informacje o Θ . Należy pamiętać, że wystarczalność jest koncepcją zależną od modelu.
źródło
Powiedz, że masz monetę i nie wiesz, czy jest to uczciwe, czy nie. Innymi słowy, ma prawdopodobieństwop zbliżających się głów ( H ) i 1−p nadchodzących ogonów ( T ) i nie znasz wartości p .
Próbujesz zrozumieć wartośćp , rzucając monetą kilka razy, powiedzmy n razy.
Powiedzmy, żen=5 a wynikiem jest sekwencja (H,H,T,H,T) .
Wyrażamy to, mówiąc, że liczba głów jest wystarczającą statystyką dla p .
Ten przykład nadaje smak koncepcji. Czytaj dalej, jeśli chcesz zobaczyć, jak łączy się z definicją formalną.
Formalnie statystyka jest wystarczająca dla parametru, jeżeli biorąc pod uwagę wartość statystyki, rozkład prawdopodobieństwa wyników nie obejmuje parametru.
źródło