Różnice między modelem statystycznym a modelem prawdopodobieństwa?

29

Zastosowane prawdopodobieństwo jest ważną gałęzią prawdopodobieństwa, w tym prawdopodobieństwem obliczeniowym. Ponieważ statystyki wykorzystują teorię prawdopodobieństwa do konstruowania modeli do przetwarzania danych, w moim rozumieniu zastanawiam się, jaka jest zasadnicza różnica między modelem statystycznym a modelem prawdopodobieństwa? Model prawdopodobieństwa nie potrzebuje rzeczywistych danych? Dzięki.

Honglang Wang
źródło

Odpowiedzi:

29

Prawdopodobieństwo modelu składa się z trój , w którym jest przestrzeń próbki jest -algebra (zdarzenia) oraz jest miarą prawdopodobieństwa na .Ω F σ P F(Ω,F,P)ΩFσPF

Intuicyjne wyjaśnienie . Model prawdopodobieństwa można interpretować jako znany zmiennej losowej . Na przykład niech X będzie zmienną losową o rozkładzie normalnym ze średnią 0 i wariancją 1 . W tym przypadku miara prawdopodobieństwa P jest powiązana z funkcją skumulowanego rozkładu (CDF) F doXX01PF

F(x)=P(Xx)=P(ωΩ:X(ω)x)=x12πexp(t22)dt.

Uogólnienia . Definicja modelu prawdopodobieństwa zależy od matematycznej definicji prawdopodobieństwa, patrz na przykład prawdopodobieństwo bezpłatne i prawdopodobieństwo kwantowe .

Statystyczne modelu jest zestaw modeli prawdopodobieństwa, to jest to zestaw środków Prawdopodobieństwo / dystrybucje na próbce kosmicznego Ohm .SΩ

Ten zestaw rozkładów prawdopodobieństwa jest zwykle wybierany do modelowania pewnego zjawiska, z którego mamy dane.

Intuicyjne wyjaśnienie . W modelu statystycznym parametry i rozkład opisujący pewne zjawisko są nieznane. Przykładem tego jest rodzina rozkładów normalnych ze średnią i wariancją σ 2R + , to znaczy, oba parametry są nieznane i zwykle chcesz użyć zestawu danych do oszacowania parametrów (tj. Wybierając element S ). Ten zestaw rozkładów można wybrać dla dowolnego Ω i F , ale jeśli się nie mylę, w prawdziwym przykładzie tylko te zdefiniowane dla tej samej pary ( Ω , F )μRσ2R+SΩF(Ω,F) są rozsądne do rozważenia.

Uogólnienia . Artykuł ten zawiera bardzo formalną definicję Modelu Statystycznego, ale autor wspomina, że ​​„Model Bayesa wymaga dodatkowego komponentu w postaci wcześniejszego rozkładu ... Chociaż formuły Bayesa nie są głównym przedmiotem tego opracowania”. Dlatego definicja Modelu Statystycznego zależy od rodzaju używanego modelu: parametrycznego lub nieparametrycznego. Również w ustawieniach parametrycznych definicja zależy od tego, jak traktowane są parametry (np. Klasyczna vs. bayesowska).

Różnica jest: w modelu prawdopodobieństwa wiesz dokładnie miarę prawdopodobieństwa, na przykład , gdzie μ 0 , σ 2 0 są znane parametry, natomiast w modelu statystycznego rozważyć zestawy dystrybucji. , na przykład Normalny ( μ , σ 2 ) , gdzie μ , σ 2 są nieznanymi parametrami.Normal(μ0,σ02)μ0,σ02Normal(μ,σ2)μ,σ2

Żaden z nich nie wymaga zestawu danych, ale powiedziałbym, że model statystyczny jest zwykle wybierany do modelowania.

Xi'an
źródło
2
@HonglangWang To do pewnego stopnia poprawne. Główną różnicą jest to, że model prawdopodobieństwa jest tylko jednym (znanym) rozkładem, podczas gdy model statystyczny jest zbiorem modeli prawdopodobieństwa; dane służą do wyboru modelu z tego zestawu lub mniejszego podzbioru modeli, które lepiej (w pewnym sensie) opisują zjawisko (w świetle danych).
2
(+1) To ładna odpowiedź, choć mam kilka komentarzy. Po pierwsze, myślę, że może to nieco sprzedawać probabilistę. Rozważanie zestawu przestrzeni prawdopodobieństwa w modelu probabilistycznym wcale nie jest rzadkością, a możliwe miary mogą być nawet losowe (skonstruowane na odpowiednio większej przestrzeni). Po drugie, bayesowski (w szczególności) może uznać tę odpowiedź za nieco niepokojącą, ponieważ bayesowski model statystyczny może być często postrzegany jako pojedynczy model prawdopodobieństwa w odpowiedniej przestrzeni produktu . Ω×Θ
kardynał
1
@gung To pytanie bardziej związane z teorią miar. Jeśli chodzi o twoje pierwsze pytanie, jest rzeczywiście zdefiniowane przez CDF. Teraz interpretacja Ω jest trudna, ponieważ formalnie P ( X x ) oznacza P ( ω Ω : X ( ω ) x ) , to Ω nie są wartościami obserwowalnymi. F to σ - algebra, która jest wstępnym obrazem Borel σ - algebry pod XPΩP(Xx)P(ωΩ:X(ω)x)ΩFσσX, znowu tego nie da się zaobserwować. Nie jestem pewien, jak to wyjaśnić na poziomie intuicyjnym.
2
@ gung zależy od zastosowania ; nie jest to określone przez teorię. Na przykład Ω może być zbiorem ruchów Browna opisujących cenę pochodnej finansowej, a X może być wartością uzyskaną w ustalonym czasie t . W innym zastosowaniu Ω może być zbiorem ludzi, a X może być długością ich przedramion. Zasadniczo Ω jest modelem matematycznym fizycznych obiektów badań, a X jest liczbową właściwością tych obiektów. F jest zbiorem możliwych zdarzeń: sytuacjami, do których chcemy przypisać prawdopodobieństwa.ΩΩXtΩXΩXF
whuber
2
@gung to algebra sigma : jest to zbiór podzbiorów („zdarzeń”). W aplikacji finansowej jest to zestaw historii cen; w aplikacji do pomiaru przedramienia zdarzeniami byłyby grupy ludzi. Możemy porozmawiać o tym więcej, jeśli chcesz na czacie. F
whuber