Dlaczego suma prawdopodobieństw w ciągłym rozkładzie równomiernym nie jest nieskończonością?

9

Funkcja gęstości prawdopodobieństwa

Funkcja gęstości prawdopodobieństwa rozkładu jednolitego (ciągłego) pokazano powyżej. Pole pod krzywą wynosi 1 - co ma sens, ponieważ suma wszystkich prawdopodobieństw w rozkładzie prawdopodobieństwa wynosi 1.

Formalnie powyższą funkcję prawdopodobieństwa (f (x)) można zdefiniować jako

1 / (ba) dla x w [a, b]

i 0 w przeciwnym razie

Zastanów się, że muszę wybrać liczbę rzeczywistą między a (powiedzmy 2) ib (powiedzmy 6). To sprawia, że ​​jednolite prawdopodobieństwo = 0,25. Ponieważ jednak w tym przedziale jest nieskończona liczba liczb, czyż suma wszystkich prawdopodobieństw nie powinna się sumować do nieskończoności? Co przeoczam?

Czy f (x) nie jest prawdopodobieństwem wystąpienia liczby x?

rahs
źródło
1
f(x)nie jest funkcją prawdopodobieństwa, to jest gęstość prawdopodobieństwa funkcji . Oznacza to, że nie daje to prawdopodobieństwaxjest pewną liczbą, ale gęstością prawdopodobieństwa lub prawdopodobieństwem na jednostkę długości wzdłuż osi x. Używasz integracji, aby uzyskać całkowite prawdopodobieństwo dla tego typu funkcji, a nie sumowania.
HelloGoodbye

Odpowiedzi:

18

f(x)opisuje w twoim przykładzie gęstość prawdopodobieństwa, a nie masę prawdopodobieństwa . Ogólnie rzecz biorąc, dla rozkładów ciągłych te wydarzenia -The rzeczy otrzymujemy prawdopodobieństwa dla-są zakresy wartości, takie jak dla obszaru pod krzywą oda do a+.1lub z a do b(chociaż takie zakresy nie muszą być ciągłe). W przypadku rozkładów ciągłych prawdopodobieństwo wystąpienia dowolnej pojedynczej wartości wynosi zwykle 0.

Alexis
źródło
Czy istnieje bardziej dokładny technicznie sposób na powiedzenie tego, co próbujesz powiedzieć? Martwię się, że „zasięg” zrzuci ludzi, biorąc pod uwagę, że ciągłe dystrybucje mogą mieć delty Diraca ...
user541686 28.08.18
3
@ Mehrdad: Delta diraca nie ma ciągłego rozkładu. Właściwy sposób przypisywania prawdopodobieństw byłby za pośrednictwemP(A)=A1dF.
Alex R.
1
@AlexR .: Oof, założyłem, że przez „ciągłą dystrybucję” chodziło ci po prostu o dystrybucję w domenie ciągłej, ponieważ ludzie mówią o tym, gdy delta Diraca jest ciągłym analogiem delty Kroneckera. Dzięki za wytłumaczenie.
user541686,
@ Mehrdad Myślałem dokładnie o delcie Diraca, ale mam nadzieję, że zauważysz termin „ogólnie”, a także pozorny poziom znajomości statystyki PO.
Alexis
@ Mehrdad Techniczne sformułowanie zmiennej losowej jest pod względem miary: istnieje funkcja od zbioru mocy przestrzeni zdarzeń do przedziału [0,1]. Jako miarę można użyć funkcji gęstości prawdopodobieństwa (miara zbioru jest po prostu całką pliku PDF w stosunku do tego zbioru), ale istnieją miary, takie jak delta Diraca (zbiór ma miarę 1, jeśli zawiera miaręx0, w przeciwnym razie wynosi zero), które, ściśle mówiąc, nie działają w tradycyjnym znaczeniu.
Accumumulation
11

Ponieważ każdy termin w podsumowaniu jest ważony przez nieskończenie małe dx. Znaczenie tego można chyba najłatwiej zrozumieć, ostrożnie przechodząc przez bardzo prosty przykład.

Rozważ użycie sumowania Riemanna do obliczenia obszaru pod następującym prostokątnym obszarem (wybrano prostokąt, aby usunąć aspekt aproksymacji sumowania Riemanna, który nie jest tutaj celem): region prostokątny] Możemy obliczyć obszar przy użyciu 2 podregionów lub przy użyciu 4 podregionów . W przypadku 2 podregionów (oznaczonoAi), obszary podano przez

A1=A2=5×2=10
podczas gdy w przypadku 4 podregionów (oznaczono Bi), obszary podano przez
B1=B2=B3=B4=5×1=5
Łączna powierzchnia w obu przypadkach odpowiada
i=12Ai=i=14Bi=20
To wszystko jest dość oczywiste, ale rodzi subtelnie ważne pytanie: dlaczego te dwie odpowiedzi są zgodne ? Intuicyjnie powinno być jasne, że to działa, ponieważ zmniejszyliśmy szerokość drugiego zestawu podregionów. Możemy rozważyć zrobienie tego samego z 8 podregionami, każdy o szerokości0.5, i znowu z 16 ... i moglibyśmy kontynuować ten proces, dopóki nie uzyskamy nieskończonej liczby podregionów, każdy o małej szerokości dx. Tak długo, jak wszystko jest zawsze odpowiednio ważone, odpowiedzi zawsze powinny się zgadzać. Bez prawidłowego ważenia podsumowanie rzeczywiście byłoby po prostu.

Dlatego zawsze zwracam uwagę studentów, że całka to nie tylko symbol , ale para symbolidx.

Zxv
źródło
5

Nieprawidłowo interpretujesz rozkład prawdopodobieństwa - jest to nieskończona liczba nieskończenie podzielonych prawdopodobieństw, więc nie możesz powiedzieć, że „prawdopodobieństwo wyciągnięcia wartości 0,5 z rozkładu równomiernego (0, 1)”, ponieważ prawdopodobieństwo to zero - istnieje nieskończona liczba możliwych wartości, które można uzyskać, a wszystkie z nich są jednakowo prawdopodobne, więc jasne jest, że prawdopodobieństwo każdego indywidualnego wyniku jest1=0[1] .

Zamiast tego możesz spojrzeć na prawdopodobieństwo szeregu wyników i zmierzyć je za pomocą obszarów (a zatem całek). Na przykład, jeśli rysujesz z jednolitego rozkładu (0, 1) (z pdff(x)=1 dla x[0,1] i f(x)=0 w przeciwnym razie), to prawdopodobieństwo, że wynik będzie pomiędzy 0.2 i 0.3 jest

0.20.3f(x) dx=0.20.31 dx=[x]0.20.3=0.30.2=0.1

tzn. masz 10% szansy na uzyskanie wyniku w tym zakresie.

[1] Przepraszamy za wszystkie osoby mające zawał serca z powodu mojego nadmiernego uproszczenia obliczeń.

ConMan
źródło
0

Zasadniczo twoje rozumowanie zawodzi w tym założeniu:

Ponieważ jednak w tym przedziale jest nieskończona liczba liczb, czyż suma wszystkich prawdopodobieństw nie powinna się sumować do nieskończoności?

Jest to problem matematyczny znany od czasów paradoksów Elei .

Dwa z jego twierdzeń były takie

  1. Strzała nigdy nie osiągnie celu
  2. Achilles nigdy nie wyprzedzi żółwia

Oba zostały oparte na twierdzeniu, że można zbudować nieskończoną sekwencję liczb dodatnich (w pierwszym przypadku mówiąc, że strzała musi przelecieć nieskończenie razy połowę pozostałej drogi do celu, w drugim przypadku mówiąc, że Achilles ma aby osiągnąć pozycję, w której wcześniej był żółw, a tymczasem żółw przemieszcza się do nowej pozycji, która staje się naszym kolejnym punktem odniesienia).

Szybko do przodu doprowadziło to do odkrycia nieskończonych kwot.

Tak więc ogólnie suma nieskończona wiele liczb dodatnich niekoniecznie musi być nieskończona ; może to jednak nie być nieskończone tylko wtedy, gdy (skrajne uproszczenie, przepraszam za to) prawie wszystkie liczby w sekwencji są bardzo bliskie zeru, bez względu na to, jak bliskie zeru są.

Infinity gra jeszcze więcej lew. Porządek , w którym dodawanie elementów sekwencji jest zbyt ważne i może doprowadzić do sytuacji, że zmiana kolejności daje różne wyniki!

Dowiedz się więcej o paradoksach nieskończoności . Możesz być zaskoczony.

Ister
źródło
Nie widzę sposobu, aby interpretować to pytanie tak, że OP myśli o policzalnych kwotach.
JiK
0

f(x) opisuje gęstość prawdopodobieństwa i ma jednostkę px. Stąd za dany x otrzymujeszf(x)=1ba w pxjednostek, a nie p, jak szukasz. Jeśli chcesz p, potrzebujesz funkcji rozkładu dla danego zakresu, czyli prawdopodobieństwa p dla xw granicach a i b.

Mam nadzieję, że to ma sens.

użytkownik3719750
źródło