Moja stat prof w zasadzie powiedziała, że jeśli otrzyma się jedną z następujących trzech, można znaleźć dwie pozostałe:
- Funkcja rozkładu skumulowanego
- Funkcja generowania momentu
- Funkcja gęstości prawdopodobieństwa
Ale mój profesor ekonometrii powiedział, że CDF są bardziej fundamentalne niż PDF, ponieważ istnieją przykłady, w których możesz mieć CDF, ale PDF nie jest zdefiniowany.
Czy CDF są bardziej fundamentalne niż pliki PDF? Skąd mam wiedzieć, czy plik PDF lub MGF można uzyskać z CDF?
probability
pdf
cdf
mgf
Stan Shunpike
źródło
źródło
Odpowiedzi:
Każdy rozkład prawdopodobieństwa na (podzbiorze) ma funkcję rozkładu skumulowanego i jednoznacznie definiuje rozkład. W tym sensie CDF jest tak samo fundamentalny jak sama dystrybucja.Rn
Jednak funkcja gęstości prawdopodobieństwa istnieje tylko dla (absolutnie) ciągłych rozkładów prawdopodobieństwa . Najprostszym przykładem rozkładu pozbawionego pliku PDF jest dowolny dyskretny rozkład prawdopodobieństwa , taki jak rozkład zmiennej losowej, która przyjmuje tylko wartości całkowite.
Oczywiście takie dyskretne rozkłady prawdopodobieństwa można zamiast tego scharakteryzować za pomocą funkcji masy prawdopodobieństwa , ale istnieją również rozkłady, które nie mają ani PDF, ani PMF, takie jak dowolna mieszanina rozkładu ciągłego i dyskretnego:
(Schemat bezwstydnie skradziony z odpowiedzi Glen_b na powiązane pytanie).
Istnieją nawet pojedyncze rozkłady prawdopodobieństwa , takie jak rozkład Cantora , którego nie można opisać nawet przez połączenie pliku PDF i PMF. Takie dystrybucje wciąż mają jednak dobrze zdefiniowany CDF. Na przykład, tutaj jest CDF dystrybucji Cantor, czasami nazywanej również „Schodami Diabła”:
( Zdjęcie z Wikimedia Commons autorstwa użytkowników Theon i Amirki , użyte na licencji CC-By-SA 3.0 .)
CDF, znany jako funkcja Cantor , jest ciągły, ale nie absolutnie ciągły. W rzeczywistości jest stały wszędzie, z wyjątkiem zbioru Cantora o zerowej miary Lebesgue'a, ale który wciąż zawiera nieskończenie wiele punktów. Zatem cała masa prawdopodobieństwa rozkładu Cantora jest skoncentrowana na tym znikającym małym podzbiorze rzeczywistej linii liczbowej, ale każdy punkt w zbiorze wciąż indywidualnie ma zerowe prawdopodobieństwo.
Istnieją również rozkłady prawdopodobieństwa, które nie mają funkcji generowania momentu . Prawdopodobnie najlepiej znanym przykładem jest rozkład Cauchy- , A rozkład tłuszczu rozkładem , który ma dobrze określone momenty rzędu 1 lub wyższy (a więc w szczególności nie ma już dobrze określonej średniej i wariancji!).
Wszystkie rozkład prawdopodobieństwa na mają jednak mieć grupę (ewentualnie) zespolonych funkcji charakterystycznej ), którego definicja różniąca się od tego MGF tylko przez pomnożenie jednostka urojona . Tak więc funkcję charakterystyczną można uznać za tak fundamentalną jak CDF.Rn
źródło
Wierzę, że twój profesor ekonometrii myślał coś w następujący sposób.
Zgodnie z definicją pliku PDF musimy go mieć
potrzebowalibyśmy
Możesz odzyskać ducha pliku PDF, ale musisz użyć bardziej wyrafinowanych obiektów matematycznych, zarówno miary, jak i rozkładu .
źródło
Ilmari daje dobrą odpowiedź z teoretycznego punktu widzenia. Można jednak zapytać, w jakim celu gęstość (pdf) i funkcja rozkładu (pdf) służą do praktycznych obliczeń. To może wyjaśnić, w których sytuacjach jedna jest bardziej bezpośrednio przydatna niż druga.
Gęstość jest jednak niezbędna dla statystyki, ponieważ prawdopodobieństwo określa się w kategoriach gęstości. Zatem jeśli chcemy obliczyć oszacowanie maksymalnego prawdopodobieństwa, potrzebujemy bezpośrednio gęstości.
Jeśli przejdziemy do porównania rozkładu empirycznego i teoretycznego, oba mogą być przydatne, ale metody takie jak wykresy pp i qq oparte na funkcji rozkładu są często preferowane.
źródło