To może równie dobrze spaść, jak najgłupsze pytania, jakie kiedykolwiek zadano na tym forum, ale po otrzymaniu rozsądnych i znaczących odpowiedzi na poprzednie pytanie, pomyślałem, że ponownie rozciągnę moje szczęście.
Przez pewien czas byłem bardzo zdezorientowany co do znaczenia rozkładów statystycznych, zwłaszcza gdy odnoszą się one do zwrotów aktywów, a dokładniej do alokacji aktywów.
Moje szczegółowe pytanie brzmi: Załóżmy, że mam 20 lat danych zwrotów miesięcznych S&P 500, dlaczego powinienem zakładać pewien rodzaj dystrybucji (tj. Lot Normalny / Johnson / Levy itp.) Dla mojej decyzji o alokacji aktywów, kiedy mogę po prostu po prostu podejmować decyzje o alokacji aktywów na podstawie danych historycznych, które mam przy sobie?
distributions
Bloodline
źródło
źródło
Odpowiedzi:
Zastosowanie założonego rozkładu (tj. Analizy parametrycznej) obniży koszt obliczeniowy twojej metody. Zakładam, że chciałbyś wykonać regresję lub klasyfikację. Oznacza to, że w pewnym momencie zamierzasz oszacować rozkład niektórych danych. Metody nieparametryczne są przydatne, gdy dane nie są zgodne z dobrze zbadanym rozkładem, ale zwykle zajmują więcej czasu na obliczenie lub więcej pamięci na przechowanie.
Również jeśli dane są generowane przez proces zgodny z rozkładem, taki jak średnia z niektórych jednakowo losowych procesów, wówczas zastosowanie tego rozkładu ma większy sens. W przypadku uśredniania zbioru zmiennej jednolitej poprawnym rozkładem jest prawdopodobnie rozkład Gaussa.
źródło
Uzupełnienie odpowiedzi Jamesa : modele parametryczne również (zwykle) wymagają mniejszej liczby próbek, aby mieć dobre dopasowanie: może to zwiększyć ich siłę generalizacyjną: to znaczy, że mogą lepiej przewidywać nowe dane, a nawet się mylić. Oczywiście zależy to od sytuacji, modeli i wielkości próbek.
źródło