Na przykład mam dane dotyczące strat historycznych i obliczam ekstremalne kwantyle (wartość zagrożona lub prawdopodobna maksymalna strata). Uzyskane wyniki służą do oszacowania straty lub ich przewidzenia? Gdzie można narysować linię? Jestem zdezorientowany.
46
Odpowiedzi:
„Prognozowanie” i „szacowanie” rzeczywiście są czasami używane zamiennie w pismach nietechnicznych i wydają się działać podobnie, ale istnieje wyraźne rozróżnienie między nimi w standardowym modelu problemu statystycznego. An Estymator danych używa się domyślić, w parametrze podczas predyktorem wykorzystuje dane odgadnąć w pewnym losowym wartości, która nie jest częścią zestawu danych. Dla tych, którzy nie są zaznajomieni z tym, co „parametr” i „wartość losowa” oznaczają w statystykach, poniżej podano szczegółowe wyjaśnienie.
W tym standardowym modelu zakłada się, że dane stanowią (prawdopodobnie wielowymiarową) obserwację zmiennej losowej której rozkład jest znany tylko z określonego zestawu możliwych rozkładów, „stanów natury”. Estymator jest procedura matematyczna, która przypisuje każdej możliwej wartości własnościach o stanie naturalnym , takich jak jego średnie . Tak więc oszacowanie jest domysłem na temat prawdziwego stanu przyrody. Możemy stwierdzić, jak dobry jest szacunek, porównując z . X t x t ( x ) θ μ ( θ ) t ( x ) μ ( θ )x X t x t(x) θ μ(θ) t(x) μ(θ)
Czynnikiem dotyczy niezależnego obserwację innej zmiennej losowej , której rozkład jest podobne do prawdziwego stanu naturalnego. Prognozowanie to przypuszczenie o kolejnej losowej wartości. Możemy powiedzieć, jak dobrze dana przepowiednia jest jedynie poprzez porównanie do wartości realizowanego przez . Mamy nadzieję, że średnio porozumienie będzie dobre (w sensie uśrednienia wszystkich możliwych wyników i jednocześnie wszystkich możliwych wartości ).Z p ( x ) Z x Zp(x) Z p(x) Z x Z
Zwykłe najmniejsze kwadraty dają standardowy przykład. Dane składają się z par wartości zmiennej zależnej z wartościami zmiennej niezależnej. Stan natury określają trzy parametry , i : mówi, że każdy przypomina niezależne losowanie z rozkładu normalnego ze średnią i odchyleniem standardowym . , i są parametrami (liczbami) uważanymi za stałe i niezmienne. Zainteresowania koncentrują się nar i x i α β Ď Y i α + β x i Ď α β Ď α β ( α , β ) α α β β α β(xi,yi) yi xi α β σ yi α+βxi σ α β σ α (punkt przecięcia) i (nachylenie). OLS oszacowania napisany jest dobrze w tym sensie, że tendencję, aby być blisko i bywa blisko , bez względu na to, co prawdziwe (ale brak danych) wartości i może być .β (α^,β^) α^ α β^ β α β
Prognozowanie OLS polega na obserwacji nowej wartości zmiennej zależnej związanej z pewną wartością zmiennej niezależnej. może, ale nie musi, należeć do w zbiorze danych; to jest nieistotne. Jednym z intuicyjnie dobrych przewidywań jest to, że ta nowa wartość prawdopodobnie będzie zbliżona do . Lepsze przewidywania mówią, jak blisko może być nowa wartość (nazywane są przedziałami przewidywania ). Uwzględniają fakt, że i są niepewne (ponieważ zależą matematycznie od losowych wartościZ=Y(x) x x xi α^+β^x α^ β^ (yi) ), że nie jest pewne (i dlatego należy to oszacować), a także założenie, że ma rozkład normalny ze standardowym odchyleniem i średnią ( zauważ brak czapek!).σ Y(x) σ α+βx
Zwróć uwagę, że ta prognoza ma dwa oddzielne źródła niepewności: niepewność danych prowadzi do niepewności w szacowanym nachyleniu, przecięciu i resztkowym odchyleniu standardowym ( ); ponadto nie ma pewności, jaka będzie wartość . Ta dodatkowa niepewność - ponieważ jest losowa - charakteryzuje prognozy. Przewidywanie może wyglądać jak oszacowanie (w końcu oszacowania :-) i może nawet mieć tę samą matematyczną formułę ( może czasami być taki sam jakσ Y ( x ), Y ( x ) α + β x α + β x P ( x ) t ( x )(xi,yi) σ Y(x) Y(x) α^+β^x α+βx p(x) t(x) ), ale przyniesie większą niepewność niż szacunki.
Tutaj zatem, w przykładzie OLS, widzimy wyraźne rozróżnienie: oszacowanie zgaduje na podstawie parametrów (które są ustalone, ale nieznane liczby), podczas gdy przewidywanie zgaduje wartość wartości losowej. Źródłem potencjalnych nieporozumień jest to, że prognozy zwykle opierają się na szacowanych parametrach i mogą nawet mieć tę samą formułę co estymator.
W praktyce estymatory można odróżnić od predyktorów na dwa sposoby:
cel : estymator stara się poznać właściwość prawdziwego stanu przyrody, podczas gdy prognoza ma na celu odgadnięcie wyniku zmiennej losowej; i
niepewność : predyktor ma zwykle większą niepewność niż powiązany estymator, ze względu na dodatkową niepewność wyniku tej zmiennej losowej. Dlatego dobrze udokumentowane i opisane predyktory zwykle mają przedziały niepewności - przedziały predykcji - które są szersze niż przedziały niepewności estymatorów, znane jako przedziały ufności. Charakterystyczną cechą przedziałów predykcyjnych jest to, że mogą (hipotetycznie) zmniejszać się wraz ze wzrostem zestawu danych, ale nie zmniejszają się do zerowej szerokości - niepewność losowego wyniku jest „nieredukowalna” - podczas gdy szerokości przedziałów ufności będą miały tendencję do zmniejszają się do zera, co odpowiada naszej intuicji, że precyzja oszacowania może stać się dowolnie dobra przy wystarczającej ilości danych.
Stosując to do oceny potencjalnej straty inwestycyjnej, najpierw rozważ cel: czy chcesz wiedzieć, ile faktycznie możesz stracić na tej inwestycji (lub na tym konkretnym koszyku inwestycji) w danym okresie, czy naprawdę zgadujesz, co to jest oczekiwana strata (być może w dużym świecie inwestycji)? Pierwsza jest prognozą, druga szacunkiem. Następnie rozważ niepewność. Jak zmieniłaby się twoja odpowiedź, gdybyś miał prawie nieskończone zasoby do gromadzenia danych i przeprowadzania analiz? Jeśli stałoby się to bardzo precyzyjne, prawdopodobnie szacujesz oczekiwany zwrot z inwestycji, a jeśli pozostajesz bardzo niepewny co do odpowiedzi, robisz prognozy.
Tak więc, jeśli nadal nie jesteś pewien, z jakim zwierzęciem masz do czynienia, zapytaj swojego estymatora / predyktora: jak prawdopodobne jest to i dlaczego? Za pomocą obu kryteriów (1) i (2) będziesz wiedział, co masz.
źródło
Szacowanie odbywa się zawsze dla nieznanego parametru, natomiast przewidywanie dla zmiennej losowej.
źródło
Nie ma różnicy w modelach. Rzeczywiście istnieje (niewielka) różnica w przeprowadzanych działaniach. Oszacowanie to kalibracja modelu probabilistycznego z wykorzystaniem danych („uczenie się” w terminologii AI). Prognozowanie jest „zgadywaniem” przyszłej obserwacji. Zakładając, że to „zgadywanie” opiera się na danych z przeszłości - może to być przypadek szacunkowy; takie jak przewidywanie wzrostu następnej osoby, z którą się spotkasz, na podstawie oszacowania średniego wzrostu w populacji. Należy jednak pamiętać, że ta prognoza nie zawsze jest przypadkiem oszacowania. Płeć następnej osoby, którą wkrótce spotkasz, nie jest parametrem populacji w klasycznym znaczeniu; Przewidywanie płci może wymagać pewnej oceny, ale będzie wymagało nieco więcej ...
W przypadku wartości zagrożonej przewidywanie i oszacowanie pokrywają się od czasu przewidywanej straty, jest to szacunkowa oczekiwana strata.
źródło
Prognozowanie to użycie funkcji regresji próbki do oszacowania wartości zmiennej zależnej uwarunkowanej niektórymi nieobserwowanymi wartościami zmiennej niezależnej.
Oszacowanie to proces lub technika obliczania nieznanego parametru lub ilości populacji.
źródło
Zazwyczaj „oszacowanie” jest zarezerwowane dla parametrów, a „przewidywanie” dotyczy wartości. Czasami jednak rozróżnienie to zaciera się, np. Możesz zobaczyć coś w rodzaju „oszacuj wartość jutro” zamiast „prognozuj wartość jutro”.
Wartość zagrożona (VaR) jest interesującym przypadkiem. VaR nie jest parametrem, ale nie mówimy „przewidzieć VaR”. Mówimy „oszacuj VaR”. Dlaczego?
Powodem tego jest to, że VaR nie jest wielkością losową, JEŻELI znasz rozkład, ORAZ musisz znać rozkład, aby obliczyć VaR. Tak więc, jeśli używasz parametrycznego podejścia VaR, najpierw szacujesz parametry rozkładu, a następnie obliczasz VaR. Jeśli używasz nieparametrycznej Var, następnie bezpośrednio oszacować VaR podobny do tego, jak byś oszacowania parametrów. Pod tym względem jest podobny do kwantylu.
Z drugiej strony kwota straty jest wartością losową. Dlatego jeśli zostaniesz poproszony o prognozowanie strat, nie przewidujesz ich. Ponownie czasami mówimy, że strata „szacuje”. Tak więc linia jest niewyraźna, jak napisałem wcześniej.
źródło
Poniższe definicje uważam za bardziej objaśniające:
Oszacowanie to obliczone przybliżenie wyniku. Ten wynik może być prognozą, ale niekoniecznie. Na przykład, mogę oszacować, że liczba samochodów na Golden Gate Bridge wczoraj o godzinie 17:00 wynosiła 900, zakładając, że trzy pasy jadące w kierunku Marin były wolne, każdy samochód zajmuje 30 stóp przestrzeni, a most ma 9000 stóp długości ( 9000/30 x 3 = 900).
Ekstrapolacja polega na oszacowaniu wartości zmiennej poza znanym zakresem wartości, zakładając, że oszacowana wartość jest zgodna z pewnym wzorem znanym. Najprostszą i najpopularniejszą formą ekstrapolacji jest oszacowanie trendu liniowego na podstawie znanych danych. Alternatywy do ekstrapolacji liniowej obejmują ekstrapolację wielomianową i stożkową. Podobnie jak szacowanie, ekstrapolacja może być używana do prognozowania, ale nie ogranicza się do prognozowania.
Prognozy mówią po prostu coś o przyszłości. Prognozy zwykle koncentrują się na wynikach, a nie ścieżce do tych wyników. Mogę na przykład przewidzieć, że do 2050 r. Wszystkie pojazdy będą zasilane silnikami elektrycznymi, nie wyjaśniając, w jaki sposób przechodzimy od niskiej adopcji w 2011 r. Do pełnej adopcji do 2050 r. Jak widać z poprzedniego przykładu, prognozy niekoniecznie opierają się na danych.
Prognozowanie to proces sporządzania prognozy lub prognozy. Pojęcia prognoza i prognoza są często używane zamiennie, ale czasami prognozy różnią się od prognoz, ponieważ prognozy często dostarczają wyjaśnienia ścieżek do wyniku. Na przykład prognoza adopcji pojazdu elektrycznego może obejmować ścieżkę do pełnej adopcji pojazdu elektrycznego według wzoru adopcji w kształcie litery S, w którym niewiele samochodów jest elektrycznych przed 2025 r., Punkt przegięcia występuje w 2030 r. Z szybkim przyjęciem, a większość samochodów jest elektryczna po 2040
Szacowanie, ekstrapolacja, prognozowanie i prognozowanie nie są wzajemnie wyczerpującymi i zbiorowo wyczerpującymi warunkami. Dobre długoterminowe prognozy dotyczące złożonych problemów często wymagają zastosowania technik innych niż ekstrapolacja w celu uzyskania wiarygodnych wyników. Prognozy i prognozy mogą również występować bez jakichkolwiek obliczeń szacunkowych.
patrz linki definicje1 definicje2
źródło