Moje pytanie dotyczy próby uzasadnienia powszechnie stosowanej metody, a mianowicie przyjęcia oczekiwanej wartości Taylor Series. Załóżmy, że mamy losową zmienną o dodatniej średniej i wariancji . Dodatkowo mamy funkcję, powiedzmy, .
Po rozszerzeniu Taylora o średnio otrzymujemy gdzie, jak zwykle, to st.
Jeśli przyjmiemy oczekiwania, otrzymamy przybliżone równanie, które ludzie zwykle określają jako coś oczywistego (patrz znak w pierwszym równaniu tutaj) :
PYTANIE : Interesuje mnie, jak udowodnić, że oczekiwana wartość pozostałego terminu jest w rzeczywistości nieznaczna, tj. (lub innymi słowy, ).
Co próbowałem zrobić : zakładając, że (co z kolei oznacza w ), próbowałem podzielić całkę na dwie części, otaczając niektórymi -vicinity :
Pierwszy można ograniczyć ze względu na fakt, że a zatem nie przeszkadza. Ale z drugim mamy dwa zbieżne fakty: z jednej strony (jako ). Ale z drugiej strony nie wiemy, co zrobić z . 1 / ξ 3 P ( | X - μ | > ε ) → 0 σ 2 → 0 1 / ξ 3
Inną możliwością mogłaby być próba użycia lematu Fatou, ale nie wiem, jak to zrobić.
Doceni każdą pomoc lub podpowiedź. Zdaję sobie sprawę, że jest to bardzo techniczne pytanie, ale muszę je przejść, aby zaufać tej metodzie „oczekiwania Taylora”. Dzięki!
PS Sprawdziłem tutaj , ale wygląda na to, że to coś innego.
Odpowiedzi:
Masz rację sceptycznie podchodząc do tego podejścia. Metoda szeregowa Taylora nie działa ogólnie, chociaż heurystyka zawiera jądro prawdy. Podsumowując poniższą dyskusję techniczną,
Jak wskazuje odpowiedź Alecosa, sugeruje to, że metoda serii Taylora powinna zostać złomowana, jeśli dane mogą mieć ciężkie ogony. (Specjaliści od finansów, patrzę na ciebie.)
Jak zauważył Elvis, kluczowym problemem jest to, że wariancja nie kontroluje wyższych momentów . Aby zobaczyć dlaczego, uprośćmy twoje pytanie tak bardzo, jak to możliwe, aby przejść do głównej idei.
Ponieważ są zmiennymi losowymi z drugich momentów skończonych i nieskończonych momentach trzecich, odpowiedź jest zdecydowanie nie . Dlatego generalnie metoda szeregowa Taylora zawodzi nawet w przypadku wielomianów 3 stopnia . Iteracja tego argumentu pokazuje, że nie można oczekiwać, że metoda szeregowa Taylora zapewni dokładne wyniki, nawet dla wielomianów, chyba że wszystkie momenty zmiennej losowej są dobrze kontrolowane.
Co zatem mamy zrobić? Z pewnością metoda ta działa dla ograniczonych zmiennych losowych, których obsługa jest zbieżna do punktu, ale ta klasa jest zdecydowanie zbyt mała, aby była interesująca. Załóżmy zamiast tego, że sekwencja pochodzi z bardzo skoncentrowanej rodziny, która spełnia (powiedzmy)Xn
dla każdego i niektórych C > 0 . Takie losowe zmienne są zaskakująco częste. Na przykład, gdy X n jest średnią empirycznąt>0 C>0 Xn
miłych zmiennych losowych (np. iid i ograniczone), różne nierówności stężenia sugerują, że X n spełnia (1). Standardowy argument (patrz p. 10 tutaj ) ogranicza p- te momenty dla takich zmiennych losowych:Yi Xn p
Dlatego dla każdego „wystarczająco miły” funkcja analityczna (patrz poniżej), możemy związany błędu E m na m -term Taylor serii zbliżenia, korzystając z nierówności trójkątaf Em m
gdy . Ponieważ przybliżenie Stirlinga daje p ! ≈ p p - 1 / 2 , błąd ściętego spełnia szereg Tayloran>C/2 p!≈pp−1/2
W związku z tym, gdy jest silnie stężony i f jest dostatecznie dobre, seria aproksymacja Taylora rzeczywiście dokładny. Nierówność występująca w (2) oznacza, że f ( p ) ( μ ) / p ! = O ( p - p / 2 ) , więc w szczególności nasz warunek wymaga, aby f było całkowite . Ma to sens, ponieważ (1) nie narzuca żadnych założeń dotyczących ograniczenia na X n .Xn f f(p)(μ)/p!=O(p−p/2) f Xn
Zobaczmy, co może pójść nie tak, gdy ma osobliwość (po komentarzu Whubera). Załóżmy, że wybieramy f ( x ) = 1 / x . Jeśli weźmiemy X n z N o r m a L ( 1 , 1 / n ) Rozkład obcięty od zera do dwóch, wówczas X brak jest wystarczającej koncentracji, e [ M ( X n ) ] = ∞ dla każdego nf f(x)=1/x Xn Normal(1,1/n) Xn E[f(Xn)]=∞ n . Innymi słowy, mamy wysoce skoncentrowaną, ograniczoną zmienną losową , a mimo to metoda szeregowa Taylora zawodzi, gdy funkcja ma tylko jedną osobliwość.
Kilka słów na temat dyscypliny. Uważam, że ładniej jest przedstawić warunek występujący w (2) jako wyprowadzony niż deus ex machina, który jest wymagany w rygorystycznym formacie twierdzenia / dowodu. Aby uczynić argument całkowicie rygorystycznym, należy najpierw zauważyć, że implikuje to prawa strona w (2)
przez tempo wzrostu chwil subgaussów z góry. Stąd twierdzenie Fubiniego
Reszta dowodu przebiega jak wyżej.
źródło
Chociaż moja odpowiedź nigdzie nie zbliży się do poziomu matematycznego wyrafinowania pozostałych odpowiedzi, postanowiłam ją opublikować, ponieważ uważam, że ma to coś do zaoferowania - chociaż, jak mówią, wynik będzie „negatywny”.
Mówiąc lekko, powiedziałbym, że PO jest „niechętny do ryzyka” (ponieważ większość ludzi, podobnie jak sama nauka), ponieważ PO wymaga wystarczających warunków, aby przybliżenie rozszerzenia Taylora drugiego rzędu było „ do przyjęcia". Ale to nie jest konieczny warunek.
Po pierwsze, koniecznym, ale niewystarczającym warunkiem wstępnym, aby oczekiwana wartość Resztki była niższego rzędu niż wariancja rv, jak wymaga PO, jest to, że szereg zbiega się w pierwszej kolejności. Czy powinniśmy po prostu założyć konwergencję? Nie.
Ogólne wyrażenie, które badamy, to:
Jak stwierdza Loistl (1976) , odwołując się do książki Gemignani „Calculus and Statistics” (1978, s. 170), warunkiem zbieżności nieskończonej sumy jest (zastosowanie testu współczynnika zbieżności)
... gdzie jest średnią wartości rv Chociaż jest to również warunek wystarczający (test stosunku jest niejednoznaczny, jeśli powyższa relacja zachowuje się z równością), szeregi będą się różnić, jeśli nierówność utrzyma się w innym kierunku.μ
Loistl zbadał trzy specyficzne formy funkcjonalne dla , wykładniczej, mocy i logarytmu (jego praca jest w dziedzinie Oczekiwanej użyteczności i wyboru portfela, więc przetestował standardowe formy funkcjonalne używane do reprezentowania wklęsłej funkcji użyteczności). Dla tych form funkcjonalnych stwierdził, że tylko dla wykładniczej formy funkcjonalnej nie nałożono żadnych ograniczeń na y - μ . Przeciwnie, w przypadku mocy i przypadku logarytmicznego (gdzie mamy już 0 < y ), stwierdzamy, że ważność nierówności [ 2 ] jest równoważna y - μ < μ ⇒ 0g() y−μ 0<y [2]
Oznacza to, że jeśli nasza zmienna zmienia się poza tym zakresem, ekspansja Taylora mająca jako centrum ekspansji średnią zmiennej będzie się różnić.
Tak więc: dla niektórych form funkcjonalnych wartość funkcji w pewnym punkcie jej domeny jest równa jej nieskończonej ekspansji Taylora, bez względu na to, jak daleko ten punkt jest od centrum ekspansji. W przypadku innych form funkcjonalnych (w tym logarytmu) punkt zainteresowania powinien leżeć nieco „blisko” wybranego centrum ekspansji. W przypadku, gdy mamy wartość RV, przekłada się to na ograniczenie teoretycznego wsparcia zmiennej (lub badanie jej obserwowanego empirycznie zakresu).
Loitl, wykorzystując przykłady numeryczne, pokazał również, że zwiększenie kolejności rozszerzenia przed obcięciem może pogorszyć dokładność przybliżenia. Należy zauważyć, że empirycznie szeregi czasowe obserwowanych zmiennych w sektorze finansowym wykazują zmienność większą niż wymagana przez nierówność. Dlatego Loitl opowiadał się za tym, aby metodologię aproksymacji szeregu Taylora całkowicie odrzucić, w odniesieniu do teorii wyboru portfela.
Odbicie nastąpiło 18 lat później od Hlawitschki (1994) . Cenny wgląd i wynik tutaj był i cytuję
Więc gdzie nas to opuszcza? Powiedziałbym, że w zawieszeniu. Wydaje się, że zarówno w teorii, jak i empiryce, akceptacja przybliżenia Taylora drugiego rzędu zależy krytycznie od wielu różnych aspektów badanego specyficznego zjawiska i zastosowanej metodologii naukowej - zależy od założeń teoretycznych, użytych form funkcjonalnych, na zaobserwowaną zmienność szeregu ...
Ale zakończmy to pozytywnie: w dzisiejszych czasach moc komputera zastępuje wiele rzeczy. Możemy więc symulować i testować poprawność aproksymacji drugiego rzędu dla szerokiego zakresu wartości zmiennej, niezależnie od tego, czy pracujemy nad zagadnieniem teoretycznym, czy empirycznym.
źródło
Nie rzeczywista odpowiedź, ale przykład pokazujący, że rzeczy nie są tak miłe i że potrzebne są dodatkowe hipotezy, aby ten wynik był prawdziwy.
PS. Czy ten przykład nie jest kontr-przykładem odpowiedzi Nicka? Kto się myli?
źródło
To nie jest kompletna odpowiedź, tylko inny sposób osiągnięcia przybliżenia drugiego rzędu.
źródło