Mam dane szeregów czasowych i użyłem jako modelu do dopasowania danych. jest wskaźnikiem zmienną losową, która jest albo 0 (gdy nie widzę rzadkie zdarzenie) lub 1 (gdy widzę rzadkie zjawisko). W oparciu o wcześniejsze obserwacje, które mam dla , mogę opracować model dla przy użyciu metodologii łańcucha Markowa o zmiennej długości. To pozwala mi symulować w okresie prognozy i daje ciąg zer i jedynek. Ponieważ jest to rzadkie wydarzenie, nie będę często widzieć . Potrafię prognozować i uzyskiwać przedziały prognozowania w oparciu o symulowane wartości dla .
Pytanie:
Jak mogę opracować wydajną procedurę symulacji, aby uwzględnić występowanie 1 w symulowanym w okresie prognozy? Muszę uzyskać średnią i przedziały prognozowania.
Prawdopodobieństwo zaobserwowania 1 jest zbyt małe, aby sądzić, że regularna symulacja Monte Carlo będzie w tym przypadku dobrze działać. Może mogę użyć „ważnego próbkowania”, ale nie jestem pewien, jak dokładnie.
Dziękuję Ci.
Odpowiedzi:
Po pierwsze rozważamy bardziej ogólny przypadek. Niech , gdzie A ∼ f A ( ⋅ ) i X ∼ f X ( ⋅ ) . Następnie, zakładając, że podparcie g x ( ⋅ ) dominuje nad jedną z f X ( ⋅ ) i wszystkie poniższe całki istnieją, mamy: P ( Y ≤ y ) = E f A , fY= Y( A , X) A ∼ fZA( ⋅ ) X∼ fX( ⋅ ) solx( ⋅ ) faX( ⋅ )
W danym przypadku i g X ( ⋅ ) można zdefiniować w następujący sposób: g x ( x ) = { 0,5 x = 1 0,5 x = 0 Dlatego może symulować X poprzez rozkład g X ( ⋅ ) , ale wszystkie obserwacje z X = 1
źródło