Modele monet tendencyjnych mają zwykle jeden parametr . Jednym ze sposobów oszacowania z serii losowań jest użycie wcześniejszej wersji beta i obliczenie rozkładu tylnej z prawdopodobieństwem dwumianowym.θ
W moich ustawieniach, z powodu jakiegoś dziwnego procesu fizycznego, moje właściwości monety powoli się zmieniają i staje się funkcją czasu . Moje dane to zestaw uporządkowanych losowań, tj. . Mogę wziąć pod uwagę, że mam tylko jedno losowanie dla każdego na dyskretnej i regularnej siatce czasu.t { H , T , H , H , H , t , . . . } t
Jak byś to wymodelował? Myślę o czymś takim jak filtr Kalmana dostosowany do faktu, że ukryta zmienna to i zachowuje prawdopodobieństwo dwumianowe. Czego mógłbym użyć do modelowania aby utrzymać możliwość wnioskowania?P ( θ ( t + 1 ) | θ ( t ) )
Edytuj następujące odpowiedzi (dzięki!) : Chciałbym modelować jako łańcuch Markowa rzędu 1, tak jak w filtrach HMM lub Kalmana. Mogę jedynie założyć, że jest płynne. Mógłbym napisać z małym szumem gaussowskim (pomysł na filtr Kalmana), ale to złamałoby wymaganie, że musi pozostać w . Zgodnie z pomysłem @J Dav, mogłem użyć funkcji probit do mapowania linii rzeczywistej na , ale mam intuicję, że dałoby to rozwiązanie nieanalityczne. Rozkład beta ze średniąθ ( t ) P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ ϵ θ [ 0 , 1 ] [ 0 , 1 ] θ ( t ) i większa wariancja może załatwić sprawę.
Zadaję to pytanie, ponieważ mam wrażenie, że ten problem jest tak prosty, że trzeba go było wcześniej zbadać.
źródło
Odpowiedzi:
Wątpię, czy możesz wymyślić model z rozwiązaniem analitycznym, ale wnioskowanie można nadal uczynić możliwym do przyjęcia przy użyciu odpowiednich narzędzi, ponieważ struktura zależności twojego modelu jest prosta. Jako badacz uczenia maszynowego wolałbym używać następującego modelu, ponieważ wnioskowanie można uczynić całkiem wydajnym przy użyciu techniki propagacji oczekiwań:
Niech będzie wynikiem tej próby. Zdefiniujmy parametr zmieniający się w czasieX(t) t
tη(t+1)∼N(η(t),τ2) dla .t≥0
Aby połączyć z , wprowadź zmienne ukryteX ( t )η(t) X(t)
i model zaX(t)
Y ( t ) ≥ 0 X ( t ) = 0 Y ( t ) P [ X ( t ) = 1 ] = Φ ( η ( t ) / β ) Φ θ ( t ) = η ( t ) / βX(t)=1 jeśli , a przeciwnym razie. Możesz faktycznie zignorować i zmarginalizować je, aby powiedzieć , (z cdf z standard normal), ale wprowadzenie ukrytych zmiennych ułatwia wnioskowanie. Zauważ też, że w oryginalnej parametryzacji .Y(t)≥0 X(t)=0 Y(t) P[X(t)=1]=Φ(η(t)/β) Φ θ(t)=η(t)/β
Jeśli jesteś zainteresowany implementacją algorytmu wnioskowania, spójrz na ten artykuł . Używają bardzo podobnego modelu, dzięki czemu można łatwo dostosować algorytm. Aby zrozumieć EP, poniższa strona może okazać się przydatna. Jeśli jesteś zainteresowany stosowaniem tego podejścia, daj mi znać; Mogę udzielić bardziej szczegółowych porad dotyczących implementacji algorytmu wnioskowania.
źródło
Aby rozwinąć mój komentarz, model taki jak p (t) = p exp (-t) jest modelem, który jest prosty i umożliwia oszacowanie p (t) poprzez oszacowanie p przy użyciu oszacowania maksymalnego prawdopodobieństwa. Ale czy prawdopodobieństwo naprawdę maleje wykładniczo. Ten model byłby wyraźnie błędny, jeśli obserwujesz okresy z dużą częstotliwością sukcesu, niż zaobserwowałeś wcześniej i później. Zachowanie oscylacyjne można modelować jako p (t) = p | sint |. Oba modele są bardzo łatwe w obsłudze i można je rozwiązać przy maksymalnym prawdopodobieństwie, ale dają bardzo różne rozwiązania.0 00 0 0
źródło
Aby odpowiedzieć na ponownie edytowane pytanie:
Jak powiedziałeś, użycie probit oznaczałoby tylko rozwiązania numeryczne, ale zamiast tego możesz użyć funkcji logistycznej:
źródło