Jak modelować monetę z tendencją do zmian w czasie?

10

Modele monet tendencyjnych mają zwykle jeden parametr . Jednym ze sposobów oszacowania z serii losowań jest użycie wcześniejszej wersji beta i obliczenie rozkładu tylnej z prawdopodobieństwem dwumianowym.θθ=P(Head|θ)θ

W moich ustawieniach, z powodu jakiegoś dziwnego procesu fizycznego, moje właściwości monety powoli się zmieniają i staje się funkcją czasu . Moje dane to zestaw uporządkowanych losowań, tj. . Mogę wziąć pod uwagę, że mam tylko jedno losowanie dla każdego na dyskretnej i regularnej siatce czasu.t { H , T , H , H , H , t , . . . } tθt{H,T,H,H,H,T,...}t

Jak byś to wymodelował? Myślę o czymś takim jak filtr Kalmana dostosowany do faktu, że ukryta zmienna to i zachowuje prawdopodobieństwo dwumianowe. Czego mógłbym użyć do modelowania aby utrzymać możliwość wnioskowania?P ( θ ( t + 1 ) | θ ( t ) )θP(θ(t+1)|θ(t))

Edytuj następujące odpowiedzi (dzięki!) : Chciałbym modelować jako łańcuch Markowa rzędu 1, tak jak w filtrach HMM lub Kalmana. Mogę jedynie założyć, że jest płynne. Mógłbym napisać z małym szumem gaussowskim (pomysł na filtr Kalmana), ale to złamałoby wymaganie, że musi pozostać w . Zgodnie z pomysłem @J Dav, mogłem użyć funkcji probit do mapowania linii rzeczywistej na , ale mam intuicję, że dałoby to rozwiązanie nieanalityczne. Rozkład beta ze średniąθ ( t ) P ( θ ( t + 1 ) | θ ( t ) ) = θ ( t ) + ϵ ϵ θ [ 0 , 1 ] [ 0 , 1 ] θ ( t )θ(t)θ(t)P(θ(t+1)|θ(t))=θ(t)+ϵϵθ[0,1][0,1]θ(t) i większa wariancja może załatwić sprawę.

Zadaję to pytanie, ponieważ mam wrażenie, że ten problem jest tak prosty, że trzeba go było wcześniej zbadać.

odparł2
źródło
Możesz uzyskać oszacowanie, jeśli masz model, w jaki sposób proporcja sukcesu zmienia się z czasem. Działałoby wiele różnych modeli, a szacunki mogą się znacznie różnić w zależności od przyjętego modelu. Nie sądzę, aby wykonalność była praktycznym kryterium wyboru modelu. Chciałbym zrozumieć proces i poszukać modelu, który wykazuje cechy charakterystyczne, które są zgodne z oczekiwanym zachowaniem.
Michael R. Chernick
@MichaelChernick: Dzięki. Mogę jedynie założyć, że porusza się płynnie i powoli. Co więcej, łatwość obsługi jest ważnym kryterium, ponieważ tak naprawdę chcę rozszerzyć rozwiązanie na przypadek wielowymiarowy z nietrywialnymi zależnościami. Idealne rozwiązanie byłoby analityczne i dawałoby „online” aktualizację oszacowań parametrów, gdy pojawiają się nowe dane. θ
odpowiedział2 2
1
Czy potrafisz określić ilościowo, co masz na myśli „ porusza się płynnie i powoli?” Liczby całkowite są dyskretne i istnieją funkcje gładkie, które przyjmują dowolne wartości na liczbach całkowitych, co oznacza, że ​​gładkość nie daje żadnych ograniczeń. Niektóre pojęcia „powoli” nadal nie nakładają żadnych ograniczeń, podczas gdy inne tak. θ
Douglas Zare
Jak szybki jest „powoli”, jak zmiana prawdopodobieństwa 0,1 / jednostkę czasu lub 0,001 lub ... I jak długo oczekiwana jest sekwencja? Czy zakres jest stosunkowo wąski (np. 0,2–0,4), czy zbliża się do (0,1)?
łucznik
@DouglasZare Przez „gładki” chciałem stwierdzić, że E [θ_t + 1 | θ_t] = θ_t (lub bardzo blisko) i VAR (θ_t + 1 | θ_t) jest mały. θ nie skacze (w przeciwnym razie nic nie da się zrobić).
odpowiedział2 2

Odpowiedzi:

2

Wątpię, czy możesz wymyślić model z rozwiązaniem analitycznym, ale wnioskowanie można nadal uczynić możliwym do przyjęcia przy użyciu odpowiednich narzędzi, ponieważ struktura zależności twojego modelu jest prosta. Jako badacz uczenia maszynowego wolałbym używać następującego modelu, ponieważ wnioskowanie można uczynić całkiem wydajnym przy użyciu techniki propagacji oczekiwań:

Niech będzie wynikiem tej próby. Zdefiniujmy parametr zmieniający się w czasieX(t)t

tη(t+1)N(η(t),τ2) dla .t0

Aby połączyć z , wprowadź zmienne ukryteX ( t )η(t)X(t)

Y(t)N(η(t),β2) ,

i model zaX(t)

Y ( t ) 0 X ( t ) = 0 Y ( t ) P [ X ( t ) = 1 ] = Φ ( η ( t ) / β ) Φ θ ( t ) = η ( t ) / βX(t)=1 jeśli , a przeciwnym razie. Możesz faktycznie zignorować i zmarginalizować je, aby powiedzieć , (z cdf z standard normal), ale wprowadzenie ukrytych zmiennych ułatwia wnioskowanie. Zauważ też, że w oryginalnej parametryzacji .Y(t)0X(t)=0Y(t)P[X(t)=1]=Φ(η(t)/β)Φθ(t)=η(t)/β

Jeśli jesteś zainteresowany implementacją algorytmu wnioskowania, spójrz na ten artykuł . Używają bardzo podobnego modelu, dzięki czemu można łatwo dostosować algorytm. Aby zrozumieć EP, poniższa strona może okazać się przydatna. Jeśli jesteś zainteresowany stosowaniem tego podejścia, daj mi znać; Mogę udzielić bardziej szczegółowych porad dotyczących implementacji algorytmu wnioskowania.

d_ijk_stra
źródło
0

Aby rozwinąć mój komentarz, model taki jak p (t) = p exp (-t) jest modelem, który jest prosty i umożliwia oszacowanie p (t) poprzez oszacowanie p przy użyciu oszacowania maksymalnego prawdopodobieństwa. Ale czy prawdopodobieństwo naprawdę maleje wykładniczo. Ten model byłby wyraźnie błędny, jeśli obserwujesz okresy z dużą częstotliwością sukcesu, niż zaobserwowałeś wcześniej i później. Zachowanie oscylacyjne można modelować jako p (t) = p | sint |. Oba modele są bardzo łatwe w obsłudze i można je rozwiązać przy maksymalnym prawdopodobieństwie, ale dają bardzo różne rozwiązania.0 0000

Michael R. Chernick
źródło
1
Wygląda na to, że OP szuka modelu prawdopodobieństwa sukcesu w czasie , , jako procesu markowskiego, a nie określa jakiejś funkcjonalnej formy dla . θ ( t ) θ ( t )tθ(t)θ(t)
Makro
1
@macro ma rację, nie jestem w stanie podać postaci parametrycznej dla , i nie jest to pożądane, ponieważ ta funkcja może być cokolwiek gładka. Chcę model Markowa rzędu 1 podobny do Ukrytego modelu Markowa lub filtr Kalmana, ale z ukrytą zmienną, która przyjmuje rzeczywiste wartości od 0 do 1, i z prawdopodobieństwem Bernouilli. theta(t)
odpowiedział2 2
@pierre Okay przed edycją wydawało się, że chciałeś oszacować zmienny czas p i sugerowałeś tylko HMM jako możliwe podejście. Nie polecałem funkcjonalnej formy, ponieważ zmienia się ona wraz z t. Zwracałem uwagę, że bez dalszych informacji można by skonstruować wiele modeli różnych typów, a moje dwa przykłady miały pokazać, że bez dalszych informacji wybory modeli mogą dać bardzo różne odpowiedzi. Dlaczego miałbyś nalegać na HMM? Jeśli ktoś działał i pasował do twoich danych, odrzuć je, ponieważ jest to „nieanalityczne.”
Michael R. Chernick
Sugeruję, że znalezienie dogodnych rozwiązań nie jest sposobem na rozwiązanie praktycznych problemów statystycznych!
Michael R. Chernick
1
@MichaelChernick Wreszcie: Chciałbym znaleźć rozwiązanie analityczne, ponieważ mam nadzieję, że jest to dobrze znany problem i ludzie zaproponowali wystarczająco elastyczne rozwiązanie analityczne. Zgadzam się jednak z naszą sugestią, że modelowanie „rzeczywistej dynamiki” jest ważniejsze niż ogólnie koszt obliczeniowy. Niestety dotyczy to dużych
zbiorów
0

tp

p=Φ(g(t,θ))g(t,θ)Φ

Φg()g()

Aby odpowiedzieć na ponownie edytowane pytanie:

Jak powiedziałeś, użycie probit oznaczałoby tylko rozwiązania numeryczne, ale zamiast tego możesz użyć funkcji logistycznej:

P[θ(t+1)]=11+exp(θ(t)+ϵ)

logP1P=θ(t)+ϵ

θ(t+1)=at3+bt2+ct+dϵϵ

P[Coint+1=H|t]=11+exp(θ(t))

ϵt

JDav
źródło
Jeśli używasz probit, rozszerzenie wielowymiarowe jest proste, ponieważ można oszacować probit wielowymiarowy. Zależności wynikałyby z macierzy kowariancji implikowanego wielowymiarowego rozkładu normalnego.
JDav