Ekonometria bayesowskiego podejścia do metodologii badania zdarzeń

11

Badania zdarzeń są szeroko rozpowszechnione w ekonomii i finansach w celu ustalenia wpływu zdarzenia na cenę akcji, ale prawie zawsze opierają się na częstych wnioskach. Regresja OLS - w okresie referencyjnym innym niż okno zdarzenia - jest zwykle stosowana do określenia parametrów wymaganych do modelowania normalnego zwrotu z aktywów. Następnie określa się istotność statystyczną skumulowanych nieprawidłowych zwrotów ( ) na zasobie po zdarzeniu podczas określonego okna zdarzeń od do . Test hipotezy służy do ustalenia, czy zwroty te są znaczące, a zatem czy rzeczywiście nieprawidłowe. A zatem:i T 1 T 2CARiT1T2

H0:CARi=0 , gdzie

CARi=t=T1T2ARi,t=t=T1T2(ri,tE[ri,t]) i

E[ri,t] to zwrot z zasobu przewidziany przez model.

Jeśli nasza liczba obserwacji jest wystarczająco duża, możemy założyć asymptotyczną normalność rozkładu zwrotów z aktywów, ale nie można tego zweryfikować dla mniejszej próby.

Można argumentować, że z tego powodu badania pojedynczych firm i pojedynczych zdarzeń (jak wymagane na przykład w sporach sądowych) powinny być zgodne z podejściem bayesowskim, ponieważ założenie o nieskończenie wielu powtórzeniach jest znacznie „dalekie od weryfikacji” niż w przypadku wielu firm. Jednak częste podejście pozostaje powszechną praktyką.

Biorąc pod uwagę ograniczoną literaturę na ten temat, moje pytanie brzmi: jak najlepiej podejść do badania zdarzeń - analogicznie do metodologii przedstawionej powyżej i streszczonej w MacKinlay, 1997 - stosując podejście bayesowskie.

Chociaż pytanie to powstaje w kontekście empirycznych finansów przedsiębiorstw, tak naprawdę dotyczy ekonometrii regresji i wnioskowania bayesowskiego oraz różnic w rozumowaniu stojących za podejściem częstokrzyskim i bayesowskim. Konkretnie:

  1. Jak najlepiej podejść do oszacowania parametrów modelu, stosując podejście bayesowskie (zakładając teoretyczne zrozumienie statystyki bayesowskiej, ale bez doświadczenia w stosowaniu go do badań empirycznych).

  2. Jak przetestować istotność statystyczną po obliczeniu skumulowanych nieprawidłowych zwrotów (przy użyciu normalnych zwrotów z modelu)?

  3. Jak można to zaimplementować w Matlabie?

Constantin
źródło
1
(1.) jest prosty: użyj regresji liniowej Bayesa . (2.) jest trudniejsze, ponieważ testowanie istotności nie jest kwestią bayesowską. Jedyne, co możesz zrobić, to porównać prawdopodobieństwo różnych modeli, a nie jest podstawą modelu, ponieważ nie jest parametrem modelu. Jaki jest cel ? Jakie decyzje są podejmowane na jego podstawie? CAR CARCAR=0CARCAR
Andy Jones,
Szukam dowodów na poparcie mojego założenia, że ​​badane zdarzenie ma wpływ na cenę akcji (w którym to przypadku różni się od zera, ponieważ jest obliczane w oknie zdarzeń w stosunku do normalnego zwrotu, który jest obliczone dla okresu referencyjnego przed zdarzeniem). Interesuje mnie, czy dane potwierdzają hipotezę, że rzeczywiście istnieje niezerowy współczynnik a także jego wielkość. Zdaję sobie sprawę, że znaczenie statystyczne nie jest tak naprawdę w statystyce bayesowskiej, ale jaką interpretację oferuje ta metoda? Czy mogę zastosować testowy odpowiednik hipotezy? C A RCARCAR
Constantin,
2
Jeśli chcesz argumentować, że podejście bayesowskie jest bardziej odpowiednie dla małych próbek o wielkości , to nieuniknione jest, że przedtem mówić zbyt głośno z taką próbką. n=1
StasK
Czy nie mogę użyć nieinformacyjnego przeora?
Constantin

Odpowiedzi:

5

Jak wspomniano w komentarzach, modelem, którego szukasz, jest regresja liniowa Bayesa . A ponieważ możemy użyć BLR do obliczenia tylnego rozkładu predykcyjnego dla dowolnego czasu , możemy liczbowo ocenić rozkład .t p ( zdarzenie CAR | D , D ref )p(rt|t,Dref)tp(CAR|Devent,Dref)

Chodzi o to, że nie sądzę, że dystrybucja w jest tym, czego naprawdę chcesz. Bezpośrednim problemem jest to, że ma prawdopodobieństwo zerowe. Podstawowym problemem jest to, że „Bayesowska wersja testów hipotez” porównuje modele według ich współczynnika Bayesa , ale wymaga to zdefiniowania dwóch konkurencyjnych modeli. I nie są modelami (a przynajmniej nie są modelami bez wyjątkowo nienaturalnego żonglowania liczbami).p ( zdarzenie CAR = 0 | D , D ref ) CAR = 0 , CAR 0CARp(CAR=0|Devent,Dref)CAR=0,CAR0

Z tego, co powiedziałeś w komentarzach, myślę, że tak naprawdę chcesz odpowiedzieć

Czy i lepiej wyjaśnić tym samym modelem lub różnymi?Zdarzenie D ref D.DrefDevent

która ma zgrabną odpowiedź bayesowską: zdefiniuj dwa modele

  • M0 : wszystkie dane w są pobierane z tego samego BLR. Aby obliczyć krańcowe prawdopodobieństwo tego modelu, należy obliczyć krańcowe prawdopodobieństwo BLR pasującego do wszystkich dane.Dref,Deventp(Dref,Devent|M0)

  • M1 : dane w i pochodzą z dwóch różnych BLR. Aby obliczyć krańcowe prawdopodobieństwo tego modelu, dopasuj BLR do i niezależnie (choć używając tych samych hiperparametrów!), a następnie weź iloczyn dwóch krańcowych prawdopodobieństw BLR.DrefDeventp(Dref,Devent|M1)DrefDevent

Po wykonaniu tej czynności możesz następnie obliczyć współczynnik Bayesa

p(Dref,Devent|M1)p(Dref,Devent|M0)

zdecydować, który model jest bardziej wiarygodny.

Andy Jones
źródło
Nie sądzę, aby osobny model dla okresu zdarzenia miałby bezpośrednie zastosowanie do mojego konkretnego pytania badawczego, ponieważ nie ma innego czynnika ryzyka, który mógłbym dodać, aby wyjaśnić zwrot w oknie zdarzenia. Patrzę na to zdarzenie jako zaburzenie w stosunku do normalnego zwrotu z mojego modelu wyceny aktywów, więc porównanie dwóch modeli nie jest tak naprawdę możliwe. Czy nie można zbudować przedziału ufności dla ? W ten sposób mogłem sprawdzić, czy 0 mieści się w określonym przedziale dotyczącym oszacowania ML, nie? CAR
Constantin
Bayesowski wariant przedziałów ufności jest przedziałem wiarygodnym i tak, możesz użyć rozkładu aby go zbudować. To jednak nie jest test hipotez. CAR
Andy Jones,
1
Myślę, że źle wytłumaczyłem ten sam model / różne modele - powyżej, co miałem na myśli przez „inny model”, były „różne parametry”. W jeden zestaw parametrów służy do wyjaśnienia wszystkich danych. W jeden zestaw parametrów służy do wyjaśnienia danych treningowych, a drugi do wyjaśnienia danych testowych. Jest to rzetelne porównanie, ponieważ chociaż ma dwa razy więcej parametrów, które może zmieścić w danych (zwiększając swoje prawdopodobieństwo marignal), wyciąga dwa razy więcej parametrów z wcześniejszego (co karane jest jego krańcowe prawdopodobieństwo). M0M1M1
Andy Jones,
OK, rozumiem. To naprawdę wydaje się eleganckie. Jak dokładnie mam określić dwa modele? Czy mógłbyś polecić jakąkolwiek literaturę lub pokrewne pojęcia do szczegółowego przestudiowania?
Constantin
1
Chociaż jest to kontrowersyjne, istnieje coś takiego jak zerowy punkt Bayesa lub test ostrej hipotezy. Jest to tylko prosty iloraz szans z nieciągłym poprzedzeniem w . Jest to kontrowersyjne, ponieważ większość modeli nie daje dobrego uzasadnienia dla połączenia ciągłych i dyskretnych priorytetów. Badania zdarzeń są możliwym wyjątkiem od tej reguły. CARi=0
jayk
2

Nie możesz zrobić badania wydarzenia w jednej firmie.

Niestety potrzebne są dane panelowe do każdego badania zdarzenia. Badania zdarzeń skupiają się na zwrotach dla poszczególnych okresów przed i po wydarzeniach. Bez wielu jednoznacznych obserwacji w przedziale czasowym przed i po zdarzeniu niemożliwe jest odróżnienie hałasu (odmiany specyficznej dla firmy) od skutków zdarzenia. Jak wskazuje StasK, nawet przy nielicznych firmach hałas zdominuje wydarzenia.

To powiedziawszy, dzięki panelowi wielu firm nadal możesz wykonywać pracę bayesowską.

Jak oszacować normalne i nienormalne zwroty

Zakładam, że model używany do normalnych zwrotów wygląda jak standardowy model arbitrażu. Jeśli tak nie jest, powinieneś być w stanie dostosować resztę tej dyskusji. Będziesz chciał rozszerzyć swoją „normalną” regresję zwrotu o serię manekinów dla daty względem daty ogłoszenia, :S

rit=αi+γtS+rm,tTβi+eit

EDYCJA: Powinno być tak, że jest uwzględnione tylko wtedy, gdy . Jednym z problemów związanych z tym problemem w tym podejściu jest to, że będzie informowany przez dane przed i po wydarzeniu. Nie odwzorowuje to dokładnie tradycyjnych badań zdarzeń, w których oczekiwane zwroty są obliczane tylko przed wydarzeniem.γss>0βi

Ta regresja pozwala mówić o czymś podobnym do tego, co zwykle widzimy w serii CAR, gdzie mamy wykres średnich nienormalnych zwrotów przed i po zdarzeniu, z pewnymi standardowymi błędami wokół niego:

wprowadź opis zdjęcia tutaj

( bezwstydnie zaczerpnięte z Wikipedii )

Musisz wymyślić strukturę rozkładu i błędów dla , prawdopodobnie normalnie rozłożoną, z pewną strukturą wariancji-ko-wariancji. Następnie możesz skonfigurować wcześniejszą dystrybucję dla , i i uruchomić regresję liniową Bayesa, jak wspomniano powyżej.eitαiβiγs

Badanie efektów ogłoszenia

W dniu ogłoszenia uzasadnione jest przypuszczenie, że mogą wystąpić nietypowe zwroty ( ). Właśnie pojawiły się nowe informacje na rynku, więc reakcje na ogół nie stanowią pogwałcenia jakichkolwiek twierdzeń o arbitrażu lub wydajności. Ani ty, ani ja nie wiemy, jakie prawdopodobnie będą skutki ogłoszenia. Nie zawsze jest też wiele wskazówek teoretycznych. Dlatego testowanie może wymagać znacznie bardziej szczegółowej wiedzy niż mamy do dyspozycji (patrz poniżej).γ00γ0=0

z analizy bayesowskiej jest to, że można zbadać cały rozkład tylny . Dzięki temu możesz odpowiedzieć na bardziej interesujące pytania, takie jak „Jak prawdopodobne jest, że zapowiedź przekroczenia zwrotu jest ujemna?” W przypadku nienormalnych zwrotów w dniu ogłoszenia sugerowałbym zrezygnowanie z rygorystycznych testów hipotez. I tak ich nie interesujesz - w większości badań wydarzeń naprawdę chcesz wiedzieć, jaka może być reakcja cenowa na ogłoszenie, a nie to, czym nie jest!γ0

W tym duchu jednym interesującym podsumowaniem twoich może być prawdopodobieństwo, że . Innym może być prawdopodobieństwo, że jest wyższa niż różne wartości progowe, lub kwantyle rozkładu tylnego dla . Na koniec możesz zawsze wykreślić tylną wartość parametru wraz z jego średnią, medianą i trybem. Ale znowu ścisłe testy hipotez mogą nie być tym, czego chcesz.γ00γ0γ0γ0

Jednak w przypadku dat przed ogłoszeniem i po nim ścisłe testowanie hipotez może odgrywać ważną rolę, ponieważ zwroty te można postrzegać jako testy skuteczności silnych i półsilnych form

Testowanie pod kątem naruszenia wydajności półsilnej formy

Na wpół silna forma i absurd kosztów transakcji sugerują, że ceny akcji nie powinny dalej dostosowywać się po ogłoszeniu wydarzenia. Odpowiada to przecięciu ostrych hipotez, że .γs>0=0

Bayesianie się niekomfortowo z testami tej formy, , zwanymi testami „ostrymi”. Czemu? Wyjmijmy to na chwilę z kontekstu finansów. Gdybym poprosił Cię, tworząc przed ponad przeciętnego dochodu obywateli amerykańskich, byś prawdopodobnie dać mi ciągłą dystrybucję, nad ewentualnych dochodów, może sięgnie około $ 60.000. Jeśli następnie weźmiesz próbkę amerykańskich dochodów i spróbujesz przetestować hipotezę, że średnia populacji wynosi dokładnie , użyłbyś współczynnika Bayesa:γs=0x¯fX={xi}i=1n $60,000

P(x¯=$60,000|X)=x¯=$60,000P(X)f(x¯)x¯$60,000P(X)f(x¯)

Całka na górze wynosi zero, ponieważ prawdopodobieństwo pojedynczego punktu z ciągłego wcześniejszego rozkładu wynosi zero. Całka na dole wynosiłaby 1, więc . Dzieje się tak z powodu ciągłego przejęcia , a nie z powodu czegoś istotnego w naturze wnioskowania bayesowskiego.P(x¯=$60,000|X)=0

Pod wieloma względami testy są testami wyceny aktywów. Ceny aktywów są dziwne dla Bayesian. Dlaczego to jest dziwne? Ponieważ, w przeciwieństwie do moich wcześniejszych dochodów, ścisłe zastosowanie niektórych hipotez dotyczących wydajności przewiduje przechwycenie dokładnie 0 po zdarzeniu. Wszelkie dodatnie lub ujemne stanowią naruszenie częściowo silnej wydajności formy i potencjalnie stanowią ogromną szansę na osiągnięcie zysku. Prawidłowy przeor może więc dać dodatnie prawdopodobieństwo na . Dokładnie takie podejście przyjęli Harvey i Zhou (1990) . Mówiąc bardziej ogólnie, wyobraź sobie, że masz przeora z dwiema częściami. Z prawdopodobieństwem wierzysz w wysoką wydajność (γs>0=0γs>0γs>0=0pγs0=0) i z prawdopodobieństwem nie wierzysz w wysoką wydajność. , że znajomość silnej formy jest fałszywa, uważasz, że istnieje ciągła dystrybucja w , . Następnie możesz skonstruować test Bayesa:1pγs>0f

P(γs>0=0|data)=P(data|γs>0=0)pγs>00P(data|γs>0)(1p)f(γs>0)>0

Ten test działa, ponieważ pod warunkiem spełnienia warunku silnej formy będziesz wiedział, że . γs>0=0W tym przypadku twój przeor jest teraz mieszanką ciągłych i dyskretnych rozkładów.

To, że istnieje ostry test, nie wyklucza korzystania z bardziej subtelnych testów. Nie ma powodu, dla którego nie można zbadać rozkładu taki sam sposób, jaki zasugerowałem dla . Może to być bardziej interesujące, zwłaszcza że nie zależy to od przekonania, że ​​koszty transakcji nie istnieją. Można tworzyć przedziały wiarygodności, a na podstawie przekonań dotyczących kosztów transakcji można zbudować testy modelowe na podstawie przedziałów . Idąc za Bravem (2000) , można również przewidywać gęstości na podstawie „normalnego” modelu zwrotu ( ) w celu porównania z rzeczywistymi zwrotami, jako pomost między metodami bayesowskimi i częstymi. γ s = 0 γ s > 0 γ s = 0γs>0γs=0γs>0γs=0

Skumulowane nieprawidłowe wyniki

Jak dotąd wszystko było dyskusją o nienormalnych zwrotach. Więc zamierzam szybko przejść do CAR:

CARτ=t=0τγt

Jest to bliski odpowiednik średnich skumulowanych nienormalnych zwrotów opartych na resztkach, do których jesteś przyzwyczajony. Możesz znaleźć rozkład tylny za pomocą integracji numerycznej lub analitycznej, w zależności od twojego wcześniejszego. Ponieważ nie ma powodu, aby zakładać , nie ma powodu, aby zakładać , więc zalecałbym taką samą analizę jak w przypadku efektów ogłoszenia, bez ostrych testów hipotez.CAR t > 0 = 0γ0=0CARt>0=0

Jak wdrożyć w Matlabie

Aby uzyskać prostą wersję tych modeli, potrzebujesz zwykłej starej regresji liniowej Bayesa. Nie używam Matlab, ale wygląda na to, że jest to wersja tutaj . Prawdopodobnie działa to tylko w przypadku sprzężonych priorów.

W przypadku bardziej skomplikowanych wersji, na przykład testu ostrej hipotezy, prawdopodobnie potrzebujesz próbnika Gibbsa. Nie znam żadnych gotowych rozwiązań dla Matlaba. Możesz sprawdzić interfejsy do JAGS lub BŁĘDÓW.

jayk
źródło
Dziękuję za tę obszerną i bardzo pomocną odpowiedź! O twoim pierwszym punkcie: czy tak jest nawet jeśli jestem zainteresowany jedynie wpływem określonego ustawodawstwa na konkretną firmę (tj. Efektem zdarzenia tylko dla małej liczby firmn1 )? Jeśli w tym przypadku nadal konieczne jest zwiększenie wielkości próby, ile firm będzie wymaganych i jak powinienem je wybrać?
Constantin
Skutek określonego ustawodawstwa może być niemożliwy do znalezienia. Jeśli jest to prawo stosowane (powiedzmy) w konkretnej branży, trudno będzie oddzielić trendy branżowe od ustawodawstwa. Zdecydowanie poleciłbym, jeśli to możliwe, ponad 30 firm. Zawsze możesz sprawdzić, czy twój poprzedni i tylny są bardzo różni. Jeśli twój tył nie zmienił się znacznie w stosunku do wcześniejszego, prawdopodobnie próbka jest za mała.
jayk
Czy zdarza ci się być w stanie podać mi referencję do badania zdarzenia, które wykorzystuje zmienne fikcyjne dla dat przed / po zdarzeniu? Dotychczas nie udało mi się znaleźć tej metodologii w literaturze. Byłbym bardzo wdzięczny!
Constantin,
Nie widziałem żadnej, ale myślę, że metoda ma sens w kontekście (z zastrzeżeniami, które na nią postawiłem). Alternatywą byłoby oszacowanie parametrów w terminach przed ogłoszeniem, a następnie użycie a posteriora do generowania zwrotów w przyszłości, jak w wyżej wspomnianym artykule Brav.
jayk