Oczekiwanie na maksimum zmiennych iid Gumbela

12

Ciągle czytam w czasopismach ekonomicznych o konkretnym wyniku stosowanym w losowych modelach użytkowych. Jedna wersja wyniku to: jeśli Gumbel ( , to:ϵiiid,μ,1),i

E[maxi(δi+ϵi)]=μ+γ+ln(iexp{δi}),

gdzie γ0.52277 jest stałą Eulera-Mascheroniego. Sprawdziłem, czy ma to sens przy użyciu R i tak jest. CDF dla dystrybucji Gumbela (μ,1) to:

G(ϵi)=exp(exp((ϵiμ)))

Próbuję znaleźć na to dowód i nie odniosłem sukcesu. Próbowałem to udowodnić sam, ale nie mogę przejść obok określonego kroku.

Czy ktoś może wskazać mi na to dowód? Jeśli nie, może uda mi się wysłać próbę do miejsca, w którym utknąłem.

Jason
źródło

Odpowiedzi:

7

Doceniam pracę pokazaną w twojej odpowiedzi: dziękuję za ten wkład. Celem tego postu jest zapewnienie prostszej demonstracji. Wartością prostoty jest objawienie: możemy z łatwością uzyskać cały rozkład maksimum, a nie tylko jego oczekiwania.


Zignoruj , wchłaniając go do i zakładając, że mają rozkład . (Oznacza to, że zamień każdy na i zmień na .) To nie zmienia losowej zmiennejμδiϵi(0,1)ϵiϵiμδiδi+μ

X=maxi(δi+ϵi)=maxi((δi+μ)+(ϵiμ)).

Niezależność oznacza dla wszystkich rzeczywistych że jest iloczynem indywidualnych szans . Zapisywanie logów i stosowanie podstawowych właściwości wykładniczych dajeϵixPr(Xx)Pr(δi+ϵix)

logPr(Xx)=logiPr(δi+ϵix)=ilogPr(ϵixδi)=ieδiex=exp(x+logieδi).

To jest logarytm CDF rozkładu Gumbela z parametrem lokalizacji To jest,λ=logieδi.

X ma .(logieδi,1)

To o wiele więcej informacji niż wymagane. Średnią takiego rozkładu jest pociągające za sobąγ+λ,

E[X]=γ+logieδi,

CO BYŁO DO OKAZANIA.

Whuber
źródło
12

Okazuje się, że Econometrica artykuł Kenneth Małych i Harvey Rosen pokazał to w 1981 roku, ale w bardzo specyficzny kontekst więc wynik wymaga dużo kopania, nie wspominając niektóre szkolenia w dziedzinie ekonomii. Postanowiłem to udowodnić w sposób, który uważam za bardziej dostępny.

Dowód : Niech będzie liczbą alternatyw. W zależności od wartości wektora , funkcja przyjmuje różne wartości. Najpierw skup się na wartościach takich jak . Oznacza to, że zintegrujemy z zestawem :Jϵ={ϵ1,...,ϵJ}maxi(δi+ϵi)ϵmaxi(δi+ϵi)=δ1+ϵ1δ1+ϵ1M1{ϵ:δ1+ϵ1>δj+ϵj,j1}

EϵM1[maxi(δi+ϵi)]=(δ1+ϵ1)f(ϵ1)[δ1+ϵ1δ2...δ1+ϵ1δJf(ϵ2)...f(ϵJ)dϵ2...dϵJ]dϵ1=(δ1+ϵ1)f(ϵ1)(δ1+ϵ1δ2f(ϵ2)dϵ2)...(δ1+ϵ1δJf(ϵJ)dϵJ)dϵ1=(δ1+ϵ1)f(ϵ1)F(δ1+ϵ1δ2)...F(δ1+ϵ1δJ)dϵ1

Powyższy termin jest pierwszym z takich terminów w . Konkretnie,JE[maxi(δi+ϵi)]

E[maxi(δi+ϵi)]=iEϵMi[maxi(δi+ϵi)].

Teraz stosujemy funkcjonalną formę rozkładu Gumbela. To daje

EϵMi[maxi(δi+ϵi)]=(δi+ϵi)eμϵieeμϵijieeμϵi+δjδidϵi=(δi+ϵi)eμϵijeeμϵi+δjδidϵi=(δi+ϵi)eμϵiexp{jeμϵi+δjδi}dϵi=(δi+ϵi)eμϵiexp{eμϵijeδjδi}dϵi

gdzie drugi krok polega na zebraniu jednego z wyrażeń potęgowanych do produktu, wraz z faktem, że jeśli .δjδi=0i=j

Teraz zdefiniujemy i podstawienia , aby i . Zauważ, że gdy zbliża się do nieskończoności, zbliża się do 0, a gdy zbliża się do nieskończoności, zbliża się do nieskończoności. Dijeδjδix=Dieμϵidx=DieμϵidϵidxDi=eμϵidϵiϵi=μlog(xDi)ϵixϵix

EϵMi[maxi(δi+ϵi)]=0(δi+μlog[xDi])(1Di)exp{x}dx=1Di0(δi+μlog[xDi])exdx=δi+μDi0exdx1Di0log[x]exdx+log[Di]Di0exdx

Funkcja Gamma jest zdefiniowana jako . Dla wartości które są dodatnimi liczbami całkowitymi, jest to równoważne, więc . Ponadto wiadomo, że stała Eulera – Mascheroniego, spełniaΓ(t)=0xt1exdxtΓ(t)=(t1)!Γ(1)=0!=1γ0.57722

γ=0log[x]exdx.

Zastosowanie tych faktów daje

EϵMi[maxi(δi+ϵi)]=δi+μ+γ+log[Di]Di

Następnie sumujemy ponad aby uzyskaći

E[maxi(δi+ϵi)]=iδi+μ+γ+log[Di]Di

Przypomnij sobie, że . Zauważ, że znane prawdopodobieństwa wyboru są odwrotnością , lub innymi słowy . Zauważ też, że . Następnie mamyDi=jeδjδi=jeδjeδiPi=eδijδjDiPi=1/DiiPi=1

E[maxi(δi+ϵi)]=iPi(δi+μ+γ+log[Di])=(μ+γ)iPi+iPiδi+iPilog[Di]=μ+γ+iPiδi+iPilog[jeδjeδi]=μ+γ+iPiδi+iPilog[jeδj]iPilog[eδi]=μ+γ+iPiδi+log[jeδj]iPiiPiδi=μ+γ+log[jexp{δj}].
QED
Jason
źródło
3
Połączyłem to, co uważam za artykuł, do którego się odwołujesz, bez faktycznego przeglądania go; proszę poprawić, jeśli źle.
Dougal
@Jason Czy wiesz, jak to udowodnić, gdy maksimum jest uzależnione od tego, że maksimum jest maksymalne? Zobacz nierozwiązane pytanie
wolfsatthedoor