Czy dwa kwantyle rozkładu beta określają jego parametry?

9

Jeśli podam dwa kwantyle i odpowiadające im lokalizacje (każdy) w przedziale otwartym , czy zawsze mogę znaleźć parametry rozkładu beta, który ma te kwantyle w określonych lokalizacjach?(q1,q2)(l1,l2)(0,1)

Bota
źródło
1
Nie, podstawowy kontrprzykład (q1, q2) = (0,1) i (l1, l2) = (0,1) bez względu na parametry.
Tim
1
@Tim Myślę, że rozumiem twój punkt widzenia, ale twój kontrprzykład nie spełnia określonych przeze mnie warunków (na przykład, że lokalizacje są w przedziale otwartym ). (0,1)
Bota,
1
Myślę, że możesz to zrobić numerycznie (i że będzie unikalne rozwiązanie), ale wymagałoby to trochę wysiłku.
Glen_b
1
Też tak myślę - rozwiązywanie liczb nie jest trudne, ale nie jest łatwo znaleźć argument za wyjątkowością.
Elvis
1
@Elvis, podejrzewam, że może istnieć sposób na sprawdzenie logów obu zmiennych ( i PO ). lq
Glen_b

Odpowiedzi:

9

Odpowiedź brzmi tak, pod warunkiem, że dane spełniają oczywiste wymagania dotyczące spójności. Argument jest prosty, oparty na prostej konstrukcji, ale wymaga pewnej konfiguracji. Sprowadza się to do intuicyjnie interesującego faktu: zwiększenie parametru w rozkładzie Beta zwiększa wartość jego gęstości (PDF) bardziej dla większych niż mniejszych ; a zwiększenie robi coś przeciwnego: im mniejsze , tym bardziej rośnie wartość pliku PDF.a(a,b)xxbx

Szczegóły podano poniżej.


Niech pożądanym kwantylem będzie a pożądanym kwantylem będzie z i (dlatego) . Wtedy istnieje unikalna i , dla których Beta podział ma te quantiles.q1x1q2x21>q2>q1>01>x2>x1>0ab(a,b)

Trudność z wykazaniem tego polega na tym, że rozkład Beta obejmuje oporną stałą normalizującą. Przypomnijmy definicję: dla i rozkład Beta ma funkcję gęstości (PDF)a>0b>0(a,b)

f(x;a,b)=1B(a,b)xa1(1x)b1.

Stałą normalizującą jest funkcja Beta

B(a,b)=01xa1(1x)b1dx=Γ(a)Γ(b)Γ(a+b).

Wszystko staje Messy jeśli spróbujemy do odróżnienia bezpośrednio w odniesieniu do i , co byłoby sposobem brute force próba demonstracji.f(x;a,b)ab

Jednym ze sposobów uniknięcia konieczności analizowania funkcji Beta jest zwrócenie uwagi, że kwantyle to obszary względne . To jest,

qi=F(xi;a,b)=0xif(x;a,b)dx01f(x;a,b)dx

dla . Oto, na przykład, PDF i funkcja dystrybucji skumulowanej (CDF) rozkładu Beta dla których i .i=1,2F(1.15,0.57)x1=1/3q1=1/6

Rycina 1

Funkcja gęstości jest wykreślona po lewej stronie. to obszar pod krzywą po lewej stronie , pokazany na czerwono, w stosunku do całkowitego obszaru pod krzywą. jest obszarem po lewej stronie , równym sumie obszarów czerwonych i niebieskich, ponownie w stosunku do całkowitego obszaru . CDF po prawej pokazuje, jak i zaznaczają na nim dwa odrębne punkty.xf(x;a,b)q1x1q2x2(x1,q1)(x2,q2)

Na tym rysunku ustalono na , wybrano na , a następnie znaleziono wartość dla której leży na Beta CDF.(x1,q1)(1/3,1/6)a1.15b(x1,q1)(a,b)

Lemma : Takie zawsze można znaleźć.b

Mówiąc konkretnie, niech zostanie naprawione raz na zawsze. (Pozostają takie same na poniższych ilustracjach: we wszystkich trzech przypadkach względny obszar po lewej stronie jest równy .) Dla dowolnego Lemma twierdzi, że istnieje unikalna wartość , zapisana dla których jest kwantylem rozkładu Beta .(x1,q1)x1q1a>0bb(a),x1q1(a,b(a))

Aby zobaczyć dlaczego, zauważ najpierw, że gdy zbliża się do zera, wszystkie prawdopodobieństwa zbliżają się do wartości , skąd zbliża się do . Gdy zbliża się do nieskończoności, wszystkie prawdopodobieństwa zbliżają się do wartości , skąd zbliża się do . W międzyczasie funkcja ściśle rośnie .b0F(x1;a,b)1b1F(x1;a,b)0bF(x1;a,b)b

To twierdzenie jest geometrycznie oczywiste: sprowadza się do powiedzenia, że ​​jeśli spojrzymy na obszar po lewej stronie pod krzywą stosunku do całkowitego pola pod krzywą i porównaj to do względnego obszaru pod krzywą dla , to ten drugi obszar jest stosunkowo większy. Stosunek tych dwóch funkcji wynosi . Jest to funkcja równa gdy stopniowo spada do gdy Dlatego wysokości funkcji są stosunkowo większexxa1(1x)b1 xxa1(1x)b1b>b(1x)bb1x=0,0x=1.xf(x;a,b)niż wysokości od dla na lewo od niż dla na prawo od W związku z tym obszar po lewej stronie w pierwszym musi być stosunkowo większy niż obszar po prawej stronie (Można to na przykład łatwo przełożyć na rygorystyczny argument przy użyciu sumy Riemanna).xf(x;a,b)xx1xx1.x1x1.

Zauważyliśmy, że funkcja rośnie ściśle monotonicznie z wartościami granicznymi odpowiednio i jako i . Jest także (wyraźnie) ciągły. W związku z tym istnieje liczba gdzie a liczba ta jest unikalna, co potwierdza lemat.bf(x1;a,b)01b0b,b(a)f(x1;a,b(a))=q1

Ten sam argument pokazuje, że wraz ze wzrostem zwiększa się obszar po lewej stronie . bx2 W związku z tym wartości zakres, w pewnym odstępie od liczby jak postępuje od prawie do prawie Limit jako wynosif(x2;a,b(a))a0.f(x2;a,b(a))a0q1.

Oto przykład, w którym jest bliskie (wynosi ). Przy i (jak na poprzednim rysunku), Pomiędzy a prawie nie ma obszarua00.1x1=1/3q1=1/6b(a)0.02.x1x2:

Rysunek 2

CDF jest praktycznie płaski między a skąd jest praktycznie na szczycie W limicie jako ,x1x2,q2q1.a0q2q1.

Na drugim końcu, na tyle duże wartości prowadzą do dowolnie blisko Oto przykład z jak poprzednio.aF(x2;a,b(a))1.(x1,q1)

Rycina 3

Tutaj i jest prawie Teraz jest w zasadzie prawie nie ma obszar na prawo oda=8b(a)10.F(x2;a,b(a))1:x2.

W związku z tym możesz wybrać dowolną między a i regulować aż Podobnie jak poprzednio, to musi być unikalny, QED .q2q11aF(x2;a,a(b))=q2.a


RKod roboczy znajdujący rozwiązania jest publikowany w części Określanie parametrów dystrybucji beta i z dwóch dowolnych punktów (kwantyli)αβ .

Whuber
źródło
Ta odpowiedź pokazuje, że jeśli wybraliśmy stałą lub , znajdziemy unikalną odpowiadającą jej wartość. Możliwe byłoby konstruowanie funkcji, które mają stały obszar w , i . Nie od razu rozumiem, dlaczego to gwarantuje, że zestaw i jest unikalny. Czy byłbyś gotów mnie rozwinąć i oświecić? ab[0,x1][x1,x2][x2,1]αβ
stycznia
@Jan Czy możesz wyjaśnić, co masz na myśli przez „zestaw i ”? Te symbole nie pojawiają się nigdzie w tym wątku. αβ
whuber