Jeśli podam dwa kwantyle i odpowiadające im lokalizacje (każdy) w przedziale otwartym , czy zawsze mogę znaleźć parametry rozkładu beta, który ma te kwantyle w określonych lokalizacjach?
9
Jeśli podam dwa kwantyle i odpowiadające im lokalizacje (każdy) w przedziale otwartym , czy zawsze mogę znaleźć parametry rozkładu beta, który ma te kwantyle w określonych lokalizacjach?
Odpowiedzi:
Odpowiedź brzmi tak, pod warunkiem, że dane spełniają oczywiste wymagania dotyczące spójności. Argument jest prosty, oparty na prostej konstrukcji, ale wymaga pewnej konfiguracji. Sprowadza się to do intuicyjnie interesującego faktu: zwiększenie parametru w rozkładzie Beta zwiększa wartość jego gęstości (PDF) bardziej dla większych niż mniejszych ; a zwiększenie robi coś przeciwnego: im mniejsze , tym bardziej rośnie wartość pliku PDF.za ( a , b ) x x b x
Szczegóły podano poniżej.
Trudność z wykazaniem tego polega na tym, że rozkład Beta obejmuje oporną stałą normalizującą. Przypomnijmy definicję: dla i rozkład Beta ma funkcję gęstości (PDF)a > 0 b > 0 ( a , b )
Stałą normalizującą jest funkcja Beta
Wszystko staje Messy jeśli spróbujemy do odróżnienia bezpośrednio w odniesieniu do i , co byłoby sposobem brute force próba demonstracji.fa( x ; a , b ) za b
Jednym ze sposobów uniknięcia konieczności analizowania funkcji Beta jest zwrócenie uwagi, że kwantyle to obszary względne . To jest,
dla . Oto, na przykład, PDF i funkcja dystrybucji skumulowanej (CDF) rozkładu Beta dla których i .i = 1 , 2 fa ( 1,15 ; 0,57 ) x1= 1 / 3 q1= 1 / 6
Funkcja gęstości jest wykreślona po lewej stronie. to obszar pod krzywą po lewej stronie , pokazany na czerwono, w stosunku do całkowitego obszaru pod krzywą. jest obszarem po lewej stronie , równym sumie obszarów czerwonych i niebieskich, ponownie w stosunku do całkowitego obszaru . CDF po prawej pokazuje, jak i zaznaczają na nim dwa odrębne punkty.x → f( x ; a , b ) q1 x1 q2 x2 (x1,q1) (x2,q2)
Na tym rysunku ustalono na , wybrano na , a następnie znaleziono wartość dla której leży na Beta CDF.(x1,q1) (1/3,1/6) a 1.15 b (x1,q1) (a,b)
Lemma : Takie zawsze można znaleźć.b
Mówiąc konkretnie, niech zostanie naprawione raz na zawsze. (Pozostają takie same na poniższych ilustracjach: we wszystkich trzech przypadkach względny obszar po lewej stronie jest równy .) Dla dowolnego Lemma twierdzi, że istnieje unikalna wartość , zapisana dla których jest kwantylem rozkładu Beta .(x1,q1) x1 q1 a>0 b b(a), x1 q1 (a,b(a))
Aby zobaczyć dlaczego, zauważ najpierw, że gdy zbliża się do zera, wszystkie prawdopodobieństwa zbliżają się do wartości , skąd zbliża się do . Gdy zbliża się do nieskończoności, wszystkie prawdopodobieństwa zbliżają się do wartości , skąd zbliża się do . W międzyczasie funkcja ściśle rośnie .b 0 F(x1;a,b) 1 b 1 F(x1;a,b) 0 b→F(x1;a,b) b
To twierdzenie jest geometrycznie oczywiste: sprowadza się do powiedzenia, że jeśli spojrzymy na obszar po lewej stronie pod krzywą stosunku do całkowitego pola pod krzywą i porównaj to do względnego obszaru pod krzywą dla , to ten drugi obszar jest stosunkowo większy. Stosunek tych dwóch funkcji wynosi . Jest to funkcja równa gdy stopniowo spada do gdy Dlatego wysokości funkcji są stosunkowo większex→xa−1(1−x)b−1 x→xa−1(1−x)b′−1 b′>b (1−x)b′−b 1 x=0, 0 x=1. x→f(x;a,b′) niż wysokości od dla na lewo od niż dla na prawo od W związku z tym obszar po lewej stronie w pierwszym musi być stosunkowo większy niż obszar po prawej stronie (Można to na przykład łatwo przełożyć na rygorystyczny argument przy użyciu sumy Riemanna).x→f(x;a,b) x x1 x x1. x1 x1.
Zauważyliśmy, że funkcja rośnie ściśle monotonicznie z wartościami granicznymi odpowiednio i jako i . Jest także (wyraźnie) ciągły. W związku z tym istnieje liczba gdzie a liczba ta jest unikalna, co potwierdza lemat.b→f(x1;a,b) 0 1 b→0 b→∞, b(a) f(x1;a,b(a))=q1
Ten sam argument pokazuje, że wraz ze wzrostem zwiększa się obszar po lewej stronie .b x2 W związku z tym wartości zakres, w pewnym odstępie od liczby jak postępuje od prawie do prawie Limit jako wynosif(x2;a,b(a)) a 0 ∞. f(x2;a,b(a)) a→0 q1.
Oto przykład, w którym jest bliskie (wynosi ). Przy i (jak na poprzednim rysunku), Pomiędzy a prawie nie ma obszarua 0 0.1 x1=1/3 q1=1/6 b(a)≈0.02. x1 x2:
CDF jest praktycznie płaski między a skąd jest praktycznie na szczycie W limicie jako ,x1 x2, q2 q1. a→0 q2→q1.
Na drugim końcu, na tyle duże wartości prowadzą do dowolnie blisko Oto przykład z jak poprzednio.a F(x2;a,b(a)) 1. (x1,q1)
Tutaj i jest prawie Teraz jest w zasadzie prawie nie ma obszar na prawo oda=8 b(a) 10. F(x2;a,b(a)) 1: x2.
W związku z tym możesz wybrać dowolną między a i regulować aż Podobnie jak poprzednio, to musi być unikalny, QED .q2 q1 1 a F(x2;a,a(b))=q2. a
R
Kod roboczy znajdujący rozwiązania jest publikowany w części Określanie parametrów dystrybucji beta i z dwóch dowolnych punktów (kwantyli)źródło