Oblicz kwantyl sumy rozkładów z poszczególnych kwantyli

9

Załóżmy N niezależne zmienne losowe X1,...,XN dla których kwantyle na pewnym określonym poziomie α są znane na podstawie danych szacunkowych: α=P(X1<q1), ..., α=P(XN<qN). Teraz zdefiniujmy zmienną losowąZ jako suma Z=i=1NXi. Czy istnieje sposób na obliczenie wartości kwantylu sumy na poziomieα, to jest, qz w α=P(Z<qZ)?

Myślę, że w szczególnych przypadkach, na przykład jeśli Xi jest zgodny z rozkładem Gaussa i jest to łatwe, ale nie jestem tak pewien w przypadku, gdy dystrybucja Xijest nieznany. Jakieś pomysły?

albarji
źródło
1
są to qioszacowane na podstawie danych czy teoretycznie znane?
Chuse
Nie jest to możliwe bez przyjęcia szczegółowych założeń dotyczących dystrybucji Xi. Czy masz na myśli rodzinę dystrybucji?
whuber
@chuse the qi są szacowane na podstawie danych, jako rozkład Xinie jest znane, ale próbki są dostępne. Zaktualizowałem pytanie o ten fakt.
albarji
@ whuber Nie mam wcześniejszej wiedzy na temat rodziny dystrybucji Ximogą być następujące, chociaż próbki danych są dostępne. Czy założenie rodziny dystrybucji (oprócz Gaussa) ułatwiłoby to?
albarji

Odpowiedzi:

4

qZ może być cokolwiek.


Aby zrozumieć tę sytuację, dokonajmy wstępnego uproszczenia. Pracując zYi=Xiqi uzyskujemy bardziej jednolitą charakterystykę

α=Pr(Xiqi)=Pr(Yi0).

To znaczy każdy Yima takie samo prawdopodobieństwo bycia negatywnym. Ponieważ

W=iYi=iXiiqi=Ziqi,

równanie definiujące dla qZ jest równa

α=Pr(ZqZ)=Pr(ZiqiqZiqi)=Pr(WqW)

z qZ=qW+iqi.


Jakie są możliwe wartości qW? Rozważ przypadek, w którymYi wszystkie mają ten sam rozkład z całym prawdopodobieństwem na dwóch wartościach, jedna z nich ujemna (y), a drugi pozytywny (y+). Możliwe wartości sumyW są ograniczone do ky+(nk)y+ dla k=0,1,,n. Każde z nich występuje z prawdopodobieństwem

PrW(ky+(nk)y+)=(nk)αk(1α)nk.

Skrajności można znaleźć przez

  1. Wybieranie y i y+ po to aby y+(n1)y+<0; y=n i y+=1osiągnie to. To gwarantuje, że W będzie ujemna, z wyjątkiem sytuacji, gdy wszystkie Yisą pozytywne. Ta szansa jest równa1(1α)n. To przekraczaα kiedy n>1, sugerując α kwantyl W musi być całkowicie negatywny.

  2. Wybieranie y i y+ po to aby (n1)y+y+>0; y=1 i y+=nosiągnie to. To gwarantuje, żeW będzie negatywny tylko wtedy, gdy wszystkie Yisą negatywne. Ta szansa jest równaαn. To mniej niżα kiedy n>1, sugerując α kwantyl W musi być całkowicie pozytywny.

To pokazuje, że α kwantyl Wmoże być ujemny lub dodatni, ale nie jest równy zero. Jaki mógłby być jego rozmiar? Musi to być jakaś integralna liniowa kombinacjay i y+. Podanie obu tych liczb całkowitych zapewnia wszystkie możliwe wartościWsą integralne. Po skalowaniuy± przez dowolną liczbę dodatnią s, możemy zagwarantować, że wszystkie integralne kombinacje liniowe y i y+ są integralnymi wielokrotnościami s. OdqW0, Musi wynosić co najmniejsw rozmiarze . W związku z tym możliwe wartościqW (i skąd qZ) są nieograniczone, bez względu na wszystkon>1 może być równy.


Tylko sposób czerpać żadnych informacji oqZ byłoby wprowadzenie konkretnych i silnych ograniczeń w dystrybucji sieci Xi, w celu zapobiegania i ograniczania rodzaju niezrównoważonych rozkładów zastosowanych do uzyskania tego ujemnego wyniku.

Whuber
źródło
Wielkie dzięki @whuber, za wyjaśnienie i przykład ilustrujący. Mimo że odpowiedź jest przecząca, nie mogę powiedzieć, że było to nieoczekiwane. Następnie postaram się ustalić, która rodzina dystrybucji pasuje do moich danych, i zobaczę, czy dzięki temu mogę obliczyć kwantyle sumy.
albarji