Dlaczego działa korekcja ciągłości (powiedzmy, normalne przybliżenie do rozkładu dwumianowego)?

24

Chciałbym lepiej zrozumieć, w jaki sposób uzyskano korektę ciągłości rozkładu dwumianowego dla normalnego przybliżenia.

Jaką metodę zastosowaliśmy, aby zdecydować, że powinniśmy dodać 1/2 (dlaczego nie inną liczbę?). Wszelkie wyjaśnienia (lub link do sugerowanej lektury, inne niż to , będą mile widziane).

Tal Galili
źródło

Odpowiedzi:

29
  1. W rzeczywistości nie zawsze „działa” (w sensie ciągłego poprawiania aproksymacji dwumianowego cdf przez normalne na dowolnym ). Jeśli dwumianowy wynosi 0,5, to myślę, że to zawsze pomaga, z wyjątkiem być może najbardziej ekstremalnego ogona. Jeśli nie jest zbyt daleko od 0,5, dla dość dużego ogólnie działa bardzo dobrze, z wyjątkiem dalekiego ogona, ale jeśli jest w pobliżu 0 lub 1, może wcale nie pomóc (patrz punkt 6. poniżej)p p n pxppnp

  2. Jedną z rzeczy, o których należy pamiętać (pomimo ilustracji, które prawie zawsze obejmują pmfs i pdf), jest to, że staramy się przybliżyć to cdf. Przydatne może być rozważenie, co się dzieje z cdf dwumianu i przybliżeniem normalnej (np. Tutaj ):n=20,p=0,5

    wprowadź opis zdjęcia tutaj

    W granicy cdf znormalizowanego dwumianu przejdzie do standardowej normalnej (zauważ, że standaryzacja wpływa na skalę na osi x, ale nie na osi y); po drodze do coraz większych dwumianowe skoki cdf mają tendencję do bardziej równomiernego pokonywania normalnego cdf.n

    Powiększmy i spójrzmy na to w powyższym prostym przykładzie:

    wprowadź opis zdjęcia tutaj

    Zauważ, że ponieważ przybliżona normalna przebiega blisko środka pionowych skoków *, podczas gdy w granicy normalny cdf jest lokalnie w przybliżeniu liniowy i (podobnie jak postęp dwumianowego cdf na górze każdego skoku); w rezultacie cdf ma tendencję do przekraczania poziomych kroków w pobliżu . Jeśli chcesz przybliżyć wartość dwumianowego cdf, na liczbie całkowitej , normalny cdf osiąga tę wysokość w pobliżu . F(x)xx+1x+12)fa(x)xx+12)

    * Jeśli zastosujemy Berry-Esseen do zmiennych Bernoulliego ze skorygowanymi wartościami, granice Berry-Esseen pozwolą na bardzo mało miejsca na gdy jest w pobliżu a jest w pobliżu - normalne cdf musi przejść rozsądnie blisko środka skacze tam, bo inaczej absolutna różnica w plikach cdfs przekroczy najlepszą Berry-Essen związaną z jednej lub drugiej strony. To z kolei odnosi się do tego, jak daleko od normalny cdf może przekroczyć poziomą część funkcji krokowej dwumianowego cdf.1p xμx+112)xμx+12)

  3. Rozwijając motywację, która w 1. zastanówmy się, jak użylibyśmy normalnego przybliżenia do dwumianowego cdf, aby obliczyć . Np. (patrz drugi schemat powyżej). Więc nasza normalna z tą samą średnią i sd to . Zauważ, że przybliżymy skok w cdf przy 9 przez zmianę normalnego cdf między około 8,5 a 9,5.n = 20 , p = 0,5 , k = 9 N ( 10 , ( P.(X=k)n=20,p=0,5,k=9N.(10,(5)2))

wprowadź opis zdjęcia tutaj

  1. Robiąc to samo pod mniej formalną, ale bardziej „zwykłą” motywacją podręcznika (która jest być może bardziej intuicyjna, szczególnie dla początkujących uczniów), staramy się przybliżyć zmienną dyskretną ciągłą. Możemy stworzyć ciągłą wersję dwumianu, zastępując każdy skok prawdopodobieństwa wysokości prostokątem o szerokości 1 wyśrodkowanym na , dając mu wysokość (patrz niebieski prostokąt poniżej; wyobraź sobie jeden na każde x- wartość), a następnie aproksymując ją normalną gęstością przy użyciu tej samej średniej i wartości sd co pierwotny dwumian:x p ( x )p(x)xp(x)

    ! [wprowadź opis zdjęcia tutaj

    Obszar pod polem jest przybliżony przez normalną między a ; dwie prawie trójkątne części, które leżą powyżej i poniżej poziomego stopnia, znajdują się blisko siebie. Pewna suma prawdopodobieństw dwumianowych w przedziale zmniejszy się do zbioru tych przybliżeń. (Narysowanie takiego diagramu jest często bardzo przydatne, jeśli nie jest od razu jasne, czy należy przejść w górę lub w dół o 0,5 dla konkretnego obliczenia ... ustalić, które wartości dwumianowe chcesz w obliczeniach i przejść po obu stronach dla każdy.)x-12)x+12)12)

    Można motywować to podejście algebraicznie za pomocą pochodnej [wzdłuż linii De Moivre'a - patrz tutaj lub tutaj na przykład], aby uzyskać normalne przybliżenie (chociaż można to wykonać nieco bardziej bezpośrednio niż podejście De Moivre'a).

    To zasadniczo przebiega przez kilka aproksymacji, w tym za pomocą aproksymacji Stirlinga dla terminu i za pomocą tego aby to uzyskać(nx)log(1+x)x-x2)/2)

    P.(X=x)12)πnp(1-p)exp(-(x-np)2)2)np(1-p))

    co oznacza, że ​​gęstość normy ze średnią i wariancją przy jest w przybliżeniu wysokości dwumianu pmf przy . Właśnie w tym miejscu dotarł De Moivre.μ=npσ2)=np(1-p)xx

    Rozważmy teraz, że mamy przybliżenie reguły punktu środkowego dla normalnych obszarów pod względem wysokości dwumianowych ... to znaczy, dla , reguła punktu środkowego mówi, że i mamy z De Moivre, że . Odwracając to, .YN.(np,np(1-p))fa(y+12))-fa(y-12))=y-12)y+12)faY(u)reufaY(y)faY(x)P.(X=x)P.(X=x)fa(x+12))-fa(x-12))

    [Podobne przybliżenie typu „reguła punktu środkowego” może być użyte do motywowania innych takich przybliżeń ciągłego pmfs przez gęstość za pomocą korekcji ciągłości, ale zawsze należy uważać, aby zwrócić uwagę na to, gdzie warto przywołać to przybliżenie]

  2. Uwaga historyczna: wydaje się, że korekta ciągłości pochodzi od Augusta de Morgana w 1838 r. Jako ulepszenie przybliżenia De Moivre. Patrz na przykład Hald (2007) [1]. Z opisu Halda, jego rozumowanie było zgodne z punktem 4 powyżej (tj. Zasadniczo pod względem próby przybliżenia pmf poprzez zastąpienie piku prawdopodobieństwa „blokiem” o szerokości 1 wyśrodkowanym na wartości x).

  3. Ilustracja sytuacji, w której korekta ciągłości nie pomaga:

    wprowadź opis zdjęcia tutaj

    Na wykresie po lewej stronie (gdzie jak poprzednio, jest dwumianowy, jest normalnym przybliżeniem), a więc . Na wykresie po prawej stronie (ten sam dwumian, ale głębiej w ogon), i tak - co jest powiedzieć, że ignorowanie korekty ciągłości jest lepsze niż użycie jej w tym regionie.XYfaX(x)faY(x+12))p(x)faY(x+12))-faY(x-12))faX(x)faY(x)p(x)faY(x)-faY(x-1)

    [1]: Hald, Anders (2007),
    „Historia wnioskowania statystycznego parametrycznego od Bernoulli do Fishera, 1713–1935”,
    Źródła i badania w historii matematyki i nauk fizycznych,
    Springer-Verlag, Nowy Jork

Glen_b - Przywróć Monikę
źródło
1

Uważam, że czynnik ten wynika z faktu, że porównujemy rozkład ciągły z dyskretnym. Musimy zatem przetłumaczyć, co oznacza każda wartość dyskretna w ciągłym rozkładzie. Moglibyśmy wybrać inną wartość, jednak byłoby to niezrównoważone w odniesieniu do danej liczby całkowitej. (tj. przypisałbyś prawdopodobieństwo bycia 6 w kierunku 7 niż 5).

Znalazłem przydatny link tutaj: link

Kitter Catter
źródło