Nierównomierny rozkład wartości p podczas symulacji testów dwumianowych w ramach hipotezy zerowej

17

Słyszałem, że zgodnie z hipotezą zerową rozkład wartości p powinien być jednolity. Jednak symulacje testu dwumianowego w MATLAB zwracają bardzo różne od jednolitych rozkłady ze średnią większą niż 0,5 (w tym przypadku 0,518): wprowadź opis zdjęcia tutaj

coin = [0 1];
success_vec = nan(20000,1);

for i = 1:20000
    success = 0;
    for j = 1:200
        success = success + coin(randperm(2,1));
    end
    success_vec(i) = success;
end

    p_vec = binocdf(success_vec,200,0.5);
    hist(p_vec);

Próba zmiany sposobu generowania liczb losowych nie pomogła. Byłbym wdzięczny za wszelkie wyjaśnienia tutaj.

TanZor
źródło
6
n/2+1
Dokładnie co robi „test dwumianowy” Matlaba?
whuber
2
Wygląda na to, że jest to test dwumianowy plakatu, binocdfto tylko CDF z dwumianowego uk.mathworks.com/help/stats/binocdf.html
sprzężony przed

Odpowiedzi:

20

pH0 zachowuje dla stale rozłożonych statystyk testowych - przynajmniej dla zerowych punktów, jak tutaj.

Jak James Stanley wspomina w komentarzach, rozkład statystyki testowej jest dyskretny, więc wynik nie ma zastosowania. Być może w twoim kodzie nie ma żadnych błędów (chociaż nie wyświetlałbym dyskretnej dystrybucji z histogramem, skłaniam się ku wyświetlaniu cdf lub pmf, albo lepiej, obu).

F(x)=x

wprowadź opis zdjęcia tutaj

Całkiem możliwe jest dokładne obliczenie tego rozkładu zamiast symulacji - ale podążyłem za tobą i wykonałem symulację (choć większą niż ty).

n wzrostem dwumianu krok cdf zbliży się do linii, a średnia zbliży się do 0,5.

α

Glen_b - Przywróć Monikę
źródło
Dzięki Glen i @JamesStanley! Próbuję zrozumieć, co to dokładnie znaczy, że rozkład wartości p nie jest jednolity, i jakie są konsekwencje w zakresie testowania hipotez - ale w tym celu chyba po prostu
zagłębię się
3
α
F(x)x
A.Donda, Glen_b - dzięki! Byłaś świetną pomocą.
TanZor