Załóżmy, że mamy proces Bernoulliego z prawdopodobieństwem uszkodzenia (który będzie mały, powiedzmy, ), z którego próbkujemy, aż napotkamy uszkodzeń. W ten sposób, że oszacowania prawdopodobieństwa awarii jak q : = 10 / N , gdzie N jest liczbą próbek.
Pytanie : Czy q stronniczy oszacowanie od q ? A jeśli tak, to czy można to naprawić?
Obawiam się, że naleganie na ostatnią próbkę jest porażką, która podważa szacunki.
estimation
bernoulli-distribution
bekliwy
źródło
źródło
Odpowiedzi:
Prawdą jest, że q jest stronniczy oszacowanie q w tym sensie, że E ( q ) ≠ q , ale nie należy koniecznie niech to powstrzymało cię. Ten dokładny scenariusz można wykorzystać jako krytykę pomysłu, że zawsze powinniśmy używać obiektywnych estymatorów, ponieważ tutaj uprzedzenie jest bardziej artefaktem konkretnego eksperymentu, który akurat przeprowadzamy. Dane wyglądają dokładnie tak, jak gdybyśmy wcześniej wybrali liczbę próbek, więc dlaczego mielibyśmy zmieniać nasze wnioski?q^ q E(q^)≠q
Co ciekawe, jeśli miałbyś zbierać dane w ten sposób, a następnie zapisać funkcję prawdopodobieństwa zarówno w modelach dwumianowych (stały rozmiar próbki), jak i ujemnych dwumianowych, okazałoby się, że oba są proporcjonalne względem siebie. Oznacza to, że q jest po prostu zwykły szacunek maksymalne prawdopodobieństwo pod ujemnego dwumianowego modelu, co oczywiście jest całkowicie uzasadnione oszacowania.q^
źródło
Nie nalega, aby ostatnia próbka była porażką, która podważa oszacowanie, przyjmuje odwrotnośćN
Więc w twoim przykładzie, ale E[10E[N10]=1q . Zbliża się to do porównania średniej arytmetycznej ze średnią harmonicznąE[10N]≠q
Zła wiadomość jest taka, że odchylenie może wzrosnąć, gdy zmniejsza się, choć niewiele, gdy q jest już małe. Dobrą wiadomością jest to, że stronniczość maleje wraz ze wzrostem wymaganej liczby awarii. Wydaje się, że jeśli potrzebujesz awarii f , to uprzedzenie jest ograniczone przez mnożnik fq q f dla małegoq; nie chcesz tego podejścia, gdy zatrzymasz się po pierwszej awarii ff−1 q
Zatrzymując się po awariach, przy q = 0,01 otrzymasz E [ N10 q=0.01 ale E[10E[N10]=100 , natomiast przyq=0,001otrzymaszE[NE[10N]≈0.011097 q=0.001 ale E[10E[N10]=1000 . Odchylenie około10E[10N]≈0.001111 mnożnik 109
źródło
źródło
10+rnbinom(10000,10,0.02)
10/(10+rnbinom(10000,10,0.02))
. Parametryzacja polega raczej na liczbie sukcesów / niepowodzeń niż na całkowitej liczbie prób, więc musisz dodać k = 10 z powrotem. Zauważ, że obiektywny estymator byłby o9/(9+rnbinom(10000,10,0.02))
jeden mniej licznik i mianownik.