To pytanie pochodzi od tego, które dotyczy „Reguły .632”. Piszę ze szczególnym uwzględnieniem odpowiedzi / notacji użytkownika user603 w zakresie, w jakim upraszcza to sprawę.
Ta odpowiedź zaczyna się od próbki o wielkości z zamianą, z różnych elementów w kolekcji (wywołaj) it N. Prawdopodobieństwo, że próbka jest różna od określonego elementu N, wynosi wtedyn i t h s i m ( 1 - 1 / n ) .
W tej odpowiedzi wszystkie elementy N mają równe szanse na losowanie.
Moje pytanie brzmi: załóżmy zamiast tego, że w powyższym pytaniu elementy do narysowania są takie, że są normalnie rozmieszczone. Oznacza to, że dzielimy standardową krzywą normalną od do na (powiedzmy) 100 podinterwali o równej długości. Każde ze 100 elementów w N ma prawdopodobieństwo narysowania równe powierzchni objętej krzywą w odpowiednim przedziale.
Moje myślenie było następujące:
Myślę, że rozumowanie jest podobne do tego w połączonej odpowiedzi. Prawdopodobieństwo, że , przy czym jest elementem N, to w którym jest prawdopodobieństwem wyciągnięcia
Prawdopodobieństwo, że dany element m znajduje się w próbce S o rozmiarze n, wynosi
= 1 - n gatunku 1 ( 1 - F ı ) .
Obliczenia wydają się pokazywać, że wraz ze zmniejszaniem się długości pod-przedziałów odpowiedź zbiega się do tej samej liczby, co w pierwszym przypadku (wszystkie prawdopodobieństwa są równe).
Wydaje mi się to sprzeczne z intuicją (dla mnie), ponieważ konstrukcja wydaje się wrzucać elementy N, które są rzadkie, więc oczekiwałbym liczby mniejszej niż .632.
Ponadto, jeśli jest to poprawne, myślę, że mielibyśmy
które nie wiem jeszcze, czy są prawdziwe czy fałszywe.
Edycja: Jeśli to prawda, prawdopodobnie uogólni niektóre.
Dzięki za wszelkie spostrzeżenia.
źródło
Odpowiedzi:
Pytanie dotyczy ograniczenia zachowania
gdy rośnie, a równomiernie kurczą się w taki sposób, że (a) wszystkie są nieujemne i (b) sumują się do jedności. ( to z konstrukcji i aksjomatów prawdopodobieństwa.)n Fi Fi
Z definicji ten produkt jest wykładnikiem logarytmu:
Twierdzenie Taylora (z resztą w postaci Lagrange'a) zastosowane do , potwierdza tolog
dla niektórych w przedziale . Innymi słowy, logarytmy te są równe do warunków, które są najwyżej razy . Ale gdy jest wystarczająco duże, aby zapewnić, że wszystkie są mniejsze niż niektóre podane (warunek zapewniony przez jednolity skurcz ), wtedy (b) oznacza i dlategoϕi [0,Fi] −Fi 1/2 F2i n Fi ϵ>0 Fi nϵ>∑Fi=1
w konsekwencji
ściska logarytm między dwiema sekwencjami zbiegającymi się do . Ponieważ jest ciągły, produkt zbiega się do wykładniczej granicy tego, . w konsekwencji−1 exp ∏ni=1(1−Fi) exp(−1)
QED .
Przy bliższym przyjrzeniu się tej analizie stwierdzono, że błąd w tym przybliżeniu (który zawsze będzie dolną granicą) nie jest większy niż Na przykład podział standardowego rozkładu normalnego na plasterków między a daje maksymalne pobliżu trybu , gdzie będzie w przybliżeniu równe powierzchni prostokąta, . Powyższe ograniczenie ustanawia wartość wzoru w granicach od jego wartości granicznej. Rzeczywisty błąd jest o rząd wielkości mniejszy,
R
(którym możemy zaufać, ponieważ żaden z jest naprawdę mały w stosunku do ):Rzeczywiście,0.6331615… 1−exp(−1) 0.6321206…
1 - prod(1-f)
wynosi podczas gdy to .źródło