Oczekiwany stosunek liczby urodzeń dziewcząt do chłopców

45

W teście umiejętności rozmowy kwalifikacyjnej natrafiłem na pytanie dotyczące krytycznego myślenia. Wygląda to mniej więcej tak:

Republika Zorganiczna ma bardzo dziwne zwyczaje. Pary pragną mieć dzieci płci żeńskiej, ponieważ tylko kobiety mogą odziedziczyć majątek rodziny, więc jeśli mają dziecko płci męskiej, nadal mają więcej dzieci, dopóki nie będą miały dziewczynki. Jeśli mają dziewczynę, przestają mieć dzieci. Jaki jest stosunek dziewcząt do chłopców w Zorganii?

Nie zgadzam się z wzorcową odpowiedzią udzieloną przez autora pytań, która wynosi około 1: 1. Uzasadnieniem było, że każde urodzenie zawsze będzie miało 50% szans na bycie mężczyzną lub kobietą.

Czy możesz mnie przekonać bardziej matematyczną, energiczną odpowiedzią na jeśli to liczba dziewcząt, a B to liczba chłopców w kraju?mi[sol]:mi[b]sol

Pizza Mobius
źródło
3
Nie zgadzasz się z odpowiedzią modelową, ponieważ stosunek urodzeń M: F różni się od stosunku M: F dzieci. W prawdziwych społeczeństwach ludzkich pary, które chcą mieć tylko dzieci, prawdopodobnie będą uciekać się do środków takich jak dzieciobójstwo lub adopcja za granicą w celu pozbycia się dzieci płci męskiej, co spowoduje stosunek M: F mniejszy niż 1: 1.
Gabe
10
@Gabe W tym pytaniu nie ma wzmianki o dzieciobójstwie, jest to ćwiczenie matematyczne w przeciwieństwie do szorstkiej analizy prawdziwego kraju, w którym morderstwo jest powszechnym miejscem. Podobnie rzeczywisty stosunek urodzeń chłopców do dziewcząt jest bliższy 51:49 (ignorując czynniki społeczne)
Richard Tingle
2
Dzięki odpowiedziom rozumiem teraz, dlaczego stosunek miałby wynosić 1: 1, co początkowo wydaje mi się sprzeczne z intuicją. Jednym z powodów mojego niedowierzania i zamieszania jest to, że wiem, że w chińskich wioskach występują przeciwne problemy związane ze zbyt wysokim stosunkiem chłopców do dziewcząt. Widzę to realistycznie, pary nie będą w stanie rozmnażać się w nieskończoność, dopóki nie osiągną płci, jakiej chcą. W Chinach prawo dopuszcza maksymalnie 2 dzieci dla osób mieszkających na obszarach wiejskich, więc w takim przypadku stosunek będzie bliższy 3: 2 niż 1: 1.
Mobius Pizza
4
@MobiusPizza: Nie, stosunek wynosi 1: 1 bez względu na to, ile masz dzieci! Powodem, dla którego Chiny mają inny stosunek, są czynniki społeczne, takie jak dzieciobójstwo, aborcja selektywna pod względem płci i adopcja zagraniczna.
Gabe
3
@newmount Symulacje są dobre, ale oznaczają tylko tyle, ile wbudowane w nie założenia. Wyświetlanie tylko kodu, bez żadnego wyjaśnienia, utrudnia ludziom zidentyfikowanie tych założeń. W przypadku braku takiego uzasadnienia i wyjaśnienia żadna ilość wyników symulacji nie rozwiąże tutaj pytania. Jeśli chodzi o „rzeczywisty świat”, każdy, kto wysunie takie twierdzenie, będzie musiał poprzeć go danymi o urodzeniach ludzi.
whuber

Odpowiedzi:

46

Zacznij bez dzieci

powtórz krok

{

Każda para, która nadal ma dzieci, ma dziecko. Połowa par ma mężczyzn, a połowa par kobiet.

Te pary, które mają kobiety, przestają mieć dzieci

}

Na każdym kroku otrzymujesz parzystą liczbę mężczyzn i kobiet, a liczba par posiadających dzieci zmniejsza się o połowę (tj. Te, które miały kobiety, nie będą miały dzieci w następnym kroku)

Tak więc w danym momencie masz taką samą liczbę mężczyzn i kobiet, a liczba par posiadających dzieci spada z każdym krokiem o połowę. Ponieważ powstaje więcej par, ta sama sytuacja się powtarza i wszystkie inne rzeczy są równe, populacja będzie zawierać taką samą liczbę mężczyzn i kobiet

martino
źródło
6
Myślę, że jest to doskonały sposób na wyjaśnienie rozkładu prawdopodobieństwa bez polegania na rygorystycznym matematycznym dowodzie.
LBushkin
1
Podoba mi się to, że tłumaczy to, co stało się z nadmiarem dziewcząt, których spodziewa się Twoja intuicja: Nadmiar dziewcząt jest pożądany przez rodziców (to rodzice, którzy próbują ponownie), ale ci rodzice (ogólnie) nigdy z powodzeniem nie tworzą nadmiaru dziewczyny.
Ben Jackson
2
Możesz jeszcze bardziej uprościć, mówiąc „powtórz krok {ktoś decyduje, czy mieć dziecko}”. Zasady, według których decydują, są całkowicie nieistotne, pod warunkiem, że wszyscy produkują chłopców i dziewczynki niezależnie z takim samym prawdopodobieństwem. Nie jest nawet konieczne przyjmowanie wartości tego prawdopodobieństwa, można po prostu powiedzieć, że częstotliwość w populacji będzie taka sama jak częstotliwość przy urodzeniu.
Steve Jessop,
1
@martino Nie sądzę, aby tak było, chociaż nie byłbym zaskoczony, gdyby istniała jakaś bardzo przekonująca matematyka na ten temat. Uważam, że ten scenariusz prowadzi do załamania naszego pojęcia wskaźników, ponieważ oczekiwana liczba dzieci na rodzinę jest nieskończona. Powinieneś być sceptyczny wobec swojej odpowiedzi ze względu na ogólność, z jaką ludzie odpowiedzieli na twoje pytanie w tym wątku.
jlimahaverford
1
@ martino. Dla zabawy uruchomiłem symulację z tym kryterium zatrzymania. 10 000 rodzin miało ogółem 160 693 469 chłopców (i ta liczba plus 10 000 więcej dziewcząt) w stosunku 0,9999377735896915. Całkiem niesamowite rzeczy.
jlimahaverford
37

Niech będzie liczbą chłopców w rodzinie. Gdy tylko mają dziewczynę, przestają, więcX

X=0if the first child was a girlX=1if the first child was a boy and the second was a girlX=2if the first two children were boys and the third was a girland so on

Jeśli jest prawdopodobieństwem, że dziecko jest chłopcem, a płcie są niezależne między dziećmi, prawdopodobieństwo, że rodzina skończy z k chłopcami, to P ( X = k ) = p k( 1 - p ) , tj. Prawdopodobieństwo mieć k chłopców, a potem mieć dziewczynkę. Oczekiwana liczba chłopców jest e x = Ď k = 0 K P K( 1 - P ) =pk

P(X=k)=pk(1p),
k Zauważmy, że k = 0 kpk= k = 0 (k+1)pk+1otrzymujemy k = 0 kpk- k = 0 k
EX=k=0kpk(1p)=k=0kpkk=0kpk+1.
k=0kpk=k=0(k+1)pk+1
, gdzie stosuje żeĎk = 0 pk=1/(1-P),przy0<p<1(patrzgeometrycznego).
k=0kpkk=0kpk+1=k=0(k+1)pk+1k=0kpk+1=k=0pk+1=pk=0pk=p1p
k=0pk=1/(1p)0<p<1

Jeśli , to ma to E X = 0,5 / 0,5 . Oznacza to, że przeciętna rodzina ma 1 chłopca. Wiemy już, że wszystkie rodziny mają 1 dziewczynę, więc wskaźnik ten będzie z czasem jeszcze się 1 / 1 = 1 .p=1/2EX=0.5/0.51/1=1

Zmienna losowa jest znana jako geometryczna zmienna losowa .X

MånsT
źródło
4
To oczywiście zakłada, że pjest tak samo dla wszystkich rodzin. Jeśli zamiast tego założymy, że niektóre pary częściej mają chłopców niż inne ( tzn. Ich liczba pjest wyższa), wynik zmienia się, nawet jeśli średnia wartość pwynosi nadal 0,5. (Mimo to jest to doskonałe wyjaśnienie podstawowych statystyk podstawowych).
Ben Hocking
2
@Ben Twój komentarz zawiera kluczowy pomysł. To samo przyszło mi do głowy, więc zredagowałem swoje pytanie, aby uwzględnić analizę tej bardziej realistycznej sytuacji. Pokazuje, że stosunek graniczny niekoniecznie musi wynosić 1: 1.
whuber
1
@BenHocking Rzeczywiście! A jak wiemy z dwóch nowoczesnych i klasycznych analiza statystyk Laplace'a wskaźników urodzeń, naprawdę nie jest równa 1 / 2 i tak. :)p1/2)
Środa
21

Podsumowanie

Prosty model, że wszystkie porody niezależnie mają 50% szans na bycie dziewczynkami, jest nierealny i, jak się okazuje, wyjątkowy. Gdy tylko weźmiemy pod uwagę konsekwencje zmienności wyników wśród populacji, odpowiedź jest taka, że ​​stosunek liczby dziewcząt do chłopców może wynosić dowolną wartość nieprzekraczającą 1: 1. (W rzeczywistości prawdopodobnie nadal byłby zbliżony do 1: 1, ale to kwestia analizy danych do ustalenia.)

Ponieważ obie te sprzeczne odpowiedzi uzyskuje się, zakładając statystyczną niezależność wyników narodzin, odwołanie do niezależności jest niewystarczającym wyjaśnieniem. Wydaje się więc, że kluczową ideą paradoksu jest zmienność (szansa na urodzenie kobiety).

Wprowadzenie

Paradoks pojawia się, gdy uważamy, że mamy dobre powody, aby w coś wierzyć, ale mamy do czynienia z solidnym argumentem przeciwnym.

Satysfakcjonujące rozwiązanie paradoksu pomaga nam zrozumieć, co było słuszne, a co mogło być nie tak w obu argumentach. Jak to często bywa w przypadku prawdopodobieństwa i statystyki, oba argumenty mogą być faktycznie aktualne: rozstrzygnięcie będzie zależeć od różnic między założeniami, które są niejawnie przyjęte . Porównanie tych różnych założeń może pomóc nam zidentyfikować, które aspekty sytuacji prowadzą do różnych odpowiedzi. Uważam, że identyfikowanie tych aspektów jest tym, co powinniśmy najbardziej cenić.

Założenia

Jak wynika z odpowiedzi na wszystkie pytania wysłane do tej pory, to jest naturalne, aby zakładać, że samice porody występują niezależnie iz stałych prawdopodobieństw o . Powszechnie wiadomo, że żadne założenie nie jest w rzeczywistości prawdziwe, ale wydaje się, że niewielkie odchylenia od tych założeń nie powinny mieć większego wpływu na odpowiedź. Pozwól nam zobaczyć. W tym celu rozważ następujący bardziej ogólny i bardziej realistyczny model:1/2

  1. W każdej rodziny prawdopodobieństwo urodzenia żeńskiej jest stałą p I , niezależnie od kolejności urodzenia.ipi

  2. Wobec braku jakiejkolwiek reguły zatrzymywania oczekiwana liczba urodzeń kobiet w populacji powinna być zbliżona do oczekiwanej liczby urodzeń mężczyzn.

  3. Wszystkie wyniki porodu są (statystycznie) niezależne.

To wciąż nie jest w pełni realistyczny model narodzin człowieka, w którym może różnić się w zależności od wieku rodziców (szczególnie matki). Jest jednak wystarczająco realistyczny i elastyczny, aby zapewnić zadowalającą rozdzielczość paradoksu, który będzie obowiązywał nawet w bardziej ogólnych modelach.pi

Analiza

Mimo, że interesujące jest przeprowadzenie dogłębnej analizy tego modelu, główne punkty stają się oczywiste, nawet jeśli rozważymy konkretną, prostą (ale nieco ekstremalną) wersję. Załóżmy, że populacja ma rodziny N. W połowie z nich szansę żeński urodzenia jest 2 / 3 , aw drugiej połowie szansa żeński urodzenia jest 1 / 3 . To wyraźnie spełnia warunek (2): oczekiwana liczba urodzeń kobiet i mężczyzn jest taka sama.2N2/31/3

Rozważ te pierwsze rodzin. Rozumujmy pod względem oczekiwań, rozumiejąc, że rzeczywiste wyniki będą losowe i dlatego będą się nieco różnić od oczekiwań. (Pomysł na następującą analizę został przekazany w skrócie i po prostu w oryginalnej odpowiedzi, która pojawia się na samym końcu tego postu).N

Niech będzie oczekiwaną liczbą urodzeń kobiet w populacji N ze stałym prawdopodobieństwem urodzeń kobiet p . Oczywiście jest proporcjonalna do N i mogą być zapisane F ( N , p ) = m ( p ) N . Podobnie niech m ( p ) N będzie oczekiwaną liczbą urodzeń mężczyzn.f(N,p)NpNf(N,p)=f(p)Nm(p)N

  • Pierwsze rodziny rodzą dziewczynę i przestają. Pozostałe ( 1 - p ) rodziny N rodzą chłopca i nadal rodzą dzieci. To p N dziewcząt i ( 1 - p ) N chłopcy tak daleko.pN(1p)NpN(1p)N

  • Pozostałe rodziny znajdują się w takiej samej sytuacji jak wcześniej:(1p)N założenie o niezależności (3) oznacza, że ​​na to, czego doświadczą w przyszłości, nie ma wpływu fakt, że ich pierworodny był synem. Tak więc rodziny te będą produkować więcej dziewcząt i m ( p ) [ ( 1 - p ) N ] więcej chłopców.f(p)[(1p)N]m(p)[(1p)N]

Zsumowanie wszystkich dziewcząt i chłopców i porównanie ich założonych wartości i m ( p ) N daje równaniaf(p)Nm(p)N

f(p)N=pN+f(p)(1p)N  and  m(p)N=(1p)N+m(p)(1p)N

z rozwiązaniami

f(p)=1  and  m(p)=1p1.

Oczekiwana liczba dziewcząt pierwszych rodzin, a p = 2 / 3 , zatem f ( 2 / 3 ), N = N i oczekiwana liczba chłopców jest m ( 2 / 3 ), N = N / 2 .Np=2/3f(2/3)N=Nm(2/3)N=N/2

Oczekiwana liczby dziewczynek w drugim rodzin, a p = 1 / 3 jest zatem f ( 1 / 3 ), N = N i oczekiwana liczba chłopców jest m ( 1 / 3 ), N = 2 N .Np=1/3f(1/3)N=Nm(1/3)N=2N

Te sumy są dziewczynek i ( 1 / 2 + 2 ) N = ( 5 / 2 ) N chłopców. Dla dużego N oczekiwany stosunek będzie zbliżony do stosunku oczekiwań,(1+1)N=2N(1/2+2)N=(5/2)NN.

mi(# dziewczyny# chłopców)2)N.(5/2))N.=45.

Reguła zatrzymywania sprzyja chłopcom!

p1-pN.

2)p(1-p)1-2)p(1-p).

p010111p=1/2)

Rozkład

Jeśli twoja intuicja jest taka, że ​​zatrzymanie się z pierwszą dziewczyną powinno dać więcej chłopców w populacji, masz rację, jak pokazuje ten przykład. Aby być poprawnym, wszystko czego potrzebujesz to to, że prawdopodobieństwo urodzenia dziewczynki jest różne (nawet nieznacznie) w poszczególnych rodzinach.

„Oficjalna” odpowiedź, że stosunek powinien być zbliżony do 1: 1, wymaga kilku nierealistycznych założeń i jest na nie wrażliwa: zakłada, że ​​nie może być różnic między rodzinami, a wszystkie narodziny muszą być niezależne.

Komentarze

Kluczową ideą podkreśloną w tej analizie jest to, że zróżnicowanie w populacji ma ważne konsekwencje. Niezależność narodzin - choć jest to założenie upraszczające stosowane w każdej analizie w tym wątku - nie rozwiązuje paradoksu, ponieważ (w zależności od innych założeń) jest spójne zarówno z oficjalną odpowiedzią, jak i jej przeciwieństwem.

pjapjapja

Jeśli zastąpimy płeć jakąś inną ekspresją genetyczną, wówczas otrzymamy proste statystyczne wyjaśnienie doboru naturalnego : reguła, która różnicowo ogranicza liczbę potomstwa na podstawie ich struktury genetycznej, może systematycznie zmieniać proporcje tych genów w następnym pokoleniu. Gdy gen nie jest powiązany z płcią, nawet niewielki efekt będzie multiplikowany w kolejnych pokoleniach i może szybko zostać znacznie powiększony.


Oryginalna odpowiedź

Każde dziecko ma kolejność urodzenia: pierworodne, drugie i tak dalej.

Zakładając równe prawdopodobieństwo porodów męskich i żeńskich oraz brak korelacji między płciami, Słabe Prawo Dużych Liczb przewiduje, że stosunek pierworodnych kobiet do mężczyzn będzie zbliżony do 1: 1 . Z tego samego powodu stosunek kobiet urodzonych w drugim wieku do mężczyzn będzie zbliżony do stosunku 1: 1 i tak dalej. Ponieważ współczynniki te wynoszą stale 1: 1, ogólny stosunek musi wynosić również 1: 1, niezależnie od tego, jakie względne częstotliwości zamówień porodowych okazują się w populacji.

Whuber
źródło
Ciekawy; wydaje się, że dzieje się tak, ponieważ chociaż żadna reguła nie może zmienić stosunku z naturalnego współczynnika, może zmienić liczbę dzieci wynikowych, a ta liczba dzieci zależy od naturalnego współczynnika. Więc w twoim przykładzie masz dwie populacje rodziców i są one dotknięte inaczej. (Powiedziawszy to, wydaje się, że jest to sytuacja poza zakresem domniemanego fikcyjnego kraju, która jest raczej ćwiczeniem matematycznym)
Richard Tingle
pja1/2)1
1
nie powinieneś też przepraszać, jest to bardzo interesujący wynik (myślałem, że wow, kiedy go czytam). Wolałbym tylko w postaci „Oryginalny wynik”, „Bardziej realistyczna sytuacja”. Sposób, w jaki napisano, jest oszustwem (co jest niesprawiedliwe, ponieważ, jak mówię, jest bardzo interesujące), ponieważ równie łatwo mógłbym powiedzieć „Cóż, oczywiście, że nie jest to 1: 1, ponieważ porody mężczyzn są bardziej powszechne” (wierzę ze względu na naszą historyczną dzierżawę zginąć w konflikcie zbrojnym)
Richard Tingle
pja0,51
@whuber Dzięki za pouczającą odpowiedź. Nie rozumiem jednak, dlaczego w swoich obliczeniach podzieliłeś populację na 2 rodziny z różnym prawdopodobieństwem urodzenia dziewcząt. Zgodnie z punktem 1 założenia modelu p_i powinien być taki sam dla wszystkich rodzin. Dlaczego podzieliłeś populację na 2 rodziny?
Mobius Pizza
14

Narodziny każdego dziecka są niezależnym wydarzeniem z P = 0,5 dla chłopca i P = 0,5 dla dziewczynki. Inne szczegóły (takie jak decyzje rodzinne) tylko odwracają uwagę od tego faktu. Odpowiedź brzmi zatem, że stosunek wynosi 1: 1 .

Wyjaśnij to: wyobraź sobie, że zamiast mieć dzieci, rzucasz uczciwą monetą (P (głowy) = 0,5), dopóki nie otrzymasz „głów”. Powiedzmy, że Rodzina A rzuca monetą i pobiera sekwencję [ogonów, ogonów, głów]. Potem rodzina B rzuca monetą i dostaje reszkę. Jakie jest prawdopodobieństwo, że następne będą główkami? Nadal 0,5 , ponieważ to właśnie oznacza niezależność . Jeśli miałbyś to zrobić z 1000 rodzin (co oznacza, że ​​pojawiło się 1000 głów), oczekiwana całkowita liczba ogonów wynosi 1000, ponieważ każde odwrócenie (zdarzenie) było całkowicie niezależne.

Niektóre rzeczy nie są niezależne, takie jak sekwencja w rodzinie: prawdopodobieństwo sekwencji [głowy, głowy] wynosi 0, nie jest równe [ogonom, ogonom] (0,25). Ale ponieważ pytanie o to nie pyta, nie ma znaczenia.

Tim S.
źródło
3
Jak stwierdzono, jest to niepoprawne. Gdyby płcie były bezwarunkowo niezależne, na dłuższą metę wśród rodzin byłoby tyle samo sekwencji dziewcząt i dziewcząt, ile jest sekwencji chłopców i chłopców. Istnieje wiele tych drugich i nigdy żadnego z nich. Istnieje pewna forma niezależności, ale uwarunkowana jest ona kolejnością urodzenia.
whuber
1
@whuber Nie pytamy, ile jest sekwencji dziewczęcych. Tylko stosunek dziewcząt do chłopców. Nie stwierdziłem, że sekwencja porodów przez pojedynczą matkę jest serią niezależnych zdarzeń, takich jak rzut monetą. Tyle tylko, że każde narodziny, indywidualnie, są niezależnym wydarzeniem.
Tim S.
Będziesz musiał być o wiele bardziej zrozumiały. Wspomniałem o sekwencjach pokazujących brak niezależności, więc spoczywa na tobie obowiązek dokładnego określenia, w jakim ścisłym tego słowa znaczeniu stosuje się tutaj „niezależność”.
whuber
@whuber Wydarzenia są niezależne w taki sam sposób, jak monety. Wyjaśniłem to w mojej odpowiedzi.
Tim S.
3
@ Whuber sekwencje dziewczyna-dziewczyna pojawią się, jeśli umieścisz wszystkie porody w jednej linii; po tym, jak jedna para kończy następne wejście itp.
Richard Tingle
6

Wyobraź sobie, że rzucasz uczciwą monetą, dopóki nie zobaczysz głowy. Ile ogonów rzucasz?

P.(0 ogony)=12),P.(1 ogon)=(12))2),P.(2) ogony)=(12))3),...

Oczekiwaną liczbę ogonów można łatwo obliczyć * na 1.

Liczba głowic wynosi zawsze 1.

* jeśli nie jest to dla ciebie jasne, zobacz „zarys dowodu” tutaj

Glen_b
źródło
6

Najczęstsze są pary z dokładnie jedną dziewczyną i bez chłopców

Powodem tego wszystkiego jest to, że prawdopodobieństwo jednego scenariusza, w którym jest więcej dziewcząt, jest znacznie większe niż scenariuszy, w których jest więcej chłopców. A scenariusze, w których jest znacznie więcej chłopców, mają bardzo małe prawdopodobieństwo. Konkretny sposób, w jaki to działa, pokazano poniżej

NumberOfChilden Probability  Girls   Boys  
1               0.5           1       0  
2               0.25          1       1  
3               0.125         1       2  
4               0.0625        1       3  
...             ...           ...     ...  

NumberOfChilden Probability   Girls*probabilty   Boys*probabilty 
1               0.5           0.5                0
2               0.25          0.25               0.25
3               0.125         0.125              0.25
4               0.0625        0.0625             0.1875
5               0.03125       0.03125            0.125
...             ...           ...                ...  
n               1/2^n         1/(2^n)            (n-1)/(2^n)

W tym momencie można praktycznie zobaczyć, dokąd to zmierza, suma dziewcząt i chłopców będzie sumować się do jednego.

Oczekiwane dziewczyny z jednej pary=n=1(12)n)=1
=n=1(n-1n2))=1

Ogranicz rozwiązania z wolfram

Każde narodziny, niezależnie od rodziny, mają 50:50 szansy na bycie chłopcem lub dziewczynką

Wszystko to ma sens, ponieważ (spróbuj jak pary) nie możesz kontrolować prawdopodobieństwa, że ​​konkretny poród będzie chłopcem lub dziewczynką. Nie ma znaczenia, czy dziecko rodzi się bez pary, czy z rodziną złożoną ze stu chłopców; szansa wynosi 50:50, więc jeśli każdy poród ma szansę 50:50, zawsze powinieneś mieć pół chłopców i pół dziewcząt. I nie ma znaczenia, jak przetasujesz porody między rodzinami; nie wpłyniesz na to.

Działa to z dowolną 1 regułą

Ponieważ ze względu na szansę 50:50 dla każdego porodu stosunek wyniesie 1: 1 dla dowolnej (rozsądnej 1 ) reguły, którą możesz wymyślić. Na przykład podobna zasada poniżej również działa

Pary przestają mieć dzieci, gdy mają dziewczynę lub mają dwoje dzieci

NumberOfChilden Probability   Girls   Boys
1               0.5           1       0
2               0.25          1       1
2               0.25          0       2

W takim przypadku łatwiej jest obliczyć łączne oczekiwane dzieci

Oczekiwane dziewczyny z jednej pary=0,51+0,251=0,75
=0,251+0,252)=0,75

1 Jak powiedziałem, działa to dla każdej rozsądnej reguły, która mogłaby istnieć w prawdziwym świecie. Nieuzasadnioną zasadą byłaby zasada, w której oczekiwane dzieci na parę byłyby nieskończone. Na przykład „Rodzice przestają mieć dzieci, gdy mają dwa razy więcej chłopców niż dziewczynki”, możemy zastosować te same techniki, co powyżej, aby pokazać, że ta zasada daje nieskończone dzieci:

NumberOfChilden Probability   Girls   Boys
3               0.125         1       2
6               1/64          2       4
9               1/512         3       6
3*m             1/((3m)^2     m       2m

Możemy wtedy znaleźć liczbę rodziców ze skończoną liczbą dzieci

Oczekiwana liczba rodziców ze skończonymi dziećmi=m=1(11/(3)m)2))=π2)54=0,18277.

Ogranicz rozwiązania z wolfram

Na podstawie tego możemy ustalić, że 82% rodziców miałoby nieskończoną liczbę dzieci; z punktu widzenia planowania miasta prawdopodobnie spowodowałoby to trudności i pokazuje, że taki warunek nie mógłby istnieć w prawdziwym świecie.

Richard Tingle
źródło
3
To, że porody nie są niezależne, jest oczywiste, badając sekwencje porodów: sekwencja dziewczyna-dziewczyna nigdy się nie pojawia, podczas gdy sekwencje chłopiec-chłopiec występują często.
whuber
1
@ whuber Rozumiem twój punkt widzenia (choć prawdopodobnie decyzja zależy od posiadania dziecka, a nie wynik samego wydarzenia). Być może lepiej byłoby powiedzieć: „Prawdopodobieństwo przyszłego porodu bycia chłopcem jest niezależne. ze wszystkich przeszłych narodzin ”
Richard Tingle
Tak, myślę, że istnieje sposób na uratowanie użycia niepodległości. Ale trafia to - myślę - do sedna sprawy, więc wydaje się, że aby uszanować prośbę OP o „energiczną” (rygorystyczną?) Demonstrację, konieczne jest staranne uzasadnienie tej kwestii.
whuber
@whuber Szczerze mówiąc, ten pierwszy akapit to bit ręcznego przekazu, kolejne akapity (a konkretnie granice) mają być rygorystycznym bitem
Richard Tingle
Brak argumentów - ale ten ostatni materiał został już omówiony w ten sam sposób w odpowiedziach na stronie stats.stackexchange.com/a/93833 , stats.stackexchange.com/a/93835 i stats.stackexchange.com/a/93841 .
whuber
5

Możesz także użyć symulacji:

p<-0
for (i in 1:10000){
  a<-0
  while(a != 1){   #Stops when having a girl
    a<-as.numeric(rbinom(1, 1, 0.5))   #Simulation of a new birth with probability 0.5
    p=p+1   #Number of births
  }
}
(p-10000)/10000   #Ratio
Aghila
źródło
1
Wyniki symulacji są dobre, ponieważ mogą dać nam pewien komfort, którego nie popełniliśmy poważnego błędu w obliczeniach matematycznych, ale daleko im do rygorystycznej wymaganej demonstracji. W szczególności, gdy mogą zdarzyć się rzadkie zdarzenia, które mają duży wpływ na oczekiwanie (np. Rodzina z 20 chłopcami, zanim pojawi się dziewczyna - co jest bardzo mało prawdopodobne, aby pojawiła się w symulacji zaledwie 10 000 rodzin), wówczas symulacje mogą być niestabilne lub nawet po prostu źle, bez względu na to, jak długo są powtarzane.
whuber
Rozpoznanie rozkładu geometrycznego liczby chłopców w rodzinie jest kluczowym krokiem do rozwiązania tego problemu. Spróbuj:mean(rgeom(10000, 0.5))
AdamO,
5

Mapowanie tego pomogło mi lepiej zobaczyć, jak stosunek populacji urodzeń (zakładany jako 1: 1) i stosunek populacji dzieci wynosiłby 1: 1. Podczas gdy niektóre rodziny miałyby wielu chłopców, ale tylko jedną dziewczynkę, co początkowo doprowadziło mnie do wniosku, że będzie więcej chłopców niż dziewcząt, liczba tych rodzin nie będzie większa niż 50% i zmniejszy się o połowę z każdym kolejnym dzieckiem, podczas gdy liczba rodzin składających się tylko z jednej dziewczynki wynosiłaby 50%. Liczba chłopców i dziewcząt równoważyłaby się. Zobacz sumy 175 na dole. Stosunek dzieci

Lowe Rudd
źródło
2

To, co otrzymałeś, było najprostsze i prawidłowa odpowiedź. Jeśli prawdopodobieństwo, że noworodek jest chłopcem, wynosi p, a dzieciom niewłaściwej płci nie spotkały niefortunne wypadki, nie ma znaczenia, czy rodzice podejmą decyzję o posiadaniu większej liczby dzieci na podstawie płci dziecka. Jeśli liczba dzieci wynosi N, a N jest duża, możesz spodziewać się p * N chłopców. Nie ma potrzeby bardziej skomplikowanych obliczeń.

Z pewnością istnieją inne pytania, takie jak: „jakie jest prawdopodobieństwo, że najmłodsze dziecko z rodziny z dziećmi jest chłopcem”, lub „jakie jest prawdopodobieństwo, że najstarsze dziecko z rodziny z dziećmi jest chłopcem”. (Jedna z nich ma prostą poprawną odpowiedź, druga ma prostą złą odpowiedź, a uzyskanie poprawnej odpowiedzi jest trudne).

gnasher729
źródło
2

Pozwolić

Ω= {(G), (B, G), (B, B, G),}

być miejscem próbki i niech

X: ΩRω|ω|-1

ωDAWNY)

E (X) =n=1(n-1)0,5n= 1

Trywialnie, oczekiwana wartość dziewcząt wynosi 1. Więc stosunek również wynosi 1.

użytkownik3451767
źródło
2

To podchwytliwe pytanie. Proporcja pozostaje taka sama (1: 1). Prawidłowa odpowiedź jest taka, że ​​nie wpływa na współczynnik urodzeń, ale wpływa na liczbę dzieci na rodzinę, przy czym czynnik ograniczający wynosi średnio 2 urodzenia na rodzinę.

Takie pytanie można znaleźć w teście logicznym. Odpowiedź nie dotyczy współczynnika urodzeń. To rozprasza.

To nie jest pytanie prawdopodobieństwa, ale pytanie rozumowania poznawczego. Nawet jeśli odpowiedziałeś w stosunku 1: 1, nadal nie zdałeś testu.

Andrew - OpenGeoCode
źródło
Niedawno zredagowałem moją odpowiedź, aby pokazać, że rozwiązaniem niekoniecznie jest 1: 1, co wyraźnie kwestionuje twoje twierdzenia.
whuber
Przeczytałem twoją odpowiedź. Wprowadziłeś orzeczenie, które nie jest określone w problemie (wariancja wskaźnika urodzeń kobiet). W tym problemie nie ma niczego, co twierdzi, że Republika Zorganiczna jest reprezentatywna dla populacji ludzkiej, a nawet ludzi.
Andrew - OpenGeoCode
1
To prawda - ale równie dobrze nie ma niczego, co uzasadniałoby zbyt uproszczone założenie, że wszystkie prawdopodobieństwa porodu są takie same. Należy przyjąć założenia w celu zapewnienia obiektywnej, możliwej do obrony odpowiedzi, więc co najmniej dobra odpowiedź będzie wyraźnie wyrażać się o przyjętych założeniach i stanowić wsparcie dla tych założeń. Twierdzenie „to nie jest pytanie o prawdopodobieństwo” nie rozwiązuje problemów, ale całkowicie je pomija.
whuber
@ whuber - Wskaźnik urodzeń w tym problemie jest niezmienny. Wariantem problemu jest liczba urodzeń na rodzinę. Pytanie to odwraca uwagę, nie jest częścią problemu. <br/> Myślenie lateralne to zdolność do kreatywnego myślenia lub „poza schematem”, jak to się czasem mówi w biznesie, do wykorzystania inspiracji i wyobraźni do rozwiązywania problemów poprzez patrzenie na nie z nieoczekiwanej perspektywy. Myślenie lateralne polega na odrzuceniu oczywistości, pozostawieniu tradycyjnych sposobów myślenia i odrzuceniu uprzedzeń. [fyi> Jestem głównym naukowcem w laboratorium]
Andrew - OpenGeoCode
1
Być może przeoczyłeś kluczowy punkt w mojej odpowiedzi: jego założenia utrzymują również uśrednioną dla populacji szansę niezmienności porodu u kobiety na 1: 1 (w konkretny sposób, który, mam nadzieję, został jasno opisany). Chciałbym utrzymywać, że w jakimkolwiek rozwiązaniu paradoksu, w którym założenia są krytycznie badane, występuje znaczne „myślenie boczne”: potrzeba wyobraźni i dobrych umiejętności analitycznych, aby zobaczyć, że przyjmuje się założenia. Odrzucenie jakiegokolwiek pytania jako zwykłej „sztuczki”, tak jak tutaj, wydaje się przeciwne do promowania lub świętowania takiego myślenia.
whuber
2

Pokazuję kod, który napisałem dla symulacji Monte Carlo (rodziny 500 x 1000) przy użyciu oprogramowania `MATLAB '. Sprawdź kod, aby się nie pomylić.

Wynik jest generowany i wykreślany poniżej. Pokazuje, że symulowane prawdopodobieństwo porodu dziewczynki ma bardzo dobrą zgodność z leżącym u jego podstaw naturalnym prawdopodobieństwem porodu, niezależnie od reguły zatrzymania dla zakresu naturalnego prawdopodobieństwa porodu.

wprowadź opis zdjęcia tutaj

Bawiąc się kodem, łatwiej jest zrozumieć jedną kwestię, której do tej pory nie robiłem --- jak podkreślają inne, reguła zatrzymywania jest rozproszeniem. Reguła zatrzymania wpływa tylko na liczbę rodzin przy określonej populacji lub z innego punktu widzenia na liczbę urodzeń dzieci przy określonej liczbie rodzin. Płeć zależy wyłącznie od rzutu kostką, a zatem stosunek lub prawdopodobieństwo (które jest niezależne od liczby dzieci) będzie zależeć wyłącznie od naturalnego współczynnika narodzin chłopca: dziewczynki.

testRange=0.45:0.01:0.55;
N=uint32(100000); %Used to approximate probability distribution
M=1000; %Number of families
L=500; %Monte Carlo repetitions
Nfamily=zeros(length(testRange),1);
boys=zeros(length(testRange),1);
girls=zeros(length(testRange),1);
for l = 1:L
    j=1; %Index variable for the different bgratio
    for bgratio=testRange
    k=1; %Index variable for family in each run (temp family id)
    vec=zeros(N,1);
    vec(1:N*bgratio,1)=1; %Approximate boy:girl population for dice roll, 
    %1 = boy

    vec=vec(randperm(s,N)); %Random permutation, technically not necessary 
    %due to randi used later, just be safe
    bog = vec(randi(N)); %boy or girl? (God's dice roll)

    while k<M %For M families...
        if bog == 1 %if boy:
            boys(j) = boys(j)+1; %total global boys tally
        else
            girls(j)=girls(j)+1; %total global girls tally
            %Family stops bearing children
            Nfamily(j) = Nfamily(j)+1; %total global family tally
            k=k+1; %temp family id
            %Next family...
        end
        bog=vec(randi(N)); %Sample next gender (God's dice roll)
    end

    j=j+1; %Index variable for the different bgratio
    end
end
figure;
scatter(testRange,girls./(boys+girls))
hold on
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.44 0.56 0.44 0.56])
Pizza Mobius
źródło
2

jathXja0,5

mi[jaXja]=jami[Xja]=0,5nn

mi[ja(1-Xja)]=jami[1-Xja]=0,5n

Niezależność urodzeń nie ma znaczenia przy obliczaniu oczekiwanych wartości.


Apropos @ Whuber, jeśli istnieje różnica w krańcowym prawdopodobieństwie między rodzinami, stosunek staje się wypaczony w stosunku do chłopców, z powodu większej liczby dzieci w rodzinach z większym prawdopodobieństwem chłopców niż rodzin o niższym prawdopodobieństwie, a tym samym zwiększający efekt oczekiwana suma wartości dla chłopców.

Innuo
źródło
2

Niezależnie zaprogramowałem również symulację w Matlabie, zanim zobaczyłem, co zrobili inni. Ściśle mówiąc, nie jest to MC, ponieważ eksperyment przeprowadzam tylko raz. Ale raz wystarczy, aby uzyskać wyniki. Oto, co daje moja symulacja. Nie sprzeciwiam się prawdopodobieństwu porodu jako prymitywu p = 0,5. Pozwoliłem, aby prawdopodobieństwo porodu zmieniało się w zakresie Pr (chłopcy = 1) = 0,25: 0,05: 0,75.

Moje wyniki pokazują, że gdy prawdopodobieństwo odbiega od p = 0,5, stosunek płci jest różny od 1: w oczekiwaniu stosunek płci jest po prostu stosunkiem prawdopodobieństwa porodu chłopca do prawdopodobieństwa porodu dziewczynki. Oznacza to, że jest to losowa zmienna geometryczna zidentyfikowana wcześniej przez @ månst. Uważam, że oryginalny plakat był intuicyjny.

Moje wyniki ściśle naśladują to, co zrobił powyższy plakat z kodem Matlab, dopasowując proporcje płci przy prawdopodobieństwie narodzin chłopca 0,45, 0,50 i 0,55. Prezentuję mój, gdy podchodzę nieco inaczej, aby uzyskać wyniki z szybszym kodem. Aby dokonać porównania, pominąłem sekcję kodu vec = vec (randperm (s, N)), ponieważ s nie jest zdefiniowane w kodzie i nie znam pierwotnej intencji tej zmiennej (ta sekcja kodu wydaje się również zbyteczna - jak pierwotnie stwierdził).

Wysyłam swój kod

clear all; rng('default')

prob_of_boy = 0.25:0.05:0.75;
prob_of_girls = 1 - prob_of_boy;

iterations = 200;

sex_ratio = zeros(length(prob_of_boy),1);
prob_of_girl_est = zeros(length(prob_of_boy),1);
rounds_of_reproduction = zeros(length(prob_of_boy),1);

for p=1:length(prob_of_boy)

    pop = 1000000;

    boys = zeros(iterations,1);
    girls = zeros(iterations,1);
    prob_of_girl = zeros(iterations,1);

    for i=1:iterations

        x = rand(pop,1);
        x(x<prob_of_boy(p))=1;

        %count the number of boys and girls
        num_boys = sum(x(x==1));

        boys(i) = num_boys;
        girls(i) = pop - num_boys;

        prob_of_girl(i) = girls(i)/(pop);

        %Only families that had a boy continue to reproduce
        x = x(x==1);

        %new population of reproducing parents
        pop = length(x);

        %check that there are no more boys 
        if num_boys==0

            boys(i+1:end)=[];
            girls(i+1:end)=[];
            prob_of_girl(i+1:end)=[];
            break

        end
    end

    prob_of_girl_est(p) = mean(prob_of_girl(prob_of_girl~=0));
    sex_ratio(p) = sum(boys)/sum(girls);
    rounds_of_reproduction(p) = length(boys);
end

scatter(prob_of_girls,prob_of_girl_est)
hold on
title('Est. vs. True Probability of a Girl Birth')
ylabel('Est. Probability of Girl Birth')
xlabel('True Probability of Girl Birth')
line([0 1],[0 1],'LineStyle','--','Color','k')
axis([0.2 0.8 0.2 0.8])

scatter(prob_of_girls,sex_ratio)
hold on
title('Sex Ratio as a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Sex Ratio: $\frac{E(Boys)}{E(Girls)}$','interpreter','latex')

scatter(prob_of_girls,rounds_of_reproduction)
hold on
title('Rounds of Reproduction a function of Girls')
xlabel('Probability of Girls Birth')
ylabel('Rounds of Reproduction')

Poniższy wykres jest oczekiwany, biorąc pod uwagę silne prawo dużej liczby. Odtwarzam to, ale ważny jest drugi wykres.

wprowadź opis zdjęcia tutaj

Tutaj prawdopodobieństwo populacyjne inne niż 0,5 dla urodzenia którejkolwiek z płci dziecka zmieni stosunek płci w całej populacji. Zakładając, że porody są niezależne (ale nie wybór dalszego rozmnażania się), w każdej rundzie warunkowego rozmnażania prawdopodobieństwo populacji reguluje ogólny skład wyników porodów chłopców i dziewcząt. Tak jak inni wspominali, reguła zatrzymania w tym problemie jest nieistotna dla wyniku populacji, na co odpowiedział plakat, który określił to jako rozkład geometryczny.

wprowadź opis zdjęcia tutaj

Dla kompletności, reguła zatrzymująca wpływa na liczbę rund reprodukcji w populacji. Ponieważ eksperyment przeprowadzam tylko raz, wykres jest nieco postrzępiony. Ale jest intuicja: dla danej wielkości populacji, wraz ze wzrostem prawdopodobieństwa porodu dziewczynki, widzimy, że rodziny potrzebują mniej rund reprodukcji, aby uzyskać pożądaną dziewczynę, zanim cała populacja przestanie się rozmnażać (oczywiście liczba rund będzie zależeć od wielkość populacji, ponieważ zwiększa to mechanicznie prawdopodobieństwo, że rodzina będzie miała na przykład 49 chłopców, zanim dostaną swoją pierwszą dziewczynę)

wprowadź opis zdjęcia tutaj

Porównanie moich obliczonych proporcji płci:

[sex_ratio' prob_of_boy']

0.3327    0.2500
0.4289    0.3000
0.5385    0.3500
0.6673    0.4000
0.8186    0.4500
1.0008    0.5000
1.2224    0.5500
1.5016    0.6000
1.8574    0.6500
2.3319    0.7000
2.9995    0.7500

i te z poprzedniego plakatu z kodem Matlab:

[boys./girls testRange']

0.8199    0.4500
0.8494    0.4600
0.8871    0.4700
0.9257    0.4800
0.9590    0.4900
1.0016    0.5000
1.0374    0.5100
1.0836    0.5200
1.1273    0.5300
1.1750    0.5400
1.2215    0.5500

Są to równoważne wyniki.

Alberto Ramírez
źródło
1

To zależy od liczby rodzin.

Xp=0,5

P.(X=x)=0,5x,x=1,2),3 ...
mi(X)=2)

N.

N.Xja

Xja/N.mi(X)=2)N.

T.T.=XjaT.

P.(T.=t)=doN.-1t-10,5t,t=N.,N.+1 ...

mi[N.Xja]=mi[N.T.]=t=N.N.tdoN.-1t-10,5t=2)fa1(N.,1,N.+1,-1)
2)fa1

2)fa1(N.,1,N.+1,-1)

Randy Lai
źródło