W teście umiejętności rozmowy kwalifikacyjnej natrafiłem na pytanie dotyczące krytycznego myślenia. Wygląda to mniej więcej tak:
Republika Zorganiczna ma bardzo dziwne zwyczaje. Pary pragną mieć dzieci płci żeńskiej, ponieważ tylko kobiety mogą odziedziczyć majątek rodziny, więc jeśli mają dziecko płci męskiej, nadal mają więcej dzieci, dopóki nie będą miały dziewczynki. Jeśli mają dziewczynę, przestają mieć dzieci. Jaki jest stosunek dziewcząt do chłopców w Zorganii?
Nie zgadzam się z wzorcową odpowiedzią udzieloną przez autora pytań, która wynosi około 1: 1. Uzasadnieniem było, że każde urodzenie zawsze będzie miało 50% szans na bycie mężczyzną lub kobietą.
Czy możesz mnie przekonać bardziej matematyczną, energiczną odpowiedzią na jeśli to liczba dziewcząt, a B to liczba chłopców w kraju?
źródło
Odpowiedzi:
Zacznij bez dzieci
powtórz krok
{
Każda para, która nadal ma dzieci, ma dziecko. Połowa par ma mężczyzn, a połowa par kobiet.
Te pary, które mają kobiety, przestają mieć dzieci
}
Na każdym kroku otrzymujesz parzystą liczbę mężczyzn i kobiet, a liczba par posiadających dzieci zmniejsza się o połowę (tj. Te, które miały kobiety, nie będą miały dzieci w następnym kroku)
Tak więc w danym momencie masz taką samą liczbę mężczyzn i kobiet, a liczba par posiadających dzieci spada z każdym krokiem o połowę. Ponieważ powstaje więcej par, ta sama sytuacja się powtarza i wszystkie inne rzeczy są równe, populacja będzie zawierać taką samą liczbę mężczyzn i kobiet
źródło
Niech będzie liczbą chłopców w rodzinie. Gdy tylko mają dziewczynę, przestają, więcX
Jeśli jest prawdopodobieństwem, że dziecko jest chłopcem, a płcie są niezależne między dziećmi, prawdopodobieństwo, że rodzina skończy z k chłopcami, to P ( X = k ) = p k ⋅ ( 1 - p ) , tj. Prawdopodobieństwo mieć k chłopców, a potem mieć dziewczynkę. Oczekiwana liczba chłopców jest e x = ∞ Ď k = 0 K P K ⋅ ( 1 - P ) =p k
Jeśli , to ma to E X = 0,5 / 0,5 . Oznacza to, że przeciętna rodzina ma 1 chłopca. Wiemy już, że wszystkie rodziny mają 1 dziewczynę, więc wskaźnik ten będzie z czasem jeszcze się 1 / 1 = 1 .p=1/2 EX=0.5/0.5 1/1=1
Zmienna losowa jest znana jako geometryczna zmienna losowa .X
źródło
p
jest tak samo dla wszystkich rodzin. Jeśli zamiast tego założymy, że niektóre pary częściej mają chłopców niż inne ( tzn. Ich liczbap
jest wyższa), wynik zmienia się, nawet jeśli średnia wartośćp
wynosi nadal 0,5. (Mimo to jest to doskonałe wyjaśnienie podstawowych statystyk podstawowych).Podsumowanie
Prosty model, że wszystkie porody niezależnie mają 50% szans na bycie dziewczynkami, jest nierealny i, jak się okazuje, wyjątkowy. Gdy tylko weźmiemy pod uwagę konsekwencje zmienności wyników wśród populacji, odpowiedź jest taka, że stosunek liczby dziewcząt do chłopców może wynosić dowolną wartość nieprzekraczającą 1: 1. (W rzeczywistości prawdopodobnie nadal byłby zbliżony do 1: 1, ale to kwestia analizy danych do ustalenia.)
Ponieważ obie te sprzeczne odpowiedzi uzyskuje się, zakładając statystyczną niezależność wyników narodzin, odwołanie do niezależności jest niewystarczającym wyjaśnieniem. Wydaje się więc, że kluczową ideą paradoksu jest zmienność (szansa na urodzenie kobiety).
Wprowadzenie
Paradoks pojawia się, gdy uważamy, że mamy dobre powody, aby w coś wierzyć, ale mamy do czynienia z solidnym argumentem przeciwnym.
Satysfakcjonujące rozwiązanie paradoksu pomaga nam zrozumieć, co było słuszne, a co mogło być nie tak w obu argumentach. Jak to często bywa w przypadku prawdopodobieństwa i statystyki, oba argumenty mogą być faktycznie aktualne: rozstrzygnięcie będzie zależeć od różnic między założeniami, które są niejawnie przyjęte . Porównanie tych różnych założeń może pomóc nam zidentyfikować, które aspekty sytuacji prowadzą do różnych odpowiedzi. Uważam, że identyfikowanie tych aspektów jest tym, co powinniśmy najbardziej cenić.
Założenia
Jak wynika z odpowiedzi na wszystkie pytania wysłane do tej pory, to jest naturalne, aby zakładać, że samice porody występują niezależnie iz stałych prawdopodobieństw o . Powszechnie wiadomo, że żadne założenie nie jest w rzeczywistości prawdziwe, ale wydaje się, że niewielkie odchylenia od tych założeń nie powinny mieć większego wpływu na odpowiedź. Pozwól nam zobaczyć. W tym celu rozważ następujący bardziej ogólny i bardziej realistyczny model:1/2
W każdej rodziny prawdopodobieństwo urodzenia żeńskiej jest stałą p I , niezależnie od kolejności urodzenia.i pi
Wobec braku jakiejkolwiek reguły zatrzymywania oczekiwana liczba urodzeń kobiet w populacji powinna być zbliżona do oczekiwanej liczby urodzeń mężczyzn.
Wszystkie wyniki porodu są (statystycznie) niezależne.
To wciąż nie jest w pełni realistyczny model narodzin człowieka, w którym może różnić się w zależności od wieku rodziców (szczególnie matki). Jest jednak wystarczająco realistyczny i elastyczny, aby zapewnić zadowalającą rozdzielczość paradoksu, który będzie obowiązywał nawet w bardziej ogólnych modelach.pi
Analiza
Mimo, że interesujące jest przeprowadzenie dogłębnej analizy tego modelu, główne punkty stają się oczywiste, nawet jeśli rozważymy konkretną, prostą (ale nieco ekstremalną) wersję. Załóżmy, że populacja ma rodziny N. W połowie z nich szansę żeński urodzenia jest 2 / 3 , aw drugiej połowie szansa żeński urodzenia jest 1 / 3 . To wyraźnie spełnia warunek (2): oczekiwana liczba urodzeń kobiet i mężczyzn jest taka sama.2N 2/3 1/3
Rozważ te pierwsze rodzin. Rozumujmy pod względem oczekiwań, rozumiejąc, że rzeczywiste wyniki będą losowe i dlatego będą się nieco różnić od oczekiwań. (Pomysł na następującą analizę został przekazany w skrócie i po prostu w oryginalnej odpowiedzi, która pojawia się na samym końcu tego postu).N
Niech będzie oczekiwaną liczbą urodzeń kobiet w populacji N ze stałym prawdopodobieństwem urodzeń kobiet p . Oczywiście jest proporcjonalna do N i mogą być zapisane F ( N , p ) = m ( p ) N . Podobnie niech m ( p ) N będzie oczekiwaną liczbą urodzeń mężczyzn.f(N,p) N p N f(N,p)=f(p)N m(p)N
Pierwsze rodziny rodzą dziewczynę i przestają. Pozostałe ( 1 - p ) rodziny N rodzą chłopca i nadal rodzą dzieci. To p N dziewcząt i ( 1 - p ) N chłopcy tak daleko.pN (1−p)N pN (1−p)N
Pozostałe rodziny znajdują się w takiej samej sytuacji jak wcześniej:(1−p)N założenie o niezależności (3) oznacza, że na to, czego doświadczą w przyszłości, nie ma wpływu fakt, że ich pierworodny był synem. Tak więc rodziny te będą produkować więcej dziewcząt i m ( p ) [ ( 1 - p ) N ] więcej chłopców.f(p)[(1−p)N] m(p)[(1−p)N]
Zsumowanie wszystkich dziewcząt i chłopców i porównanie ich założonych wartości i m ( p ) N daje równaniaf(p)N m(p)N
z rozwiązaniami
Oczekiwana liczba dziewcząt pierwszych rodzin, a p = 2 / 3 , zatem f ( 2 / 3 ), N = N i oczekiwana liczba chłopców jest m ( 2 / 3 ), N = N / 2 .N p=2/3 f(2/3)N=N m(2/3)N=N/2
Oczekiwana liczby dziewczynek w drugim rodzin, a p = 1 / 3 jest zatem f ( 1 / 3 ), N = N i oczekiwana liczba chłopców jest m ( 1 / 3 ), N = 2 N .N p=1/3 f(1/3)N=N m(1/3)N=2N
Te sumy są dziewczynek i ( 1 / 2 + 2 ) N = ( 5 / 2 ) N chłopców. Dla dużego N oczekiwany stosunek będzie zbliżony do stosunku oczekiwań,(1+1)N=2N (1/2+2)N=(5/2)N N
Reguła zatrzymywania sprzyja chłopcom!
Rozkład
Jeśli twoja intuicja jest taka, że zatrzymanie się z pierwszą dziewczyną powinno dać więcej chłopców w populacji, masz rację, jak pokazuje ten przykład. Aby być poprawnym, wszystko czego potrzebujesz to to, że prawdopodobieństwo urodzenia dziewczynki jest różne (nawet nieznacznie) w poszczególnych rodzinach.
„Oficjalna” odpowiedź, że stosunek powinien być zbliżony do 1: 1, wymaga kilku nierealistycznych założeń i jest na nie wrażliwa: zakłada, że nie może być różnic między rodzinami, a wszystkie narodziny muszą być niezależne.
Komentarze
Kluczową ideą podkreśloną w tej analizie jest to, że zróżnicowanie w populacji ma ważne konsekwencje. Niezależność narodzin - choć jest to założenie upraszczające stosowane w każdej analizie w tym wątku - nie rozwiązuje paradoksu, ponieważ (w zależności od innych założeń) jest spójne zarówno z oficjalną odpowiedzią, jak i jej przeciwieństwem.
Jeśli zastąpimy płeć jakąś inną ekspresją genetyczną, wówczas otrzymamy proste statystyczne wyjaśnienie doboru naturalnego : reguła, która różnicowo ogranicza liczbę potomstwa na podstawie ich struktury genetycznej, może systematycznie zmieniać proporcje tych genów w następnym pokoleniu. Gdy gen nie jest powiązany z płcią, nawet niewielki efekt będzie multiplikowany w kolejnych pokoleniach i może szybko zostać znacznie powiększony.
Oryginalna odpowiedź
Każde dziecko ma kolejność urodzenia: pierworodne, drugie i tak dalej.
Zakładając równe prawdopodobieństwo porodów męskich i żeńskich oraz brak korelacji między płciami, Słabe Prawo Dużych Liczb przewiduje, że stosunek pierworodnych kobiet do mężczyzn będzie zbliżony do 1: 1 . Z tego samego powodu stosunek kobiet urodzonych w drugim wieku do mężczyzn będzie zbliżony do stosunku 1: 1 i tak dalej. Ponieważ współczynniki te wynoszą stale 1: 1, ogólny stosunek musi wynosić również 1: 1, niezależnie od tego, jakie względne częstotliwości zamówień porodowych okazują się w populacji.
źródło
Narodziny każdego dziecka są niezależnym wydarzeniem z P = 0,5 dla chłopca i P = 0,5 dla dziewczynki. Inne szczegóły (takie jak decyzje rodzinne) tylko odwracają uwagę od tego faktu. Odpowiedź brzmi zatem, że stosunek wynosi 1: 1 .
Wyjaśnij to: wyobraź sobie, że zamiast mieć dzieci, rzucasz uczciwą monetą (P (głowy) = 0,5), dopóki nie otrzymasz „głów”. Powiedzmy, że Rodzina A rzuca monetą i pobiera sekwencję [ogonów, ogonów, głów]. Potem rodzina B rzuca monetą i dostaje reszkę. Jakie jest prawdopodobieństwo, że następne będą główkami? Nadal 0,5 , ponieważ to właśnie oznacza niezależność . Jeśli miałbyś to zrobić z 1000 rodzin (co oznacza, że pojawiło się 1000 głów), oczekiwana całkowita liczba ogonów wynosi 1000, ponieważ każde odwrócenie (zdarzenie) było całkowicie niezależne.
Niektóre rzeczy nie są niezależne, takie jak sekwencja w rodzinie: prawdopodobieństwo sekwencji [głowy, głowy] wynosi 0, nie jest równe [ogonom, ogonom] (0,25). Ale ponieważ pytanie o to nie pyta, nie ma znaczenia.
źródło
Wyobraź sobie, że rzucasz uczciwą monetą, dopóki nie zobaczysz głowy. Ile ogonów rzucasz?
Oczekiwaną liczbę ogonów można łatwo obliczyć * na 1.
Liczba głowic wynosi zawsze 1.
* jeśli nie jest to dla ciebie jasne, zobacz „zarys dowodu” tutaj
źródło
Najczęstsze są pary z dokładnie jedną dziewczyną i bez chłopców
Powodem tego wszystkiego jest to, że prawdopodobieństwo jednego scenariusza, w którym jest więcej dziewcząt, jest znacznie większe niż scenariuszy, w których jest więcej chłopców. A scenariusze, w których jest znacznie więcej chłopców, mają bardzo małe prawdopodobieństwo. Konkretny sposób, w jaki to działa, pokazano poniżej
W tym momencie można praktycznie zobaczyć, dokąd to zmierza, suma dziewcząt i chłopców będzie sumować się do jednego.
Oczekiwane dziewczyny z jednej pary= ∑∞n = 1( 12)n) = 1
= ∑∞n = 1( n - 1n2)) = 1
Ogranicz rozwiązania z wolfram
Każde narodziny, niezależnie od rodziny, mają 50:50 szansy na bycie chłopcem lub dziewczynką
Wszystko to ma sens, ponieważ (spróbuj jak pary) nie możesz kontrolować prawdopodobieństwa, że konkretny poród będzie chłopcem lub dziewczynką. Nie ma znaczenia, czy dziecko rodzi się bez pary, czy z rodziną złożoną ze stu chłopców; szansa wynosi 50:50, więc jeśli każdy poród ma szansę 50:50, zawsze powinieneś mieć pół chłopców i pół dziewcząt. I nie ma znaczenia, jak przetasujesz porody między rodzinami; nie wpłyniesz na to.
Działa to z dowolną 1 regułą
Ponieważ ze względu na szansę 50:50 dla każdego porodu stosunek wyniesie 1: 1 dla dowolnej (rozsądnej 1 ) reguły, którą możesz wymyślić. Na przykład podobna zasada poniżej również działa
W takim przypadku łatwiej jest obliczyć łączne oczekiwane dzieci
Oczekiwane dziewczyny z jednej pary= 0,5 ⋅ 1 + 0,25 ⋅ 1 = 0,75
= 0,25 ⋅ 1 + 0,25 ⋅ 2 = 0,75
1 Jak powiedziałem, działa to dla każdej rozsądnej reguły, która mogłaby istnieć w prawdziwym świecie. Nieuzasadnioną zasadą byłaby zasada, w której oczekiwane dzieci na parę byłyby nieskończone. Na przykład „Rodzice przestają mieć dzieci, gdy mają dwa razy więcej chłopców niż dziewczynki”, możemy zastosować te same techniki, co powyżej, aby pokazać, że ta zasada daje nieskończone dzieci:
Możemy wtedy znaleźć liczbę rodziców ze skończoną liczbą dzieci
Oczekiwana liczba rodziców ze skończonymi dziećmi= ∑∞m = 1( 11 / ( 3 m )2)) = π2)54= 0,18277 ... .
Ogranicz rozwiązania z wolfram
Na podstawie tego możemy ustalić, że 82% rodziców miałoby nieskończoną liczbę dzieci; z punktu widzenia planowania miasta prawdopodobnie spowodowałoby to trudności i pokazuje, że taki warunek nie mógłby istnieć w prawdziwym świecie.
źródło
Możesz także użyć symulacji:
źródło
mean(rgeom(10000, 0.5))
Mapowanie tego pomogło mi lepiej zobaczyć, jak stosunek populacji urodzeń (zakładany jako 1: 1) i stosunek populacji dzieci wynosiłby 1: 1. Podczas gdy niektóre rodziny miałyby wielu chłopców, ale tylko jedną dziewczynkę, co początkowo doprowadziło mnie do wniosku, że będzie więcej chłopców niż dziewcząt, liczba tych rodzin nie będzie większa niż 50% i zmniejszy się o połowę z każdym kolejnym dzieckiem, podczas gdy liczba rodzin składających się tylko z jednej dziewczynki wynosiłaby 50%. Liczba chłopców i dziewcząt równoważyłaby się. Zobacz sumy 175 na dole.
źródło
To, co otrzymałeś, było najprostsze i prawidłowa odpowiedź. Jeśli prawdopodobieństwo, że noworodek jest chłopcem, wynosi p, a dzieciom niewłaściwej płci nie spotkały niefortunne wypadki, nie ma znaczenia, czy rodzice podejmą decyzję o posiadaniu większej liczby dzieci na podstawie płci dziecka. Jeśli liczba dzieci wynosi N, a N jest duża, możesz spodziewać się p * N chłopców. Nie ma potrzeby bardziej skomplikowanych obliczeń.
Z pewnością istnieją inne pytania, takie jak: „jakie jest prawdopodobieństwo, że najmłodsze dziecko z rodziny z dziećmi jest chłopcem”, lub „jakie jest prawdopodobieństwo, że najstarsze dziecko z rodziny z dziećmi jest chłopcem”. (Jedna z nich ma prostą poprawną odpowiedź, druga ma prostą złą odpowiedź, a uzyskanie poprawnej odpowiedzi jest trudne).
źródło
Pozwolić
być miejscem próbki i niech
Trywialnie, oczekiwana wartość dziewcząt wynosi 1. Więc stosunek również wynosi 1.
źródło
To podchwytliwe pytanie. Proporcja pozostaje taka sama (1: 1). Prawidłowa odpowiedź jest taka, że nie wpływa na współczynnik urodzeń, ale wpływa na liczbę dzieci na rodzinę, przy czym czynnik ograniczający wynosi średnio 2 urodzenia na rodzinę.
Takie pytanie można znaleźć w teście logicznym. Odpowiedź nie dotyczy współczynnika urodzeń. To rozprasza.
To nie jest pytanie prawdopodobieństwa, ale pytanie rozumowania poznawczego. Nawet jeśli odpowiedziałeś w stosunku 1: 1, nadal nie zdałeś testu.
źródło
Pokazuję kod, który napisałem dla symulacji Monte Carlo (rodziny 500 x 1000) przy użyciu oprogramowania `MATLAB '. Sprawdź kod, aby się nie pomylić.
Wynik jest generowany i wykreślany poniżej. Pokazuje, że symulowane prawdopodobieństwo porodu dziewczynki ma bardzo dobrą zgodność z leżącym u jego podstaw naturalnym prawdopodobieństwem porodu, niezależnie od reguły zatrzymania dla zakresu naturalnego prawdopodobieństwa porodu.
Bawiąc się kodem, łatwiej jest zrozumieć jedną kwestię, której do tej pory nie robiłem --- jak podkreślają inne, reguła zatrzymywania jest rozproszeniem. Reguła zatrzymania wpływa tylko na liczbę rodzin przy określonej populacji lub z innego punktu widzenia na liczbę urodzeń dzieci przy określonej liczbie rodzin. Płeć zależy wyłącznie od rzutu kostką, a zatem stosunek lub prawdopodobieństwo (które jest niezależne od liczby dzieci) będzie zależeć wyłącznie od naturalnego współczynnika narodzin chłopca: dziewczynki.
źródło
Niezależność urodzeń nie ma znaczenia przy obliczaniu oczekiwanych wartości.
Apropos @ Whuber, jeśli istnieje różnica w krańcowym prawdopodobieństwie między rodzinami, stosunek staje się wypaczony w stosunku do chłopców, z powodu większej liczby dzieci w rodzinach z większym prawdopodobieństwem chłopców niż rodzin o niższym prawdopodobieństwie, a tym samym zwiększający efekt oczekiwana suma wartości dla chłopców.
źródło
Niezależnie zaprogramowałem również symulację w Matlabie, zanim zobaczyłem, co zrobili inni. Ściśle mówiąc, nie jest to MC, ponieważ eksperyment przeprowadzam tylko raz. Ale raz wystarczy, aby uzyskać wyniki. Oto, co daje moja symulacja. Nie sprzeciwiam się prawdopodobieństwu porodu jako prymitywu p = 0,5. Pozwoliłem, aby prawdopodobieństwo porodu zmieniało się w zakresie Pr (chłopcy = 1) = 0,25: 0,05: 0,75.
Moje wyniki pokazują, że gdy prawdopodobieństwo odbiega od p = 0,5, stosunek płci jest różny od 1: w oczekiwaniu stosunek płci jest po prostu stosunkiem prawdopodobieństwa porodu chłopca do prawdopodobieństwa porodu dziewczynki. Oznacza to, że jest to losowa zmienna geometryczna zidentyfikowana wcześniej przez @ månst. Uważam, że oryginalny plakat był intuicyjny.
Moje wyniki ściśle naśladują to, co zrobił powyższy plakat z kodem Matlab, dopasowując proporcje płci przy prawdopodobieństwie narodzin chłopca 0,45, 0,50 i 0,55. Prezentuję mój, gdy podchodzę nieco inaczej, aby uzyskać wyniki z szybszym kodem. Aby dokonać porównania, pominąłem sekcję kodu vec = vec (randperm (s, N)), ponieważ s nie jest zdefiniowane w kodzie i nie znam pierwotnej intencji tej zmiennej (ta sekcja kodu wydaje się również zbyteczna - jak pierwotnie stwierdził).
Wysyłam swój kod
Poniższy wykres jest oczekiwany, biorąc pod uwagę silne prawo dużej liczby. Odtwarzam to, ale ważny jest drugi wykres.
Tutaj prawdopodobieństwo populacyjne inne niż 0,5 dla urodzenia którejkolwiek z płci dziecka zmieni stosunek płci w całej populacji. Zakładając, że porody są niezależne (ale nie wybór dalszego rozmnażania się), w każdej rundzie warunkowego rozmnażania prawdopodobieństwo populacji reguluje ogólny skład wyników porodów chłopców i dziewcząt. Tak jak inni wspominali, reguła zatrzymania w tym problemie jest nieistotna dla wyniku populacji, na co odpowiedział plakat, który określił to jako rozkład geometryczny.
Dla kompletności, reguła zatrzymująca wpływa na liczbę rund reprodukcji w populacji. Ponieważ eksperyment przeprowadzam tylko raz, wykres jest nieco postrzępiony. Ale jest intuicja: dla danej wielkości populacji, wraz ze wzrostem prawdopodobieństwa porodu dziewczynki, widzimy, że rodziny potrzebują mniej rund reprodukcji, aby uzyskać pożądaną dziewczynę, zanim cała populacja przestanie się rozmnażać (oczywiście liczba rund będzie zależeć od wielkość populacji, ponieważ zwiększa to mechanicznie prawdopodobieństwo, że rodzina będzie miała na przykład 49 chłopców, zanim dostaną swoją pierwszą dziewczynę)
Porównanie moich obliczonych proporcji płci:
i te z poprzedniego plakatu z kodem Matlab:
Są to równoważne wyniki.
źródło
To zależy od liczby rodzin.
źródło