Czy fakt, że mój włoski syn będzie uczęszczał do szkoły podstawowej, zmieni oczekiwaną liczbę włoskich dzieci obecnych w jego klasie?

37

To pytanie wynika z rzeczywistej sytuacji, na którą naprawdę byłem zaskoczony odpowiedzią.

Mój syn ma rozpocząć szkołę podstawową w Londynie. Ponieważ jesteśmy Włochami, byłem ciekawy, ilu włoskich dzieci uczęszcza już do szkoły. Poprosiłem o to urzędnika ds. Przyjęć podczas składania wniosku, a ona powiedziała mi, że mają średnio 2 włoskie dzieci na klasę (30 osób).

Jestem teraz w momencie, w którym wiem, że moje dziecko zostało przyjęte, ale nie mam żadnych innych informacji o innych dzieciach. Kryteria przyjęć oparte są na odległości, ale na potrzeby tego pytania uważam, że możemy założyć, że opiera się ono na losowej alokacji od dużej próby wnioskodawców.

Ile włoskich dzieci ma być w klasie mojego syna? Czy będzie bliżej 2 czy 3?

użytkownik90213
źródło
39
To przypomina mi stary żart: „Zawsze noszę bombę podczas podróży, ponieważ jakie są szanse, że dwie osoby będą miały bombę w tym samym samolocie?”
Bill the Lizard
2
To, że urzędnik ds. Przyjęć powiedział ci, że mają średnio 2 włoskie dzieci na klasę, sprawia, że ​​dane te są dla mnie „podejrzane”. Gdyby wynikało to z prawdziwego obliczenia, można oczekiwać nieokrągłej liczby. Możliwe więc, że prawdziwa wartość to, powiedzmy, 1,51 lub 2,49. Ponieważ urzędnik ds. Przyjęć z większym prawdopodobieństwem spróbuje „zadowolić cię” swoją odpowiedzią, być może zaokrąglił w górę, a nie w dół (gdyby uważał, że będziesz zadowolony z posiadania dziecka wśród innych Włochów), co sugeruje, że prawdopodobieństwo rozkład na wartości bliskie 2 byłby niesymetryczny. Odpowiedzi poniżej można dostosować.
PatrickT
4
@PatrickT „Tryb” jest prawidłowym typem średniej.
Ian Ringrose,
1
Wielkie dzięki chłopaki za odpowiedź. Zadałem też podobne pytanie, ale z inną ramką ( stats.stackexchange.com/questions/173969/... ), która została wywołana przez niektóre z twoich danych wejściowych / odpowiedzi.
user90213,
1
@PatrickT Myślę, że jest o wiele słabiej wykształconych ludzi, którzy byliby zdezorientowani 1,5 („Jak masz pół dzieciaka?”) Niż nerdowie zirytowani nadmiernym zaokrąglaniem wydają mi się bardziej prawdopodobne. (Zakładając, że dokładniejsza liczba nie jest tak naprawdę 1,9 lub 2,1.)
Dan Neely,

Odpowiedzi:

27

Jak zawsze należy wziąć pod uwagę model probabilistyczny, który opisuje, w jaki sposób szkoła dzieli dzieci na poszczególne klasy. Możliwości:

  1. Szkoła dba o to, aby wszystkie klasy miały tę samą liczbę cudzoziemców.
  2. Szkoła stara się nawet upewnić, że każda narodowość jest reprezentowana mniej więcej tak samo w każdej klasie.
  3. Szkoła w ogóle nie bierze pod uwagę narodowości i po prostu dystrybuuje losowo lub na podstawie innych kryteriów.

Wszystkie są rozsądne. Biorąc pod uwagę strategię 2, odpowiedź na twoje pytanie brzmi „nie”. Gdy zastosują strategię 3, oczekiwania będą zbliżone do 3, ale nieco mniejsze. Jest tak, ponieważ twój syn zajmuje „miejsce”, a ty masz o jedną szansę mniej losowego Włocha.

Kiedy szkoła stosuje strategię 1, oczekiwania również rosną; ile zależy od liczby cudzoziemców na klasę.

Bez znajomości twojej szkoły nie ma sposobu, aby odpowiedzieć na to dokładniej. Jeśli masz tylko jedną klasę rocznie, a kryteria przyjęć są zgodne z opisem, odpowiedź byłaby taka sama jak dla 3 powyżej.

Szczegółowa kalkulacja dla 3:

E(X)=1+E(B(29,2/30))=1+1.9333=2.9333.

X to liczba włoskich dzieci w klasie. 1 pochodzi od znanego dziecka, 29 to reszta klasy, a 2/30 to prawdopodobieństwo, że nieznane dziecko jest Włochem, biorąc pod uwagę to, co mówi szkoła. B jest rozkładem dwumianowym.

Zauważ, że rozpoczęcie od nie daje właściwej odpowiedzi, ponieważ wiedza, że ​​określone dziecko jest Włochem, narusza wymienność przyjętą przez rozkład dwumianowy. Porównaj to z paradoksem chłopca lub dziewczynki , gdzie ma to znaczenie, czy wiesz, że jedno dziecko jest dziewczynką, czy wiedząc, że starsze dziecko jest dziewczynką.E(X|X1)

Erik
źródło
2
Przyjmijmy założenie dwumianowe i niech . Wydaje się, że wybór pomiędzy E ( X ~ B ( 30 , 2 / 30 ) | X 1 ) i E ( B ( 29 , 2 / 30 ) )n=30E(XB(30,2/30)|X1)E(B(29,2/30))może zależeć od założeń. Na przykład, jeśli założę, że każdy włoski ojciec w Londynie najprawdopodobniej będzie tak zaskoczony jak @ user90213, a następnie opublikuje pytanie tutaj, to zobaczenie tego jednego pytania nie zmieni moich oczekiwań. Dowiedziałem się tylko, że jedno dziecko jest Włochem i obliczy . Czy to, co nazywasz „wymienialnością”? Jeśli natomiast użytkownik90213 jest moim bliskim przyjacielem i znam jego syna, dotarłbym do twojej odpowiedzi. E(X|X1)
ameba mówi Przywróć Monikę
2
@amoeba Wiedząc, że w konkretnej szkole i w konkretnej klasie jest użytkownik user90213, aby odróżnić go od reszty, nie zależy to od tego, jak szczególny jest twój stosunek do użytkownika 90213. Ale jest to trudne, ponieważ ma znaczenie, jak się uczysz informacji. Na przykład, jeśli zapytasz przez e-mail, że najstarsze włoskie dziecko w klasie kontaktuje się z tobą po imieniu i otrzymujesz odpowiedź, wybrałbyś podejście nawet jeśli później możesz je rozróżnić. Spróbuj googlować w poszukiwaniu paradoksu dla dziewcząt i chłopców, a nawet zadaj bardziej ogólne pytanie. Jest wiele dyskusji na ten temat. E(X|X>1)
Erik,
Zgadza się, dzięki Erik. W poprzednim komentarzu miałem na myśli coś podobnego do twojego przykładu z e-mailem. Jeśli założę, że wszyscy włoscy rodzice w klasie opublikują tutaj pytanie, to zobaczenie tego pytania jest jak kontakt z najstarszym włoskim dzieckiem. Wygląda na to, że ogólnie jesteśmy zgodni, +1. Link do wiki jest naprawdę interesujący.
ameba mówi Przywróć Monikę
(+1) Ale zastanawiasz się, dlaczego mówisz „Jeśli masz tylko jedną klasę rocznie [...]”.
Scortchi - Przywróć Monikę
@Scortchi Jeśli szkoła ma tylko jedną klasę rocznie, może skorzystać z dwóch strategii o nazwach 1 i 2, ponieważ każde dziecko przyjęte w szkole w tym roku kończy się w tej samej klasie.
Erik
13

Innym sposobem na to jest na poziomie poszczególnych dzieci. Zakładając, że 30 dzieci dobranych losowo z populacji (co już wskazane możemy), możemy działać wstecz do szorstkiej prawdopodobieństwem włoskiego dziecka jest wyciągnąć z tej populacji: = 1 / 15 .2/301/15

Biorąc pod uwagę, że wiemy, że jeden z 30 jest Włochem, musimy tylko obliczyć prawdopodobieństwo dla pozostałych dzieci:

291/15=29/15=1.933

Wiedząc, że Twoje dziecko jest Włochem, zmienia oczekiwaną liczbę włoskich dzieci w klasie na około 2,933, co jest znacznie bliższe 3 niż 2.

Thomas Cleberg
źródło
5

Oto moje przemyślenia, jak do tego podejść:

Niech zmienna losowa oznacza liczbę włoskich dzieci w klasie, która ma obecnie rozmiar n . Niech X będzie wskaźnikiem tego, że nowe dziecko jest Włochem. Załóżmy, że dodajemy dziecko X do tej klasy. Zatem oczekiwana liczba włoskich dzieci w tej rozszerzonej klasie wielkości n + 1 wynosi E ( S n + X ) = E ( S n ) + E ( X ) = E ( S n ) + P (SnnXXn+1 . Zauważ, że niezależność nie ma tutaj znaczenia, ponieważ używamy tylko liniowości oczekiwań. Jeśliwiadomo, żedziecko X jest Włochem, X = 1 z prawdopodobieństwem 1, więc zwiększyliśmy wartość oczekiwaną o 1.E(Sn+X)=E(Sn)+E(X)=E(Sn)+P(X=1)XX=1

jld
źródło
1
n+1
Tak. Czy jest coś, za czym tęsknię?
jld
1
Zależy, jak przeczytasz pytanie. Załóżmy, że zajęcia obejmują dokładnie 30 dzieci.
Scortchi - Przywróć Monikę
1
Może źle zrozumiałem pytanie. Myślałem, że pyta o to, jak dodanie znanego włoskiego dziecka zmienia oczekiwania.
jld
1
To bardzo dobry punkt o klasie rozmiarów może być ograniczona
JLD
1

Binom(30,2/30)E(X|X1)XBinom(30,2/30)2.28


E[X|X1]=i=030iP(X=i|X1)=030iP(X=i,X1)P(X1)=130iP(i)1P(0)

(zwróć uwagę na dolną granicę sumy w ostatnim kroku)

jf328
źródło
1
Czy możesz rozwinąć warunkowe oczekiwania?
Antoni Parellada,
3
Twoja odpowiedź jest nieprawidłowa. Właściwym sposobem na obliczenie tego byłoby 1 (znane dziecko) + E (B (29, 2/30)), co okazuje się 2,9333. A założenie o rozkładzie dwumianowym jest wątpliwe.
Erik,
Jeszcze jedną rzecz, na którą chciałbym zwrócić uwagę: a) błędne jest obliczenie warunkowych oczekiwań. Ale b) co ważniejsze, rozpoczęcie od warunkowych oczekiwań jest niepoprawne. Wiedza, że ​​określone dziecko jest Włochem, przerywa wymienność zakładaną przez rozkład dwumianowy. Jest bardzo podobny do paradoksu chłopiec-dziewczynka ( en.wikipedia.org/wiki/Boy_or_Girl_paradox ), gdzie ma znaczenie, czy wiesz, że starsze dziecko jest dziewczynką, czy wiesz, że jedno z dwojga dzieci jest dziewczynką.
Erik,
Dodaj komentarz a) z góry. Ale b) i tak jest poważniejszy;)
Erik
Zgadzam się. W przypadku OP rozkład nie jest już dwumianowy (30, 2/30), ale rzeczywiście 1 + dwumianowy (29, 2/30)
jf328,
-3

Nie. Twoja wiedza o zbliżających się wydarzeniach nic nie zmienia w typowym doświadczeniu szkoły.

Targowisko
źródło
2
-1. Jest to niepoprawne, jak wyjaśniono szczegółowo w innych odpowiedziach i komentarzach tutaj.
ameba mówi Przywróć Monikę
wybacz mój brak zaawansowanej matematyki, ale to, co sprawia, że dziecko w tym Gent, by nie być jednym z „typowo 2” dzieci .. tak, że skończymy bliżej 3.?
Mart
Mart: Wyobraź sobie, że rzucam monetą dziesięć razy i liczę głowy; nic dziwnego w monetach i sposobie, w jaki je rzucam. Powtarzam ten eksperyment wiele razy i średnio widzę prawie dokładnie 5 głów w dziesięciu rzutach; które wyniki widzisz (w sumie 1000 rzutów, z czego 50,3% to główki, co jest zgodne z oczekiwaną odmianą dla uczciwej procedury losowania monet; decydujemy, że proces wydaje się co najmniej praktycznie sprawiedliwy). Teraz przeprowadzam z tobą eksperyment jeszcze raz i widzisz, że pierwsze 4 rzuty są główkami. Jaka jest oczekiwana liczba głów w pełnym zestawie dziesięciu rzutów? 5? więcej?
Glen_b,
Zauważ, że we wcześniejszym argumencie pierwsze cztery „mogły być czterema z oczekiwanych pięciu”. Ale wtedy powiedziałbyś, że jest mniej niż 50% szansy na kolejne sześć rzutów (w rzeczywistości mówisz, że jest tylko szansa średnio 1/6). Skąd moneta wiedziałaby, że rzadziej pojawia się?
Glen_b