Instruktor na moim uniwersytecie zadał takie pytanie (nie na zadanie domowe, ponieważ lekcja się skończyła, a mnie nie było). Nie mogę wymyślić, jak do tego podejść.
Pytanie dotyczy 2 torebek, z których każda zawiera asortyment różnych rodzajów owoców:
Pierwsza torba zawiera następujące losowo wybrane owoce:
+ ------------- + -------- + --------- + | średnica cm | masa g | zgniły? | + ------------- + -------- + --------- + | 17,28 | 139,08 | 0 | | 6,57 | 91,48 | 1 | | 7,12 | 74,23 | 1 | | 16,52 | 129,8 | 0 | | 14,58 | 169,22 | 0 | | 6,99 | 123,43 | 0 | | 6,63 | 104,93 | 1 | | 6,75 | 103,27 | 1 | | 15,38 | 169,01 | 1 | | 7,45 | 83,29 | 1 | | 13,06 | 157,57 | 0 | | 6,61 | 117,72 | 0 | | 7,19 | 128,63 | 0 | + ------------- + -------- + --------- +
Druga torebka zawiera 6 losowo wybranych owoców z tego samego sklepu, co pierwsza torebka. Suma ich średnic wynosi 64,2 cm, a 4 są zgniłe.
Podaj szacunkową masę drugiej torby.
Widzę, że wydają się istnieć dwa różne rodzaje owoców o normalnie rozmieszczonych średnicach i masach, ale jestem zagubiony, jak postępować.
regression
estimation
rutilusk
źródło
źródło
Odpowiedzi:
Zacznijmy od wykreślenia danych i przyjrzenia się im. Jest to bardzo ograniczona ilość danych, więc będzie to nieco ad hoc z mnóstwem założeń.
Oto dane, czerwone kropki oznaczają zgniłe owoce:
Masz rację zakładając, że wydają się istnieć dwa rodzaje owoców. Moje założenia są następujące:
Ponieważ podano, że suma średnicy wynosi 64,2 cm, najprawdopodobniej dwa owoce są duże, a cztery są małe. Teraz są 3 przypadki na wagę. Zgniłe są 2, 3 lub 4 małe owoce (zgniłe duże owoce nie wpływają na masę z założenia ). Teraz możesz uzyskać granice swojej masy, obliczając te wartości.
Możemy empirycznie oszacować prawdopodobieństwo zgniłych małych owoców. Używamy prawdopodobieństw do ważenia naszych oszacowań masy, w zależności od liczby zgniłych owoców:
Dając nam ostateczną ocenę 691,5183 g . Myślę, że musisz wyciągnąć większość założeń, które wyciągnąłem, aby dojść do wniosku, ale myślę, że byłoby to możliwe w mądrzejszy sposób. Próbuję również empirycznie, aby uzyskać prawdopodobieństwo liczby zgniłych małych owoców, to jest po prostu lenistwo i można to zrobić „analitycznie”.
źródło
Proponuję następujące podejście:
Wszystko to jest możliwe do zarządzania za pomocą prostego skryptu.
źródło
Wiele podejść obejmuje, od najprostszego do złożonego,
. . .
metody kombinatoryczne
Podejścia są ułożone w kolejności prostoty obliczania, a nie w celu lepszego podejścia lub jakiegokolwiek dobrego. Wybór podejścia do zastosowania zależy od tego, jakie cechy populacji są znane lub zakładane. Na przykład, jeśli masy owoców w populacji sklepu są normalnie rozmieszczone i niezależne od średnic i stanu zgnilizny, można zastosować pierwsze, najprostsze podejście bez żadnych zalet (a nawet wad błędu próbkowania wielu zmiennych) stosowania bardziej złożonych podejść . Jeśli nie są niezależnymi identycznie rozmieszczonymi zmiennymi losowymi, lepszym wyborem może być bardziej złożony wybór w zależności od znanych lub zakładanych informacji o populacji.
źródło