Czy to ważne, jak próbkujesz populację?

9

Mam dobrze wymieszaną kadzinę zawierającą nieskończoną liczbę kulek. W kadzi jest nieskończona ilość kulek, ale występują one tylko w nieznanej, ale skończonej liczbie odmian : jest nieznany, a dla narysowanie marmuru typu może być bardziej prawdopodobne niż narysowanie marmuru typu .

V.={v1,v2),v3),...,vk}
kjajotvjavjot

W eksperymencie maszyna próbkuje kadź przy użyciu nieznanej procedury. Maszyna zgłasza zestaw opisujący odmian kulek z próbki: Xqk

XV.;|X|=q

Próby tego eksperymentu są powtarzane ( jest ustalone między próbami) i otrzymujemy sekwencję podzbiorów , .qV.(X1,X2),)

Jedyne inne rzeczy, które wiemy to:

  • próby są niezależne i identyczne
  • maszyna zgłasza najczęściej występujące odmiany w swojej próbceq

Nie wiemy dokładnie, jak maszyna próbkuje kulki. Może wybrać dużą liczbę kulek, a następnie zgłosić najczęściej. Alternatywnie może zbierać kulki, dopóki nie będzie odmian. Są też inne rzeczy, które mógłby zrobić.qq

Czy na przebieg naszych prób będzie miała wpływ procedura próbkowania maszyny?(X1,X2),)

Christian Chapman
źródło
3
+1 To świetne pytanie, ponieważ docenia to, że losowe pobieranie próbek ma więcej niż niejasną formę arbitralności lub braku wiedzy na temat procedury pobierania próbek.
whuber
Zasada próbkowania z pewnością będzie miała znaczenie. W przeciwnym razie rozważ tę procedurę: maszyna, na każdej próbie, zawsze wybiera pojedynczy marmur typu 1 (pierwsza odmiana). Każde losowanie będzie niezależne i będzie miało identyczny rozkład (trywialnie), a otrzymasz q = 1, całkowicie niepomocny wynik.
AlaskaRon,

Odpowiedzi:

9

Prostym sposobem sprawdzenia, czy metoda ma znaczenie, jest wybranie określonych prawdopodobieństw dla rodzajów marmurów i obliczenie szansy każdego podzbioru zgodnie z niektórymi metodami. Nie może to jednak udowodnić, że metoda nie ma znaczenia.

Załóżmy, że są 3) typy i szanse każdego typu są 1/2), 1/4, i 1/4odpowiednio. Załóżmy, że wybierasz2) rodzaje kulek.

Załóżmy, że po wybraniu marmuru ignorujesz resztę tego rodzaju. Szansa, którą masz{v2),v3)} jest 2)1/41/3)=1/6.

Załóżmy, że odrzucasz pary z powtarzającymi się typami. Szansa na{v2),v3)} jest

2)1/41/42)1/41/4+2)1/2)1/4+2)1/2)1/4=1/81/8+1/4+1/4=1/5

Ponieważ są one różne, metoda, z której korzysta maszyna, ma znaczenie. Odrzucanie par z typami powtarzanymi powoduje, że pary zwykłych typów są mniej obciążone.

Dwie z wymienionych metod są równoważne. Ignorowanie reszty tego rodzaju po zerwaniu marmuru jest tym samym, co zrywanie, dopóki go nie maszq różne rodzaje.

Douglas Zare
źródło