Jaka jest różnica między „proporcjami zliczania” a „proporcjami ciągłymi”?

12

W komentarzu do innego pytania zapytano o wyjaśnienie, czy omawiany temat to „proporcje zliczania” czy „proporcje ciągłe”, a obserwacja wykazała, że ​​różnica była krytyczną informacją (na temat regresji logistycznej / dwumianowej vs. regresji beta).

Jaka jest różnica między nimi i gdzie ma to znaczenie? O czym należy pamiętać podczas pracy z „liczeniem proporcji” w porównaniu z pracą z „proporcjami ciągłymi”?

RM
źródło

Odpowiedzi:

14

Być może pomoże jakiś przykład. Załóżmy, że obserwujesz wiele osób i liczysz, ile z nich to kobiety. Wynikowa proporcja jest nazywana proporcją zliczania i przyjmuje wartości od zera do jednego, ale tylko z nich, gdzie n jest liczbą całkowitą, którą zaobserwowałeś. Załóżmy, że kupujesz kiełbasę w lokalnym supermarkecie i zauważysz na etykiecie, że wieprzowina w 80% jest przykładem stałej proporcji i może przyjmować dowolną wartość od 0 do 100.n+1n

Różnica w modelowaniu polega na tym, że w pierwszym przypadku sensowne jest przewidzenie prawdopodobieństwa, że ​​przypadkowa osoba będzie kobietą (regresja logistyczna), ale w drugim przypadku nie jest to rozsądne pytanie i preferowane byłoby coś innego (często regresja beta) .

mdewey
źródło
4
Zgadzam się, ale różnica może być mniejsza niż domniemana. Mężczyźni i kobiety są liczeni, w zasadzie i w praktyce. Cząsteczki gliny, mułu i piasku, bez względu na zasadę, nie są liczone w praktyce. Prawdopodobieństwo bycia (np.) Gliną (zamiast mułu lub piasku) odnosi się wówczas do hipotetycznie małych ilości osadów lub gleby. To, czy ziemia jest (powiedzmy) wiejska czy miejska, jest zasadniczo problemem w pomiarach obszarów (ale w praktyce może to nadal sprowadzać się do pewnego rodzaju liczenia małych jednostek powierzchni!). Ale zasada jest taka, że ​​proporcje liczenia są dyskretne, a proporcje ciągłe ciągłe.
Nick Cox
@Nick, nawet jeśli składniki są cząstkami, nie możemy ich po prostu policzyć, chyba że wprowadzisz nierealistyczne założenie, że wszystkie cząstki piasku iłu iłu muszą być takie same (powiedzmy, ta sama masa, jeśli mierzymy proporcje wagowe) zarówno w obrębie typów, jak i między nimi. Ponieważ takie ciągłe proporcje mogą często zasadniczo różnić się od proporcji zliczania, to „1” zazwyczaj nie zmienia wiele. Z pewnością niektóre właściwości mogą być współużytkowane (nie tylko dlatego, że oba są w przedziale jednostkowym), ale pod pewnymi względami będą one lub często będą się różnić w istotny sposób.
Glen_b
Rzeczywiście przykład jest mętny, ponieważ chociaż cząstki mogą być dyskretne, to ich masa, a nie ich liczba, jest tym, co chcemy zmierzyć. Chciałem przykładu, w którym byty są dyskretne, ale my mierzymy w praktyce, aby podkreślić, że rozróżnienie między liczeniem a mierzeniem jest nieco rozmyte. Lepszy przykład byłby mile widziany.
Nick Cox,
Muszę powiedzieć @NickCox, że starałem się wymyślić absolutnie żeliwny, 22-karatowy, kuloodporny przykład i jak na definicję zrezygnowałem.
mdewey,
@mdewey Sympathies. Jak wiadomo, w statystykach coś jest uważane za dyskretne, jeśli w czyimś osądzie dyskrecja jest widoczna i ważna dla bezpośredniego celu, a ciągła w przeciwnym razie i odwrotnie. W całkiem innym kontekście pedolog zaproponował definicję, że gleba jest czymś tak zwanym przez właściwy organ, i wysadziła malinę (brytyjski angielski, który zrozumiemy, nie wiemy, jak daleko to będzie tłumaczone) z udręką nad definicjami.
Nick Cox,