Co rozumie się przez podział kategoryczny?

12

Czy ten osobny typ dystrybucji (EX: dwumianowy, bernoulli, wielomianowy) lub jakikolwiek rozkład może być reprezentowany w ten sposób. Czy ktoś może opracować prosty przykład

subha
źródło

Odpowiedzi:

12

Rozkład kategoryczny jest uogólnieniem rozkładu Bernoulliego na stałą liczbę wyników.2k

Odpowiednio, jest to szczególny przypadek rozkładu wielomianowego, w którym liczba „wyborów” jest ustalona na jeden.n

Dlatego ma pdf:

i=1kpixi(where 0pi and ipi=1)
ponad wsparcie gdzie
xi{0,1}
ni=1kxi=1.

Podsumowując, Bernoulli ma k=2,n=1 , dwumianowy ma k=2,n1 , wielomian ma k2,n1 , a kategoryczny ma k2,n=1 .

Neil G.
źródło
czy to konieczne, xi = 0,1. Nie może być więcej niż to.
subha
@subha: Tak rozumiem moje rozumienie podziału na kategorie. Oczywiście w przypadku wielomianu i dwumianu może być.
Neil G
5

Zmienne jakościowe mają skończone zestawy wartości dyskretnych. Przykłady obejmują płeć (mężczyzna / kobieta), kraj, planetę itp. Porównaj to z ciągłymi zmiennymi, które mogą przyjąć nieskończoną liczbę różnych wartości. Przykłady obejmują wagę, długość geograficzną, odległość itp.

Zauważ, że podobne informacje mogą czasami być wyrażone w kategoryczny i ciągły sposób; np. planet = earthmożna wyrazić jako distance to sun = 1 astronomical unit ≈ 150 million kilometers. Jednak tak naprawdę nie ma sposobu na wyrażenie 200 milionów kilometrów od Słońca w kategoriach planet, ponieważ nie ma tam żadnej planety (Mars jest 228 milionów km od Słońca). To samo dla 201 milionów km, 202 itd. Wszystko, co można powiedzieć o tych odległościach w odniesieniu do planet, to planet = none; nie możesz powiedzieć planet = 4/3×earthani .88×Mars, ponieważ nie ma sensownego sposobu pomnożenia planety lub jakiejkolwiek innej zmiennej kategorycznej. W kategoriach planet odległości te byłyby nie do odróżnienia, ale oczywiście mają sens jako wyraźne odległości od Słońca, gdy wyrażone jako takie - jako zmienna ciągła.

Można również wyrażać zmienne ciągłe z dowolną precyzją (np. Jedna jednostka astronomiczna ma 149 597 871 km, a nie dokładnie 150 milionów km). I odwrotnie, nie ma możliwości planet = earthdokładniejszego wyrażenia ; Ziemia jest dokładnie ziemią, ani więcej, ani mniej. Ponadto nie ma sensu mówić, że jakakolwiek inna planeta jest „większa” lub „mniejsza” niż Ziemia, jeśli planetjest zmienną nominalną. Może być jednak zakodowany jako zmienna uporządkowana (porządkowa) - planety są uporządkowane pod względem odległości do Słońca, objętości, liczby księżyców itp. Liczby te są ciągłe według własnych terminów (lub przynajmniej liczby, które są dyskretne ale nie kategorycznie), ale nie w kategoriach planet. Na przykład, jeśli planety są uporządkowane według odległości od słońca lub liczby księżyców mars > earth > venus. Jeśli planety są uporządkowane według objętości,earth > venus > mars. Nie jest konieczne porządkowanie zmiennych kategorialnych, a być może niektórych nie da się uporządkować, ale dodanie porządku nie czyni ich mniej kategorycznymi.

Jak mówi Wikipedia, rozkłady jakościowe są uogólnieniami rozkładu Bernoulliego na więcej niż dwie możliwe wartości (rozkład Bernoulliego jest ściśle dwójkowy). Rozkład Bernoulliego jest również szczególnym przypadkiem rozkładu dwumianowego, ale nie nazwałbym rozkładu dwumianowego kategorycznym (jest dyskretny, ale zmienna zliczająca, więc definiowane są odległości między wartościami). Rozkłady wielomianowe mogą być powiązane z rozkładami kategorycznymi, ale Wikipedia ostrzega przed tym .

Nick Stauner
źródło