Czy ta ilość związana z niezależnością ma nazwę?

18

Oczywiście zdarzenia A i B są niezależne iff Pr = Pr ( A ) Pr ( B ) . Zdefiniujmy odpowiednią ilość Q:(AB)(A)(B)

QPr(AB)Pr(A)Pr(B)

Zatem A i B są niezależne iff Q = 1 (przy założeniu, że mianownik jest niezerowy). Czy Q faktycznie ma nazwę? Wydaje mi się, że odnosi się to do jakiejś elementarnej koncepcji, która mi teraz ucieka, i że będę się głupio nawet na to pytać.

Michael McGowan
źródło
1
Myślę, że to zależy od kontekstu. Zauważ, że tak abyPr(A|B)=QPr(A)iPr(B|A)=QPr(B). Ta forma ma bardziej smak wnioskowania bayesowskiego.
Q=Pr(A|B)Pr(A)=Pr(B|A)Pr(B)
Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
vqv
To SE mogłoby poradzić sobie z kilkoma bardziej „głupimi” pytaniami. To bardzo przerażające, nawet dla kogoś, kto lubił podstawowe statystyki na poziomie licencjackim. +1 za głupotę
naught101
1
Idź do „Migdal Probability”;)
Bitwise
1
@PiotrMigdal Dzięki za miłą ofertę. Wolałbym zobaczyć twoją własną odpowiedź. Może w tym, jak wymyśliłeś to pytanie i jak ta ilość może być przydatna.

Odpowiedzi:

14

Jest obserwowany w stosunku do oczekiwanego stosunku (skrót: o / e ).

Cytując odpowiedź na O wspólnym prawdopodobieństwie podzielonym przez iloczyn prawdopodobieństwa w Math.SE (wskazany przez Procrastinator ):

Następnie, przynajmniej w literaturze środowiskowej, medycznej i naukach przyrodniczych, P (A∩B) / (P (A) P (B)) nazywa się stosunkiem obserwowanym do oczekiwanego (skrót o / e). Chodzi o to, że licznik jest rzeczywistym prawdopodobieństwem A∩B, podczas gdy mianownik jest taki, jak by to było, gdyby A i B były niezależne.

Piotr Migdal
źródło
11

Myślę, że szukasz Lift(lub poprawy). Wzrost jest stosunkiem prawdopodobieństwa wystąpienia A i B do wielokrotności dwóch indywidualnych prawdopodobieństw dla A i B. Służy do interpretacji znaczenia reguły w wydobywaniu reguł asocjacyjnych . Wzrost jest sposobem na zmierzenie, o ile lepszy jest model w porównaniu z testem porównawczym, i jest definiowany jako pewność podzielona przez test porównawczy, gdzie każda wartość, która jest większa niż sugeruje, jest pewna przydatność reguły. Zobacz tę stronę również jako kolejny przykład.

George Dontas
źródło
(+1) Dobra odpowiedź. W arules winieta też mieć jakieś dobre referencje na temat windy .
chl
Dzięki, pewnie już to widziałem wcześniej. Wydaje mi się, że widziałem wcześniej nieco inną definicję w kontekście uczenia maszynowego ... Nienawidzę tego, że czasami brakuje konsensusu w sprawie definicji, a innym razem istnieje wiele terminów na tę samą koncepcję.
Michael McGowan,
8

Ludzie analizy korespondencji nazywają jedną z tych wielkości współczynnikiem nieprzewidzianym w kontekście zliczeń tabelarycznych. Odległości wielu takich stosunków od 1 są tym, co wizualizują biploty. Patrz np. Greenacre (1993) rozdz. 13.

Oldschoolowy automatyczny wybór funkcji uczenia maszynowego wywołuje dziennik tej ilości punktowej wzajemnej informacji . Patrz np. Manning i Schütze (1999) str. 66.

sprzężonyprior
źródło
Dziękujemy za wskazanie „wskaźnika awaryjności” i „wzajemnej wzajemnej informacji”.
Piotr Migdal
6

Wydaje się, że w Data Mining nazywają to windą .

RichardN
źródło
0

Być może pytasz, jak ta ilość jest powiązana ze ilorazem szans, jako wielkości do pomiaru niezależności.

Myślę, że szukasz „Związku z niezależnością statystyczną”. Zobacz http://en.wikipedia.org/wiki/Odds_ratio

Kenneth Cabrera
źródło