Powiedzieć, że mają dwa normalnych rozkładów A i B ze środkami i i wariancje i . Chcę wziąć ważoną mieszaninę tych dwóch rozkładów przy użyciu wag i gdzie i . Wiem, że średnia tej mieszaniny to .
Jaka byłaby ta wariancja?
Konkretnym przykładem byłoby, gdybym znał parametry rozkładu wysokości męskiej i żeńskiej. Gdybym miał pokój ludzi w 60% płci męskiej, mógłbym uzyskać oczekiwaną średnią wysokość dla całego pokoju, ale co z wariancją?
normal-distribution
mixture
JoFrhwld
źródło
źródło
Odpowiedzi:
Wariancja jest drugim momentem minus kwadrat pierwszego momentu, więc wystarczy obliczyć momenty mieszanin.
Ogólnie biorąc, biorąc pod uwagę rozkłady z plikami PDF i stałymi (nieprzypadkowymi) wagami , PDF mieszanki tofi pi
z którego wynika bezpośrednio na dowolnej chwili tymk
I napisane dla momentu i dla momentu .μ(k) kth f μ(k)i kth fi
Korzystając z tych wzorów, można zapisać wariancję
Odpowiednio, jeśli wariancje są podane jako , to , umożliwiając zapisanie wariancji mieszaniny pod względem wariancji i środków jej składników jakfi σ2i μ(2)i=σ2i+(μ(1)i)2 f
Innymi słowy, jest to (ważona) średnia wariancja powiększona o średnią kwadratową średnią minus kwadrat średniej średniej. Ponieważ kwadratowanie jest funkcją wypukłą, Nierówność Jensena stwierdza, że średnia kwadratowa średnia może być nie mniejsza niż kwadrat średniej średniej. To pozwala nam zrozumieć formułę, w której stwierdzono, że wariancja mieszaniny jest mieszaniną wariancji plus nieujemny termin uwzględniający (ważoną) dyspersję średnich.
W twoim przypadku wariancja jest
Możemy zinterpretować, że jest to ważona mieszanina dwóch wariancji, , plus (koniecznie dodatni) składnik korekcyjny uwzględniający przesunięcia od poszczególnych średnich w stosunku do ogólnej średniej mieszaniny.pAσ2A+pBσ2B
Przydatność tej wariancji w interpretacji danych, takich jak podana w pytaniu, jest wątpliwa, ponieważ rozkład mieszaniny nie będzie Normalny (i może znacznie od niego odstąpić, do tego stopnia, że wykaże bimodalność).
źródło