Pytanie: jak wygląda dwumianowy rozkład dwumianowy w przestrzeni trójwymiarowej?
Poniżej znajduje się konkretna funkcja, którą chciałbym wizualizować dla różnych wartości parametrów; mianowicie , p 1 i p 2 .
Zauważ, że istnieją dwa ograniczenia; oraz p 1 + p 2 = 1 . Ponadto n jest liczbą całkowitą dodatnią, powiedzmy 5 .
W podjąłem dwie próby wykreślenia funkcji przy użyciu LaTeX (TikZ / PGFPLOTS). W ten sposób uzyskać wykresy poniżej dla następujących wartości: , P 1 = 0,1 i P 2 = 0,9 , a n = 5 , P 1 = 0,4 i P 2 = 0,6 , odpowiednio. Nie udało mi się wdrożyć ograniczenia wartości domeny; x 1 + x 2 = n , więc jestem trochę zakłopotany.
Wizualizacja wykonana w dowolnym języku byłaby w porządku (R, MATLAB itp.), Ale pracuję w LaTeX z TikZ / PGFPLOTS.
Pierwsze podejscie
, P 1 = 0,1 i P 2 = 0,9
Drugie podejście
, P 1 = 0,4 i P 2 = 0,6
Edytować:
Dla porównania, tutaj jest artykuł zawierający kilka wykresów. Tytuł pracy to „Nowa dwuwymiarowa dystrybucja dwumianowa” autorstwa Atanu Biswasy i Jing-Shiang Hwanga. Statystyka i listy prawdopodobieństwa 60 (2002) 231–240.
Edycja 2: Dla jasności i w odpowiedzi na @GlenB w komentarzach poniżej znajduje się migawka tego, jak dystrybucja została mi przedstawiona w mojej książce. Książka nie odnosi się do przypadków zdegenerowanych / nie zdegenerowanych i tak dalej. Po prostu przedstawia to w ten sposób i starałem się to wyobrazić. Twoje zdrowie! Ponadto, jak zauważył @JohnK, prawdopodobnie wystąpi literówka w odniesieniu do x1 + x1 = 1, co sugeruje, że powinno to być x1 + x1 = n.
Obraz równania z:
Spanos, A (1986) Statystyczne podstawy modelowania ekonometrycznego. Cambridge University Press
źródło
Odpowiedzi:
Są w tym dwa elementy: najpierw musisz dowiedzieć się, jakie są poszczególne prawdopodobieństwa, a potem jakoś je wykreślić.
Możemy najpierw obliczyć krańcowe dwumianowe PMF, ponieważ jest to takie proste. Ponieważ zmienne są niezależne, każde wspólne prawdopodobieństwo będzie po prostu iloczynem krańcowych prawdopodobieństw; to jest algebra macierzowa. Tutaj demonstruję ten proces za pomocą
R
kodu:W tym momencie mamy dwie wymagane macierze prawdopodobieństw. Musimy tylko zdecydować, w jaki sposób chcemy je wykreślić. Szczerze mówiąc, nie jestem wielkim fanem wykresów słupkowych 3D. Ponieważ
R
wydaje się, że zgadzam się ze mną, stworzyłem te wykresy w Excelu:b19
:b46
:źródło
Odpowiedź Gunga jest dobrą odpowiedzią na rzeczywisty dwumianowy dwumian, dobrze wyjaśniający problemy (zaleciłbym zaakceptowanie go jako dobrej odpowiedzi na pytanie tytułowe, najprawdopodobniej przydatne dla innych).
Zdefiniujmy więc rzeczy poprawnie. Zauważ, że w rzeczywistości nie jest dostępna żadna definicja zmiennej losowej, więc pozostaje nam trochę zgadywania.
Możemy uznać to za dwumianowy dwuwymiarowy (skalowany) zdegenerowany dwuwymiarowy:
ale naprawdę trudno jest nazwać to, co jest zdefiniowane w książce, dwumianowym dwumianowym (ponieważ jest to faktycznie dwumianowy jednowymiarowy).
Zakładając, że ktoś będzie chciał wygenerować wykres podobny do wykresu 3D, ten kawałek kodu (R) zbliża się do drugiego wykresu powyżej:
(Potrzebujesz
scatterplot3d
pakietu, który zawiera funkcję o tej samej nazwie.)Dwumianowy „prawdziwy” (nie zdegenerowany) dwuwymiarowy ma zmienność obu zmiennych jednocześnie. Oto przykład jednego szczególnego dwuwymiarowego dwumianowego (w tym przypadku nie niezależnego). Uciekłem się do użycia różnych kolorów w fabule, ponieważ w przeciwnym razie zbyt łatwo jest zgubić się w lesie „patyków”.
[1]: Hamdan, MA (1972),
„Kanoniczna ekspansja dwuwymiarowej dwumianowej dystrybucji z nierównymi wskaźnikami krańcowymi”,
Międzynarodowy Przegląd Statystyczny , 40 : 3 (grudzień), s. 277–280
źródło
Mathematica
jest teraz dość silny w takich rzeczach - ma rozwiązanie twojego problemu bezpośrednio w dokumentacji . Z niewielkimi dodatkami stworzyłem model do zabawy (zp = p1 = 0.4
lepszą prezentacją wizualną). Tak wygląda interfejs i jak można nim kontrolować.Skrawek
Główną rzeczą jest to
PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}]
, co jest selfexplanatory, myślę.Multinomial
po prostu oznacza, że możesz wziąć wiele rozkładówpi
dla każdej zmiennej dla każdej zmiennej. Prosta forma toBinomialDistribution
. Oczywiście mogę to zrobić ręcznie, ale reguła jest taka, że jeśli masz wbudowaną funkcję - powinieneś jej użyć.Jeśli potrzebujesz komentarzy na temat struktury kodu, daj mi znać.
źródło