Czytam z książki, która przedstawia dystrybucję Dirchilet, a następnie przedstawiłam dane na jej temat. Ale tak naprawdę nie byłem w stanie zrozumieć tych liczb. Dołączyłem figurę tutaj na dole. To, czego nie rozumiem, to znaczenie trójkątów.
Zwykle, gdy chce się wykreślić funkcję 2 zmiennych, bierze się wartość var1 i va2, a następnie wykreśla wartość wartości funkcji tych dwóch zmiennych ... co daje wizualizację w wymiarze 3D. Ale tutaj są 3 wymiary i jedna inna wartość dla wartości funkcji, więc tworzy wizualizację w przestrzeni 4D. Nie rozumiem tych liczb!
Mam nadzieję, że ktoś może je wyjaśnić!
EDYTOWAĆ: oto czego nie rozumiem z rysunku 2.14a. Narysowaliśmy więc z K = 3 dirichlet próbkę theta (która jest w zasadzie wektorem), czyli: theta = [theta1, theta2, theta3]. Wykresy trójkąta [theta1, theta2, theta3]. Odległość od początku do każdego theta_i jest wartością theta_i. Następnie dla każdego theta_i umieścił wierzchołek i połączył wszystkie trzy wierzchołki i utworzył trójkąt. Wiem, że jeśli podłączę [theta1, theta2, theta3] do dir (theta | a), otrzymam jedną liczbę, która jest wspólnym prawdopodobieństwem wektora theta. Rozumiem również, że prawdopodobieństwo ciągłych zmiennych losowych jest miarą obszaru. Ale tutaj mamy 3 wymiary, więc prawdopodobieństwo połączenia będzie miarą objętości przestrzeni od różowej płaszczyzny i pod ... tj. Piramidą. Teraz nie rozumiem, jaka jest tutaj rola trójkąta.
Odpowiedzi:
Wszystkie punkty w trójkącie muszą spełniać dwa ograniczenia: od zera do jednego w każdym wymiarze (0≤θ≤1 ) i wszystkie sumują się do jednego (θ0+θ1+θ2=1 ).
Sposób, w jaki to ostatecznie zrozumiałem, jest następujący:
Więc (a) pokazuje przestrzeń 3-D zθ1 , 2 , 3 jako współrzędne. Wynoszą tylko od 0 do 1.
W (b) pokazano trójkąt, to jest nasz simpleks.
(c) pokazuje dwa przykładowe punkty, które „leżą” na simpleksie, które spełniają również drugie kryterium (sumuje się do jednego).
(d) pokazuje inny przykładowy punkt na simpleksie, zachowują się te same ograniczenia
W (e) próbowałem pokazać rzut prostego trójkąta 2-D ze wszystkimi przykładowymi punktami pokazanymi wcześniej.
Mam nadzieję, że teraz ma to większy sens :)
źródło
Wykres 2.14 (a) pokazuje płaszczyznę złożoną z trzech wierzchołków na każdej osi. Odległość wierzchołka od początku wynosiθja , odpowiadający jednemu z k = 3 zajęcia Obszar objęty różową płaszczyzną i płaszczyznami osi jest prawdopodobieństwem (wektor)θ . Załóżmy teraz, że przechylasz tę płaszczyznę, tak aby piramida z różową płaszczyzną, twarzą najbliższą czytnikowi, była umieszczona płasko na stronie. Następnie pomiń trzeci wymiar „wyskakiwanie” strony i zamiast tego pokoloruj trójkąt, aby obszar o większej gęstości, z większą odległością od podstawy do powierzchni, był bardziej czerwony. Tak pokazują wykresy 2.14 (b) i 2.14 (c). Im bardziej czerwony jest skoncentrowany w pobliżu wierzchołka, tym bardziej prawdopodobna jest klasa związana z tym wierzchołkiem. Podobnie, jeśli czerwony region nie znajduje się bardzo blisko żadnego wierzchołka, nie jest szczególnie prawdopodobne, aby zdarzenie miało większe prawdopodobieństwo członkostwa w którejkolwiek z klas.
Ta piramida ma jednak sens tylko jako jedna realizacja rozkładu Dirichleta. Ponowne rysowanie z tego samego rozkładu może dać inną piramidę o różnych długościachθ do każdego z wierzchołków. Kluczowa różnica między (a) i (b) / (c) polega na tym, że (a) graficznie pokazuje prawdopodobieństwo jednego losowania wektoraθ . Wykresy (b) i (c) pokazują gęstość prawdopodobieństwa dla wartościθ w k = 3 simplex, czyli próbują przedstawić funkcję gęstości prawdopodobieństwa dla wszystkich wartości θ we wsparciu. Jednym ze sposobów myślenia o (b) i (c) jest punkt mający dodatkowy czerwony kolor zgodnie ze średnią wysokością między płaską różową płaszczyzną a powierzchnią piramidy, uśrednioną dla wielu rysunkówθ ∼ Dir ( α ) .
źródło