Dodawanie, odejmowanie, mnożenie i dzielenie normalnych zmiennych losowych są dobrze określone, ale co z operacjami trygonometrycznymi?
Załóżmy na przykład, że próbuję znaleźć kąt trójkątnego klina (modelowanego jako trójkąt pod kątem prostym) z dwoma catheti o wymiarach i , oba opisane jako rozkłady normalne.
Zarówno intuicja, jak i symulacja mówią mi, że wynikowy rozkład jest normalny, ze średnim . Ale czy istnieje sposób na obliczenie rozkładu wynikowego kąta? Referencje na temat tego, gdzie znajdę odpowiedź?
(Dla pewnego kontekstu pracuję nad statystyczną tolerancją części mechanicznych. Moim pierwszym impulsem byłoby po prostu symulacja całego procesu, sprawdzenie, czy wynik końcowy jest w miarę normalny i obliczenie odchylenia standardowego. Ale zastanawiam się jeśli może istnieć bardziej odpowiednie podejście analityczne).
Odpowiedzi:
W tej interpretacji trójkąt jest trójkątem prostym o długości boków i Y rozmieszczonych dwumianowo z oczekiwaniami μ x i μ y , odchyleniami standardowymi σ x i σ y oraz korelacją ρ . Szukamy dystrybucji arktanu ( Y / X ) . W tym celu standaryzuj X i Y tak, abyX Y μx μy σx σy ρ arctan(Y/X) X Y
i Y = σ y η + μ y
z i η normalna normalna zmienia się z korelacją ρ . Niech θ będzie kątem, a dla wygody wpisz q = tan ( θ ) . Następnieξ η ρ θ q=tan(θ)
Lewa strona, będąca liniową kombinacją norm, jest normalna, ze średnią i wariancją σ 2 y + q 2 σ 2 x - 2 q ρ σ x σ y .μyσy−qμxσx σ2y+q2σ2x−2qρσxσy
Zróżnicowanie normalnego cdf tych parametrów w odniesieniu do daje pdf kąta. To wyrażenie jest dość makabryczne, ale jego kluczową częścią jest wykładniczyθ
pokazując od razu, że kąt zwykle nie jest rozkładany. Jednak, jak pokazują twoje symulacje i intuicja sugerują, powinna być w przybliżeniu normalna, pod warunkiem, że zmiany długości boków są małe w porównaniu do samych długości. W tym przypadku przybliżenie Saddlepoint powinno dawać dobre wyniki dla określonych wartości , μ y , σ x , σ y i ρ , nawet jeśli ogólne rozwiązanie w postaci zamkniętej nie jest dostępne. Przybliżone odchylenie standardowe spadnie natychmiast po znalezieniu drugiej pochodnej (w odniesieniu do θμx μy σx σy ρ θ ) of the logarithm of the pdf (as shown in equations (2.6) and (3.1) of the reference). I recommend a computer algebra system (like MatLab or Mathematica) for carrying this out!
źródło
You are looking at circular statistics and in particular a circular distribution called the projected normal distribution.
For some reason this topic can be a little hard to google, but the two major texts on circular statistics are The Statistical Analysis of Circular Data by Fisher and Directional Statistics by Mardia and Jupp.
For a thorough analysis of the projected normal distribution see page 46 of Mardia and Jupp. There are closed form expressions (up to the error function integral) for the distribution, and as whuber has suggested, it looks similar to the normal when its `variance' (careful here, what does variance mean for a random variable on a circle?!) is small, i.e. when the distribution is quite concentrated at one point (or direction or angle).
źródło