Operacje trygonometryczne na odchyleniach standardowych

14

Dodawanie, odejmowanie, mnożenie i dzielenie normalnych zmiennych losowych są dobrze określone, ale co z operacjami trygonometrycznymi?

Załóżmy na przykład, że próbuję znaleźć kąt trójkątnego klina (modelowanego jako trójkąt pod kątem prostym) z dwoma catheti o wymiarach d1 i d2 , oba opisane jako rozkłady normalne.

Zarówno intuicja, jak i symulacja mówią mi, że wynikowy rozkład jest normalny, ze średnim arctan(mean(d1)mean(d2)). Ale czy istnieje sposób na obliczenie rozkładu wynikowego kąta? Referencje na temat tego, gdzie znajdę odpowiedź?

(Dla pewnego kontekstu pracuję nad statystyczną tolerancją części mechanicznych. Moim pierwszym impulsem byłoby po prostu symulacja całego procesu, sprawdzenie, czy wynik końcowy jest w miarę normalny i obliczenie odchylenia standardowego. Ale zastanawiam się jeśli może istnieć bardziej odpowiednie podejście analityczne).

Bossykena
źródło
2
Czy możesz potwierdzić, że (a) d1 id2 są długościami bocznymi (a nie kątami); (b) zakładasz, że kąt między nimi jest kątem prostym (w przeciwnym razie formuła atan jest podejrzana); oraz (c) że jesteś zainteresowany rozkładem jednego z pozostałych kątów tego prawego trójkąta? Ponadto przypuszczalnie SD dla każdego rozkładu długości jest znacznie mniejsze niż się spodziewano, ponieważ trójkąt nie powinien mieć żadnego znaczącego prawdopodobieństwa ujemnej długości boku :-).
whuber
Dokładny. Przeformułowałem problem, aby był nieco jaśniejszy. I tak, SD będzie małe w stosunku do wymiarów.
Bossykena
Używając formuł do mnożenia i dodawania, możesz wypróbować rozszerzenie Taylora.
Dziękuję za obie doskonałe odpowiedzi, które (o ile wiem z moją ograniczoną wiedzą na temat statystyk) są zarówno intuicyjne, jak i solidne.
Bossykena

Odpowiedzi:

15

W tej interpretacji trójkąt jest trójkątem prostym o długości boków i Y rozmieszczonych dwumianowo z oczekiwaniami μ x i μ y , odchyleniami standardowymi σ x i σ y oraz korelacją ρ . Szukamy dystrybucji arktanu ( Y / X ) . W tym celu standaryzuj X i Y tak, abyXYμxμyσxσyρarctan(Y/X)XY

i Y = σ y η + μ y

X=σxξ+μx
Y=σyη+μy

z i η normalna normalna zmienia się z korelacją ρ . Niech θ będzie kątem, a dla wygody wpisz q = tan ( θ ) . Następnieξηρθq=tan(θ)

P[arctan(Y/X)θ]=P[YqX]

=P[σyη+μyq(σxξ+μx)

=P[σyηqσxξqμxμy]

Lewa strona, będąca liniową kombinacją norm, jest normalna, ze średnią i wariancją σ 2 y + q 2 σ 2 x - 2 q ρ σ x σ y . μyσyqμxσxσy2+q2σx22qρσxσy

Zróżnicowanie normalnego cdf tych parametrów w odniesieniu do daje pdf kąta. To wyrażenie jest dość makabryczne, ale jego kluczową częścią jest wykładniczyθ

exp((μy(σy+1)μx(σx+1)tan(θ))22(2ρσxσytan(θ)+σx2+σy2+tan2(θ))),

pokazując od razu, że kąt zwykle nie jest rozkładany. Jednak, jak pokazują twoje symulacje i intuicja sugerują, powinna być w przybliżeniu normalna, pod warunkiem, że zmiany długości boków są małe w porównaniu do samych długości. W tym przypadku przybliżenie Saddlepoint powinno dawać dobre wyniki dla określonych wartości , μ y , σ x , σ y i ρ , nawet jeśli ogólne rozwiązanie w postaci zamkniętej nie jest dostępne. Przybliżone odchylenie standardowe spadnie natychmiast po znalezieniu drugiej pochodnej (w odniesieniu do θμxμyσxσyρθ) of the logarithm of the pdf (as shown in equations (2.6) and (3.1) of the reference). I recommend a computer algebra system (like MatLab or Mathematica) for carrying this out!

whuber
źródło
1
There was never any chance of it being normally distributed. It is an angle! It only takes values on [π,π).
Robby McKilliam
1
P(Y/X q) = P(Y qX) is not correct if X is a normal r.v. - X can be negative too.
ronaf
@ronaf: actually, since X and Y are the side lengths of a physical triangle, we should not have negative X!
shabbychef
2
@ronaf: That's the right idea. If one uses signed side lengths and also considers the angle as a real value (rather than its value modulo 2π), there is no inconsistency with normality in either case. Your point about the inequality possibly being wrong is excellent. All I can do in response is to claim that the equation is an excellent approximation under the assumptions made because the chance of X or Y being negative is negligible.
whuber
1
@YBE I agree that the last "+" in my expression looks like it doesn't belong--it might have slipped in when I was cleaning up the TeX markup. I don't have a reference because I computed the derivative myself.
whuber
12

You are looking at circular statistics and in particular a circular distribution called the projected normal distribution.

For some reason this topic can be a little hard to google, but the two major texts on circular statistics are The Statistical Analysis of Circular Data by Fisher and Directional Statistics by Mardia and Jupp.

For a thorough analysis of the projected normal distribution see page 46 of Mardia and Jupp. There are closed form expressions (up to the error function integral) for the distribution, and as whuber has suggested, it looks similar to the normal when its `variance' (careful here, what does variance mean for a random variable on a circle?!) is small, i.e. when the distribution is quite concentrated at one point (or direction or angle).

Robby McKilliam
źródło