Zbadaj istotną różnicę w stosunkach normalnie rozłożonych zmiennych losowych

9

Związane z analizowaniem stosunków zmiennych i jak sparametryzować stosunek dwóch normalnie rozłożonych zmiennych lub odwrotność jednej? .

Załóżmy, że mam szereg próbek z czterech różnych ciągłych rozkładów losowych, z których wszystkie możemy założyć, że są w przybliżeniu normalne. W moim przypadku odpowiadają one niektórym miernikom wydajności dwóch różnych systemów plików (powiedzmy ext4 i XFS), zarówno z szyfrowaniem, jak i bez. Metryką może być na przykład liczba plików tworzonych na sekundę lub średnie opóźnienie dla niektórych operacji na plikach. Możemy założyć, że wszystkie próbki pobrane z tych rozkładów zawsze będą ściśle dodatnie. Nazwijmy te dystrybucje gdzie i .Perffstype,encryptionfstype{xfs,ext4}encryption{crypto,nocrypto}

Moja hipoteza jest taka, że ​​szyfrowanie spowalnia jeden z systemów plików o wiele większy czynnik niż drugi. Czy istnieje jakiś prosty test dla hipotezy ?E[Perfxfs,crypto]E[Perfxfs,nocrypto]<E[Perfext4,crypto]E[Perfext4,nocrypto]

Sami Liedes
źródło
Wygląda na to, że jakiś tekst został usunięty ze środka tego pytania. Myślisz, że możesz to przywrócić?
whuber
Myślę, że „Tak więc” zostało tam przez pomyłkę, przynajmniej nie mogę myśleć, co chciałbym do tego dodać. Prawdopodobnie w końcu przeniosłem się do drugiego akapitu.
Sami Liedes,
Możesz dopasować uogólniony model liniowy dla rozkładu normalnego za pomocą funkcji łączenia logów.
onestop
1
„Liczba plików” i „średnie opóźnienie” nie mogą być normalnie dystrybuowane (żaden z nich nie może być ujemny na początek). Oba mogą być nieco pochylone. Liczba plików jest liczbą dyskretną.
Glen_b

Odpowiedzi:

12

Jedną z alternatyw dla dobrej odpowiedzi StasK jest użycie testu permutacji. Pierwszym krokiem jest zdefiniowanie statystyki testowej , być może:T

T=Perf^ext4,cryptoPerf^ext4,nocryptoPerf^xfs,cryptoPerf^xfs,nocrypto

gdzie to być może przykładowa średnia z obserwacji itp. (To pasuje do twojej definicji hipotezy jako stosunku oczekiwania zamiast alternatywnej możliwości oczekiwania na stosunek - która alternatywa może być tym, czego naprawdę chcesz). Drugim krokiem jest wielokrotne losowe permutowanie etykiet w danych wiele razy, powiedzmy, i oblicz dla każdej permutacji. Ostatnim krokiem jest porównanie oryginalnej z zaobserwowanym ; wartość p permutacji szacowana byłaby frakcja . Perf^ext4,cryptoPerfext4,cryptoext4, xfsi=1,,10000TiTTiTiT

Test permutacji uwalnia cię od polegania na asymptotyce, ale oczywiście w zależności od wielkości twojej próbki (i oczywiście także danych), metoda delta, której również czasami używam, może działać dobrze.

łucznik
źródło
To także dobra sugestia!
StasK
Zauważ, że stosunek dwóch wyśrodkowanych zmiennych normalnych jest zmienną Cauchy'ego.
Xi'an
1
@ Xi'an: Czy jest jasne, że możemy założyć, że są tutaj niezależni? Jak wiecie, byłoby to konieczne, aby ten wynik się utrzymał (i miał szansę być przydatny).
kardynał
@cardinal: tak, w rzeczywistości musieliby być niezależni!
Xi'an
1
Jako bardzo snobistyczny punkt techniczny - permutacja działa trochę lepiej, gdy twoja statystyka testu jest kluczowa / nie obejmuje nieznanych parametrów / jest stabilizowana wariancją ... przynajmniej poniżej zera. Dzięki proporcjom możesz wykonać transformację łuku grzechu. Przy ściśle dodatnich ilościach ciągłych prawdopodobnie zacznę od logów. Ale to naprawdę wisienka na torcie.
StasK
4

Możesz obliczyć (asymptotyczny) błąd standardowy współczynnika za pomocą metody delta . Jeśli masz dwie losowe zmienne i takie, że w dystrybucji (co byłoby w przypadku, gdy masz niezależne dane, ale miałoby to również bardziej ogólny przypadek dane klastrowane, gdy przeprowadziłeś testy na różnych komputerach), a następnie dla stosunku z analogiem populacji , mamy XY

n(X¯μXY¯μY)N((00),(σXXσXYσXYσYY))
r=Y¯/X¯ro=μY/μX
n(rr0)N(0,μY2μX4σXX2μYμX3σXY+1μX2σYY)
Jeśli i są niezależne, co można rozsądnie założyć w twoim przypadku, to wyrażenie nieco upraszcza, upuszczając , więc otrzymujemy, że kwadratowe współczynniki wariantów sumują się: Ma dodatkową zaletą jest to, że rozmiary próbek mogą się różnić. Ponadto, jeśli RHS i LHS są niezależne, można tworzyć -test Statystyka dlaXYσXY
CV2[r]=CV2[X¯]+CV2[Y¯]
zH0: bez różnicy, biorąc różnicę współczynników i dzieląc ją przez odpowiedni błąd standardowy uzyskany z tych CV.

Mam nadzieję, że możesz wziąć to stamtąd i wykonać pozostałe obliczenia koperty, aby uzyskać ostateczną formułę.

Należy zauważyć, że wynik jest asymptotyczny, a stosunek jest tendencyjnym estymatorem w małych próbkach. Odchylenie ma rząd i zanika asymptotycznie w porównaniu ze zmiennością próbkowania, która jest rzędu .rr0O(1/n)O(1/n)

StasK
źródło
Dziękujemy za doskonałą i pouczającą odpowiedź! Myślę, że wybiorę test permutacji jbowbana do moich badań, ponieważ myślę, że lepiej go rozumiem i jego ograniczenia, ale metoda delta zdecydowanie wygląda na coś, co muszę przestudiować i wymyślić.
Sami Liedes
@stask czy można to zrobić tutaj? stats.stackexchange.com/questions/398436/…
Xavier Bourret Sicotte
Xavier, myślę, że @ usεr11852 dał dobrą odpowiedź. Nie zawracam sobie głowy dodawaniem do tego.
StasK
@StasK - pod jakimi warunkami są ważne warunki podane w odpowiedzi? Czy konwergencja statystyki wskaźnika jest gwarantowana przez poprzednie założenie i metodę Delta?
Xavier Bourret Sicotte
To asymptotyka ... nic nigdy nie jest gwarantowane, a granice błędów są trudne do osiągnięcia. Cała metoda delta (lub jakikolwiek inny wynik słabej zbieżności) mówi, że wraz ze wzrostem wielkości próby różnica między rzeczywistym rozkładem próby skończonej a rozkładem asymptotycznym będzie się zmniejszać. Może to oznaczać, że wraz ze wzrostem wielkości próbki z 1000 do 10000 różnica pionowa między plikami cdf spadnie z 0,2 do 0,1, a ta ostatnia jest nadal nie do przyjęcia ze względów praktycznych. Lub może to oznaczać, że różnica wynosi od 0,01 do 0,001.
StasK
0

Stosunek normalnych zmiennych jest rozkładem Cauchy'ego. Wiedząc o tym, możesz po prostu wykonać test Bayes Factor Test.

To był raczej spontaniczny pomysł. Nie jestem teraz pewien mechanizmu generowania danych. Czy instalujesz różne systemy plików na tym samym komputerze, a następnie porównujesz dwa przypadki, abyśmy mogli przyjąć hierarchiczną strukturę danych?

Nie jestem też pewien, czy proporcje szukania mają sens.

A potem napisałeś stosunek wartości oczekiwanych, podczas gdy myślałem o wartości oczekiwanej współczynników. Chyba potrzebuję więcej informacji na temat generowania danych przed przejściem dalej.

joint_p
źródło
1
Stosunek normalnych wynosi tylko Cauchy'ego, jeżeli (a) są niezależne i (b) mają tę samą wariancję.
kardynał
Xi'an miał chyba taką samą myśl ...
joint_p
1
Nie jest dla mnie (przynajmniej dla mnie) jasne, że istnieje taka struktura niezależności lub że będą miały zerową średnią. Być może, jeśli uda ci się rozwinąć swoją odpowiedź, pomoże to jaśniejszego podejścia, które sugerujesz. :)
kardynał
1
@ kardynał - myślałem, że to stosunek niezależnych normalnych ze średnią zerową to cauchy z zerową medianą i parametrem skali równym stosunkowi normalnych odchyleń standardowych. Jeśli mają niezerową średnią, to nie jest to cauchy.
Prawdopodobieństwo
@prob: (+1) Masz rację! Dzięki za złapanie tego. Porzuciłem „standard” i „zero zero” w moim pierwszym komentarzu (ten drugi udało się dostać do drugiego).
kardynał
0

W przypadkach, w których nie można wykonać permutacji, na przykład gdy wielkość próbki stwarza miliony możliwości, innym rozwiązaniem byłoby ponowne próbkowanie Monte Carlo.

Hipotezą zerową jest to, że nie ma różnicy w szybkości między i , dla i . Dlatego średni stosunek wszystkich próbek nie różni się od .ext4xfsnocryptocryptoext4xfsnocryptocrypto

H0:Tobserved=xnocryptonnocryptoxcryptoncrypto=0

gdzie x=ext4xfs

i n=samplesize

Jeśli jest prawdziwe, losowe wybieranie wyników dla współczynników lub spowoduje również . Można by obliczyć:H0nocryptocryptoTobserved=0

Tresampling=x1random+xnrandomnnocryptox1random+xnrandomncrypto

i wykonajmy powiedzmy 10 000 rund ponownego próbkowania. Wynikowy rozkład wartości jest przedziałem ufności dla . Różnica między a współczynnikiem jest znacząca, jeżeli obliczona wartość leży poza zakresem np. 95% wartości .TresamplingH0nocryptocryptoTobserved(p<0.05)Tresampling

użytkownik1979481
źródło