Korekta dla normalnie rozłożonej precyzji zegara

10

Mam eksperyment przeprowadzany na setkach komputerów rozmieszczonych na całym świecie, który mierzy występowanie niektórych zdarzeń. Zdarzenia zależą od siebie, więc mogę uporządkować je w kolejności rosnącej, a następnie obliczyć różnicę czasu.

Zdarzenia powinny być rozkładane wykładniczo, ale podczas rysowania histogramu otrzymuję to:

Histogram wydarzeń

Niedokładność zegarów na komputerach powoduje, że niektórym zdarzeniom przypisuje się znacznik czasu wcześniej niż zdarzenie, od którego zależą.

Zastanawiam się, czy można obwiniać synchronizację zegara za to, że szczyt pliku PDF nie ma wartości 0 (że przesunęły całość w prawo)?

Jeśli różnice między zegarami są normalnie rozłożone, to czy mogę po prostu założyć, że efekty będą się wzajemnie kompensować, a tym samym po prostu użyć obliczonego różnicy czasu?

cdecker
źródło

Odpowiedzi:

13

Problemy z synchronizacją zegara mogą rzeczywiście powodować przesunięcie piku w prawo. Poniższa symulacja w R pokazuje to zjawisko. Użyłem czasów wykładniczych i normalnych różnic zegara, aby uzyskać kształt, który z grubsza przypomina twoje zdjęcie:

Zegary

Rozkład w lewo (rzeczywiste różnice mierzone bez błędów) ma pik przy 0, podczas gdy rozkład po prawej (różnice mierzone z błędem) ma pik około 100.

Kod R:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

Jeśli różnice zegarowe są normalne ze średnią 0, różnice powinny się zlikwidować w tym sensie, że średnia zaobserwowanych różnic powinna być równa średniej rzeczywistych różnic. To, czy tak jest, zależy od tego, czy istnieje systematyczna różnica między komputerami, na których ma miejsce pierwsze zdarzenie, a komputerami, na których ma miejsce drugie zdarzenie.

MånsT
źródło
4
+1 Ładnie ilustrowane. Matematycznie dane pochodzą z sumy rozkładu błędów i (zakładanego) rozkładu wykładniczego. Kuszące jest oszacowanie rozkładu błędów i odkształcenie danych w celu oszacowania rzeczywistego rozkładu.
whuber