Czy różnice między równomiernie rozmieszczonymi liczbami są równomiernie rozmieszczone?

22

Wiele razy rzucamy kostką 6-stronną.

Obliczając różnicę (wartość bezwzględną) między rolką a jej rolką poprzedzającą, czy oczekuje się, że różnice będą równomiernie rozłożone?

Aby zilustrować 10 rolkami:

roll num  result diff
1           1     0
2           2     1
3           1     1
4           3     2
5           3     0
6           5     2
7           1     4
8           6     5
9           4     2
10          4     0

Czy diffwartości byłyby równomiernie rozłożone?

distributions uniform Hej, Jude
źródło

13

Wykreśl

2

Sprawdź rozkład Poissona .

leftaroundabout

To wygląda jak praca domowa ....

Manu H

@Manu H, zapewniam, że dni pracy domowej są już za mną

HeyJude

37

Nie, to nie jest jednolite

Możesz policzyć równie prawdopodobnych możliwości różnic bezwzględnych $36$

     second 1   2   3   4   5   6
first                           
1           0   1   2   3   4   5
2           1   0   1   2   3   4
3           2   1   0   1   2   3
4           3   2   1   0   1   2
5           4   3   2   1   0   1
6           5   4   3   2   1   0

co daje rozkład prawdopodobieństwa dla bezwzględnych różnic

0    6/36  1/6
1   10/36  5/18
2    8/36  2/9
3    6/36  1/6
4    4/36  1/9
5    2/36  1/18

Henz
źródło

27

@onurcanbektas Tabela w tej odpowiedzi wyraźnie zaprzecza twojemu twierdzeniu: na przykład pokazuje, że tylko jedna z możliwych różnic wynosi 5, a 6 z nich to 0. Ponieważ wszystkie 36 możliwości są jednakowo prawdopodobne, to nie jest jednolite.

whuber

13

@onurcanbektas Zapraszam ponownie do kontemplacji stołu. Ponieważ ma tylko dwie absolutne różnice 5, czyż nie jest oczywiste, że nie więcej niż dwie różnice mogą równać się 5?

whuber

14

@onurcanbektas Dla prostych różnic (tj. ze znakami, więc liczbami całkowitymi od -5 do +5), rozkład jest symetrycznym dyskretnym rozkładem trójkątnym z trybem (najprawdopodobniej wartością) na 0. Dla różnic bezwzględnych, jak pokazano w mojej odpowiedzi, tryb to 1.

Henry

2

Warto jednak zauważyć, że podpisana różnica modulo 6 jest równomiernie rozłożona.

Federico Poloni,

2

@FedericoPoloni Czy to nie jest banalnie oczywiste? Mam na myśli, że tak naprawdę nigdy o tym nie myślałem przed przeczytaniem komentarza, ale jest całkiem oczywiste, że to po prostu musi być prawda

Cruncher

21

Używając tylko najbardziej podstawowych aksjomatów o prawdopodobieństwach i liczbach rzeczywistych, można udowodnić znacznie silniejsze stwierdzenie:

Różnica dowolnych dwóch niezależnych, identycznie rozmieszczonych niestałych wartości losowych $X-Y$ nigdy nie ma dyskretnego rozkładu jednorodnego.

(Analogiczne stwierdzenie dla zmiennych ciągłych zostało udowodnione w Uniform PDF różnicy dwóch rv .)

Chodzi o to, że szansa $X-Y$ jest wartością ekstremalną, musi być mniejsza niż szansa, że $X-Y$ wynosi zero, ponieważ istnieje tylko jeden sposób (powiedzmy) maksymalizacji $X-Y$ podczas gdy istnieje wiele sposobów, aby zerować różnicę , ponieważ $X$ i $Y$ mają taki sam rozkład, a zatem mogą być sobie równe. Oto szczegóły.

Po pierwsze zauważ, że dwie hipotetyczne dwie zmienne $X$ i $Y$ mowa, mogą osiągnąć tylko skończoną liczbę $n$ wartości z prawdopodobieństwem dodatnim, ponieważ będą co najmniej $n$ wyraźne różnice, a równomierny rozkład przypisuje im wszystkie równe prawdopodobieństwo. Jeśli $n$ jest nieskończone, to byłaby liczba możliwych różnic o dodatnim, równym prawdopodobieństwie, skąd suma ich szans byłaby nieskończona, co jest niemożliwe.

$Y$ $m$ $q = \Pr(Y=m)$ $X$ $M$ $p = \Pr(X=M).$ $X$ $Y$

\begin{matrix} (*) & Pr (X - Y = M - m) = Pr (X = M) Pr (Y = m) = p q > 0. \end{matrix}

$\Pr(X-Y = M - m) = \Pr(X=M)\Pr(Y=m) = pq \gt 0.\tag{*}$

Wreszcie , ponieważ i mają ten sam rozkład, istnieje wiele sposobów ich różnice mogą wytwarzać wartość Wśród tych sposobów są przypadki, w których i Ponieważ ten rozkład nie jest stały, różni się od To pokazuje, że te dwa przypadki są zdarzeniami rozłącznymi, a zatem muszą przyczyniać się co najmniej w wysokości do szansy, że wynosi zero; to jest, $X$ $Y$ $0.$ $X=Y=m$ $X=Y=M.$ $m$ $M.$ $p^2 + q^2$ $X-Y$

Pr (X - Y = 0) \geq Pr (X = Y = m) + Pr (X = Y = M) = p^{2} + q^{2} .

$\Pr(X-Y=0) \ge \Pr(X=Y=m) + \Pr(X=Y=M) = p^2 + q^2.$

Ponieważ kwadraty liczb nie są ujemne, skąd wywodzimy z że $0 \le (p-q)^2,$ $(*)$

Pr (X - Y = M - m) = p q \leq p q + (p - q)^{2} = p^{2} + q^{2} - p q < p^{2} + q^{2} \leq Pr (X - Y = 0),

$\Pr(X-Y=M-m)=pq \le pq + (p-q)^2 = p^2 + q^2 - pq \lt p^2 + q^2 \le \Pr(X-Y=0),$

pokazujący rozkład nie jest jednolity, QED. $X-Y$

Edytuj w odpowiedzi na komentarz

Podobna analiza różnic bezwzględnychzauważa, że ponieważ i mają taki sam rozkład,Wymaga to od nas zbadaniaTa sama technika algebraiczna daje prawie taki sam wynik, ale istnieje możliwość, że iTen układ równań ma unikalne rozwiązanie $|X-Y|$ $X$ $Y$ $m=-M.$ $\Pr(X-Y=|M-m|) = 2pq.$ $2pq=2pq+(p-q)^2$ $2pq+p^2+q^2=1.$ $p=q=1/2$ odpowiadający uczciwej monecie („dwustronna kostka”). Oprócz tego wyjątku wynik dla różnic bezwzględnych jest taki sam jak dla różnic i z tych samych powodów już podanych: mianowicie, absolutne różnice dwóch zmiennych losowych iid nie mogą być równomiernie rozłożone, gdy występują więcej niż dwie wyraźne różnice z prawdopodobieństwem dodatnim.

(koniec edycji)

Zastosujmy ten wynik do pytania, które dotyczy czegoś nieco bardziej złożonego.

Modeluj każdy niezależny rzut kości (która może być niesprawiedliwą kością) za pomocą losowej zmiennej Różnice obserwowane w tych rolkach to liczby Możemy się zastanawiać, jak równomiernie rozmieszczone są te liczby . To naprawdę pytanie dotyczące oczekiwań statystycznych: jaka jest na przykład oczekiwana liczba które są równe zeru? Jaka jest oczekiwana liczba równa ? Itd itd. $X_i,$ $i=1, 2, \ldots, n.$ $n$ $\Delta X_i = X_{i+1}-X_i.$ $n-1$ $\Delta X_i$ $\Delta X_i$ $-1$

Problematycznym aspektem tego pytania jest to, że nie są niezależne: na przykład i dotyczą tego samego rzutu $\Delta X_i$ $\Delta X_1 = X_2-X_1$ $\Delta X_2 = X_3 - X_2$ $X_2.$

To jednak nie jest trudność. Ponieważ oczekiwanie statystyczne jest addytywne, a wszystkie różnice mają ten sam rozkład, jeśli wybierzemy dowolną możliwą wartość różnic, oczekiwana liczba razy różnica równa w całej sekwencji rzutów jest tylko krotnością oczekiwanej liczby różnica razy równa się w jednym etapie procesu. Oczekiwanie na jeden krok to (dla dowolnego ). Oczekiwania te będą takie same dla wszystkich (to znaczy jednolitych ) wtedy i tylko wtedy, gdy będą takie same dla pojedynczego $k$ $k$ $n$ $n-1$ $k$ $\Pr(\Delta X_i = k)$ $i$ $k$ $\Delta X_i.$ Ale widzieliśmy, że żaden nie ma równomiernego rozkładu, nawet gdy matryca może być stronnicza. Zatem nawet w tym słabszym sensie oczekiwanych częstotliwości różnice walców nie są jednolite. $\Delta X_i$

Whuber
źródło

@Michael Dobra uwaga: odpowiedziałem na pytanie w formie zadanej (która dotyczy „różnic”), a nie jak pokazano (co wyraźnie odnosi się do różnic bezwzględnych). Obowiązuje ta sama technika - należy wziąć pod uwagę zarówno maksymalną, jak i minimalną różnicę. W przypadku, gdy są to jedyne dwie możliwości (wraz z zerem), możemy uzyskać równość, stąd pochodzi wynik Bernoulliego (pokazując, że jest to unikalny taki przykład).

(1 / 2)

$(1/2)$

whuber

Inna odpowiedź potwierdzająca konkretną wersję tego jest tutaj .

Przywróć Monikę

Dzięki, @Ben: Zapomniałem tego wątku. Ponieważ jest to lepsze odniesienie, teraz w tej odpowiedzi prowadzę do bezpośredniego linku.

whuber

12

Na poziomie intuicyjnym zdarzenie losowe może być równomiernie rozłożone tylko wtedy, gdy wszystkie jego skutki są jednakowo prawdopodobne.

Czy tak jest w przypadku danego zdarzenia losowego - absolutna różnica między dwoma rzutami kostką?

W tym przypadku wystarczy przyjrzeć się skrajnościom - jakie są największe i najmniejsze wartości, jakie może przyjąć ta różnica?

Oczywiście 0 jest najmniejsze (patrzymy na różnice bezwzględne i rzuty mogą być takie same), a 5 to największe ( 6vs 1).

Możemy wykazać, że wydarzenie jest nierównomierne, pokazując, że 0jest większe (lub mniejsze) prawdopodobieństwo wystąpienia 5.

Na pierwszy rzut oka istnieją tylko dwa sposoby wystąpienia 5 - jeśli pierwsza kostka to 6, a druga 1 lub odwrotnie . Ile sposobów może wystąpić 0?

MichaelChirico
źródło

1

+1 Myślę, że trafia to do sedna sprawy. Przedstawiłem uogólnienie pytania, które ostatecznie opiera się na tej samej obserwacji.

whuber

5

Jak przedstawia Henry, różnice w rozkładach równomiernie rozłożonych nie są równomiernie rozłożone.

Aby to zilustrować symulowanymi danymi, możemy użyć bardzo prostego skryptu R:

barplot(table(sample(x=1:6, size=10000, replace=T)))

Widzimy, że daje to rzeczywiście jednolity rozkład. Przyjrzyjmy się teraz rozkładowi bezwzględnych różnic dwóch losowych próbek z tego rozkładu.

barplot(table(abs(sample(x=1:6, size=10000, replace=T) - sample(x=1:6, size=10000, replace=T))))

LuckyPal
źródło

6

Dlaczego ma to coś wspólnego z CLT, który dotyczy asymptotycznego rozkładu średnich wartości dużej liczby wartości id?

whuber

2

n

$n$

n

$n$

n > 1

$n>1$

n = 2

$n=2$

n = 2

$n=2$

n = 4

$n=4$

n

$n$

krubo

3

@Krubo Oryginalne pytanie dotyczy rozkładu różnic między kolejnymi rzutami kostki. CLT nie ma nic do powiedzenia na ten temat. Rzeczywiście, bez względu na to, ile razy kostka jest rzucana, rozkład tych różnic nie zbliży się do normalności.

whuber

Czy ten rozkład ma tendencję do równomierności, gdy liczba powierzchni matryc zmierza do nieskończoności? Nie wiem, jak to pokazać, ale intuicyjnie wydaje się, że zmierza w tym kierunku, ale nie wiem, czy zostanie gdzieś asymptotycznie „zablokowany”, zanim wystarczająco się spłaszczy

Cruncher

@Cruncher można łatwo zmienić liczbę powierzchni matryc w kodzie R. Im więcej twarzy, tym bardziej widoczny staje się charakter rozmieszczenia schodów. „1” jest zawsze szczytem tych schodów, a przy większych różnicach prawdopodobieństwo zbliża się do zera. Ponadto różnica „0” jest wyraźnie rzadsza niż „1”. (przynajmniej jeśli najmniejszą wartością

kości

2

Inni pracowali nad obliczeniami, dam ci odpowiedź, która wydaje mi się bardziej intuicyjna. Chcesz zbadać sumę dwóch unifrom rv (Z = X + (-Y)), ogólny rozkład jest (dyskretnym) produktem splotu:

P (Z = z) = \sum_{k = - \infty}^{\infty} P (X = k) P (- Y = z - k)

$P(Z=z) = \sum^{\infty}_{k=-\infty} P(X=k) P(-Y = z-k)$

$z$ $k$ $z$

Dzięki przetwarzaniu sygnału wiemy, jak zachowuje się produkt splotowy:

Iloczyn splotu dwóch jednorodnych funkcji (dwóch prostokątów) da trójkąt. Ilustruje to wikipedia dla ciągłych funkcji:

$z$ $z$
Mówiąc bardziej ogólnie, wiemy, że jedynymi funkcjami, które są stabilne podczas splotu, są funkcje rodziny gaussowskiej. tzn. tylko rozkład gaussowski jest stabilny przez dodanie (lub bardziej ogólnie, kombinacja liniowa). Oznacza to również, że nie otrzymujesz jednolitego rozkładu podczas łączenia rozkładów jednolitych.

Dlaczego otrzymujemy te wyniki, odpowiedź leży w rozkładzie Fourriera tych funkcji. Transformacja Fouriera produktu splotowego jest prostym produktem transformacji Fouriera każdej funkcji. Daje to bezpośrednie powiązania między współczynnikami Fouriera dla funkcji prostokąta i trójkąta.

lcrmorin
źródło

Sprawdź ważność swoich roszczeń i logikę odpowiedzi. Pytanie nie dotyczy tego, czy splot dwóch rozkładów jednolitych jest jednolity: chodzi o to, czy splot jakiegoś rozkładu i jego odwrócenie mogą być jednolite. I jest znacznie więcej rodzin dystrybucyjnych niż Gaussowskich, które są stabilne w trakcie splotu (oczywiście standaryzacja modulo): patrz pl.wikipedia.org/wiki/Stable_distribution

whuber

Masz rację co do stabilnych dystrybucji. W przypadku pytania jestem pewien, że chodzi o różnicę między dwiema losowymi wartościami o jednolitym rozkładzie (jak wskazuje tytuł). Pytanie, czy splot jakiegoś rozkładu i jego odwrócenie może być jednolite, jest większe niż to, o co tu pytamy.

lcrmorin

1

$x$ $y$ $|x-y| = k$ $k = 0, 1, 2, 3, 4, 5$ $k$

Jak łatwo zauważyć, liczba punktów dla każdego koloru nie jest taka sama; dlatego różnice nie są równomiernie rozłożone.

dzisiaj
źródło

0

$D_t$ $X$ $P(D_t = 5) = P(X_t = 6, X_{t-1} = 1) < P((X_t, X_{t-1}) \in \{(6, 3), (5, 2)\}) < P(D_t = 3)$

$P(D_t = d)$ $d$

Hunaphu
źródło

Czy różnice między równomiernie rozmieszczonymi liczbami są równomiernie rozmieszczone?

Odpowiedzi:

Edytuj w odpowiedzi na komentarz

(koniec edycji)