Jak poszedłbyś wyjaśnić iid (niezależne i identycznie rozpowszechniane) osobom nietechnicznym?
random-variable
intuition
użytkownik333
źródło
źródło
Wyjaśnienie nietechniczne:
Niezależność to bardzo ogólne pojęcie. Uważa się, że dwa zdarzenia są niezależne, jeśli wystąpienie jednego nie daje żadnych informacji na temat tego, czy drugie zdarzenie miało miejsce, czy nie. W szczególności na to, że przypisujemy drugie zdarzenie, nie ma wpływu wiedza, że pierwsze zdarzenie miało miejsce.
Przykład niezależnych wydarzeń, prawdopodobnie identycznie rozmieszczonych
Rozważ rzucenie dwiema różnymi monetami jedna po drugiej. Zakładając, że twój kciuk nie zmęczył się nadmiernie, gdy rzucił pierwszą monetą, rozsądnie jest założyć, że wiedza, że pierwsze rzucie monetą spowodowało Głowy, w żaden sposób nie wpływa na to, co uważasz za prawdopodobieństwo Głowy na drugim rzucie. Dwa zdarzenia są zdarzeniami niezależnymi .
Jeśli wiemy lub uparcie nalegamy, że obie monety mają różne prawdopodobieństwo uzyskania głów, wówczas wydarzenia nie są identycznie rozłożone.
Jeśli wiemy lub założymy, że obie monety mają takie samo prawdopodobieństwo zbliżających się głów, wówczas powyższe zdarzenia są również identycznie rozmieszczone, co oznacza, że obie mają takie samo prawdopodobieństwo wystąpienia . Zauważ jednak, że jeśli , prawdopodobieństwo Głowy nie równa się prawdopodobieństwu Ogonów. Jak zauważono w jednym z komentarzy, „identyczny rozkład” nie jest tym samym, co „równie prawdopodobny”.p p = 1p p p=12
Przykład identycznie rozmieszczonych, niezależnych zdarzeń
Rozważ urnę z dwiema kulkami, jedną czarną i jedną białą. Sięgamy do niego i wyciągamy dwie kule jedna po drugiej, losowo wybierając pierwszą (i to oczywiście określa kolor następnej piłki). Tak więc dwa równie prawdopodobne wyniki eksperymentu to (biały, czarny) i (czarny, biały), i widzimy, że pierwsza kula jest równie prawdopodobne, że będzie czarna lub biała, a więc druga piłka również równie dobrze jest czarna lub biały. Innymi słowy, wydarzenia pewnością są identycznie rozmieszczone, ale zdecydowanie są nie1
źródło
Zmienna losowa to zmienna, która zawiera prawdopodobieństwo wszystkich możliwych zdarzeń w scenariuszu. Na przykład, stwórzmy losową zmienną, która reprezentuje liczbę głów na 100 rzutów monetą. Zmienna losowa będzie zawierać prawdopodobieństwo uzyskania 1 głów, 2 głów, 3 głów ... aż do 100 głów. Nazwijmy tę zmienną losową X .
Jeśli masz dwie zmienne losowe, to są one IID (niezależnie identycznie rozmieszczone), jeśli:
Uwaga dodatkowa: Niezależność oznacza również, że możesz pomnożyć prawdopodobieństwa. Załóżmy, że prawdopodobieństwo głów wynosi p, a prawdopodobieństwo uzyskania dwóch głów z rzędu wynosi p * p lub p ^ 2.
źródło
Na tym przykładzie pokazano, że dwie zmienne zależne mogą mieć taki sam rozkład:
Załóżmy, że dwa kolejne eksperymenty obejmują każde 100 rzutów monetą o tendencyjnym kursie, przy czym całkowita liczba głowy jest modelowana jako zmienna losowa X1 dla pierwszego eksperymentu i X2 dla drugiego eksperymentu. X1 i X2 są dwumianowymi zmiennymi losowymi o parametrach 100 ip, gdzie p jest nastawieniem monety.
Jako takie są one identycznie dystrybuowane. Nie są one jednak niezależne, ponieważ wartość tego pierwszego jest dość pouczająca o wartości tego drugiego. To znaczy, jeśli wynik pierwszego eksperymentu wynosi 100 głów, to mówi nam wiele o nastawieniu monety, a zatem daje nam wiele nowych informacji dotyczących rozkładu X2.
Nadal X2 i X1 są identycznie rozmieszczone, ponieważ pochodzą z tej samej monety.
Prawdą jest również to, że jeśli 2 zmienne losowe są zależne, to późniejszy X2 przy danym X1 nigdy nie będzie taki sam jak wcześniejszy X2 i odwrotnie. Podczas gdy X1 i X2 są niezależne, ich potomkowie są równi swoim przeorom. Dlatego, gdy dwie zmienne są zależne, obserwacja jednej z nich skutkuje zrewidowanymi szacunkami dotyczącymi rozkładu drugiej. Nadal oba mogą pochodzić z tej samej dystrybucji, po prostu dowiadujemy się w trakcie procesu więcej o naturze tej dystrybucji. Wracając do eksperymentów rzutu monetą, początkowo przy braku jakichkolwiek informacji możemy założyć, że X1 i X2 mają rozkład dwumianowy o parametrach 100 i 0,5. Ale po zaobserwowaniu 100 głów w jednym rzędzie z pewnością zmienilibyśmy nasze oszacowanie dotyczące parametru p, aby zbliżyć się do 1.
źródło
Agregacja kilku losowych losowań z tego samego rozkładu. Przykładem może być wyciągnięcie marmuru z torby 10 000 razy i liczenie razy, kiedy wyciągasz czerwony marmur.
źródło
Niemniej jednak identyczne rozmieszczenie niekoniecznie oznacza niezależność.
źródło