Co mają na myśli, gdy mówią „zmienna losowa”?
69
Co mają na myśli, gdy mówią „zmienna losowa”?
Zmienna losowa to zmienna, której wartość zależy od nieznanych zdarzeń. Możemy podsumować nieznane zdarzenia jako „stan”, a następnie zmienna losowa jest funkcją stanu.
Przykład:
Załóżmy, że mamy trzy rzuty kostkami ( , , ). Następnie stan .
a sample
, który poprosiłem o odróżnienie od wyników . Dlaczego musisz wprowadzić funkcję i nazwać ją zmienną losową, chociaż jest ona absolutnie deterministyczna i wcale nie zmienna? Dlaczego nie możesz od razu wypróbować wyniku?Wprowadzenie
Rozważając ostatni komentarz, zauważam, że wszystkie odpowiedzi do tej pory cierpią z powodu użycia niezdefiniowanych terminów, takich jak „zmienna” i niejasnych terminów, takich jak „nieznane”, lub odwoływania się do technicznych pojęć matematycznych, takich jak „funkcja” i „przestrzeń prawdopodobieństwa”. Co powinniśmy powiedzieć osobie niematematycznej, która chciałaby prostej, intuicyjnej, ale dokładnej definicji „zmiennej losowej”? Po wstępnych opisach prostego modelu zjawisk losowych przedstawiam taką definicję, która jest wystarczająco krótka, aby zmieściła się w jednej linii. Ponieważ może nie w pełni zaspokoić cognoscenti , później wyjaśnia, jak rozszerzyć to do zwykłej definicji technicznej.
Bilety w pudełku
Jednym ze sposobów podejścia do idei zmiennej losowej jest odwołanie się do modelu losowości biletów w pudełku . Ten model zastępuje eksperyment lub obserwację pudełkiem pełnym biletów. Na każdym bilecie zapisany jest możliwy wynik eksperymentu. (Wynik może być tak prosty jak „główki” lub „ogony”, ale w praktyce jest to bardziej skomplikowana sprawa, taka jak historia cen akcji, pełny zapis długiego eksperymentu lub sekwencja wszystkich słów w dokumencie .) Wszystkie możliwe wyniki pojawiają się przynajmniej raz wśród biletów; niektóre wyniki mogą pojawić się na wielu biletach.
Zamiast faktycznie przeprowadzać eksperyment, wyobrażamy sobie dokładnie - ale na ślepo - miksowanie wszystkich biletów i wybieranie tylko jednego. Jeśli możemy wykazać, że prawdziwy eksperyment powinien zachowywać się tak, jakby był przeprowadzony w ten sposób, to zredukowaliśmy potencjalnie skomplikowany (i kosztowny i długi) eksperyment w świecie rzeczywistym do prostego, intuicyjnego, myślowego eksperymentu (lub „modelu statystycznego” „). Klarowność i prostota, jaką zapewnia ten model, umożliwia analizę eksperymentu.
Przykład
Standardowe przykłady dotyczą wyników podrzucania monet i kości oraz losowania kart do gry. Są one nieco rozpraszające ze względu na ich trywialność, aby to zilustrować, przypuśćmy, że jesteśmy zaniepokojeni wynikiem wyborów prezydenckich w USA w 2016 r. Jako (niewielkie) uproszczenie założę, że jedna z dwóch głównych partii - republikańska (R) lub Demokratyczna (D) - wygra. Ponieważ (przy obecnie dostępnych informacjach) wynik jest niepewny, wyobrażamy sobie wkładanie biletów do pudełka: niektóre z napisem „R” na nich, a inne z „D”. Nasz model wyniku polega na wyciągnięciu dokładnie jednego biletu z tego pola.
Czegoś brakuje: nie ustaliliśmy jeszcze, ile biletów będzie na każdy wynik. W rzeczywistości znalezienie tego jest głównym problemem statystyki: w oparciu o obserwacje (i teorię), co można powiedzieć o względnych proporcjach każdego wyniku w ramce?
(Mam nadzieję, że jasne jest, że proporcje każdego rodzaju biletu w polu określają jego właściwości, a nie rzeczywiste liczby każdego biletu. Proporcje są zdefiniowane - jak zwykle - jako liczba każdego rodzaju biletu podzielona przez całkowita liczba biletów. Na przykład pudełko z jednym biletem „D” i jednym biletem „R” zachowuje się dokładnie tak samo, jak pudełko z milionem biletów „D” i milionem biletów „R”, ponieważ w każdym przypadku każdy typ jest 50% wszystkich biletów, a zatem każdy ma 50% szans na wylosowanie, gdy bilety zostaną dokładnie wymieszane).
Wykonanie modelu ilościowego
Ale nie zajmujmy się tym pytaniem tutaj, ponieważ jesteśmy blisko celu, jakim jest zdefiniowanie zmiennej losowej. Problem z modelem do tej pory polega na tym, że nie jest on kwantyfikowalny, podczas gdy chcielibyśmy móc za jego pomocą odpowiedzieć na pytania ilościowe. Nie mam też na myśli trywialnych, ale prawdziwe, praktyczne pytania, takie jak: „jeśli moja firma zainwestuje miliard euro w rozwój morskich paliw kopalnych w Stanach Zjednoczonych, to ile zmieni się wartość tej inwestycji w wyniku wyborów w 2016 r. ? W tym przypadku model jest tak prosty, że niewiele możemy zrobić, aby uzyskać realistyczną odpowiedź na to pytanie, ale możemy posunąć się tak daleko, aby skonsultować się z pracownikami ekonomicznymi i poprosić o ich opinie na temat dwóch możliwych wyników:
Jeśli demokraci wygrają, ile zmieni inwestycja? (Załóżmy, że odpowiedź to dolarów).d
Jeśli republikanie wygrają, ile to zmieni? (Załóżmy, że odpowiedź to dolarów.)r
Odpowiedzi są liczbami. Aby użyć ich w modelu, poproszę moich pracowników o przejrzenie wszystkich biletów w pudełku i na każdym bilecie „D”, aby napisać „ dolarów” i na każdym bilecie „R”, aby napisać „ dolarów”. Teraz możemy jasno i ilościowo modelować niepewność inwestycji: zmiana wartości po wyborach jest taka sama, jak w przypadku otrzymania kwoty pieniędzy zapisanej na pojedynczym losowaniu losowo z tego pola.d r
Ten model pomaga nam odpowiedzieć na dodatkowe pytania dotyczące inwestycji. Na przykład, jak niepewni powinniśmy być co do wartości inwestycji ? Chociaż istnieją (proste) formuły matematyczne dla tej niepewności, moglibyśmy odtworzyć ich odpowiedzi dość rozsądnie, po prostu używając naszego modelu wielokrotnie - może tysiąc razy - aby zobaczyć, jakie wyniki faktycznie się zdarzają i mierzyć ich rozprzestrzenianie. Model biletów w pudełku daje nam sposób na ilościowe uzasadnienie niepewnych wyników.
Zmienne losowe
Aby uzyskać odpowiedzi ilościowe dotyczące zjawisk niepewnych lub zmiennych, możemy przyjąć model biletu w pudełku i zapisywać liczby na biletach. Ten proces pisania liczb musi być zgodny tylko z jedną zasadą: musi być spójny. W tym przykładzie na każdym bilecie demokratycznym musi być napisane „ dolarów” - bez wyjątków - a na każdym bilecie republikańskim musi być napisane „ dolarów”.d r
Zmienna losowa jest jakikolwiek spójny sposób pisać numery na bilety w pudełku.
(Matematyczna notacja tego polega na nadaniu nazwy procesowi numeracji, zwykle wielkimi literami łacińskimi, takimi jak lubX Y ω X ω X(ω) X X(D)=d X(R)=r X X X
Następnie: o mierzalności
Gdy definicji zmiennej losowej towarzyszy zastrzeżenie „mierzalne”, to, co ma na myśli podmiot definiujący, to uogólnienie modelu biletów w pudełku na sytuacje o nieskończenie wielu możliwych wynikach. (Technicznie jest to potrzebne tylko uncountably nieskończonych efektów lub gdzie irracjonalne są zaangażowane prawdopodobieństwa, a nawet w tym ostatnim przypadku można uniknąć.) Z nieskończenie wielu wyników trudno jest powiedzieć, jaka część z całości będzie. Jeśli istnieje nieskończenie wiele biletów „D” i nieskończenie wiele biletów „R”, jakie są ich względne proporcje? Nie możemy się dowiedzieć, dzieląc jedną nieskończoność przez drugą!
W takich przypadkach potrzebujemy innego sposobu określenia proporcji. „Wymiernym” zestawem biletów jest każda kolekcja biletów w polu, dla której można określić ich proporcję. Kiedy to nastąpi, liczbę, o której myśleliśmy jako „proporcję”, nazywa się „prawdopodobieństwem”. (Nie każda kolekcja biletów musi mieć z tym związane prawdopodobieństwo).
źródło
Nieformalnie zmienna losowa jest sposobem przypisania kodu numerycznego do każdego możliwego wyniku. *
Przykład 1
Przykład 2
W brydżu as jest wart 4 wysokie punkty, król 3, królowa 2 i walet 1. Każda inna karta jest warta 0 punktów.
* Formalnie zmienna losowa jest funkcją, która odwzorowuje każdy wynik (w przestrzeni próbki) na liczbę rzeczywistą.
źródło
W przeciwieństwie do zmiennej zwykłej, zmienna losowa nie może być zastąpiona jedną niezmienną wartością. Raczej właściwości statystyczne , takie jak dystrybucja zmiennej losowej może być inaczej. Rozkład jest funkcją, która zapewnia prawdopodobieństwo, że zmienna przyjmie daną wartość lub mieści się w zakresie, biorąc pod uwagę pewne parametry, takie jak średnia lub odchylenie standardowe.
Zmienne losowe można klasyfikować jako dyskretne, jeśli rozkład opisuje wartości z zestawu policzalnego, takie jak liczby całkowite. Druga klasyfikacja zmiennej losowej jest ciągła i jest stosowana, jeśli rozkład obejmuje wartości z niepoliczalnego zbioru, takiego jak liczby rzeczywiste.
źródło
Powiedziano mi tę historię:
W ten sam sposób zmienna losowa nie jest ani losowa, ani zmienna. To tylko funkcja. (historia została opowiedziana tutaj: źródło ).
To przynajmniej dziwaczny sposób na wyjaśnienie, który może pomóc ludziom zapamiętać!
źródło
Z Wikipedii :
Od cnx.org :
źródło
Zmienna losowa, zwykle oznaczona jako X, jest zmienną, w której wynik jest niepewny. Obserwacja konkretnego wyniku tej zmiennej nazywana jest realizacją. Mówiąc dokładniej, jest to funkcja, która odwzorowuje przestrzeń prawdopodobieństwa na przestrzeń mierzalną, zwykle nazywaną przestrzenią stanu. Zmienne losowe są dyskretne (mogą przyjmować wiele różnych wartości) lub ciągłe (mogą przyjmować nieskończoną liczbę wartości).
Rozważ zmienną losową X, która jest sumą uzyskaną przy rzucie dwiema kostkami. Może przyjmować dowolną z wartości 2-12 (z jednakowym prawdopodobieństwem, biorąc pod uwagę uczciwe kości), a wynik jest niepewny, dopóki kości nie zostaną rzucone.
źródło
W moich niematematowych badaniach uniwersyteckich powiedziano nam, że zmienna losowa jest mapą od wartości, które zmienna może przyjmować do prawdopodobieństw. Pozwoliło to na narysowanie rozkładów prawdopodobieństwa
Niedawno zdałem sobie sprawę, jak różni się to od matematyków. Okazuje się, że przez zmienną losową mają na myśli prostą funkcję X: Ω → R, która pobiera element przestrzeni próbki Ω ( inaczej wynik, bilet lub indywidualny , jak wyjaśniono powyżej) i tłumaczy go na liczbę rzeczywistą R z zakresu ( -∞, ∞). Oznacza to, że trafnie zauważono powyżej, że nie jest losowy i nie ma żadnej zmiennej. Losowość zwykle pochodzi z miary prawdopodobieństwa P, jako części przestrzeni miary (Ω, P). P odwzorowuje próbki na R, podobnie jak zmienna losowa, ale ten zakres czasowy jest ograniczony do [0,1] i możemy powiedzieć, że zmienna losowa tłumaczy (Ω, P) na (R, P), a zatem zmienna losowa jest wyposażona w prawdopodobieństwo zmierz P: R -> [0,1], abyś mógł powiedzieć dla każdego xw R, jakie jest prawdopodobieństwo jego wystąpienia.
całka nie potrzebuje żadnych rzeczywistych wartości zmiennej losowej.
źródło