Z jednej strony mam regres do średniej, az drugiej strony błędność hazardzisty .
Błąd Hazarda jest zdefiniowany przez Millera i Sanjurjo (2019) jako „błędne przekonanie, że losowe sekwencje mają systematyczną tendencję do odwracania, tj. Że smugi podobnych wyników są bardziej prawdopodobne, że zakończą się niż będą kontynuowane”. Na przykład moneta, która upadła, ma kilka głów czasy z rzędu będą uważane za nieproporcjonalnie prawdopodobne, że spadną w wyniku kolejnej próby.
Miałem dobrą wydajność w ostatniej grze i, zgodnie z regresją do średniej, prawdopodobnie będę miał gorszą wydajność w następnej grze.
Ale zgodnie z błędem gracza: Rozważ następujące dwa prawdopodobieństwa, zakładając uczciwą monetę
- prawdopodobieństwo 20 głów, następnie 1 ogon =
- prawdopodobieństwo 20 głów, następnie 1 głowa =
Następnie...
Rozważ prosty przykład: klasa uczniów wykonuje 100-elementowy test prawda / fałsz na dany temat. Załóżmy, że wszyscy studenci wybierają losowo wszystkie pytania. Następnie wynik każdego ucznia byłby realizacją jednego z zestawu niezależnych i identycznie rozmieszczonych zmiennych losowych, z oczekiwaną średnią 50.
Oczywiście niektórzy studenci przypadkowo zdobędą znacznie więcej niż 50, a niektórzy znacznie poniżej 50. Jeśli weźmie się tylko 10% uczniów z najwyższym wynikiem i da im drugi test, na którym ponownie wybiorą losowo wszystkie przedmioty, średnia ocena ponownie będzie bliska 50.
W ten sposób średnia tych uczniów „cofnie się” aż do średniej wszystkich uczniów, którzy przystąpili do pierwotnego testu. Bez względu na to, co uczeń oceni w pierwszym teście, najlepsza prognoza jego wyniku w drugim teście wynosi 50.
W szczególnym przypadku, jeśli weźmie się tylko 10% najlepszych uczniów i da im drugi test, na którym ponownie wybiorą losowo wszystkie przedmioty, średnia ocena ponownie będzie bliska 50.
Zgodnie z błędem gracza nie należy oczekiwać takiego samego prawdopodobieństwa zdobycia bramki i niekoniecznie bardziej zbliżonego do 50?
Miller, JB i Sanjurjo, A. (2019). Jak doświadczenie potwierdza błąd gracza, gdy wielkość próbki jest zaniedbywana.
źródło
Odpowiedzi:
Myślę, że zamieszanie można rozwiązać, biorąc pod uwagę, że pojęcie „regresji do średniej” naprawdę nie ma nic wspólnego z przeszłością. To tylko obserwacja tautologiczna, że przy każdej iteracji eksperymentu oczekujemy średniego wyniku. Więc jeśli wcześniej mieliśmy wynik powyżej średniej, oczekujemy gorszego wyniku, lub jeśli mieliśmy wynik poniżej średniej, oczekujemy lepszego. Kluczową kwestią jest to, że samo oczekiwanie nie zależy od żadnej wcześniejszej historii, podobnie jak w przypadku błędu gracza.
źródło
the expectation itself does not depend on any previous history
iif we previously had an above average outcome then we expect a worse result
. Używasz słowa expect w obu miejscach i mówisz o przeszłości / poprzedniej historii w obu miejscach.Jeśli miałbyś znaleźć się w takiej pozycji, jako racjonalna osoba (i zakładając uczciwą monetę), najlepszym rozwiązaniem byłoby zgadnięcie. Jeśli miałbyś znaleźć się w sytuacji przesądnego hazardzisty, najlepszym rozwiązaniem byłoby przyjrzenie się wcześniejszym wydarzeniom i próba uzasadnienia swojego rozumowania na temat przeszłości - np. „Łał, głowy są gorące , czas na ante!”. lub „Nie ma mowy, żebyśmy zobaczyli kolejne głowy - prawdopodobieństwo tego rodzaju serii jest niewiarygodnie niskie!”.
Błąd gracza nie zdaje sobie sprawy, że każdy konkretny ciąg 20 monet rzuca nas niesamowicie mało prawdopodobne - na przykład bardzo mało prawdopodobne jest przewrócenie 10 głów, a następnie 10 ogonów, bardzo mało prawdopodobne, aby przerzucić naprzemienne głowy i ogony, bardzo mało prawdopodobne jest podzielenie na 4, itp. Jest nawet bardzo mało prawdopodobne, aby przerzucić HHTHHTTTHT .. ponieważ dla dowolnego łańcucha istnieje tylko jeden sposób, aby to osiągnąć z wielu różnych wyników . Tak więc połączenie któregokolwiek z nich jako „prawdopodobnego” lub „mało prawdopodobnego” jest błędem, ponieważ wszystkie są możliwe do zastosowania.
Regresja do średniej to słusznie uzasadnione przekonanie, że na dłuższą metę twoje obserwacje powinny zbiegać się w skończoną oczekiwaną wartość. Na przykład - założę się, że 10 z 20 rzutów monetą jest dobre, ponieważ istnieje wiele sposobów na osiągnięcie tego. Zakład na 15 z 20 jest znacznie mniej prawdopodobny, ponieważ istnieje znacznie mniej ciągów, które osiągają końcową liczbę. Warto zauważyć, że jeśli siedzisz wystarczająco długo i rzucasz (uczciwymi) monetami, ostatecznie skończysz z czymś w przybliżeniu 50/50 - ale nie skończysz z czymś, co nie ma „smug” lub innych nieprawdopodobnych wydarzenia w nim. To jest podstawa różnicy między tymi dwoma koncepcjami.
TL; DR : Regresja do średniej mówi, że z czasem skończysz z rozkładem, który odzwierciedla oczekiwany w każdym eksperymencie. Błąd gracza (niesłusznie) mówi, że każdy pojedynczy rzut monety ma pamięć o poprzednich wynikach, które powinny wpłynąć na następny niezależny wynik.
źródło
Regression to the mean is the rightly-founded belief that in the long run, your observations should converge to a finite expected value
- To jest „błąd hazardzisty” - że po sznurku głów ogony są teraz bardziej prawdopodobne, ponieważ z uczciwą monetąZawsze staram się pamiętać, że regresja do średniej nie jest mechanizmem kompensującym obserwowanie wartości odstających.
Nie ma związku przyczynowo-skutkowego między wybitnym przebiegiem hazardu, a następnie pójściem 50-50 po tym. Jest to po prostu pomocny sposób na zapamiętanie, że kiedy próbujesz z rozkładu, najprawdopodobniej zobaczysz wartości zbliżone do średniej (pomyśl o tym, co nierówność Czebyszewa ma tu do powiedzenia).
źródło
Oto prosty przykład: zdecydowałeś się wrzucić w sumie 200 monet. Jak dotąd rzuciłeś 100 z nich i masz ogromne szczęście: 100% wpadło na głowę (niesamowite, wiem, ale postarajmy się zachować prostotę).
Zależnie od 100 głów w 100 pierwszych rzutach, na koniec gry masz 150 głów. Skrajnym przykładem błędu gracza jest myślenie, że nadal oczekujesz tylko 100 głów ogółem (tj. Oczekiwanej wartości przed rozpoczęciem gry), nawet po uzyskaniu 100 w pierwszych 100 rzutach. Gracz błędnie uważa, że następne 100 rzutów musi być ogonem. Przykładem regresji do średniej (w tym kontekście) jest to, że oczekuje się, że Twój współczynnik głowy wynoszący 100% spadnie do 150/200 = 75% (tj. W kierunku średniej 50%) po zakończeniu gry.
źródło
Mogłem się mylić, ale zawsze myślałem, że różnica polega na przejęciu niezależności.
W błędnym założeniu Hazardzisty problemem jest niezrozumienie niezależności. Pewnie, że w przypadku dużej liczby N rzutów monetą będziesz miał około 50-50 podziałów, ale jeśli przypadkiem nie jesteś, wtedy myśl, że twoje następne rzuty T pomogą wyrównać szanse, jest nieprawidłowa, ponieważ tam każde rzut monetą jest niezależny od poprzednie.
Regresja w kierunku średniej jest, tam gdzie ją widzę, pewnym pomysłem, że remisy zależą od poprzednich losowań lub wcześniejszych obliczonych średnich / wartości. Na przykład zastosuj procent strzelania NBA. Jeśli gracz A wykonał średnio 40% swoich strzałów podczas swojej kariery i rozpoczął nowy rok strzelając 70% w swoich pierwszych 5 meczach, uzasadnione jest przypuszczenie, że cofnie się do średniej swojej kariery. Istnieją czynniki zależne, które mogą i będą wpływać na jego grę: smugi na gorąco / zimno, gra w zespole, pewność siebie i prosty fakt, że gdyby miał utrzymać 70% strzelania przez cały rok, absolutnie unicestwiłby wiele rekordów, które są po prostu niemożliwymi wyczynami fizycznymi (pod obecnymi możliwościami zawodowymi profesjonalnych graczy w koszykówkę). W miarę grania w więcej gier procent strzelania prawdopodobnie spadnie bliżej średniej kariery.
źródło
Kluczem jest to, że nie mamy żadnych informacji, które pomogłyby nam w kolejnym wydarzeniu (błąd gracza), ponieważ następne zdarzenie nie jest zależne od poprzedniego wydarzenia. Możemy rozsądnie zgadywać, jak potoczy się seria prób. To rozsądne przypuszczenie jest średnią, czyli naszym oczekiwanym średnim wynikiem. Kiedy więc obserwujemy odchylenie średniego trendu z powrotem w kierunku średniej, w miarę upływu czasu / prób, obserwujemy regres do średniej.
Jak widać regresja do średniej jest obserwowaną serią działań , nie jest to predyktor. W miarę przeprowadzania większej liczby prób, rzeczy bardziej zbliżą się do rozkładu normalnego / Gaussa. Oznacza to, że nie poczyniam żadnych założeń ani nie domyślam się, jaki będzie następny wynik. Korzystając z prawa wielkich liczb , mogę teoretyzować, że nawet jeśli obecnie sytuacja zmienia się w jedną stronę, z czasem wszystko się wyrówna. Kiedy się wyrównają, zestaw wyników cofnął się do średniej. Należy tutaj zauważyć, że nie mówimy, że przyszłe próby zależą od wcześniejszych wyników. Po prostu obserwuję zmianę równowagi danych.
The paradoks hazardzisty jak rozumiem to jest bardziej bezpośredni w jego celów i koncentruje się na przewidywaniu przyszłych wydarzeń. Śledzi to, czego pragnie gracz. Zazwyczaj gry losowe są przechylane przeciwko graczowi w dłuższej perspektywie, więc gracz chce wiedzieć, jaka będzie kolejna próba, ponieważ chce wykorzystać tę wiedzę. To prowadzi gracza do błędnego założenia, że kolejna próba zależy od poprzedniej próby. Może to prowadzić do neutralnych wyborów, takich jak:
Lub wybór może być samoobsługowy:
Jak widać, istnieje kilka kluczowych różnic:
Regresja do średniej nie zakłada, że niezależne próby są zależne, podobnie jak błąd gracza.
Regresja do średniej jest stosowana w odniesieniu do dużej ilości danych / prób, w których błąd gracza dotyczy następnej próby.
Regresja do średniej opisuje to, co już miało miejsce. Błąd hazardzisty próbuje przewidzieć przyszłość na podstawie oczekiwanej średniej i wcześniejszych wyników.
źródło
Czy uczniowie z wyższymi ocenami, którzy osiągają gorsze wyniki w testach oszustów?
Pytanie otrzymało znaczną edycję od ostatniej z sześciu odpowiedzi.
A może powinni trzymać się z dala od koła ruletki?
Szczęśliwe monety i szczęśliwe klapki
Tak więc, nawet jeśli niektóre monety są lepsze od innych, losowość rzutów monetą oznacza, że wybranie najlepszych wyników testu będzie nadal wykazywać regresję do średniej w teście ponownym. W tym zmodyfikowanym modelu gorączka nie jest już całkowitym błędem - lepsze wyniki w pierwszej rundzie oznaczają większe prawdopodobieństwo posiadania dobrej monety! Jednak błąd gracza jest nadal błędem - nie można oczekiwać, że ci, którzy doświadczyli szczęścia, zostaną zrekompensowani ponownym testem.
źródło
Mówią to samo. Byliście w większości zdezorientowani, ponieważ żaden pojedynczy eksperyment w przykładzie rzutu monetą nie przyniósł ekstremalnych rezultatów (H / T 50/50). Zmień to na „rzucanie dziesięcioma uczciwymi monetami jednocześnie w każdym eksperymencie”, a gracze chcą je wszystkie poprawnie zrobić. Wówczas ekstremalnym pomiarem byłoby stwierdzenie, że wszystkie z nich są głowami.
Błąd hazardzisty: Traktuj każdy wynik hazardu (wynik rzutu monetą) jak IID . Jeśli znasz już dystrybucję tych akcji IID, kolejna prognoza powinna pochodzić bezpośrednio ze znanej dystrybucji i nie ma nic wspólnego z historycznymi (lub przyszłymi) wynikami (inaczej innymi IID).
Regresja do średniej: Traktuj każdy wynik testu jako IID (ponieważ zakłada się, że uczeń zgaduje losowo i nie ma prawdziwych umiejętności). Jeśli znasz już dystrybucję tych akcji IID, kolejna prognoza pochodzi bezpośrednio ze znanej dystrybucji i nie ma nic wspólnego z historycznymi (lub przyszłymi) wynikami (inaczej innymi IID) ( dokładnie tak, jak wcześniej ). Ale według CLT , jeśli zaobserwowałeś skrajność wartości w jednym pomiarze (np. Przypadkiem pobierałeś próbki tylko z 10% najlepszych studentów z pierwszego testu), powinieneś wiedzieć, że wynik z następnej obserwacji / pomiaru będzie nadal generowany ze znanego dystrybucja (a zatem bardziej prawdopodobne, że będzie bliższa średniej niż pozostawanie w skrajności).
Zasadniczo oboje twierdzą, że następny pomiar będzie pochodził z rozkładu, a nie z wcześniejszych wyników.
źródło
Niech X i Y będą dwiema identycznymi zmiennymi losowymi na [0,1]. Załóżmy, że obserwujemy ich jeden po drugim.
Błąd Hazardzisty: P (Y | X)! = P (Y) To oczywiście nonsens, ponieważ X i Y są niezależne.
Regresja do średniej: P (Y <X | X = 1)! = P (Y <X) To prawda: LHS wynosi 1, LHS <1
źródło
Dzięki twoim odpowiedziom, myślę, że mogłem zrozumieć różnicę między Regresją a podstępem i błędem Hazardzisty. Co więcej, zbudowałem bazę danych, aby pomóc mi zilustrować „prawdziwy” przypadek.
Zbudowałem tę sytuację: zebrałem 1000 studentów i zleciłem im losowe odpowiadanie na pytania.
Wynik testu waha się od 01 do 05. Ponieważ odpowiadają losowo na pytania, więc każdy wynik ma 20% szansy na osiągnięcie. Tak więc dla pierwszego testu liczba uczniów z wynikiem 05 powinna być zbliżona do 200
(1.1)1000 ∗ 0 , 20
(1.2)200
Miałem 196 studentów z wynikiem 05, co jest bardzo zbliżone do oczekiwanych 200 studentów.
Więc sprawiłem, że 196 studentów powtórzy test. 39 uczniów z wynikiem 05.
(2.1)196 ∗ 0 , 20
(2.2)39
Cóż, zgodnie z wynikiem mam 42 studentów, co jest zgodne z oczekiwaniami.
Dla tych, którzy otrzymali ocenę 05, powtarzam test i tak dalej ...
Dlatego oczekiwanymi liczbami były:
Oczekiwany RETEST 03
(3.1)42 ∗ 0 , 20
(3.2)8
(3.3) Wyniki (8)
Oczekiwany OSTATECZNY 04
(4.1)8 ∗ 0 , 20
(4.2)1 , 2
(4.3) Wyniki (2)
Oczekiwany zwrot 05
(4.1)2 ∗ 0 , 20
(4.2)0 , 1
(4.3) Wyniki (0)
Jeśli spodziewam się, że student, który uzyska ocenę 05 cztery razy, stawię czoła prawdopodobieństwu0 , 204 , tj. 1,2 ucznia na 1000. Jeśli jednak spodziewam się, że uczeń, który uzyska ocenę 05 pięć razy, powinienem mieć co najmniej 3.500 próbek, aby uzyskać 1,12 ucznia z wynikiem 05 we wszystkich testach
(5.1.)0 , 205= 0 , 00032
(5.2.)0 , 00032 ∗ 3500 = 1,2
Dlatego prawdopodobieństwo, że jeden uczeń uzyska wynik 05 we wszystkich 05 testach, nie ma nic wspólnego z jego ostatnim wynikiem, to znaczy, nie mogę obliczać prawdopodobieństwa na każdym teście pojedynczo. Muszę poszukać tych 05 testów, takich jak jedno zdarzenie, i obliczyć prawdopodobieństwo tego zdarzenia.
źródło