Wyobraź sobie, że na świecie jest 80 graczy w zbijaki. Każdy z nich rozegrał tysiące gier typu dodgeball z pozostałymi 79 graczami w bardziej lub mniej losowej kolejności. To świat bez drużyn (np. Każdy gracz ma szansę na losowanie w każdej drużynie w każdej grze). Znam poprzedni wskaźnik wygranych każdego gracza (np. Jeden wygrał 46% wszystkich poprzednich gier, inny wygrał 56% wszystkich swoich poprzednich gier). Powiedzmy, że zbliża się mecz i wiem, kto gra w każdej drużynie. Znam również ich poprzedni wskaźnik wygranych.
Jaki jest najlepszy sposób na obliczenie prawdopodobieństwa wygranej każdej drużyny na podstawie składu zespołu?
Jeśli wymaga względnie zaawansowanych obliczeń (np. Regresji logistycznej), daj mi znać niektóre szczegóły. Znam dość dobrze SPSS, ale raczej nie muszę zadawać pytań uzupełniających.
Co więcej, jak zbadałbym dokładność mojej metody przy użyciu danych archiwalnych? Wiem, że nie będzie to jasne, ponieważ większość graczy unosi się wokół 40-60%, ale nadal.
Mówiąc konkretnie, jakie są szanse, że drużyna A wygra?
A - składa się z osób z poprzednim wskaźnikiem wygranych 52%, 54%, 56%, 58%, 60% B - składa się z osób z poprzednim wskaźnikiem wygranych 48%, 55%, 56%, 58%, 60%
(to tylko przypadkowy przykład w celach ilustracyjnych. Dwie całkiem dobre drużyny.)
Edycja: Czy jest sposób, aby zacząć od bardzo prostego algorytmu, a następnie zobaczyć, jak to działa? Może moglibyśmy po prostu zsumować wartości procentowe każdej drużyny i przewidzieć, że ta z najwyższym procentem wygra. Oczywiście nasza klasyfikacja nie byłaby dokładna, ale w tysiącach zarchiwizowanych gier mogliśmy sprawdzić, czy możemy przewidzieć lepiej niż przypadek.
źródło
AvgTeam1WinP
/AvgTeam2WinP
? Powinien dać szanse nateam1
wygranąteam2
.Odpowiedzi:
Brzmi jak praca dla naiwnych Bayesów . Nie do końca rozumiem leżącą u podstaw teorię, więc niestety nie mogę dać wam przykładu, ale Bayes współpracuje ze znanymi (archiwalnymi) danymi w celu wyciągania wniosków.
Myślę, że Bayes jest dostępny tylko w Statistic Server SPSS, więc jeśli masz dostęp do jednego z nich, masz szczęście. Alternatywnie możesz użyć Weka, która zawiera także kilka innych klasyfikatorów, więc może przeprowadzisz eksperyment i poinformujesz nas o wynikach?
EDYCJA: Bayes i powiązane klasyfikatory mogą również wyciągać wnioski z samych graczy, np. Ma wynik 65%, ale gdy i odgrywają w przeciwległych zespołów wydajność jest spada o 5%.ZA ZA b ZA
źródło
Czy to prawda, że masz nie tylko te wartości procentowe, ale także wszystkie indywidualne wyniki gry? Następnie sugerowałbym pakiet r PlayerRatings. Ten pakiet nie tylko rozwiązuje problemy, takie jak obliczanie siły gracza (przy użyciu algorytmów takich jak elo lub glicko), ale oferuje funkcje, które mogą również przewidywać przyszłe wyniki gry.
Przykłady sprawdź: http://cran.r-project.org/web/packages/PlayerRatings/vignettes/AFLRatings.pdf
źródło
Czy to nie tylko prosty podział średnich?
AvgTeam1WinP
/AvgTeam2WinP
? Powinien dać szanse nateam1
wygranąteam2
.Jeśli wezmę pod uwagę następujące kwestie:
Gdyby
player1
grał przeciwkoplayer2
drużynom „1-osobowym”, zgodziłby się Pan, że szanse, że gracz1 wygra z graczem2, to prawdopodobieństwo, że gracz1 wygra losowo, podzielone przez prawdopodobieństwo, że gracz2 wygra losowo (to oczywiście dotyczy tylko w przypadku, gdy uważasz, że% zwycięstwa jest dokładny, jak w ich asymptotycznym limicie), po prostu:Jeśli argumentujesz, że nie ma efektu interakcji między niektórymi graczami, który jest okropny, a tym samym wpływa na wynik bardziej negatywnie niż oczekiwano * lub, że niektórzy gracze są naprawdę dobrzy, wpływając na wynik bardziej pozytywnie niż oczekiwano **, wydaje się logiczne, że możesz wystarczy wziąć średnie prawdopodobieństwo dla każdego gracza w każdej drużynie.
* Jeśli kombinacja 60%, 60%, 60%, 60% jest uważana za lepszą niż zespół składający się z 70%, 70%, 70%, 30%, gdzie jeden zły gracz spowodowałby gorsze szanse dla drużyny, mimo że średnie są takie same. Bez dodatkowych hipotez nie można rozwiązać tego konkretnego pytania.
** Podobnie, jeśli 50,50,50,90 nie jest uważane za równe 60, 60, 60, 60, 60, to to samo dotyczy.
źródło