System oceny Elo wykorzystuje algorytm minimalizacji spadku gradientu funkcji utraty entropii krzyżowej między spodziewanym i obserwowanym prawdopodobieństwem wyniku w porównaniach w parach. Możemy zapisać funkcje strat ogólnych jako
gdzie suma jest wykonywana dla wszystkich wyników i wszystkich przeciwników n . p i to obserwowana częstotliwość zdarzenia i oraz oczekiwaną częstotliwość.
W przypadku tylko dwóch możliwych wyników (wygrana lub przegrana) i jednego przeciwnika mamy
Jeśli jest rankingiem gracza i i jest rankingiem gracza j , możemy zbudować oczekiwane prawdopodobieństwo jako q i = e π i qj=eπj
gdzie a p i są oczekiwane i obserwowane prawdopodobieństwo wygranej gracza I wobec gracza j . To sązasady aktualizacji.two outcomes
W przypadku losowań możemy uogólnić powyższy model z prawdopodobieństwem trzeciego wyniku
I możemy zbudować funkcję Loss jako
gdzie win
loose
draw
win
, loose
i draw
. W tym drugim przypadku reguła aktualizacji byłaby
three outcome
Pytanie brzmi, dlaczego system oceny Elo korzysta z two outcomes
reguły aktualizacji nawet w przypadku losowań?
źródło