Zdyskontowany zysk skumulowany (DCG) jest jednym z najpopularniejszych wskaźników wykorzystywanych do oceny rankingu w dowolnej wyszukiwarce. Jest to miara jakości rankingu. Podczas wyszukiwania informacji jest często używany do pomiaru skuteczności wyszukiwarki internetowej.
Opiera się na następujących założeniach:
- Bardzo trafne dokumenty są bardziej przydatne, jeśli pojawiają się wcześniej w wynikach wyszukiwania.
- Dokumenty o dużym znaczeniu są bardziej przydatne niż dokumenty o marginalnym znaczeniu, które są lepsze niż dokumenty nieistotne.
Wzór na DCG wygląda następująco:
D C.solp= ∑i = 1pr e ljal o g2)( i + 1 )= r e l1+ ∑i = 2pr e ljal o g2)( i + 1 )(1)
Gdzie:
- i jest zwróconą pozycją dokumentu w wyniku wyszukiwania.
- r e lja to stopniowane znaczenie dokumentu
- sumowanie przez p (liczbę zwróconych wyników), zatem skumulowany skumulowany zysk daje miary wydajności zwróconego wyniku.
DCG pochodzi od CG (Skumulowany zysk) , otrzymany przez:
dosolp= ∑i = 1pr e lja(2)
Z (2) widać, że nie zmienia się w przypadku zmiany kolejności wyników. Aby rozwiązać ten problem, wprowadzono DCG. Istnieje inna forma DCG, która jest popularna ze względu na bardzo duży nacisk na odzyskiwanie dokumentów. Ta wersja DCG jest dostarczana przez:dosolp
D C.solp= ∑i = 1p2)r e lja- 1l o g2)( i + 1 )(3)
Jedną oczywistą wadą równania DCG przedstawionego w (1) i (3) jest to, że algorytmy zwracające inną liczbę wyników nie mogą być skutecznie porównywane. Jest tak, ponieważ im wyższa wartość tym wyższa wartość zostanie przeskalowana do.pD C.solp
Aby rozwiązać ten problem, proponuje się znormalizowany DCG (nDCG) . Daje to
n D Csolp= D CsolpjaD C.solp
gdzie jest idealnym , podanym przez,jaD C.solpD C.solp
jaD C.solp= ∑i = 1| REL |2)r e lja- 1l o g2)( i + 1 )
Gdzie | REL | to lista dokumentów uporządkowanych według istotności w korpusie do pozycji p.
Aby uzyskać idealny algorytm rankingu,
D C.solp= JaD C.solp
Ponieważ wartości nDCG są skalowane w zakresie [0,1], porównanie tych zapytań jest możliwe przy użyciu tych wskaźników.
Wady:
1. nDCG nie penalizuje wyników wyszukiwania złych dokumentów. Można to naprawić, dostosowując wartości trafności przypisane dokumentom. 2. nDCG nie penalizuje brakujących dokumentów. Można to naprawić, ustalając rozmiar pobierania i stosując minimalną liczbę punktów dla brakujących dokumentów.
Zobacz to, aby zobaczyć przykładowe obliczenia nDCG.
Odniesienie