Przekształcanie listy częściowych rankingów w globalny ranking

13

Pracuję nad czymś w rodzaju następującego problemu. Mam grupę użytkowników i N książek. Każdy użytkownik tworzy uporządkowany ranking wszystkich książek, które przeczytał (co jest prawdopodobnie podzbiorem N książek), np. Książka 1> Książka 40> Książka 25.

Teraz chcę przekształcić te indywidualne rankingi użytkowników w jeden uporządkowany ranking wszystkich książek.

Czy są jakieś dobre lub standardowe podejścia do wypróbowania? Do tej pory myślę o modelach Bradleya-Terry'ego stosowanych do porównań parami, ale zastanawiam się, czy jest coś jeszcze.

raegtin
źródło
2
Sądzę, że napotkasz wiele problemów ze rzadkością, chyba że użytkownicy (z jakiegoś powodu) przeczytają podobne książki. Ale biorąc pod uwagę n ludzi i biorąc pod uwagę, że większość ludzi czyta stosunkowo niewiele książek, zdecydowana większość par będzie miała tylko jedną osobę dokonującą porównania. (Mediana liczby wynosiła 6 na osobę rocznie, patrz Pew
Peter Flom - Przywróć Monikę
2
(+1) Raegtin, zadajesz miłe, interesujące pytania. Lubię modele BT, ale wygląda na to, że jest tu trochę zmuszony. Czy znasz literaturę dotyczącą wspólnego filtrowania? To nie ten sam problem, ale niektóre koncepcje i techniki można pożyczyć. Pytanie, na które nie ma odpowiedzi, brzmi: dlaczego należy wierzyć książkom w jednoznaczny, dobrze określony ranking. (Jak na przykład poradziłbyś sobie z przypadkiem dwóch użytkowników i dwóch książek?)
kardynał
@Peter Flom: Prawidłowo, większość par nie ma porównań. Ale mam nadzieję, że to w porządku, ponieważ jeśli wiesz, że A> B i B> C, to nawet jeśli A i C nie są bezpośrednio porównywane, możesz wywnioskować A> C.
raegtin
@cardinal: Tak, modele BT wydają się tutaj wymuszone, ale to jedyna rzecz, o której mogę teraz myśleć. Znam literaturę dotyczącą wspólnego filtrowania, ale nie jestem pewien, jak się tu stosuje, ponieważ chcę rankingów, a nie podobieństw. Prawdą jest, że pojedynczy globalny ranking niekoniecznie ma sens (np. Czy ma sens porównywanie książek dla dzieci z książkami dla dorosłych? Fikcja kontra non-fiction?), Ale w praktyce wciąż jest przydatna. Listy książek „Best of” pojawiają się cały czas :)
raegtin
Poza tym nie dbam zbytnio o ścisłe porządki (np. Czy książka nr 1 jest naprawdę lepsza niż książka nr 2), ale raczej porządki zbiorcze (np. Chcę, aby 10% najlepszych książek w mojej kolejności być lepszy niż dolne 10% lub środkowe 10%).
raegtin

Odpowiedzi:

2

Jeśli jesteś zainteresowany wykorzystaniem (bardziej niż rozwojem), powinieneś spróbować rankingu , naszego systemu rankingowego.

Rankade jest darmowy i łatwy w użyciu, i różni się od modelu Bradley-Terry i systemu rankingowego Elo (oto porównanie ), ponieważ może zarządzać meczami z ponad 2 frakcjami (tj. Książkami, w twoim scenariuszu). Wstawiając uporządkowane rankingi użytkownika (jako mecze między dwiema lub więcej książkami, ze szczegółowymi końcowymi ocenami , w tym powiązaniami) otrzymasz pojedynczy uporządkowany ranking wszystkich książek, których szukasz. Uzależniony od rankingów daje możliwość sprawdzenia ewolucji czasu w rankingu książek, statystyk meczów książek i nie tylko.

Tomaso Neri
źródło
1
Powinieneś opisać swój algorytm, przynajmniej ogólnie, jako podejście. I link do artykułu, w którym jest on w pełni opisany. W przeciwnym razie twoją odpowiedź można uznać za zwykłą reklamę.
ttnphns
1
Dodałem link do prostego porównania między ree a najbardziej znanym systemem rankingowym. Pierwsze stwierdzenie mówi: Jeśli jesteś zainteresowany użytkowaniem (bardziej niż programowaniem) , więc jest proponowany jako rozwiązanie problemu (ranking zawiera GUI, podczas gdy Bradley-Terry i Plackett-Luce wymagają implementacji), więcej niż ścieżka do osiągnięcia żądanego rozwiązania.
Tomaso Neri
1

Modele rankingowe Plackett-Luce radzą sobie z tym problemem i są techniką opartą na prawdopodobieństwie, w której prawdopodobieństwo jest maksymalizowane przy użyciu procedury maksymalizacji-maksymalizacji, która jest podobna do Maksymalizacji oczekiwań, w tym sensie, że używają pomocniczej funkcji celu w stosunku do funkcji prawdopodobieństwa, która jest zoptymalizowany, aby zagwarantować iteracyjną monotoniczną maksymalizację funkcji prawdopodobieństwa. (patrz algorytmy MM dla modeli rankingowych Plackett-Luce autorstwa Davida Huntera). Zapewnia również kod.

> =

To idealnie pasuje do twojego zestawu danych:

Książka 1> Książka 40> Książka 25

Książka 40> Książka 30

Książka 25> Książka 17> Książka 11> Książka 3 itp.

karawan
źródło