Dlaczego Netflix miałby przejść z pięciogwiazdkowego systemu ocen na system lajków / niechęci?

11

Netflix opierał swoje sugestie na ocenach innych filmów / programów przesłanych przez użytkownika. Ten system ocen miał pięć gwiazdek.

Teraz Netflix pozwala użytkownikom lubić / nie lubić (kciuk w górę / kciuk w dół) filmów / programów. Twierdzą, że łatwiej jest oceniać filmy.

Czy ta dwukierunkowa klasyfikacja nie byłaby statystycznie mniej przewidywalna niż pięciokierunkowy system klasyfikacji? Czy nie uchwyciłby mniejszej zmienności?

jvriesem
źródło
1
Myślę, że wszelkie odpowiedzi powinny poważnie potraktować własne wyjaśnienie Netflix, w tym, że w testach A / B uzyskały 4x więcej ocen w systemie dwukierunkowym. Samo to jest ogromne. Również Wynikiem słynnym konkursie Netflix było, że lepsze przewidywanie ocen (co dostali od konkurencji) nie przekładają się na lepsze przewidywanie zachowań . Możesz uznać „Dumę i uprzedzenie” za lepszy film, ale bardziej prawdopodobne jest, że obejrzysz „Die Hard”. Netflix prawdopodobnie dba o to, co chcesz (lub będzie) oglądać, niż o to, co uważasz za lepszy film.
ctwardy

Odpowiedzi:

11

Według artykułu Prestona i Colemana (2000), niezawodność w 2 pozycjach nie różni się znacząco od niezawodności w 5 pozycjach:

Wiarygodność skal przedmiotów

Przedmiotem pomiaru była satysfakcja z restauracji, ale dobrze przekłada się to na ocenę filmu. Zmierzono także łatwość użycia, szybkość użycia i skuteczność wyrażania uczuć na różnych skalach przedmiotów. Wyniki są następujące:

Środki satysfakcji

Oczywiste jest, że użytkownicy uważają, że 2-elementowa skala jest nieco łatwiejsza w użyciu i szybsza w porównaniu z 5-punktową skalą, ale także bardzo nieodpowiednia w wyrażaniu prawdziwych przekonań użytkownika. Wskazuje to, że skala 2 elementów nie uwzględnia bardzo dobrze podstawowej zmienności i powoduje utratę zmienności. Wskaźniki dyskryminacji są również znacznie gorsze dla 2 skal przedmiotów w porównaniu z 5 skalami przedmiotów.

Biorąc powyższe pod uwagę, spekulowałbym, że Netflix chce wymienić pewną precyzję głosowania, aby zachęcić więcej użytkowników do głosowania. Myślę, że wolą więcej osób głosujących, ponieważ zwiększa to zasięg próby. Może to prowadzić do lepszego zrozumienia mniej zaangażowanych użytkowników. Wartość krańcowa dodatkowych informacji dla mniej zaangażowanych użytkowników jest prawdopodobnie znacznie wyższa w porównaniu do zaangażowanych użytkowników.

Vivaldi
źródło