Bardzo często w polecającym mamy dane użytkownika, które mają etykietę np. „Kliknięcie”. Aby poznać model, potrzebuję danych dotyczących kliknięć i braku kliknięć.
Najprostszym podejściem do generowania jest pobranie par produktów użytkownika, których nie ma w danych kliknięć. Może to jednak wprowadzać w błąd. Przykład:
user1, product1 (click)
user2, product2 (click)
user2, product3 (click)
user3, product2 (click)
Mogę zabrać użytkownika 1 ze wszystkimi produktami oprócz produktu 1 i oznaczyć je jako „no_click” i tak dalej. Ale to może nie być prawda. Może użytkownik 1 kliknąłby produkt 2, gdyby pokazano mu produkt 2. Ale tylko dlatego, że pokazano mu inne zestawy produktów - nie miał okazji zdecydować się na kliknięcie / brak kliknięcia produktu2.
Jak więc rozwiązać problem pojedynczych danych?
źródło
Odpowiedzi:
Istnieją więc dwa problemy.
Dla (1) powinieneś rejestrować te informacje. Jeśli nie jest aktualnie nagrywany, powinieneś zacząć rejestrować te informacje. Ponieważ nie masz tych informacji, chcesz podać rekomendacje. Na szczęście po kliknięciu danych nadal możesz utworzyć matrycę narzędziową, patrz 9.1.1.
http://i.stanford.edu/~ullman/mmds/ch9.pdf
Następnie możesz zastosować oparte na użytkownikach lub elementach wspólne filtrowanie, jak opisano w artykule. Jest to w zasadzie ćwiczenie wypełniania matrycy narzędzi i próby znalezienia „wyników” dla niezaznaczonych elementów. Twoja rekomendacja będzie odznaczonym przedmiotem o najwyższym wyniku.
W przypadku (2) nadal będziesz wydawać zalecenia dotyczące odznaczonych przedmiotów. Samo to nie jest problemem. Będziesz jednak chciał zoptymalizować swoje wrażenia. Nie możesz również mieć pełnej wiedzy, w której użytkownik może zobaczyć wszystkie możliwe opcje. Musisz rejestrować wrażenia i rozumieć wiele rzeczy.
To ogromny temat i w zasadzie jest to problematyczna dziedzina reklamy online. Jednak silnik rekomendacji próbuje znaleźć interesujące przedmioty na długim ogonie, co nieco różni się od optymalizacji reklam. Jest to pętla zwrotna umożliwiająca ocenę Twojego zalecenia. Testy A / B są powszechne. Będziesz chciał przetestować współczynniki klikalności i błędy rekomendacji między obecnym systemem a nowym systemem.
Zobacz także tutaj.
http://cs.brynmawr.edu/Courses/cs380/fall2006/Herlocker2004.pdf
http://www.cs.umd.edu/~samir/498/Amazon-Recommendations.pdf
źródło