Jak stworzyć system rekomendujący, który integruje funkcje filtrowania grupowego i funkcje treści?

10

Tworzę system polecający i chcę uwzględnić zarówno oceny „podobnych” użytkowników, jak i cechy produktów. Dane wyjściowe to przewidywana ocena [0-1]. Rozważam sieć neuronową (na początek).

Tak więc dane wejściowe są kombinacją cech elementów i ocen każdego użytkownika. Dla elementu A i użytkownika 1 system może zostać przeszkolony na podstawie połączonych danych A1. To byłby jeden przykład szkolenia.

Co się stanie, jeśli użytkownik 1 oceni także film B? Czy dane B1 byłyby również przykładem szkolenia? Czy istnieje problem z powtarzaniem treningu z funkcjami użytkownika 1 w ten sposób?

Czy masz jakieś sugestie dotyczące lepszego sposobu rozwiązania problemu?

B Seven
źródło

Odpowiedzi:

11

Dlaczego zastanawiasz się nad siecią neuronową, zanim całkowicie zrozumiesz problem?

Standardowe metody faktoryzacji macierzy do wspólnego filtrowania umożliwiają łatwe wykorzystanie funkcji treści. Przykład tego, jak można to zrobić w ustawieniu bayesowskim, znajduje się w dokumencie Matchbox .

Alexandre Passos
źródło
6

Trzy artykuły na temat integracji faktoryzacji macierzy z funkcjami treści (tutaj, w szczególności model tematyczny):

  • Deepak Agarwal i Bee-Chung Chen. 2010. fLDA: faktoryzacja macierzy poprzez ukryty przydział dirichleta. W materiałach z trzeciej międzynarodowej konferencji ACM na temat wyszukiwania w sieci i eksploracji danych (WSDM '10). ACM, Nowy Jork, NY, USA, 91-100.
  • Hanhuai Shan i Arindam Banerjee. 2010. Uogólnione faktoryzacje macierzy probabilistycznych na potrzeby filtrowania grupowego. W materiałach z międzynarodowej konferencji IEEE 2010 w sprawie eksploracji danych (ICDM '10). IEEE Computer Society, Waszyngton, DC, USA, 1025–1030.
  • Chong Wang i David M. Blei. 2011. Wspólne modelowanie tematów do rekomendowania artykułów naukowych. W materiałach z 17. międzynarodowej konferencji ACM SIGKDD na temat odkrywania wiedzy i eksploracji danych (KDD '11). ACM, Nowy Jork, Nowy Jork, USA, 448–456.

Chciałbym również promować swój własny wpis na blogu, który trochę omawia ten problem: modele tematyczne spełniają modele Lantent Factor

Liangjie Hong
źródło
3

Nie ma potrzeby stosowania sieci neuronowej, wspólne filtrowanie jest algorytmem samym w sobie. Dla twojego problemu, istnieje dobry opis systemu cf i systemu rekomendacji na:

ml-class.org

(poszukaj XVI: Systemy rekomendujące). Jest elegancki, prosty, a jeśli zrobisz to dobrze (to znaczy zastosujesz wektoryzowaną formę, szybkie minimalizatory i przygotowane gradienty), może być dość szybki.

vonPetrushev
źródło
Użyłem tego podejścia, ale nie korzysta ono z funkcji przedmiotów. Chciałbym również uwzględnić funkcje.
B, 7