Znaczenie ukrytych cech?

15

Próbuję zrozumieć modele faktoryzacji macierzy dla systemów rekomendujących i zawsze czytam „ukryte funkcje”, ale co to znaczy? Wiem, co oznacza funkcja dla zestawu danych szkoleniowych, ale nie jestem w stanie zrozumieć idei ukrytych funkcji. Każdy artykuł na ten temat, który mogę znaleźć, jest po prostu zbyt płytki.

Edytować:

jeśli przynajmniej możesz wskazać mi kilka artykułów wyjaśniających ten pomysł.

machine-learning data-mining recommender-system Jack Twain
źródło

Oto prosty przykład, który może ci pomóc quuxlabs.com/blog/2010/09/…

Akavall

9

Utajone oznacza, że nie można ich bezpośrednio zaobserwować. Powszechnym zastosowaniem tego terminu w PCA i analizie czynnikowej jest zmniejszenie wymiaru dużej liczby cech bezpośrednio obserwowalnych do mniejszego zestawu cech pośrednio obserwowalnych.

samthebest
źródło

więc zmniejszone wymiary są wtedy ukrytymi cechami? W przypadku PCA wektory własne macierzy kowariancji, tj. Główne składniki, prawda?

Jack Twain

Prawidłowe @AlexTwain

samthebest

Czy możesz podać mi samouczek / artykuł, który o tym wspomina? Nie mogę znaleźć żadnego systematycznego samouczka / artykułu!

Jack Twain

Cóż, strona wiki jest całkiem dobra, jeśli naprawdę chcesz, możesz skorzystać z tamtejszych referencji en.wikipedia.org/wiki/Latent_variable

samthebest

1

@JackTwain poprawną analogią PCA jest to, że ukryte cechy to wektory własne. Głównymi składnikami są wagi przypisane do każdej obserwacji dla głównych wektorów własnych. W innych modelach faktoryzacji macierzy cechy ukryte odgrywają rolę wektorów własnych. Może to zabrzmieć pedantycznie, ale błąd nie powoduje końca zamieszania dla ludzi.

przypuszcza

3

W kontekście metody faktoryzacji ukryte cechy mają zazwyczaj na celu scharakteryzowanie elementów wzdłuż każdego wymiaru. Pozwól mi wyjaśnić na przykładzie.

$R$ $R_{ui}$ $p_u^T q_i$ $p_u$ $u$ $q_i$ $i$

$p_u$ $q_i$

Artem Sobolev
źródło

Czytałem artykuły, w których ukryte funkcje (np. „Wektor użytkownika”) są używane do przewidywania niektórych zmiennych docelowych, na przykład wykorzystajmy płeć. „Działa”, ponieważ w ten sposób można zbudować model predykcyjny. Moje pytanie brzmi: jaka jest różnica między „wektorem użytkownika” a, powiedzmy, uśrednianiem „wektorów przedmiotów” dla wszystkich elementów, które „odwiedził” użytkownik? IOW, czy spodziewałbyś się, że wspomniany wyżej model predykcyjny będzie lepszy lub gorszy w przypadku jednego lub drugiego? Dzięki (jeśli kiedykolwiek to zobaczysz).

thecity2

@ thecity2, możesz uśrednić elementy użytkownika, a to może być przydatne, gdy masz do czynienia z nowicjuszami, dla których nie masz wcześniej obliczonych wektorów użytkownika (choć trudno jest wykonać kilka iteracji optymalizacyjnych, aby je obliczyć). Istnieje również problem z prostym uśrednianiem: im więcej przedmiotów zużył użytkownik - im bliżej zera będzie prawdopodobnie ich średni wektor przedmiotów (z powodu typowego regulizatora L2 i być może innych nieprzyjemnych właściwości przestrzeni wielowymiarowych). Wreszcie, posiadanie oddzielnego wektora jest bardziej elastyczne: Twój model może nauczyć się takiego uśredniania.

Artem Sobolev

To powiedziawszy, są próby wykorzystania historii użytkownika do modelowania wektora użytkownika. Na przykład patrz artykuł „Zbuduj swoją własną rekomendację muzyczną poprzez modelowanie internetowych strumieni radiowych”

Artem Sobolev

0

Powiedziałbym, że czynniki są bardziej reprezentatywne niż główne składniki, aby uzyskać postrzeganie „opóźnienia” / ukrywania zmiennej. Opóźnienie jest jednym z powodów, dla których naukowcy behawioralni mierzą konstrukty percepcyjne, takie jak odczuwanie, smutek w kategoriach wielu przedmiotów / miar, i uzyskują liczbę dla takich ukrytych zmiennych, których nie można bezpośrednio zmierzyć.

KarthikS
źródło

0

Tutaj twoje dane są ocenami przyznawanymi przez różnych użytkowników dla różnych filmów. Jak zauważyli inni, ukryte środki nie są bezpośrednio widoczne.

W przypadku filmu jego ukryte funkcje określają ilość akcji, romans, fabułę, słynnego aktora itp. Podobnie, w innym zestawie danych składającym się z odręcznych cyfr, ukrytymi zmiennymi mogą być kąt krawędzi, pochylenie itp.

poszukiwacz
źródło

Znaczenie ukrytych cech?

Odpowiedzi: