Czy wymiary t-sne są znaczące?

18

Czy są jakieś znaczenia dla wymiarów osadzania t-sne? Podobnie jak w przypadku PCA, mamy poczucie maksymalizacji wariancji transformacji liniowej, ale czy dla t-sne jest intuicja oprócz tylko przestrzeni, którą definiujemy do mapowania i minimalizacji odległości KL?

Nitro
źródło
1
Nie jestem pewien, czy tak naprawdę odpowiada to temu, o co pytasz, ale uważam, że wymiary t-sne naprawdę zależą tylko od rozdzielności danych. Wymiary mogą ulec zmianie, biorąc pod uwagę ten sam zestaw danych, ponieważ jest to transformacja nieliniowa. Tak więc wymiary można naprawdę interpretować tylko w kontekście danej instancji. Daj mi znać, jeśli się mylę, to interesujące pytanie.
Hobbes,
Może to po prostu nudne stare ?3?
Nitro,

Odpowiedzi:

17

Wymiary przestrzeni niskiego wymiaru nie mają znaczenia. Należy zauważyć, że funkcja straty t-SNE opiera się wyłącznie na odległościach między punktami ( i y j ) oraz rozkładach prawdopodobieństwa na tych odległościach ( p i jyjayjotpjajot i ):qjajot

δdoδyja=4jot(pjajot-qjajot)(yja-yjot)(1+||yja-yjot||2))-1

Zatem nie ma rzutowania z całej przestrzeni wielowymiarowej na przestrzeń niskowymiarową, t-SNE znajduje jedynie odwzorowanie od określonego zestawu punktów wielowymiarowych do określonego zestawu punktów niskowymiarowych. Ponieważ nie ma żadnej funkcji z jednej przestrzeni do drugiej, nie ma również nieodłącznego znaczenia osi.

Rzeczy, które możesz sobie to zilustrować:

  • Obracanie lub translacja przestrzeni o wysokich lub niskich wymiarach nie wpływa na odległości między punktami. Dlatego t-SNE nie dba o rotację lub translację w obu przestrzeniach. Zatem nie ma absolutnej interpretacji osi.
  • Rozkład t-Studentów ma grube ogony. To powoduje, że reprezentacja niskiego wymiaru jest niezmienna dla zmian punktów znajdujących się daleko w przestrzeni wielowymiarowej. Powoduje to również, że punkty, które są daleko w przestrzeni wielowymiarowej, mogą być albo dość daleko, bardzo daleko, albo naprawdę daleko w przestrzeni niskiego wymiaru. W tym sensie rozciąga on niektóre części osi niskiego wymiaru (w dowolnym dowolnym kierunku).

To powiedziawszy, t-SNE jest przede wszystkim techniką wizualizacji, a jego skuteczność zmniejszania wymiarów do innych celów nie jest oczywista (prawdopodobnie nie nadaje się do grupowania, wydobywania cech lub wyboru cech).

Również: papier .

Pieter
źródło