Jakie jest znaczenie osi w t-SNE?

12

Obecnie próbuję owinąć głowę wokół matematyki t-SNE . Niestety, wciąż jest jedno pytanie, na które nie potrafię odpowiedzieć zadowalająco: Jakie jest rzeczywiste znaczenie osi na wykresie t-SNE? Gdybym miał przedstawić prezentację na ten temat lub zamieścić ją w jakiejkolwiek publikacji: Jak odpowiednio oznaczyć osie?

PS: Czytam to pytanie Reddita, ale podane tam odpowiedzi (takie jak „to zależy od interpretacji i wiedzy w dziedzinie”), naprawdę nie pomagają mi tego zrozumieć.

Hagbard
źródło

Odpowiedzi:

20

Poszczególne osie w t-SNE nie mają żadnego znaczenia.

Algorytmy takie jak MDS, SNE, t-SNE itp. Dbają tylko o parowe odległości między punktami. Próbują ustawić punkty na płaszczyźnie w taki sposób, aby odległości między nimi w parach zminimalizowałyby określone kryterium. Oznacza to, że jeśli weźmiesz wykres T-SNE i obrócisz go, wówczas powstałe ustawienie będzie równie dobre, jeśli chodzi o t-SNE. Zatem całkowity obrót uzyskany z algorytmu t-SNE jest dowolny.

Aby oznaczyć osie, zalecam napisanie czegoś takiego jak „wymiar t-SNE 1” i „wymiar t-SNE 2”.

(Czasami ludzie piszą „t-SNE 1” i „t-SNE 2” lub coś takiego, co jest niechlujne. Czasami widzę „t-SNE składnik 1” i „t-SNE składnik 2”, ale myślę, że to słowo „komponent” nie działa zbyt dobrze w tym kontekście).

ameba mówi Przywróć Monikę
źródło
2
Następstwem tej odpowiedzi jest to, że sugestia Reddita jest trochę błędna. Prawdopodobnie nie ma rozsądnego sposobu interpretacji osi w ogóle, nawet jeśli masz wiedzę w dziedzinie, którą należy zastosować.
shadowtalker
3
Inną konsekwencją tej odpowiedzi jest to, że osie powinny być wyświetlane w tej samej skali, aby po pomnożeniu przez matrycę rotatora i odpowiednio pochyleniu głowy wykres wyglądałby dokładnie tak samo. Jest to niestety dalekie od standardowej praktyki (narzekanie!).
eric_kernfeld