Jakie jest dobre zastosowanie t-SNE, oprócz wizualizacji danych?

W jakich sytuacjach powinniśmy używać t-SNE (oprócz wizualizacji danych)?

T-SNE służy do redukcji wymiarów. Odpowiedź na to pytanie sugeruje, że t-SNE powinien być używany tylko do wizualizacji i że nie powinniśmy go używać do grupowania. Jakie jest zatem dobre zastosowanie t-SNE?

data-visualization dimensionality-reduction tsne wolfe
źródło

Standardowa rada to NIE używać tsne do tworzenia klastrów, ponieważ klastry są tak zależne od problemów. Ma być używany tylko do „wizualizacji”. Ale to nie jest dla mnie bardzo jasne, ponieważ od razu szuka się (i widzi) klastrów, patrząc na działkę tsne. Dlatego twoje pytanie jest dobre: do czego służy tsne?

generic_user

Zobacz odpowiedź na to pytanie, które zadałem: stats.stackexchange.com/questions/263539/...

generic_user

jak powiedział @generic_user, chcę poznać zalety t-sne, oprócz jego wizualizacji.

wolfe

Nie wiem, dlaczego został zamknięty jako duplikat. OP pyta, jakie są dobre zastosowania t-sne oprócz wizualizacji. W połączonym wątku chodzi o klastrowanie. Ale mogą być inne zastosowania.

ameba

Powiązane: stats.stackexchange.com/questions/132639/…

Amelio Vazquez-Reina

Odpowiedzi:

Odpowiedź na to pytanie sugeruje, że t-SNE powinny być wykorzystywane tylko do wizualizacji i że powinniśmy nie używać go do grupowania. Jakie jest zatem dobre zastosowanie t-SNE?

Nie zgadzam się z tym wnioskiem. Nie ma powodu, aby zakładać, że t-SNE jest ogólnie gorszy niż jakikolwiek inny algorytm grupowania. Każdy algorytm grupowania przyjmuje założenia dotyczące struktury danych i można oczekiwać, że będą działać inaczej w zależności od podstawowego rozkładu i końcowego zastosowania zmniejszonej wymiarowości.

t-SNE, podobnie jak wiele algorytmów uczenia się bez nadzoru, często zapewnia środki do osiągnięcia celu, np. uzyskanie wczesnego wglądu w to, czy dane są możliwe do oddzielenia, testowanie, czy ma pewną możliwą do zidentyfikowania strukturę, oraz sprawdzanie charakteru tej struktury. Nie trzeba wizualizacji wyjścia t-SNE, aby zacząć odpowiadać na niektóre z tych pytań. Inne zastosowania osadzania niższych wymiarów obejmują funkcje budowania do klasyfikacji lub pozbycie się wielokolinearności w celu poprawy wydajności metod prognozowania.

Amelio Vazquez-Reina
źródło