Jestem bardzo nowy w osadzaniu słów. Chcę wyobrazić sobie, jak wyglądają dokumenty po nauce. Czytałem, że t-SNE jest podejściem do tego. Mam 100 000 dokumentów o 250 wymiarach jako rozmiarze osadzenia. Dostępnych jest również kilka pakietów.
Jednak w przypadku t-SNE nie wiem, ile iteracji, wartość alfa lub wartość zdolności pertraktacyjnych powinienem się uczyć, aby lepiej się uczyć.
Czy są to hiper-parametry, czy można je określić na podstawie niektórych atrybutów?
źródło
Przytoczę najczęściej zadawane pytania ze strony internetowej t-SNE . Najpierw zakłopotanie:
W przypadku wszystkich innych parametrów należy rozważyć przeczytanie tego:
Innymi słowy oznacza to: spójrz na wykres, jeśli wizualizacja jest dobra, nie zmieniaj parametrów. Możesz także wybrać przebieg z najmniejszą dywergencją KL dla każdej stałej zakłopotania.
źródło