Lemat Johnsona-Lindenstraussa pozwala reprezentować punkty w przestrzeni o dużych wymiarach w punktach o niższych wymiarach. Podczas znajdowania najlepiej dopasowanych mniejszych wymiarów, standardową techniką jest znalezienie rozkładu wartości w liczbie pojedynczej, a następnie wzięcie podprzestrzeni wygenerowanej przez największe wartości w liczbie pojedynczej. Kiedy warto zastosować Johnson-Lindenstrauss zamiast SVD?
źródło
SVD i JL również inaczej ekstrapolują do przyszłych punktów.
To znaczy, jeśli założymy, że dane pochodzą z jakiegoś podstawowego rozkładu, w zasadzie SVD powinien pozostać „dobry” dla wszelkich przyszłych punktów, o ile są one próbkowane z tego samego rozkładu. Z drugiej strony wymiar docelowy JL zależy od liczby punktów, co oznacza, że zastosowanie transformacji JL do dodatkowych punktów może zwiększyć prawdopodobieństwo błędu.
Staje się to istotne, na przykład, jeśli używasz redukcji wymiarowości jako kroku wstępnego przetwarzania dla jakiegoś innego algorytmu. Granice SVD dla danych treningowych mogą zawierać dane testowe, ale JL nie.
źródło
Jest to kontynuacja odpowiedzi Suresha - po przeczytaniu jego odpowiedzi trochę googlowałem i doszedłem do następującego zrozumienia. Pierwotnie zamierzałem opublikować to jako komentarz do jego odpowiedzi, ale ciągle się zwiększało.
Proszę wskazać błędy w odpowiedzi, nie jestem ekspertem w tej dziedzinie.
W pewnym sensie JL i SVD są jak jabłka i pomarańcze.
1) Rozwiązane przez nich problemy są zupełnie inne. Jedna dotyczy odległości parami, druga ma najlepszą reprezentację. Jeden to najgorszy przypadek, drugi to przeciętny przypadek.
Zwraca JL podprzestrzeni
(JL nie jest konstruktywny, ale załóżmy, że zwróciła najlepszą podprzestrzeń)jest rozwiązaniem następującej optymalizacji(To nie jest dokładne, skomentuję to później)
Problem, który SVD rozwiązuje, to (biorąc pod uwagę wymiar ) arg min P dim dim { Śr (( | | u - P u | | 2 ) }k
3) JL nie jest konstruktywny, SVD jest konstruktywny - ten punkt jest nieco niejasny, ponieważ termin konstruktywny nie jest precyzyjnie zdefiniowany. Istnieją algorytmy deterministyczne do obliczania SVD, ale algorytm znajdowania przestrzeni JL jest randomizowany - wykonaj losowe projekcje, jeśli zawiedziesz, spróbuj ponownie.(Zobacz komentarze, aby uzyskać wyjaśnienie dotyczące fragmentów odpowiedzi w odpowiedzi).
Edycja: @ john-myles-white napisał post o JL, aby zweryfikować swoje roszczenia i pokazać, jak można zbudować projekcję: http://www.johnmyleswhite.com/notebook/2014/03/24/a-note- on-the-johnson-lindenstrauss-lemma /
źródło