Powiedzmy, że otrzymujesz dwa wielowymiarowe zestawy danych, powiedzmy stary i nowy, i że powinny być one wygenerowane przez ten sam proces (dla którego nie masz modelu), ale być może gdzieś wzdłuż linii zbierania / tworzenia dane, coś poszło nie tak. Nie chcesz używać nowych danych jako, powiedzmy, zestawu sprawdzającego poprawność starych danych lub dodawać do starych danych.
Możesz wykonać kilka statystyk 1-d (dla każdej zmiennej), np. Sumę rang Wilcoxona i wypróbować kilka poprawek wielokrotnych testów, ale nie jestem pewien, czy to optymalne (aby uchwycić zawiłości danych wielowymiarowych, nie mówiąc już o problemach z wieloma testami). Jednym ze sposobów jest użycie klasyfikatora i sprawdzenie, czy można rozróżnić dwa zestawy danych (biorąc pod uwagę optymalny klasyfikator, który jest optymalny). Wydaje się, że to działa, ale nadal a) perhpas istnieje lepszy sposób b) Nie jest tak naprawdę zaprojektowany, aby powiedzieć ci, dlaczego jest inny (jeśli nic więcej, użyje najlepszych predyktorów i prawdopodobnie przegapi inne dobre predyktory, które były podrzędne przez lepsze)
źródło
Spójrz w górę T ^ 2 Hotellinga, lub jeśli masz naprawdę bardzo słabe dane, spójrz na to: http://normaldeviate.wordpress.com/2012/07/14/modern-two-sample-tests/
źródło