Badam wykorzystanie statystycznego testowania istotności (SST) do walidacji wyników analizy skupień. Znalazłem kilka artykułów na ten temat, takich jak
- „ Statystyczne znaczenie grupowania dla danych o dużych wymiarach i małych próbkach ” Liu, Yufeng i in. (2008)
- „ O niektórych testach istotności w analizie skupień ”, Bock (1985)
Ale jestem zainteresowany znalezieniem literatury, która dowodzi, że SST NIE jest odpowiedni do sprawdzania poprawności wyników analizy skupień. Jedynym źródłem, które znalazłem, twierdząc, że to jest, jest strona internetowa producenta oprogramowania
W celu wyjaśnienia:
Jestem zainteresowany badaniem, czy w wyniku analizy skupień wykryto znaczącą strukturę skupień, dlatego chciałbym wiedzieć o artykułach potwierdzających lub odrzucających obawy „dotyczące możliwości post-hoc testowania wyników danych eksploracyjnych analiza stosowana do znajdowania klastrów ".
Właśnie znalazłem artykuł z 2003 r. „ Metody grupowania i klasyfikacji ” autorstwa Milligana i Hirtle'a , na przykład, że użycie ANOVA byłoby nieprawidłową analizą, ponieważ dane nie mają losowych przypisań do grup.
Odpowiedzi:
Jest dość oczywiste, że nie można (naiwnie) przetestować różnic w rozkładach dla grup, które zostały zdefiniowane przy użyciu tych samych danych. Jest to znane jako „testowanie selektywne”, „podwójne zanurzenie”, „wnioskowanie kołowe” itp.
Przykładem może być test t na wysokościach „wysokich” i „niskich” osób w twoich danych. Wartość null będzie (prawie) zawsze odrzucana.
To powiedziawszy - można rzeczywiście uwzględnić etap grupowania na etapie testowania. Nie znam jednak takiego odniesienia, ale podejrzewam, że należało to zrobić.
źródło
Zamiast testowania hipotez za pomocą danego testu, zalecałbym sposoby ładowania lub inne podsumowania szacunkowe między klastrami. Na przykład możesz polegać na bootilerze percentyla z co najmniej 1000 próbek. Kluczową kwestią jest zastosowanie klastrowania niezależnie do każdej próbki bootstrap.
Takie podejście byłoby dość solidne, dostarczało dowodów na różnice i wspierało twierdzenie o znacznej różnicy między klastrami. Ponadto można wygenerować inną zmienną (powiedzmy różnicę między klastrami), a szacunki bootstrap takiej zmiennej różnej byłyby podobne do formalnego testu hipotezy.
źródło