Istnieje bardzo szeroka gama metod grupowania, które są z natury eksploracyjne i nie sądzę, aby którakolwiek z nich, hierarchiczna lub oparta na partycjach, opiera się na rodzaju założeń, które należy spełnić, aby przeanalizować wariancję.
Przeglądając dokumentację [MV] w Stacie, aby odpowiedzieć na twoje pytanie, znalazłem ten zabawny cytat na stronie 85:
Chociaż niektórzy powiedzieli, że istnieje tyle metod analizy skupień, ile osób przeprowadza analizę skupień. To rażące niedopowiedzenie! Istnieje nieskończenie więcej sposobów przeprowadzania analizy skupień niż osoby, które ją wykonują.
W tym kontekście wątpię, aby były jakieś założenia dotyczące metody grupowania. Pozostała część tekstu stanowi ogólną zasadę, że do tworzenia klastrów potrzebna jest pewna forma „miary niepodobieństwa”, która nie musi być nawet odległością metryczną.
Jest jednak jeden wyjątek, który występuje w przypadku grupowania obserwacji w ramach analizy po oszacowaniu. W programie Stata vce
polecenie zawiera następujące ostrzeżenie na stronie 86 tego samego źródła:
Jeśli znasz dużą tablicę poleceń szacowania Staty, pamiętaj, aby odróżnić analizę skupień (polecenie skupienia) od dozwolonej opcji vce (skupienie klastrów) w przypadku wielu poleceń oszacowania. Analiza skupień wyszukuje grupy w danych. Opcja vce (klaster klastrowy) dozwolona z różnymi poleceniami szacowania wskazuje, że obserwacje są niezależne w grupach zdefiniowanych przez opcję, ale niekoniecznie są niezależne w obrębie tych grup. Zmienna grupująca utworzona za pomocą komendy klaster rzadko spełnia założenia związane z użyciem opcji vce (klaster klastrowy).
Na tej podstawie zakładam, że niezależne obserwacje nie są wymagane poza tym konkretnym przypadkiem. Intuicyjnie dodałbym, że analiza skupień może być nawet wykorzystana do dokładnego celu zbadania stopnia, w jakim obserwacje są niezależne lub nie.
Na koniec wspomnę, że na stronie 356 „ Statystyki ze Statą” Lawrence Hamilton wymienia znormalizowane zmienne jako „niezbędny” aspekt analizy skupień, chociaż nie zagłębia się bardziej szczegółowo w tę kwestię.