Rozważ kontekst klastrowania dendrogramu. Nazwijmy pierwotne odmienności odległościami między jednostkami. Po skonstruowaniu dendrogramu definiujemy khenetyczną odmienność między dwoma osobami jako odległość między skupieniami, do których te osoby należą.
Niektóre osoby uważają, że korelacja między pierwotnymi odmiennościami a kopenetycznymi odmiennościami (zwana korelacją kopenetyczną ) jest „wskaźnikiem przydatności” klasyfikacji. Brzmi dla mnie całkowicie zagadkowo. Mój sprzeciw nie opiera się na konkretnym wyborze korelacji Pearsona, ale na ogólnej idei, że jakikolwiek związek między pierwotnymi odmiennościami a kopenetycznymi odmiennościami może być związany ze stosownością klasyfikacji.
Czy zgadzasz się ze mną, czy może przedstawiłbyś argument przemawiający za wykorzystaniem korelacji kopenetycznej jako wskaźnika przydatności do klasyfikacji dendrogramu?
źródło
general idea that any link between the original dissimilarities and the cophenetic dissimilarities could be related to the suitability of the classification
. Klasyfikacja powinna odzwierciedlać pierwotne różnice. Podstawową cechą klasyfikacji Dendrogramic w tym celu jest odmienność kopenetyczna. Czy jest coś źle?Odpowiedzi:
Dla mnie nie jest jasne, co to oznacza. Tak to rozumiem
jest miarą struktury hierarchicznej między obserwacjami , tj. ich odległości. To znaczy, że podobieństwa do obserwacji w innej grupie są korzystnie podobne. Biorąc pod uwagę zestawy danych A i B skupione za pomocą odległości euklidesowej i pełnego połączenia ... ... nawet bez spojrzenia na kopenetyczną mapę odległości lub obliczenie korelacji kopenetycznej, można zauważyć, że korelacja kopenetyczna A jest wyższa niż B W hierarchii są poziomy. Tak więc CC mówi o tym, czy odległości do obserwacji na tym samym poziomie (gromadzie) są podobne.
Dla kompletności: Korelacje kopenetyczne wynoszą CC (A) = 0,936 i CC (B) = 0,691
źródło