Chciałbym uzyskać graficzną reprezentację korelacji w artykułach, które zebrałem do tej pory, aby łatwo zbadać relacje między zmiennymi. Kiedyś rysowałem (niechlujny) wykres, ale teraz mam za dużo danych.
Zasadniczo mam stół z:
- [0]: nazwa zmiennej 1
- [1]: nazwa zmiennej 2
- [2]: wartość korelacji
Matryca „ogólna” jest niekompletna (np. Mam korelację V1 * V2, V2 * V3, ale nie V1 * V3).
Czy istnieje sposób na przedstawienie tego graficznie?
źródło
ggfluctuation
, nie widziałem tego wcześniej! Ten post zawiera inny użyteczny kod do wizualizacji tego typu datownika: stackoverflow.com/questions/5453336/…hclust(…)$order
) [ stat.ethz.ch/R-manual/R-devel/library/stats/html/hclust.html] wizualizacja będzie często łatwiejsza do przeglądania.mixOmics::cim
Funkcja jest bardzo dobry do tego. Temat pokrewny został tutaj omówiony, stats.stackexchange.com/questions/8370/… .Twoje dane mogą być podobne
Możesz zmienić układ długiego stołu na szeroki przy użyciu następującego kodu R.
Dostajesz
Teraz możesz użyć technik wizualizacji macierzy korelacji (przynajmniej takich, które poradzą sobie z brakującymi wartościami).
źródło
reshape
opakowanie może być również użyteczne. Gdy już to zrobisze
, zastanów się nad czymś takimlibrary(reshape) cast(melt(e), name1 ~ name2)
The
corrplot
Pakiet jest użyteczną funkcją dla wizualizacji macierze korelacji. Akceptuje macierz korelacji jako obiekt wejściowy i ma kilka opcji wyświetlania samej macierzy. Przyjemną cechą jest to, że może zmieniać kolejność zmiennych przy użyciu metod hierarchicznego grupowania lub metod PCA.Zobacz zaakceptowaną odpowiedź w tym wątku, aby zobaczyć przykładową wizualizację.
źródło