Jestem bardzo nowy z R i statystykami w ogóle, ale muszę stworzyć wykres rozproszenia, który moim zdaniem może wykraczać poza jego natywne możliwości.
Mam kilka wektorów obserwacji i chcę zrobić z nimi wykres rozrzutu, a każda para należy do jednej z trzech kategorii. Chciałbym utworzyć wykres rozrzutu, który oddziela każdą kategorię, albo kolorem, albo symbolem. Myślę, że byłoby to lepsze niż generowanie trzech różnych wykresów rozrzutu.
Mam inny problem z tym, że w każdej z kategorii są duże klastry w jednym punkcie, ale klastry są większe w jednej grupie niż w dwóch pozostałych.
Czy ktoś wie, jak to zrobić? Pakiety, które powinienem zainstalować i nauczyć się korzystać? Ktoś zrobił coś podobnego?
Dzięki
Jest to jeden z klasycznych problemów dla zestawu danych „Iris”. Jest to łącze do całego zestawu projektów kreślenia opartych na tym zestawie danych z kodem R, który możesz dostosować do swojego problemu.
Oto podejście, które wykorzystuje bazowy R zamiast pakietu dodatkowego.
co daje tę liczbę:
Stamtąd, w zależności od fabuły, możesz zacząć bawić się poziomami alfa / przezroczystości, aby umożliwić nadpisywanie itp., Ale najpierw zbudowałbym z bardzo podstawowego wykresu.
Chociaż istnieje wiele powodów, aby trzymać się podstawy R, inne pakiety upraszczają drukowanie. Oddzielanie danych za pomocą funkcji wyróżniającej jest jedną z mocnych stron ggplot2 i pakietów kratowych . ggplot2 tworzy szczególnie atrakcyjne wizualnie wykresy. Oba pakiety są przedstawione w odpowiedzi przez @cbeleites.
źródło
Lub z ggplot2:
Który produkuje
źródło