Mam zestaw danych w następującej strukturze wstawiony do pliku CSV:
Banana Water Rice
Rice Water
Bread Banana Juice
Każdy wiersz wskazuje kolekcję przedmiotów, które zostały zakupione razem. Na przykład, pierwszy wiersz oznacza, że przedmioty Banana
, Water
i Rice
zostały zakupione razem.
Chcę utworzyć wizualizację, jak poniżej:
Jest to w zasadzie wykres siatki, ale potrzebuję jakiegoś narzędzia (może Python lub R), które może odczytać strukturę wejściową i wygenerować taki wykres jak powyższy jako wynik.
python
r
data-mining
visualization
association-rules
João_testeSW
źródło
źródło
Dla
R
, można użyć bibliotekiArulesViz
. Jest ładna dokumentacja, a na stronie 12 znajduje się przykład tworzenia tego rodzaju wizualizacji.Kod tego jest tak prosty:
źródło
Z Wolfram Language in Mathematica .
Uzyskaj liczbę par.
Uzyskaj indeksy dla nazwanych kleszczy.
Rysuj za
MatrixPlot
pomocąSparseArray
. Przydałby się równieżArrayPlot
.Pamiętaj, że jest on trójkątny.
Mam nadzieję że to pomoże.
źródło
Możesz to zrobić w Pythonie z biblioteką wizualizacji dna morskiego (zbudowaną na matplotlib).
Ostateczna ramka danych
df
wygląda następująco:a wynikowa wizualizacja to:
źródło