Jak interpretować i generować wykresy wykresów fasoli. Oto jeden przykład wzięty z Walkesa i in. 2010 r . Jakiego rodzaju dane są najbardziej przydatne?
(źródło: biomedcentral.com )
data-visualization
boxplot
Vanson Samuel
źródło
źródło
Odpowiedzi:
Wykresy pudełkowe zostały naprawdę zaprojektowane dla normalnych danych, a przynajmniej danych niemodalnych. Beanplot pokazuje rzeczywistą krzywą gęstości, która jest bardziej pouczająca.
Kształt jest gęstością, a krótkie poziome linie reprezentują każdy punkt danych. Łączy to wszystko, co najlepsze z wykresu pudełkowego, wykresu gęstości i wykresu dywanu w jednym i jest bardzo czytelny.
Niestety, w przykładzie, który wybrałeś, postanowiłeś dodać kilka dłuższych linii, które zaśmiecają wykres nie do poznania (dla mnie). [fantastyczna okazja]
EDYCJA: Po dłuższej pracy z wykresem fasoli dłuższe grube linie są średnią (lub opcjonalnie medianą) dla każdej fasoli. Dłuższe cienkie linie to dane, z rodzajem „układania” w stos, w którym szersze linie wskazują bardziej powielone wartości. (Możesz również je drżeć, co wolę, ale przynajmniej „normalna” kategoria ma już dość gęstą liczbę punktów, które drżenie mogą pogorszyć).
Nadal uważam, że wybrany przez ciebie przykład jest raczej zagracony, co można by wyjaśnić, stosując jitter zamiast układania w stosy.
Papier, który opisuje pakiet R do tworzenia wykresów fasoli jest ładny odczytu.
źródło
Bez przeczytania całego artykułu wydaje się, że jest to w zasadzie wariant wykresu pudełkowego. Jako taki, możesz go użyć tam, gdzie w innym przypadku użyłbyś wykresu pudełkowego, na przykład porównując rozkłady jednowymiarowe kilku grup. Wyświetla linię dla każdego punktu i nakłada oszacowanie gęstości jądra. Patrząc na to, sądzę, że może to być bardziej pouczające przy małych ilościach danych, ale byłoby zbyt zagracone większą ilością danych. Na pierwszy rzut oka nie wydaje mi się to wstrząsające ziemią. Jeśli chcesz dowiedzieć się czegoś więcej, opracuj swoje pytanie.
źródło