Podczas kreślenia wykresu pudełkowego za pomocą python matplotblib linie w połowie wykresu są medianą rozkładu.
Czy istnieje możliwość, aby zamiast tego linia była średnia. Lub nakreśl go obok w innym stylu.
Ponadto, ponieważ linia jest często medianą, czy naprawdę dezorientuje moich czytelników, jeśli ustawię ją jako średnią (oczywiście dodam notatkę, co jest środkową linią)?
data-visualization
python
matplotlib
boxplot
Peter Smit
źródło
źródło
Aby odpowiedzieć na twoje drugie pytanie: Tak, myślę, że wprowadzanie linii na środku zamiast mediany będzie mylące. Dokładne zasady kontrolujące długość „wąsów” (jeśli istnieją) i sposób traktowania wartości odstających są różne, ale wszyscy trzymają się pola używanego przez Tukeya jako wyświetlającego medianę oraz dolne i górne kwartyle. W przypadku rozkładów o dużym nachyleniu średnia może być na zewnątrz ramką, co wyglądałoby bardzo dziwnie. Częstym zastosowaniem jest to, że mediana idzie w parze z przedziałem międzykwartylowym, podczas gdy średnia idzie w parze ze standardowym odchyleniem (lub standardowym błędem średniej, jeśli interesuje cię wnioskowanie, a nie opis danych). Jeśli chcesz pokazać środek wizualnie, użyłbym innego symbolu, aby go wyświetlić, aby uniknąć zamieszania.
źródło