W przypadku części zadania domowego poproszono mnie o obliczenie skróconej średniej dla zbioru danych poprzez usunięcie najmniejszej i największej obserwacji oraz o interpretację wyniku. Średnia obcięta była niższa niż średnia nieprzycięta.
Z mojej interpretacji wynika, że było to spowodowane dodatnim wypaczeniem leżącego u podstaw rozkładu, więc lewy ogon jest gęstszy niż prawy. W wyniku tego skośności usunięcie wysokiego punktu odniesienia pociąga go bardziej w dół niż usuwanie niskiego, które go popycha, ponieważ, mówiąc nieformalnie, więcej niskich danych „czeka, aby zająć jego miejsce”. (Czy to rozsądne?)
Potem zacząłem się zastanawiać, jak wpływa na to procent przycinania, więc obliczyłem średnią przyciętą dla różnych . Mam ciekawy paraboliczny kształt:
Nie jestem pewien, jak to interpretować. Intuicyjnie wydaje się, że nachylenie wykresu powinno być (proporcjonalne do) ujemnej skośności części rozkładu w obrębie punktów danych mediany. (Ta hipoteza sprawdza się z moimi danymi, ale mam tylko , więc nie jestem zbyt pewny).
Czy ten typ wykresu ma nazwę, czy jest powszechnie używany? Jakie informacje możemy uzyskać z tego wykresu? Czy istnieje standardowa interpretacja?
Dla porównania dane są następujące: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80.