Zainspirowany przez " rzeczywistymi przykładami typowych rozkładów ” zastanawiam się, jakich przykładów pedagogicznych używają ludzie, by wykazać negatywne przekrzywienie? Istnieje wiele „kanonicznych” przykładów rozkładów symetrycznych lub normalnych używanych w nauczaniu - nawet jeśli takie jak wzrost i waga nie przeżyją dokładniejszej analizy biologicznej! Ciśnienie krwi może być bliższe normalności. Lubię astronomiczne błędy pomiarowe - z historycznego punktu widzenia intuicyjnie nie są bardziej prawdopodobne, aby leżeć w jednym kierunku niż w innym, z małymi błędami bardziej niż dużymi.
Typowe pedagogiczne przykłady pozytywnej skośności obejmują dochody ludzi; przebieg używanych samochodów na sprzedaż; czasy reakcji w eksperymencie psychologicznym; ceny domów; liczba roszczeń odszkodowawczych zgłaszanych przez klienta ubezpieczeniowego; liczba dzieci w rodzinie. Ich fizyczna racjonalność często wynika z ograniczenia poniżej (zwykle przez zero), przy czym niskie wartości są prawdopodobne, nawet powszechne, ale bardzo duże (czasem wyższe o rząd wielkości) wartości są dobrze znane.
W przypadku negatywnego przekrzywienia trudniej jest mi podać jednoznaczne i żywe przykłady, które młodsza publiczność (licealiści) może intuicyjnie zrozumieć, być może dlatego, że mniej rzeczywistych dystrybucji ma wyraźną górną granicę. Przykładem złego smaku, którego uczono mnie w szkole, była „liczba palców”. Większość ludzi ma dziesięć, ale niektórzy tracą jeden lub więcej wypadków. Rezultatem było „99% ludzi ma ponadprzeciętną liczbę palców”! Polydactyly komplikuje to zagadnienie, ponieważ dziesięć nie jest ścisłą górną granicą; ponieważ zarówno brakujące, jak i dodatkowe palce są rzadkimi zdarzeniami, może być niejasne dla uczniów, który efekt dominuje.
Zwykle używam rozkładu dwumianowego o wysokim . Ale uczniowie często stwierdzają, że „liczba zadowalających składników w partii jest negatywnie wypaczona” mniej intuicyjnie niż uzupełniający fakt, że „liczba wadliwych komponentów w partii jest pozytywnie wypaczona”. (Podręcznik jest tematem przemysłowym; wolę jajka z pękniętymi i nienaruszonymi opakowaniami po 12 sztuk). Może uczniowie uważają, że „sukces” powinien być rzadki.
Inną opcją jest wskazanie, że jeśli jest pozytywnie wypaczone, to - X jest negatywnie wypaczone, ale umieszczenie tego w praktycznym kontekście („ujemne ceny domów są negatywnie wypaczone”) wydaje się skazane na niepowodzenie pedagogiczne. Chociaż nauczanie o skutkach transformacji danych przynosi korzyści, wydaje się rozsądne, aby najpierw podać konkretny przykład. Wolałbym taki, który nie wydaje się sztuczny, w którym negatywne przekrzywienie jest dość jednoznaczne, i dla którego doświadczenie życiowe uczniów powinno dać im świadomość kształtu rozkładu.
źródło
Odpowiedzi:
W Wielkiej Brytanii cena książki. Istnieje „zalecana cena detaliczna”, która na ogół będzie ceną modalną i praktycznie nigdzie nie musiałbyś płacić więcej. Ale niektóre sklepy będą dyskontować, a niektóre mocno.
Również wiek na emeryturze. Większość osób przechodzi na emeryturę w wieku 65-68 lat, kiedy zaczyna się emerytura państwowa, bardzo niewiele osób pracuje dłużej, ale niektórzy ludzie przechodzą na emeryturę w wieku 50 lat, a całkiem sporo na początku lat 60.
W takim razie liczba osób otrzymujących GCSE. Większość dzieci jest zapisana na 8-10, a więc dostają 8-10. Mała liczba robi więcej. Niektóre dzieci nie zdają wszystkich egzaminów, więc liczba ta stale wzrasta z 0 do 7.
źródło
Nick Cox dokładnie skomentował, że „wiek w chwili śmierci jest negatywnie wypaczony w krajach rozwiniętych”, co moim zdaniem było doskonałym przykładem.
Znalazłem najwygodniejsze liczby, na które mogłem położyć ręce, pochodzące z Australijskiego Biura Statystycznego ( w szczególności skorzystałem z tego arkusza Excela ), ponieważ ich przedziały wiekowe wzrosły do 100 lat, a najstarszy australijski mężczyzna miał 111 lat , więc czułem się komfortowo odcinając ostatni pojemnik po 110 latach. Inne krajowe agencje statystyczne często wydawały się zatrzymywać na poziomie 95, co sprawiało, że ostatni przedział był niewygodnie szeroki. Powstały histogram pokazuje bardzo wyraźne przekrzywienie negatywne, a także kilka innych interesujących cech, takich jak niewielki szczyt śmiertelności wśród małych dzieci, który byłby odpowiedni do dyskusji i interpretacji w klasie.
Następuje kod R z surowymi danymi,
HistogramTools
pakiet okazał się bardzo przydatny do drukowania w oparciu o dane zagregowane! Dzięki temu pytanie StackOverflow za oznaczenie go.źródło
Oto wyniki dla czterdziestu sportowców, którzy pomyślnie ukończyli legalny skok w rundzie kwalifikacyjnej olimpijskiego skoku w dal mężczyzn w 2012 roku, przedstawione na wykresie gęstości jądra z wykresem pod dywan.
Wydaje się, że o wiele łatwiej jest być o metr za główną grupą konkurentów niż o metr do przodu, co tłumaczyłoby negatywną skośność.
Podejrzewam, że niektóre zgrupowanie na najwyższym końcu wynika z tego, że sportowcy strzelali do kwalifikacji (co wymagało finałowej dwunastki lub wyniku 8,10 metra lub więcej), a nie osiągania jak największej odległości. Fakt, że dwa najlepsze wyniki wynosiły 8,11 metra, tuż powyżej automatycznej oceny kwalifikacyjnej, jest bardzo sugestywny, podobnie jak sposób, w jaki zwycięskie medale skoki w finale były dłuższe i bardziej rozłożone na 8,31, 8,16 i 8,12 metra. Wyniki w finale miały nieznaczne, nieistotne, ujemne przekrzywienie.
Dla porównania, wyniki za heptathlon olimpijskim w Seulu 1988 dostępne są w
heptathlon
zbiorze danych w pakiecie RHSAUR
. W tych zawodach nie było rundy kwalifikacyjnej, ale każde wydarzenie wniosło punkty do ostatecznej klasyfikacji; zawodniczki wykazały wyraźne ujemne pochylenie w wynikach skoku wzwyż i nieco negatywne pochylenie w skoku w dal. Co ciekawe, nie zostało to powtórzone w zdarzeniach rzucania (strzał i oszczep), mimo że są to również zdarzenia, w których wyższa liczba odpowiada lepszemu wynikowi. Ostateczne wyniki punktowe również były nieco negatywnie wypaczone.Dane i kod
źródło
Wyniki łatwych testów lub, alternatywnie, wyniki testów, do których uczniowie są szczególnie zmotywowani, mają tendencję do zniekształcania.
W rezultacie wyniki SAT / ACT studentów wchodzących do poszukiwanych szkół wyższych (a tym bardziej ich GPA) wydają się być zniekształcone. Istnieje wiele przykładów na collegeapps.about.com, np. Fabuła z University of Chicago SAT / ACT i GPA jest tutaj .
Podobnie GPA absolwentów są często odchylone w lewo, np. Histogramy poniżej GPA białych i czarnych absolwentów na uniwersytecie nastawionym na zysk zaczerpniętym z ryc. 5 Gramling, Tim. „W jaki sposób pięć cech studentów dokładnie przewiduje szanse na ukończenie uniwersytetu dla zysku ”. SAGE Open 3.3 (2013): 2158244013497026.
(Nie jest trudno znaleźć inne, podobne przykłady.)
źródło
W Stochastic Frontier Analysis, a konkretnie w jej historycznym początkowym ukierunkowaniu, produkcji, funkcja produkcyjna firmy / jednostki produkcyjnej jest ogólnie określona stochastycznie jako
gdzieσ2) jest odchyleniem standardowym „podstawowej” normalnej zmiennej losowej, której wartością bezwzględną jest połowa normy.
Złożony termin błęduε = u - w charakteryzuje się następującą gęstością
Jest to gęstość normalnie skośna, z parametrem lokalizacji0 , parametr skali s2) i parametr pochylenia ( - σ2)σu) , gdzie ϕ i Φ są odpowiednio standardowymi plikami pdf i cdf. Dlaσu= 1 ,σ2)= 3 , gęstość wygląda następująco:
Tak więc negatywna skośność jest, powiedziałbym, najbardziej naturalnym modelem wysiłków samej rasy ludzkiej: zawsze odbiega od jej wyobrażonego ideału - w większości przypadków pozostaje w tyle (ujemna część gęstości), podczas gdy w stosunkowo mniejszej liczbie przypadków przekroczenie jego postrzeganych granic (dodatnia część gęstości). Sami uczniowie mogą być modelowani jako taka funkcja produkcyjna. Łatwo jest mapować symetryczne zakłócenia i jednostronny błąd na aspekty prawdziwego życia. Nie mogę sobie wyobrazić, jak bardziej intuicyjnie można się z tym pogodzić.
źródło
Negatywna skośność jest powszechna w hydrologii powodziowej. Poniżej znajduje się przykład krzywej częstotliwości powodzi (South Creek at Mulgoa Rd, lat -33.8783, lon 150.7683), który wziąłem z „Australian Rainfall and Runoff” (ARR) przewodnik po szacowaniu powodzi opracowany przez Engineers, Australia.
W ARR jest komentarz:
Często uważa się, że powodzie w określonym miejscu mają górną granicę zwaną „prawdopodobną maksymalną powodzią” (PMF). Istnieją standardowe sposoby obliczania PMF.
źródło
Zmiany cen aktywów (zwroty) zwykle mają ujemne przekrzywienie - wiele małych wzrostów cen z kilkoma dużymi spadkami cen. Wydaje się, że pochylenie dotyczy prawie wszystkich rodzajów aktywów: cen akcji, cen towarów itp. Negatywne pochylenie można zaobserwować przy miesięcznych zmianach cen, ale jest to o wiele bardziej widoczne, gdy zaczynasz patrzeć na dzienne lub godzinne zmiany cen. Myślę, że byłby to dobry przykład, ponieważ możesz pokazać wpływ częstotliwości na pochylenie.
Więcej informacji: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/
źródło
Wiek ciążowy w chwili porodu (szczególnie w przypadku urodzeń żywych) pozostaje zniekształcony. Niemowlęta mogą urodzić się żywe bardzo wcześnie (chociaż szanse na przeżycie są niewielkie, gdy są zbyt wcześnie), osiągają szczyt między 36-41 tygodniem i szybko spadają. Typowe jest, że kobiety w USA są indukowane po 41/42 tygodniach, więc po tym okresie zwykle nie widzimy wielu dostaw.
źródło
W rybołówstwie często występują przykłady negatywnego wypaczenia ze względu na wymogi regulacyjne. Na przykład rozkład długości ryb wypuszczanych w ramach rybołówstwa rekreacyjnego; ponieważ czasami istnieje minimalna długość, jaką musi mieć ryba, aby mogła zostać zatrzymana, wszystkie ryby poniżej limitu są odrzucane. Ale ponieważ ludzie łowią ryby tam, gdzie zwykle występuje dozwolona długość, tendencja do przechylania się jest ujemna i zbliża się do górnej granicy prawnej. Dopuszczalna długość nie stanowi jednak twardego odcięcia. Ze względu na limity worków (lub limity liczby ryb, które można przywieźć z powrotem do doku), ludzie nadal będą odrzucać ryby o normalnych rozmiarach, gdy złowią większe.
np. Sauls, B. 2012. Podsumowanie danych na temat rozkładu wielkości i warunków wypuszczania odrzutów lucjanowatych z rekreacyjnych badań rybołówstwa w Zatoce Meksykańskiej. SEDAR31-DW11. SEDAR, North Charleston, Karolina Południowa. 29 s.
źródło
Kilka świetnych sugestii dotyczących tego wątku. Jeśli chodzi o śmiertelność związaną z wiekiem, wskaźniki awaryjności maszyn są często funkcją wieku maszynowego i należą do tej klasy rozkładów. Oprócz odnotowanych już czynników finansowych, funkcje i rozkłady strat finansowych zwykle przypominają te kształty, szczególnie w przypadku strat o ekstremalnej wartości, np. Jak stwierdzono w szacunkach BIS III (Bank of International Settlement) oczekiwanego niedoboru (ES), lub w BIS II wartość zagrożona (VAR) jako dane wejściowe do wymogów regulacyjnych dotyczących alokacji kapitału rezerwowego.
źródło
Wiek emerytalny w USA jest negatywnie wypaczony. Większość emerytów jest starszych, a kilku emerytów stosunkowo młody.
źródło
W teorii macierzy losowych rozkład Tracy Widom jest przesunięty w prawo. Jest to rozkład największej wartości własnej macierzy losowej. Z symetrii najmniejsza wartość własna ma ujemny rozkład Tracy Widom i dlatego jest przekrzywiona w lewo.
Wynika to w przybliżeniu z faktu, że losowe wartości własne są podobne do naładowanych cząstek, które odpychają się nawzajem, a zatem największa wartość własna jest zwykle odpychana od reszty. Oto przesadzone zdjęcie (zrobione stąd ):
źródło