Przykłady rozkładów z ujemną skośnością

20

Zainspirowany przez " rzeczywistymi przykładami typowych rozkładów ” zastanawiam się, jakich przykładów pedagogicznych używają ludzie, by wykazać negatywne przekrzywienie? Istnieje wiele „kanonicznych” przykładów rozkładów symetrycznych lub normalnych używanych w nauczaniu - nawet jeśli takie jak wzrost i waga nie przeżyją dokładniejszej analizy biologicznej! Ciśnienie krwi może być bliższe normalności. Lubię astronomiczne błędy pomiarowe - z historycznego punktu widzenia intuicyjnie nie są bardziej prawdopodobne, aby leżeć w jednym kierunku niż w innym, z małymi błędami bardziej niż dużymi.

Typowe pedagogiczne przykłady pozytywnej skośności obejmują dochody ludzi; przebieg używanych samochodów na sprzedaż; czasy reakcji w eksperymencie psychologicznym; ceny domów; liczba roszczeń odszkodowawczych zgłaszanych przez klienta ubezpieczeniowego; liczba dzieci w rodzinie. Ich fizyczna racjonalność często wynika z ograniczenia poniżej (zwykle przez zero), przy czym niskie wartości są prawdopodobne, nawet powszechne, ale bardzo duże (czasem wyższe o rząd wielkości) wartości są dobrze znane.

W przypadku negatywnego przekrzywienia trudniej jest mi podać jednoznaczne i żywe przykłady, które młodsza publiczność (licealiści) może intuicyjnie zrozumieć, być może dlatego, że mniej rzeczywistych dystrybucji ma wyraźną górną granicę. Przykładem złego smaku, którego uczono mnie w szkole, była „liczba palców”. Większość ludzi ma dziesięć, ale niektórzy tracą jeden lub więcej wypadków. Rezultatem było „99% ludzi ma ponadprzeciętną liczbę palców”! Polydactyly komplikuje to zagadnienie, ponieważ dziesięć nie jest ścisłą górną granicą; ponieważ zarówno brakujące, jak i dodatkowe palce są rzadkimi zdarzeniami, może być niejasne dla uczniów, który efekt dominuje.

Zwykle używam rozkładu dwumianowego o wysokim . Ale uczniowie często stwierdzają, że „liczba zadowalających składników w partii jest negatywnie wypaczona” mniej intuicyjnie niż uzupełniający fakt, że „liczba wadliwych komponentów w partii jest pozytywnie wypaczona”. (Podręcznik jest tematem przemysłowym; wolę jajka z pękniętymi i nienaruszonymi opakowaniami po 12 sztuk). Może uczniowie uważają, że „sukces” powinien być rzadki. $p$

Inną opcją jest wskazanie, że jeśli jest pozytywnie wypaczone, to jest negatywnie wypaczone, ale umieszczenie tego w praktycznym kontekście („ujemne ceny domów są negatywnie wypaczone”) wydaje się skazane na niepowodzenie pedagogiczne. Chociaż nauczanie o skutkach transformacji danych przynosi korzyści, wydaje się rozsądne, aby najpierw podać konkretny przykład. Wolałbym taki, który nie wydaje się sztuczny, w którym negatywne przekrzywienie jest dość jednoznaczne, i dla którego doświadczenie życiowe uczniów powinno dać im świadomość kształtu rozkładu. $X$ $-X$

distributions skewness teaching Silverfish
źródło

4

Nie jest oczywiste, że negowanie zmiennej będzie „niepowodzeniem pedagogicznym”, ponieważ istnieje możliwość dodania stałej bez zmiany kształtu rozkładu. Wiele przekrzywionych rozkładów obejmuje na przykład proporcje

, a komplementarne proporcje

są zwykle tak samo naturalne i łatwe do interpretacji jak proporcje pierwotne. Nawet przy cenach domów

wartości

gdzie

jest maksymalną ceną domu w okolicy, mogą być interesujące i nie są trudne do zrozumienia. Rozważ również użycie dzienników i ujemnych transformacji mocy do utworzenia ujemnego przekrzywienia.

X

$X$

1 - X

$1-X$

X

$X$

C - X

$C-X$

C

$C$

Whuber

2

Zgadzam się, że

w przypadku cen domów byłby nieco wymyślony. Ale

nie: byłaby to „ilość domu, którą można kupić za dolara”. Podejrzewam, że na jakimkolwiek stosunkowo jednorodnym obszarze miałoby to silną negatywną krzywiznę. Takie przykłady mogą dać głębszą naukę, że skośność jest funkcją tego, jak wyrażamy dane.

C - X

$C-X$

1 / X

$1/X$

Whuber

3

@whuber To wcale nie byłoby wymyślone. Maksymalne i minimalne potencjalne ceny na rynku powstają naturalnie, ponieważ odzwierciedlają różne oceny uczestników rynku. Wśród kupujących jest prawdopodobnie taki, który zapłaciłby maksymalną cenę za dany dom. A wśród sprzedawców jest taki, który prawdopodobnie zaakceptowałby cenę minimalną. Ale te informacje nie są jawne, a zatem na faktyczne obserwowane ceny transakcyjne ma wpływ niekompletność informacji. (

CONT'D

1

CONT'D ... Poniższy artykuł Kumbhakara i Parmetera (2010) modeluje dokładnie to (dopuszczając również przypadek symetrii) oraz z aplikacją na rynku domowym

Alecos Papadopoulos

3

Wiek w chwili śmierci jest negatywnie wypaczony w krajach rozwiniętych.

Nick Cox

3

W Wielkiej Brytanii cena książki. Istnieje „zalecana cena detaliczna”, która na ogół będzie ceną modalną i praktycznie nigdzie nie musiałbyś płacić więcej. Ale niektóre sklepy będą dyskontować, a niektóre mocno.

Również wiek na emeryturze. Większość osób przechodzi na emeryturę w wieku 65-68 lat, kiedy zaczyna się emerytura państwowa, bardzo niewiele osób pracuje dłużej, ale niektórzy ludzie przechodzą na emeryturę w wieku 50 lat, a całkiem sporo na początku lat 60.

W takim razie liczba osób otrzymujących GCSE. Większość dzieci jest zapisana na 8-10, a więc dostają 8-10. Mała liczba robi więcej. Niektóre dzieci nie zdają wszystkich egzaminów, więc liczba ta stale wzrasta z 0 do 7.

użytkownik148573
źródło

1

Być może wymaga to wyjaśnienia, że GCSE jest egzaminem w brytyjskich szkołach średnich i niektórych powiązanych systemach, najczęściej zdawanym w wieku około 16 lat. Liczba podjętych przedmiotów, np. Matematyka jest zwykle jednym przedmiotem.

Nick Cox,

18

Nick Cox dokładnie skomentował, że „wiek w chwili śmierci jest negatywnie wypaczony w krajach rozwiniętych”, co moim zdaniem było doskonałym przykładem.

Znalazłem najwygodniejsze liczby, na które mogłem położyć ręce, pochodzące z Australijskiego Biura Statystycznego ( w szczególności skorzystałem z tego arkusza Excela ), ponieważ ich przedziały wiekowe wzrosły do 100 lat, a najstarszy australijski mężczyzna miał 111 lat , więc czułem się komfortowo odcinając ostatni pojemnik po 110 latach. Inne krajowe agencje statystyczne często wydawały się zatrzymywać na poziomie 95, co sprawiało, że ostatni przedział był niewygodnie szeroki. Powstały histogram pokazuje bardzo wyraźne przekrzywienie negatywne, a także kilka innych interesujących cech, takich jak niewielki szczyt śmiertelności wśród małych dzieci, który byłby odpowiedni do dyskusji i interpretacji w klasie.

Wiek w chwili śmierci australijskich mężczyzn w 2012 r

Następuje kod R z surowymi danymi, HistogramTools pakiet okazał się bardzo przydatny do drukowania w oparciu o dane zagregowane! Dzięki temu pytanie StackOverflow za oznaczenie go.

library(HistogramTools)

deathCounts <- c(565, 116, 69, 78, 319, 501, 633, 655, 848, 1226, 1633, 2459, 3375, 4669, 6152, 7436, 9526, 12619, 12455, 7113, 2104, 241)
ageBreaks <- c(0, 1, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110)

myhist <- PreBinnedHistogram(
    breaks = ageBreaks,
    counts = deathCounts,
    xname = "Age at Death of Australian Males, 2012")
plot(myhist)

Silverfish
źródło

2

Nieco związane z tym stanowiskiem, słyszałem, że wiek emerytalny ma negatywną skośność: większość ludzi przechodzi na emeryturę w wieku około nominalnego wieku (powiedzmy 65 lub 67 lat w wielu krajach), ale niektórzy (powiedzmy, pracownicy kopalni węgla) przechodzą na emeryturę znacznie wcześniej.

Christoph Hanck

Czy wiek śmierci jest zgodny z jakimś znanym rozkładem empirycznym?

StubbornAtom

11

Oto wyniki dla czterdziestu sportowców, którzy pomyślnie ukończyli legalny skok w rundzie kwalifikacyjnej olimpijskiego skoku w dal mężczyzn w 2012 roku, przedstawione na wykresie gęstości jądra z wykresem pod dywan.

Wyniki rundy kwalifikacyjnej Igrzysk Olimpijskich Londyn 2012 w Londynie

Wydaje się, że o wiele łatwiej jest być o metr za główną grupą konkurentów niż o metr do przodu, co tłumaczyłoby negatywną skośność.

Podejrzewam, że niektóre zgrupowanie na najwyższym końcu wynika z tego, że sportowcy strzelali do kwalifikacji (co wymagało finałowej dwunastki lub wyniku 8,10 metra lub więcej), a nie osiągania jak największej odległości. Fakt, że dwa najlepsze wyniki wynosiły 8,11 metra, tuż powyżej automatycznej oceny kwalifikacyjnej, jest bardzo sugestywny, podobnie jak sposób, w jaki zwycięskie medale skoki w finale były dłuższe i bardziej rozłożone na 8,31, 8,16 i 8,12 metra. Wyniki w finale miały nieznaczne, nieistotne, ujemne przekrzywienie.

Dla porównania, wyniki za heptathlon olimpijskim w Seulu 1988 dostępne są w heptathlonzbiorze danych w pakiecie R HSAUR. W tych zawodach nie było rundy kwalifikacyjnej, ale każde wydarzenie wniosło punkty do ostatecznej klasyfikacji; zawodniczki wykazały wyraźne ujemne pochylenie w wynikach skoku wzwyż i nieco negatywne pochylenie w skoku w dal. Co ciekawe, nie zostało to powtórzone w zdarzeniach rzucania (strzał i oszczep), mimo że są to również zdarzenia, w których wyższa liczba odpowiada lepszemu wynikowi. Ostateczne wyniki punktowe również były nieco negatywnie wypaczone.

Dane i kod

require(moments)
require(ggplot2)

sourceAddress <- "http://www.olympic.org/olympic-results/london-2012/athletics/long-jump-m"

longjump.df <- read.csv(header=TRUE, sep=",", text="
rank,name,country,distance
1,Mauro Vinicius DA SILVA,BRA,8.11 
2,Marquise GOODWIN,USA,8.11
3,Aleksandr MENKOV,RUS,8.09
4,Greg RUTHERFORD,GBR,8.08
5,Christopher TOMLINSON,GBR,8.06
6,Michel TORNEUS,SWE,8.03
7,Godfrey Khotso MOKOENA,RSA,8.02
8,Will CLAYE,USA,7.99
9,Mitchell WATT,AUS,7.99,
10,Tyrone SMITH,BER,7.97,
11,Henry FRAYNE,AUS,7.95,
12,Sebastian BAYER,GER,7.92,
13,Christian REIF,GER,7.92,
14,Eusebio CACERES,ESP,7.92,
15,Aleksandr PETROV,RUS,7.89,
16,Sergey MORGUNOV,RUS,7.87,
17,Mohammad ARZANDEH,IRI,7.84,
18,Ignisious GAISAH,GHA,7.79,
19,Damar FORBES,JAM,7.79,
20,Jinzhe LI,CHN,7.77,
21,Raymond HIGGS,BAH,7.76,
22,Alyn CAMARA,GER,7.72,
23,Salim SDIRI,FRA,7.71,
24,Ndiss Kaba BADJI,SEN,7.66,
25,Arsen SARGSYAN,ARM,7.62,
26,Povilas MYKOLAITIS,LTU,7.61,
27,Stanley GBAGBEKE,NGR,7.59,
28,Marcos CHUVA,POR,7.55,
29,Louis TSATOUMAS,GRE,7.53,
30,Stepan WAGNER,CZE,7.50,
31,Viktor KUZNYETSOV,UKR,7.50,
32,Luis RIVERA,MEX,7.42,
33,Ching-Hsuan LIN,TPE,7.38,
33,Supanara SUKHASVASTI N A,THA,7.38,
35,Boleslav SKHIRTLADZE,GEO,7.26,
36,Xiaoyi ZHANG,CHN,7.25,
37,Mohamed Fathalla DIFALLAH,EGY,7.08,
38,Roman NOVOTNY,CZE,6.96,
39,George KITCHENS,USA,6.84,
40,Vardan PAHLEVANYAN,ARM,6.55,
NA,Luis MELIZ,ESP,NA,
NA,Irving SALADINO,PAN,NA")

roundedSkew <- signif(skewness(longjump.df$distance, na.rm=TRUE), 3)

ggplot(longjump.df, aes(x=distance)) + 
    xlab("Distance in metres") +
    ggtitle("London 2012 Men's Long Jump qualifying round results") +
    geom_rug(size=0.8) + 
    geom_density(fill="steelblue") +
    annotate("text", x=7.375, y=0.0625, colour="white", label=paste("Source:", sourceAddress), size=3) +
    annotate("rect", xmin = 6.25, xmax = 7.25, ymin = 0.5, ymax = 1.125, fill="white") +
    annotate("text", x=6.75, y=1, colour="black", label="Best jump in up to 3 attempts") +
    annotate("text", x=6.75, y=.875, colour="black", label="42 athletes competed") +
    annotate("text", x=6.75, y=.75, colour="black", label="2 athletes had no legal jump") +
    annotate("text", x=6.75, y=.625, colour="black", label=paste("Skewness = ", roundedSkew))


# Results of the top twelve who qualified for the Final were closer to symmetric
skewness(longjump.df$distance[1:12])
# -0.1248782

# Results in the Final (some had 3 jumps, others 6) were only slightly negatively skewed
skewness(c(8.31, 8.16, 8.12, 8.11, 8.10, 8.07, 8.01, 7.93, 7.85, 7.80, 7.78, 7.70))
# -0.08578357

# Compare to Seoul 1988 Heptathlon
require(HSAUR)
skewness(heptathlon)

Silverfish
źródło

11

Wyniki łatwych testów lub, alternatywnie, wyniki testów, do których uczniowie są szczególnie zmotywowani, mają tendencję do zniekształcania.

W rezultacie wyniki SAT / ACT studentów wchodzących do poszukiwanych szkół wyższych (a tym bardziej ich GPA) wydają się być zniekształcone. Istnieje wiele przykładów na collegeapps.about.com, np. Fabuła z University of Chicago SAT / ACT i GPA jest tutaj .

Podobnie GPA absolwentów są często odchylone w lewo, np. Histogramy poniżej GPA białych i czarnych absolwentów na uniwersytecie nastawionym na zysk zaczerpniętym z ryc. 5 Gramling, Tim. „W jaki sposób pięć cech studentów dokładnie przewiduje szanse na ukończenie uniwersytetu dla zysku ”. SAGE Open 3.3 (2013): 2158244013497026.

Histogram GPA pokazujący ujemne pochylenie

(Nie jest trudno znaleźć inne, podobne przykłady.)

Glen_b
źródło

2

W przypadku klasy statystyk wprowadzających myślę, że ten przykład działa dobrze pedagogicznie - jest to coś, co uczniowie prawdopodobnie będą mieli w życiu, mogą rozumować intuicyjnie i potwierdzać na podstawie ogólnie dostępnych zbiorów danych.

Silverfish,

9

W Stochastic Frontier Analysis, a konkretnie w jej historycznym początkowym ukierunkowaniu, produkcji, funkcja produkcyjna firmy / jednostki produkcyjnej jest ogólnie określona stochastycznie jako

q = fa (x) + u - w

$q = f(\mathbf x) + u-w$

$q$ $f(\mathbf x)$ $\mathbf x$ $u$ $w$ odchylenie od pełnej wydajnościz powodów, których ekonometr może nie wiedzieć, ale może dokonać pomiaru za pomocą tej konfiguracji. Zakłada się, że ta zmienna losowa podlega rozkładowi półnormalnemu lub wykładniczemu. Zakładając, że połowa normy (z jakiegoś powodu), mamy

u \sim N. (0, σ_{u}^{2)}), w \sim H. N. (\sqrt{\frac{2)}{π}} σ_{2)}, (1 - \frac{2)}{π}) σ_{2)}^{2)})

$u \sim N(0, \sigma_u^2),\;\; w\sim HN\left(\sqrt {\frac 2{\pi}}\sigma_2, \left(1- \frac 2{\pi}\right)\sigma_2^2\right)$

gdzie $\sigma_2$ jest odchyleniem standardowym „podstawowej” normalnej zmiennej losowej, której wartością bezwzględną jest połowa normy.

Złożony termin błędu $\varepsilon = u-w$ charakteryzuje się następującą gęstością

{fa}_{ε} (ε) = \frac{2)}{s_{2)}} ϕ (ε / s_{2)}) Φ ((- \frac{σ_{2)}}{σ_{u}}) \cdot (ε / s_{2)})), s_{2)}^{2)} = σ_{u}^{2)} + σ_{2)}^{2)}

$f_{\varepsilon}(\varepsilon) = \frac 2{s_2}\phi\left(\varepsilon/s_2\right)\Phi\left((-\frac {\sigma_2}{\sigma_u})\cdot(\varepsilon/s_2)\right),\;\; s_2^2 = \sigma^2_u + \sigma^2_2$

Jest to gęstość normalnie skośna, z parametrem lokalizacji $0$ , parametr skali $s_2$ i parametr pochylenia $(-\frac {\sigma_2}{\sigma_u})$ , gdzie $\phi$ i $\Phi$ są odpowiednio standardowymi plikami pdf i cdf. Dla $\sigma_u =1, \;\; \sigma_2 = 3$ , gęstość wygląda następująco: wprowadź opis zdjęcia tutaj

Tak więc negatywna skośność jest, powiedziałbym, najbardziej naturalnym modelem wysiłków samej rasy ludzkiej: zawsze odbiega od jej wyobrażonego ideału - w większości przypadków pozostaje w tyle (ujemna część gęstości), podczas gdy w stosunkowo mniejszej liczbie przypadków przekroczenie jego postrzeganych granic (dodatnia część gęstości). Sami uczniowie mogą być modelowani jako taka funkcja produkcyjna. Łatwo jest mapować symetryczne zakłócenia i jednostronny błąd na aspekty prawdziwego życia. Nie mogę sobie wyobrazić, jak bardziej intuicyjnie można się z tym pogodzić.

Alecos Papadopoulos
źródło

1

Ta odpowiedź wydaje się odzwierciedlać sugestię grad GPA @ Glen_b. Silnie zmotywowane ludzkie zachowanie ukierunkowane na nieuchwytny ideał z pewnością pasuje do tego scenariusza! Ogólnie wydajność jest świetnym przykładem.

Nick Stauner

2

@Nick Stauner Ważną kwestią jest to, że bierzemy pod uwagę „rzeczywisty minus cel”, a nie „odległość” w wartościach bezwzględnych. Trzymamy znak, aby wiedzieć, czy jesteśmy powyżej, czy poniżej celu. Intuicja polega na tym, że dokładnie tak, jak piszesz, „wysoce zmotywowane” zachowanie przybliża „faktyczne” bliżej „celu”, tworząc asymetrię.

Alecos Papadopoulos

1

@NickStauner Rzeczywiście, własne stanowisko Silverfish dotyczące wyników w skoku w dal odnosi się również do „wysoce zmotywowanego zachowania” (biorąc pod uwagę ograniczenia tego, co ludzie mogą obecnie osiągnąć jako rodzaj nieformalnego „nieuchwytnego ideału”)

Glen_b

6

Negatywna skośność jest powszechna w hydrologii powodziowej. Poniżej znajduje się przykład krzywej częstotliwości powodzi (South Creek at Mulgoa Rd, lat -33.8783, lon 150.7683), który wziąłem z „Australian Rainfall and Runoff” (ARR) przewodnik po szacowaniu powodzi opracowany przez Engineers, Australia.

W ARR jest komentarz:

Przy ujemnym pochyleniu, które jest wspólne z logarytmicznymi wartościami powodzi w Australii, rozkład log Pearson III ma górną granicę. Daje to górną granicę powodziom, które można wyciągnąć z rozkładu. W niektórych przypadkach może to powodować problemy z oszacowaniem powodzi o niskim AEP, ale często nie powoduje problemów w praktyce. [Wyciąg z australijskiego deszczu i spływu - tom 1, księga IV sekcja 2.]

Często uważa się, że powodzie w określonym miejscu mają górną granicę zwaną „prawdopodobną maksymalną powodzią” (PMF). Istnieją standardowe sposoby obliczania PMF.

wprowadź opis zdjęcia tutaj

Tony Ladson
źródło

7

+1 Ten przykład ładnie pokazuje, jak arbitralne jest pytanie: kiedy mierzysz powodzie pod względem szczytowego zrzutu, będą one pozytywnie wypaczone, ale mierzone w zrzutach kłód, (najwyraźniej) są wypaczone negatywnie. Podobnie dowolna zmienna dodatnia może być ponownie wyrażona w prosty sposób, który wypacza jej rozkład ujemnie (jedynie przez przyjęcie odpowiednio ujemnego parametru Box-Coxa). Wszystko sprowadza się do tego, co należy rozumieć jako „łatwo uchwycić”, jak sądzę - ale to pytanie dotyczy studentów, a nie statystyki.

whuber

5

Zmiany cen aktywów (zwroty) zwykle mają ujemne przekrzywienie - wiele małych wzrostów cen z kilkoma dużymi spadkami cen. Wydaje się, że pochylenie dotyczy prawie wszystkich rodzajów aktywów: cen akcji, cen towarów itp. Negatywne pochylenie można zaobserwować przy miesięcznych zmianach cen, ale jest to o wiele bardziej widoczne, gdy zaczynasz patrzeć na dzienne lub godzinne zmiany cen. Myślę, że byłby to dobry przykład, ponieważ możesz pokazać wpływ częstotliwości na pochylenie.

Więcej informacji: http://www.fusioninvesting.com/2010/09/what-is-skew-and-why-is-it-important/

wcampbell
źródło

Bardzo podoba mi się ten przykład! Czy istnieje intuicyjny sposób wyjaśnienia - zasadniczo „wstrząsy spadkowe są bardziej prawdopodobne (lub przynajmniej bardziej dotkliwe) niż wstrząsy wzrostowe”?

Silverfish,

2

@Silverfish powiedziałbym, że skrajne negatywne wyniki rynkowe są bardziej prawdopodobne niż skrajnie pozytywne wyniki rynkowe. Rynki mają również zmienność asymetryczną. Zmienność rynku ogólnie wzrasta bardziej po ujemnych zwrotach niż dodatnich. Często jest to modelowane za pomocą modeli Garch, takich jak GJR-Garch (patrz artykuł Arch wikipedia).

John

3

Widziałem też wyjaśnienie, że złe wiadomości są publikowane w pęczkach. Nie korzystałem z GJR-GARCH. Próbowałem użyć multifraktalnego ruchu Browna (Mandelbrota) do modelowania asymetrii, ale nie byłem w stanie sprawić, by działał.

wcampbell,

4

Jest to w najlepszym wypadku uproszczone. Na przykład właśnie wziąłem zestaw danych dziennych zwrotów z 31 indeksów giełdowych. Ponad połowa z nich ma skośność dodatnią (przy zastosowaniu skośności Pearsona), a ponad 70% jest dodatnich w stosunku do miary 3 * (średnia - mediana) / stdev. W przypadku towarów tendencja do zauważania jest jeszcze bardziej pozytywna, ponieważ szoki podażowe i popytowe mogą gwałtownie podnieść ceny (np. Ropa, gaz i kukurydza w ostatnich latach).

Chris Taylor

5

Wiek ciążowy w chwili porodu (szczególnie w przypadku urodzeń żywych) pozostaje zniekształcony. Niemowlęta mogą urodzić się żywe bardzo wcześnie (chociaż szanse na przeżycie są niewielkie, gdy są zbyt wcześnie), osiągają szczyt między 36-41 tygodniem i szybko spadają. Typowe jest, że kobiety w USA są indukowane po 41/42 tygodniach, więc po tym okresie zwykle nie widzimy wielu dostaw.

Sara
źródło

4

W rybołówstwie często występują przykłady negatywnego wypaczenia ze względu na wymogi regulacyjne. Na przykład rozkład długości ryb wypuszczanych w ramach rybołówstwa rekreacyjnego; ponieważ czasami istnieje minimalna długość, jaką musi mieć ryba, aby mogła zostać zatrzymana, wszystkie ryby poniżej limitu są odrzucane. Ale ponieważ ludzie łowią ryby tam, gdzie zwykle występuje dozwolona długość, tendencja do przechylania się jest ujemna i zbliża się do górnej granicy prawnej. Dopuszczalna długość nie stanowi jednak twardego odcięcia. Ze względu na limity worków (lub limity liczby ryb, które można przywieźć z powrotem do doku), ludzie nadal będą odrzucać ryby o normalnych rozmiarach, gdy złowią większe.

np. Sauls, B. 2012. Podsumowanie danych na temat rozkładu wielkości i warunków wypuszczania odrzutów lucjanowatych z rekreacyjnych badań rybołówstwa w Zatoce Meksykańskiej. SEDAR31-DW11. SEDAR, North Charleston, Karolina Południowa. 29 s.

jamesfreinhardt
źródło

„Pochylenie w kierunku dużych rozmiarów” zwykle interpretowane byłoby jako pochylenie dodatnie , a nie „negatywne”. Być może mógłbyś wyjaśnić tę odpowiedź ilustrując typowy rozkład? Opisane przez ciebie mechanizmy - górna granica regulacyjna i pewna tendencja do jej przekraczania - mogą prowadzić do przekrzywienia ujemnego lub dodatniego, w zależności od okrojonego rozmieszczenia ryb małych rozmiarów (i w zależności od sposobu pomiaru ryb: skośność ich rozkład masy nie byłby taki sam jak skośność ich rozkładu długości).

whuber

3

Kilka świetnych sugestii dotyczących tego wątku. Jeśli chodzi o śmiertelność związaną z wiekiem, wskaźniki awaryjności maszyn są często funkcją wieku maszynowego i należą do tej klasy rozkładów. Oprócz odnotowanych już czynników finansowych, funkcje i rozkłady strat finansowych zwykle przypominają te kształty, szczególnie w przypadku strat o ekstremalnej wartości, np. Jak stwierdzono w szacunkach BIS III (Bank of International Settlement) oczekiwanego niedoboru (ES), lub w BIS II wartość zagrożona (VAR) jako dane wejściowe do wymogów regulacyjnych dotyczących alokacji kapitału rezerwowego.

Mike Hunter
źródło

2

Wiek emerytalny w USA jest negatywnie wypaczony. Większość emerytów jest starszych, a kilku emerytów stosunkowo młody.

Ronet Bachman
źródło

2

W teorii macierzy losowych rozkład Tracy Widom jest przesunięty w prawo. Jest to rozkład największej wartości własnej macierzy losowej. Z symetrii najmniejsza wartość własna ma ujemny rozkład Tracy Widom i dlatego jest przekrzywiona w lewo.

Wynika to w przybliżeniu z faktu, że losowe wartości własne są podobne do naładowanych cząstek, które odpychają się nawzajem, a zatem największa wartość własna jest zwykle odpychana od reszty. Oto przesadzone zdjęcie (zrobione stąd ):

Alex R.
źródło

Rozkłady o skośnych prawach mają skośność dodatnią i dlatego nie odpowiadają na pytanie.

whuber

@ whuber: Chodzi o użycie najmniejszej wartości własnej. Poprawione

Alex R.

Przykłady rozkładów z ujemną skośnością

Odpowiedzi: