Mam kilka pytań dotyczących przedziałów prognoz i tolerancji.
Najpierw ustalmy przedziały tolerancji: otrzymujemy poziom ufności, powiedzmy 90%, procent populacji do przechwycenia, powiedzmy 99%, i wielkość próby, powiedzmy 20. Rozkład prawdopodobieństwa jest znany, powiedzmy normalny dla wygody. Teraz, biorąc pod uwagę powyższe trzy liczby (90%, 99% i 20) oraz fakt, że podstawowy rozkład jest normalny, możemy obliczyć liczbę tolerancji . Biorąc pod uwagę próbkę ze średnią i odchyleniem standardowym , przedział tolerancji wynosi . Jeśli ten przedział tolerancji obejmuje 99% populacji, wówczas próbka jest nazywana sukcesema warunkiem jest, aby 90% próbek zakończyło się sukcesem .
Komentarz: 90% jest a priori prawdopodobieństwo próbka się sukcesem. 99% to warunkowe prawdopodobieństwo, że przyszła obserwacja będzie w przedziale tolerancji, biorąc pod uwagę, że próbka zakończy się sukcesem.
Moje pytania: czy możemy postrzegać przedziały prognozowania jako przedziały tolerancji? Patrząc na Internet, dostałem sprzeczne odpowiedzi, nie wspominając już o tym, że nikt tak naprawdę nie zdefiniował dokładnie przedziałów prognoz. Więc jeśli masz dokładną definicję przedziału prognozy (lub referencji), byłbym wdzięczny.
Zrozumiałem, że na przykład przedział predykcji 99% nie przechwytuje 99% wszystkich przyszłych wartości dla wszystkich próbek. Byłby to taki sam przedział tolerancji, który obejmuje 99% populacji ze 100% prawdopodobieństwem.
W definicjach, które znalazłem dla przedziału predykcji 90%, 90% jest prawdopodobieństwem a priori przy danej próbce, powiedzmy (rozmiar jest ustalony) i jednej przyszłej obserwacji , że będzie w przedziale prognoz. Wydaje się więc, że zarówno próbka, jak i przyszła wartość są podawane jednocześnie, w przeciwieństwie do przedziału tolerancji, w którym próbka jest podawana iz pewnym prawdopodobieństwem jest sukcesem , pod warunkiem, że próbka jest sukcesy, podana jest przyszła wartość iz pewnym prawdopodobieństwem mieści się w przedziale tolerancji. Nie jestem pewien, czy powyższa definicja przedziału predykcji jest prawidłowa, czy nie, ale wydaje się ona sprzeczna z intuicją (przynajmniej).
Jakaś pomoc?
źródło
Odpowiedzi:
Twoje definicje wydają się poprawne.
Książka skonsultować się o tych sprawach jest statystyczne Odstępy (Gerald Hahn & William Meeker), 1991. Cytuję:
Oto poprawki w standardowej terminologii matematycznej. Niech dane należy uznać za realizację niezależnych zmiennych losowych ze wspólną funkcją dystrybucji skumulowanej . ( pojawia się jako przypomnienie, że może być nieznany, ale zakłada się, że leży w danym zestawie dystrybucji ). Niech będzie kolejną zmienną losową o tym samym rozkładzie i niezależną od pierwszych zmiennych.X = ( X 1 , … , X n ) F θ θ F F θ | θ ∈ Θ X 0 F θ nx=(x1,…,xn) X=(X1,…,Xn) Fθ θ F Fθ|θ∈Θ X0 Fθ n
Przedział przewidywania (dla jednej obserwacji przyszłych) podaje końcowych , ma tę właściwość, że określenie[l(x),u(x)]
W szczególności odnosi się do rozkładu określonego przez prawo . Zwróć uwagę na brak jakichkolwiek prawdopodobieństw warunkowych: jest to pełne wspólne prawdopodobieństwo. Zauważ też, że brak jakiegokolwiek odniesienia do sekwencji czasowej: bardzo dobrze można zaobserwować w czasie przed innymi wartościami. Nie ważne.Prθ n+1 (X0,X1,…,Xn) Fθ X0
Nie jestem pewien, które aspekty mogą być „sprzeczne z intuicją”. Jeśli pomyślimy o wybraniu procedury statystycznej jako czynności, którą należy wykonać przed zebraniem danych, jest to naturalne i rozsądne sformułowanie planowanego dwuetapowego procesu, ponieważ obie dane ( ) a „przyszła wartość” musi być modelowana losowo.Xi,i=1,…,n X0
Przedział tolerancji podaje końcowych , ma właściwość określającą tę(L(x),U(x)]
Zwróć uwagę na brak jakiegokolwiek odniesienia do : nie odgrywa żadnej roli.X0
Gdy jest zbiorem rozkładów normalnych, istnieją przedziały predykcji formularza{Fθ}
( to średnia próbki, a to standardowe odchylenie próbki). Wartości funkcji , które zestawiają Hahn i Meeker, nie zależą od danych . Istnieją inne procedury interwału przewidywania, nawet w przypadku Normalnym: nie są to jedyne.x¯ s k x
Podobnie istnieją przedziały tolerancji formy
Istnieją inne procedury przedziałów tolerancji : nie są to jedyne.
Zauważając podobieństwo między tymi parami wzorów, możemy rozwiązać równanie
Pozwala to na reinterpretację interwału predykcji jako interwału tolerancji (na wiele różnych możliwych sposobów poprzez zmianę i ) lub na reinterpretację interwału tolerancji jako interwału predykcji (dopiero teraz jest zwykle jednoznacznie określana przez i ). Może to być jedno źródło zamieszania.α′ p α α′ p
źródło
Jak rozumiem, dla normalnych granic tolerancji wartość pochodzi z niecentralnego t percentyla. Oczywiście, zdaniem W Hubera, niektórzy statystycy nie są zaznajomieni z ideą granic tolerancji w porównaniu z granicami prognoz; wydaje się, że idea tolerancji pojawia się głównie w projektowaniu inżynierskim i produkcji, w przeciwieństwie do biostatystyki klinicznej. Być może przyczyną nieznajomości przedziałów tolerancji i pomieszania z przedziałami prognozowania jest kontekst, w którym ktoś otrzymuje szkolenie statystyczne.K(α,p)
źródło