Co możemy powiedzieć o populacji w próbie 1?

43

Zastanawiam się, co możemy powiedzieć, jeśli w ogóle, o średniej populacji, kiedy wszystko, co mam, to jeden pomiar, (wielkość próby 1). Oczywiście chcielibyśmy mieć więcej pomiarów, ale nie możemy ich uzyskać.y 1μy1

Wydaje mi się, że skoro średnia próbki, , jest trywialnie równa , to . Jednak przy wielkości próby 1 wariancja próbki jest niezdefiniowana, a zatem nasze zaufanie do używania jako estymatora jest również niezdefiniowane, prawda? Czy byłby jakiś sposób na ograniczenie naszej oceny ? y1E[ ˉ y ]=E[y1]=μ ˉ y μμy¯y1E[y¯]=E[y1]=μy¯μμ

thedu
źródło
Tak, przedział ufności dla można zbudować pod pewnymi założeniami. Jeśli nikt tego nie opublikuje, wyśledzę to. μ
soakley
5
Zobacz stats.stackexchange.com/questions/1807, aby uzyskać inną wersję tego samego pytania (dostępna jest średnia próbki, ale nie jej wielkość, więc w rzeczywistości średnia jest pojedynczą obserwacją z nieznanego rozkładu próbkowania) i stats.stackexchange .com / pytania / 20300 na powiązaną dyskusję.
whuber
najnowszy artykuł omawiający optymalizację tych estymatorów w normalnym przypadku: tandfonline.com/doi/full/10.1080/00031305.2017.1360796
user795305

Odpowiedzi:

8

Oto zupełnie nowy artykuł na ten temat w sprawie Poissona, przyjmujący ładne podejście pedagogiczne:

Andersson. Per Gösta (2015). Podejście szkolne do konstrukcji przybliżonego przedziału ufności średniej Poissona przy użyciu jednej obserwacji. The American Statistician , 69 (3), 160-164, DOI: 10.1080 / 00031305.2015.1056830 .

S. Kolassa - Przywróć Monikę
źródło
... niestety za zaporą.
Tim
@Tim: tak jest. Z drugiej strony członkostwo w ASA nie jest strasznie drogie, a Ty masz dostęp do The American Statistician , JASA i kilku innych czasopism w bardzo rozsądnej cenie, którą osobiście bardzo chętnie płacę z własnej kieszeni. Naprawdę uważam, że warto tu dostać swoje pieniądze. Oczywiście YMMV.
S. Kolassa - Przywróć Monikę
4
+1, ale przypadek Poissona jest radykalnie różny od normalnego przypadku, ponieważ wariancja musi być równa średniej. Wynik Poissona jest dość prosty, podczas gdywynik dla normalnego przypadku jest sprzeczny z intuicją i tajemniczy. x±9.68|x|
ameba mówi Przywróć Monikę
@amoeba: całkiem poprawne, ale PO nie określił żadnych ograniczeń dystrybucji.
S. Kolassa - Przywróć Monikę
Jest to tak krótkie, że lepiej posłużyć jako komentarz. Ale ponieważ jest to zaakceptowana odpowiedź, prawdopodobnie nie będziesz chciał przekonwertować jej na komentarz. Czy mógłbyś zatem streścić główne punkty tego artykułu?
Richard Hardy
42

Jeśli wiadomo, że populacja jest normalna, 95% przedział ufności oparty na pojedynczej obserwacji jest podawany przezx ± 9,68 | x |x

x±9.68|x|

Jest to omówione w artykule „Skuteczny przedział ufności dla średniej z próbkami wielkości pierwszej i drugiej” autorstwa Wall, Boen i Tweedie, The American Statistician , maj 2001, vol. 55, nr 2 . ( pdf )

soakley
źródło
5
Nienawidzę brzmieć głupio, ale ... na pewno nie. Zależy to od jednostek i nie zachowuje się właściwie (właściwie mam na myśli mnożenie skalarne ....)
Alec Teal
8
@Alec To, że procedura zależy od jednostek miary (tzn. Nie jest niezmienna), nie oznacza, że ​​jest automatycznie nieważne lub nawet złe. Ten jest ważny: przeczytaj artykuł i zrób matematykę. Jednak wielu przyzna, że ​​jest to trochę niepokojące . Co jeszcze bardziej zaskakujące, nie musisz nawet zakładać, że leżący u podstaw rozkład jest Normalny: podobny wynik występuje w przypadku każdego rozkładu unimodalnego (ale 9,68 należy zwiększyć do około 19): zobacz linki, które podałem w komentarzu do tego pytanie.
whuber
4
Późniejsze wydanie czasopisma zawierało trzy listy do redakcji, z których jeden przywołał uwagę Aleca Teala na temat jednostek. Odpowiedź Walla brzmi następująco: „Przedział ufności nie jest równoważny (tj. Jego prawdopodobieństwo pokrycia zależy od stosunku ...)” Później ona mówi „Przedział ufności nie jest oparty na kluczowej wielkości ...” To niezwykłe podejście i wynik, bez wątpienia! |μ|σ
soakley,
5
Aby zaoszczędzić trochę pracy: listy do redaktora i odpowiedź @ soakley notes pojawiły się w The American Statistician , vol. 56, nr 1 (2002) .
S. Kolassa - Przywróć Monikę
3
Wydaje się, że daje to przedziały ufności pokrywające średnią z prawdopodobieństwem około gdy ale w przeciwnym razie ze znacznie wyższymi prawdopodobieństwami. Jeśli wówczas prawdopodobieństwo wynosi ponieważ przedziały ufności zawsze zawierają . σ | μ | > 0 μ = 0 100 % 095%σ|μ|>0μ=0100%0
Henry
28

Pewnie że jest. Użyj paradygmatu bayesowskiego . Są szanse masz przynajmniej jakiś pomysł, co mogłoby być - na przykład, że fizycznie nie może być ujemna, albo że to oczywiście nie może być większa niż 100 (może jesteś pomiaru wysokości lokalnych członków zespołu High School Football w stopach). Postaw na to pierwszeństwo, zaktualizuj je swoją samotną obserwacją, a będziesz miał wspaniały widok z tyłu.μ

S. Kolassa - Przywróć Monikę
źródło
18
(+1) Jedno spostrzeżenie zostanie przytłoczone przez przeora, więc wydaje się, że to, co wydostaniesz się z tyłu, nie będzie niczym więcej niż tym, co wkładasz w przeora.
whuber
Co jeśli połączymy takiego przeora z rodzajem prawdopodobieństwa wynikającym z tego nieszczęśliwego? x±9.68|x|
Simon Kuang,
@ SimonKuang: jednym z problemów koncepcyjnych jest to, że możemy użyć tylkointerwał po tym , jak zaobserwowaliśmy , więc nie można wprowadzić wcześniejszego . xx±9.68|x|x
S. Kolassa - Przywróć Monikę
@StephanKolassa Nie, ten przedział (i związany z nim rozkład) tworzy prawdopodobieństwo. Nasz przeor jest osobny.
Simon Kuang,
@SimonKuang: tak, masz rację, mój błąd. Niestety nie mam teraz czasu, aby się tym zająć, ale jeśli to zrobisz, opublikuj to, co znajdziesz!
S. Kolassa - Przywróć Monikę
14

Małe ćwiczenie symulacyjne pokazujące, czy odpowiedź @soakley działa:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

Z miliona losowych prób przedział ufności obejmuje prawdziwy milion razy, czyli zawsze . Nie powinno tak się zdarzyć, jeśli przedział ufności wynosił 95% .

Więc formuła wydaje się nie działać ... A może popełniłem błąd kodowania?

Edycja: ten sam wynik empiryczny zachowuje się przy użyciu ; jest to jednak dla - a zatem jest bardzo zbliżone do 95% przedziału ufności.0,950097 0,95 ( μ , σ ) = ( 1000 , 1000 )(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)

Richard Hardy
źródło
2
Rzeczywiście, dla nie równego 0, jest to przydatne (i +1 dla podania kodu w pierwszej kolejności!). Chodziło mi tylko o to, że dla jest to przesądzony wniosek, że 0 zawsze zostanie przechwycone. μ = 0μμ=0
Wolfgang
2
(@Wolfgang) To nie jest sposób na sprawdzenie przedziału ufności. Definicja nie wymaga, aby CI poziom obejmował średnią czasu w każdym przypadku : wymaga jedynie, aby (a) miała co najmniej tak duży zasięg w każdym przypadku i (b) aproksymuje to pokrycie w niektórych przypadkach. Tak więc, aby twoje podejście było ważne i przekonujące, musiałbyś poszukać wielu możliwości. Spróbuj1 - αα1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
whuber
2
Rozumiem punkt, który próbujesz przedstawić, ale zdecydowanie nie zgadzam się ze stwierdzeniem, że „to nie jest sposób na sprawdzenie przedziału ufności”. W definicji / konstrukcji CI parametr jest stałą stałą. W twojej symulacji ciągle się zmienia. W przypadku ustalonego , jeśli metoda naprawdę daje 95% CI, to powinna pokryć w 95% przypadków. Nie ma Również, nawet przy twojej konstrukcji, daje zasięg bardzo zbliżony do 1 (oczywiście teraz znów zbliżamy się do ustalonego na 0). μ μ μ μμμμsim(0.1)μ
Wolfgang,
2
@Wolfgang sprawdź definicję użytą w cytowanym papierze: , tzn. Prawdopodobieństwo, że jest w przedziale wynosi co najmniej 0,95. μP(Xζ|X|μX+ζ|X|)1αμ
Tim
2
Znów jest stałą. Zatem symulowanie za pomocą jest całkowicie w porządku . Oczywiście wtedy zasięg musi wynosić 1. Metoda zapewnia CI, który ma co najmniej 95% pokrycia, a przykład pokazuje (czy to poprzez symulację, czy poprzez rozumowanie), że w niektórych warunkach zasięg może wynosić nawet 100%. To nie jest 95% CI. To wciąż dość sprytna metoda wyciągania wniosków z tak małej ilości informacji. μ = 0μμ=0
Wolfgang,
0

Patrz Edelman, D (1990) „Przedział ufności dla centrum nieznanego rozkładu unimodalnego na podstawie wielkości próby pierwszej” The American Statistician, tom 44, nr 4. Artykuł dotyczy przypadków normalnych i nieparametrycznych.

David Edelman
źródło
3
Witamy w Stats.SE. Czy możesz edytować swoją odpowiedź, aby ją rozwinąć, aby uwzględnić główne punkty cytowanej książki? Będzie to bardziej pomocne zarówno dla oryginalnego plakatu, jak i dla innych osób szukających w tej witrynie. Nawiasem mówiąc, skorzystać z okazji, aby zrobić wycieczkę , jeśli nie to zrobić już. Zobacz także kilka wskazówek na temat odpowiedzi , pomocy w formatowaniu i zapisywania równań za pomocą LaTeX / MathJax .
Ertxiem
Witamy na naszej stronie, David. Twój wkład, jako autora tego artykułu (który, jak sądzę, zacytowano w kilku wątkach tutaj), jest bardzo doceniany, więc każda perspektywa lub komentarze, które możesz podać w tej odpowiedzi, byłyby bardzo mile widziane.
whuber