Przeglądam artykuł, który wykorzystuje nierówność wyroczni, aby coś udowodnić, ale nie jestem w stanie zrozumieć, co on nawet próbuje zrobić. Kiedy szukałem w Internecie „Nierówności Oracle”, niektóre źródła skierowały mnie do artykułu „Candes, Emmanuel J.„ Nowoczesne oszacowanie statystyczne poprzez nierówności wyroczni ”. ”, który można znaleźć tutaj https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf . Ale ta książka wydaje mi się zbyt ciężka i uważam, że brakuje mi pewnych warunków wstępnych.
Moje pytanie brzmi: jak wyjaśniłbyś, czym jest wyrocznia dla nie-matematyki (w tym inżynierów)? Po drugie, w jaki sposób poleciłbyś im omówienie wymagań wstępnych / tematów przed próbą nauczenia się czegoś takiego jak wyżej wspomniana książka.
Zdecydowanie poleciłbym, aby ktoś, kto ma konkretną wiedzę i duże doświadczenie w statystyce wielowymiarowej, odpowiedział na to.
Odpowiedzi:
Spróbuję to wyjaśnić w przypadku liniowym. Rozważ model liniowy Gdy (liczba zmiennych niezależnych mniejsza lub równa liczbie obserwacji) i macierz projektowa ma pełną rangę, najmniejszym kwadratowym estymatorem jest Błąd i przewidywania to z którego możemy wywnioskować Oznacza to, że każdy parametr jest szacowany z dokładnością do kwadratuWięc ogólna kwadratowa dokładność wynosiP ≤ n b b = ( X , T X ) - 1 x T Y ‖ X ( b - β 0 ) ‖ 2 2
Co teraz, jeśli liczba obserwacji jest mniejsza niż liczba zmiennych niezależnych ? „Uważamy”, że nie wszystkie nasze niezależne zmienne odgrywają rolę w wyjaśnianiu , więc tylko kilka, powiedzmy , jest niezerowych. Gdybyśmy wiedzieli, które zmienne są niezerowe, moglibyśmy pominąć wszystkie inne zmienne i powyższym argumentem ogólna kwadratowa dokładność wynosiłaby(p>n) Y k (σ2/n)k.
Ponieważ zestaw niezerowych zmiennych jest nieznany, potrzebujemy pewnej kary regularyzacji (na przykład ) z parametrem regularyzacji (który kontroluje liczbę zmiennych). Teraz chcesz uzyskać wyniki podobne do omówionych powyżej, chcesz oszacować dokładność do kwadratu. Problem polega na tym, że twój optymalny estymator jest teraz zależny od . Ale wielkim faktem jest to, że przy właściwym wyborze można z dużym prawdopodobieństwem uzyskać górną granicę błędu prognozy, czyli „nierówność wyroczni” Zwróć uwagę na dodatkowy czynnik X β X X ‖ X ( β - β 0 ) ‖ 2 2l1 λ β^ λ λ logpc
źródło