Co to jest błąd Bayesa w uczeniu maszynowym?

15

http://www.deeplearningbook.org/contents/ml.html Strona 116 wyjaśnia błąd Bayesa jak poniżej

Idealny model to wyrocznia, która po prostu zna prawdziwy rozkład prawdopodobieństwa, który generuje dane. Nawet taki model nadal będzie powodował błąd w wielu problemach, ponieważ może nadal występować szum w dystrybucji. W przypadku uczenia nadzorowanego mapowanie od x do y może być z natury stochastyczne lub y może być funkcją deterministyczną, która obejmuje inne zmienne oprócz tych zawartych w x. Błąd spowodowany przez wyrocznię dokonującą prognoz z rzeczywistego rozkładu p (x, y) nazywa się błędem Bayesa.

pytania

  1. Proszę wyjaśnić błąd Bayesa intuicyjnie?
  2. Czym różni się od nieredukowalnego błędu?
  3. Czy mogę powiedzieć, że całkowity błąd = odchylenie + odchylenie + błąd Bayesa?
  4. Co oznacza „y może być z natury stochastyczny”?
GeorgeOfTheRF
źródło

Odpowiedzi:

23

y

Na przykład przy rzucie uczciwą monetą wiemy dokładnie, jaki proces generuje wynik (rozkład dwumianowy). Gdybyśmy jednak przewidzieli wynik serii rzutów monetą, nadal popełnilibyśmy błędy, ponieważ proces ten jest z natury losowy (tj. Stochastyczny).

Aby odpowiedzieć na inne pytanie, masz rację, twierdząc, że całkowity błąd jest sumą (kwadrat) odchylenia, wariancji i błędu nieredukowalnego. Zobacz także ten artykuł, aby łatwo zrozumieć wyjaśnienie tych trzech pojęć.

Frans Rodenburg
źródło
-2

Od https://www.cs.helsinki.fi/u/jkivinen/opetus/iml/2013/Bayes.pdf . W przypadku zadania klasyfikacji błąd Bayesa definiuje się jako:

minf=Cost(f)

argminf=Cost(f)

Co oznacza „y może być z natury stochastyczny”? Na przykład . Ale to, co zbierasz jako y, jest zawsze zanieczyszczane jako , gdzie Więc nie masz sposobu, aby poznać prawdziwe y, a szacowany koszt to z natury zanieczyszczone. Nawet Oracle daje właściwą odpowiedź, myślisz, że się mylą.y=f(x)=sin(x)y~=y+ttN(0,σ2)

JP Zhang
źródło