W kontekście uczenia maszynowego widziałem, że termin „ Prawda naziemna” jest często używany. Dużo szukałem i znalazłem następującą definicję w Wikipedii :
W uczeniu maszynowym termin „podstawowa prawda” odnosi się do dokładności klasyfikacji zestawu szkoleniowego dla nadzorowanych technik uczenia się. Jest to wykorzystywane w modelach statystycznych do udowodnienia lub obalenia hipotez badawczych. Termin „ścieranie gruntu” odnosi się do procesu gromadzenia odpowiednich obiektywnych (możliwych do udowodnienia) danych dla tego testu. Porównaj ze złotym standardem.
Bayesowskie filtrowanie spamu jest częstym przykładem nadzorowanego uczenia się. W tym systemie algorytm uczy się ręcznie różnic między spamem a nie spamem. Zależy to od prawdziwej naziemnej wiadomości użytej do wyszkolenia algorytmu - niedokładności w podstawowej prawdzie będą korelować z niedokładnościami w wynikowych werdyktach dotyczących spamu / niemspamu.
Chodzi o to, że naprawdę nie mogę zrozumieć, co to znaczy. Czy to etykieta używana dla każdego obiektu danych lub funkcja docelowa, która nadaje etykietę każdemu obiektowi danych , czy może coś innego?
źródło
Prawda podstawowa: taką rzeczywistość chcesz przewidzieć w swoim modelu.
Może mieć trochę hałasu, ale chcesz, aby Twój model nauczył się bazowego wzorca w danych, który powoduje tę podstawową prawdę. Praktycznie twój model nigdy nie będzie w stanie przewidzieć prawdy naziemnej, ponieważ prawda naziemna również będzie miała hałas i żaden model nie zapewnia stuprocentowej dokładności, ale chcesz, aby Twój model był jak najbliżej.
źródło