Jak nazywa się operator, który przyjmuje wektor kategoryczny i przekształca go w reprezentację binarną za pomocą kodowania „na gorąco”? Zastanawiam się, skoro piszę artykuł naukowy i potrzebuję do tego odpowiedniej nazwy.
10
Jak nazywa się operator, który przyjmuje wektor kategoryczny i przekształca go w reprezentację binarną za pomocą kodowania „na gorąco”? Zastanawiam się, skoro piszę artykuł naukowy i potrzebuję do tego odpowiedniej nazwy.
Odpowiedzi:
Statystycy nazywają kodowanie „na gorąco” jako kodowanie pozorowane . Jak sugerowali inni (w tym Scortchi w komentarzach), nie jest to dokładny synonim, ale jest to termin, który byłby zwykle używany w przypadku zmiennych kategorialnych zakodowanych w zakresie 0-1.
Zobacz także: „Zmienna manekina” kontra „zmienna wskaźnikowa” dla danych nominalnych / kategorialnych
źródło
To zależy od grupy docelowej.
Jak powiedział Tim , statystycy nazywają to kodowaniem pozornym i tego właśnie oczekiwałbym, opisując coś w rodzaju modelu regresji. „Uwzględniono zmienne kodowane jako atrapy, aby dostosować się do lokalizacji sklepu”. Wydaje mi się, że nazwanie go „gorącym kodowaniem” wydaje się nieco dziwne.
Jednak, jak powiedział inny Tim , kodowanie na gorąco jest dość powszechne w literaturze dotyczącej uczenia maszynowego. Słabo implikuje istnienie węzłów (jak w sieci neuronowej), fizycznych przewodów (w urządzeniu) lub czegoś podobnego, przynajmniej dla mnie.
Formalnie myślę, że stosujesz zestaw funkcji wskaźnikowych , ale prawdopodobnie jest to zbyt formalne poza dowodem.jaX
źródło
Termin pochodzi od inżynierii elektronicznej. Pomyśl tylko, kto nazwałby 1 „gorącym”? Tylko ci, którzy pracują z elektrycznością, gdzie „gorący” lub „pod napięciem” oznacza, że drut ma potencjał elektryczny . „Jeden gorący” odnosi się do konstrukcji obwodu, w której poziom dyskretnego sygnału elektrycznego na jednym przewodzie byłby dekodowany na gorącym / zimnym na zestawie przewodów. Podejrzewam, że niektórzy uczący się maszynami z wykształceniem EE uznali tę analogię za przekonującą.
W ekonometrii i statystykach można napotkać
dummy
lubindicator
zmienne, które są dość podobne, ponieważ służą one do reprezentowania odrębnych kategorii za pomocą ich odrębnych wskaźników. Jest jednak subtelna różnica. Na przykład wykonujesz manekiny K-1 dla kategorii K, ponieważ kategoria podstawowa odpowiada wszystkim manekinom ustawionym na 0. W przeciwieństwie do tego, myślę, że w jednym kodowaniu na gorąco masz K drutów, gdzie kategoria podstawowa będzie miała własny drut ( zmienna).źródło
Jestem wyszkolony statystycznie, a ostatnio słyszałem o „kodowaniu na gorąco” w uczeniu maszynowym / comp sci lit. Zwykle określałem macierz jednopunktową jako macierz projektową / macierz danych / ramkę projektową.
źródło
W naukach fizycznych i inżynierii nazywa się to (uogólnioną) deltą Kroneckera .
W najprostszej formie, delta Kronekera jest zdefiniowana jako choć to w sposób trywialny uogólnione na δ [ warunek ] ≡ { 1 jeśli [ warunek ] 0 jeszcze .
Delta Kroneckera jest naprawdę przydatna w Sigma / Pi / Einstein / etc. notacje, ponieważ umożliwia warunkowe określenie warunków.
Aby odnieść to do typowych struktur programowania, delta Kroneckera
condition?1:0
, gdzie?:
jest operatorem warunkowym .źródło
Pattern Recognition i Uczenia Maszynowego Christopher Bishop używa terminu1 -z-K. schemat.
Oto cytat z książki
źródło