Dzisiaj natknąłem się na książkę „Teoria informacji: wprowadzenie do samouczka” Jamesa Stone'a i przez chwilę zastanawiałem się nad zakresem zastosowania teorii informacji w nauce o danych stosowanych (jeśli nie czujesz się komfortowo z tym wciąż nieco rozmytym terminem, pomyśl o analizie danych , której nauka IMHO jest uwielbioną wersją). Jestem świadom znaczącego wykorzystania teorii informacji opartych podejść , metod i środków , zwłaszcza entropii , pod maską różnych technik i metod statystycznych do analizy danych.
Jestem jednak ciekawy zakresu / poziomu wiedzy, który jest potrzebny stosowanemu naukowcowi społecznemu, aby z powodzeniem wybierać i stosować te koncepcje, miary i narzędzia bez zbyt głębokiego sięgania w matematyczne pochodzenie teorii. Z niecierpliwością czekam na wasze odpowiedzi, które mogą odpowiedzieć na moje obawy w kontekście wyżej wspomnianej książki (lub innych podobnych książek - zachęcamy do polecania) lub ogólnie.
Byłbym także wdzięczny za niektóre zalecenia dla źródeł drukowanych lub internetowych, które omawiają teorię informacji oraz jej koncepcje, podejścia, metody i miary w kontekście (w porównaniu z) innymi (bardziej) tradycyjnymi podejściami statystycznymi ( częsty i bayesowski ).
źródło
Odpowiedzi:
Pierwsza część pytania: czy naukowcy danych muszą znać teorię informacji ? Myślałem, że odpowiedź brzmi „nie” aż do niedawna. Powodem, dla którego zmieniłem zdanie, jest jeden kluczowy element: hałas.
Wiele modeli uczenia maszynowego (zarówno stochastycznych, jak i nie) wykorzystuje szum jako część procesu kodowania i transformacji, aw wielu z tych modeli należy wywnioskować prawdopodobieństwo wpływu szumu po zdekodowaniu przetworzonego wyjścia modelu. Myślę, że jest to podstawowa część teorii informacji. Nie tylko to, że w głębokim uczeniu się rozbieżność KL jest bardzo ważnym stosowanym miernikiem, który również pochodzi z teorii informacji.
Druga część pytania: Myślę, że najlepszym źródłem jest teoria informacji Davida MacKaya , algorytmy wnioskowania i uczenia się . Zaczyna od teorii informacji i przenosi te pomysły do sieci wnioskowania, a nawet sieci neuronowych. Pdf jest bezpłatny na stronie Dave'a, a wykłady są online, które są świetne
źródło