Nauka danych

16
Co to jest wynik LB w uczeniu maszynowym?

Przeglądałem artykuł o blogach Kaggle. Wielokrotnie autor wymienia „wynik LB” i „dopasowanie LB”) jako miernik skuteczności uczenia maszynowego (wraz z wynikiem weryfikacji krzyżowej (CV)). Badając znaczenie „LB” spędziłem sporo czasu, zdałem sobie sprawę, że ogólnie ludzie nazywają go...

16
Jak samouczyć się danych? [Zamknięte]

Zamknięte . To pytanie musi być bardziej skoncentrowane . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Zaktualizuj pytanie, aby skupiało się tylko na jednym problemie, edytując ten post . Zamknięte 4 lata temu . Jestem samoukiem i jestem...

16
Co jeszcze oferuje TensorFlow kamerom?

Wiem, że keras służy jako interfejs wysokiego poziomu dla TensorFlow. Wydaje mi się jednak, że keras może samodzielnie wykonywać wiele funkcji (wprowadzanie danych, tworzenie modeli, szkolenie, ocena). Co więcej, niektóre funkcje TensorFlow mogą być przeniesione bezpośrednio do keras (np. W...

16
Wyodrębnij najbardziej pouczające części tekstu z dokumentów

Czy są jakieś artykuły lub dyskusje na temat wyodrębnienia części tekstu, która zawiera najwięcej informacji o bieżącym dokumencie. Na przykład mam duży zbiór dokumentów z tej samej domeny. Istnieją fragmenty tekstu zawierające kluczowe informacje, o których mówi pojedynczy dokument. Chcę...

16
Metoda punktacji OOB RandomForestClassifier

Czy przypadkowa implementacja lasu w scikit-learn wykorzystuje średnią dokładność jako metodę punktacji do oszacowania błędu uogólnienia przy próbkach z worka? Nie jest to wspomniane w dokumentacji, ale metoda score () podaje średnią dokładność. Mam bardzo niezrównoważony zestaw danych i używam...

16
propagacja wsteczna w CNN

Mam następujący CNN: Zaczynam od obrazu wejściowego o rozmiarze 5x5 Następnie stosuję splot za pomocą jądra 2x2 i stride = 1, który tworzy mapę cech o rozmiarze 4x4. Następnie stosuję maksymalne łączenie 2x2 z krokiem = 2, co zmniejsza mapę obiektów do rozmiaru 2x2. Następnie stosuję sigmoid...

16
NLP - Czy Gazetteer to oszustwo?

W NLP istnieje koncepcja, Gazetteerktóra może być bardzo przydatna do tworzenia adnotacji. O ile rozumiem: Gazeter składa się z zestawu list zawierających nazwy podmiotów, takich jak miasta, organizacje, dni tygodnia itp. Listy te służą do wyszukiwania wystąpień tych nazw w tekście, np. Do...

16
Podcasty z zakresu nauki o danych?

Jakie są podcasty związane z nauką danych? To jest podobne pytanie do pytania z prośbą o referencję na CrossValidated . Szczegóły / zasady: Podcasty (temat i odcinki) powinny być związane z nauką danych. (Na przykład: podcast dotyczący innej domeny z odcinkiem, który mówi o analizie danych w...