Nauka danych - strona 26

11

Definicja modelu w uczeniu maszynowym

Ta definicja nie do końca się stosuje, ponieważ nie zawsze przyjmujemy rozkład podstawowy. Czym więc tak naprawdę jest model? Czy GBM z określonymi hiperparametrami można uznać za model? Czy model to zbiór

machine-learning

11

Czy TensorFlow jest kompletną biblioteką uczenia maszynowego?

Jestem nowy w TensorFlow i muszę zrozumieć możliwości i wady TensorFlow, zanim będę mógł z niego korzystać. Wiem, że jest to platforma do głębokiego uczenia się, ale oprócz tej, której innych algorytmów uczenia maszynowego możemy używać z przepływem tensora. Na przykład, czy możemy używać SVM lub...

machine-learning

11

Sieci neuronowe - korelacja strat i dokładności

Jestem trochę zdezorientowany współistnieniem wskaźników strat i dokładności w sieciach neuronowych. Oba mają uczynić „dokładność” w porównaniu yyy i Y nie są? Czy więc zastosowanie dwóch zbędnych elementów w epokach treningowych nie jest możliwe? Co więcej, dlaczego nie są ze sobą...

neural-network evaluation

11

Jak zdefiniować niestandardową metrykę wydajności w Keras?

Próbowałem zdefiniować niestandardową funkcję metryczną (F1-Score) w Keras (backend Tensorflow) zgodnie z następującymi zasadami: def f1_score(tags, predicted): tags = set(tags) predicted = set(predicted) tp = len(tags & predicted) fp = len(predicted) - tp fn = len(tags) - tp if...

tensorflow keras evaluation

11

Nie możesz znaleźć liniowej warstwy osadzającej w splotowej sieci neuronowej?

Mam architekturę sieci z artykułu „uczenie się drobnoziarnistego podobieństwa obrazu z głębokim rankingiem” i nie jestem w stanie zrozumieć, w jaki sposób dane wyjściowe z trzech równoległych sieci są łączone za pomocą liniowej warstwy osadzania. Jedyne informacje podane na tej warstwie w artykule...

neural-network deep-network

11

Sieć neuronowa Tensorflow TypeError: Argument Fetch ma niepoprawny typ

Tworzę prostą sieć neuronową za pomocą tensorflow, z danymi, które sam zebrałem, ale to nie współpracuje: PI napotkał błąd, którego nie mogę naprawić lub znaleźć dla, a chciałbym za twoją pomoc. Błąd: Błąd typu: argument pobierania 2861.6152 z 2861.6152 ma niepoprawny typ, musi być łańcuchem...

machine-learning python neural-network tensorflow

11

Wyodrębnij informacje ze zdania

Tworzę prosty chatbot. Chcę uzyskać informacje z odpowiedzi użytkownika. Przykładowy scenariusz: Bot : Hi, what is your name? User: My name is Edwin. Chciałbym wydobyć imię Edwin ze zdania. Użytkownik może jednak reagować na różne sposoby, np User: Edwin is my name. User: I am Edwin. User:...

python nlp

11

Trenuj na partiach w Tensorflow

Obecnie próbuję trenować model na dużym pliku csv (> 70 GB z ponad 60 milionami wierszy). Aby to zrobić, używam tf.contrib.learn.read_batch_examples. Mam problem ze zrozumieniem, w jaki sposób ta funkcja faktycznie odczytuje dane. Jeśli używam wielkości partii np. 50 000, czy odczytuje pierwsze...

python tensorflow

11

Uczenie maszynowe a uczenie głębokie

Jestem trochę zdezorientowany różnicą między terminami „Machine Learning” i „Deep Learning”. Przejrzałem go i przeczytałem wiele artykułów, ale wciąż nie jest to dla mnie jasne. Znana definicja uczenia maszynowego przez Toma Mitchella to: Program komputerowy mówi się nauczyć z doświadczeń E w...

machine-learning deep-learning

11

Drzewo wzmocnienia gradientu: „im więcej zmiennych, tym lepiej”?

Z samouczka XGBoost myślę, że gdy każde drzewo rośnie, wszystkie zmienne są skanowane w celu wybrania w celu podzielenia węzłów i zostanie wybrana ta z podziałem maksymalnego wzmocnienia. Więc moje pytanie brzmi: co jeśli dodam jakieś zmienne szumu do zbioru danych, czy te zmienne szumu wpłyną na...

xgboost self-study

11

Jak używać GAN do ekstrakcji funkcji bez nadzoru z obrazów?

Zrozumiałem, jak działa GAN, podczas gdy dwie sieci (generatywna i dyskryminacyjna) konkurują ze sobą. Zbudowałem DCGAN (GAN z dyskryminatorem splotowym i generatorem dekonwolucji), który teraz z powodzeniem generuje ręcznie pisane cyfry podobne do tych w zestawie danych MNIST. Dużo czytałem o...

feature-extraction unsupervised-learning gan

11

GPU Accelerated Data Processing for R w Windows

Obecnie piszę artykuł na temat Big Data, który mocno wykorzystuje R do analizy danych. Zdarza mi się mieć GTX1070 w komputerze z powodów związanych z grami. Pomyślałem więc, że byłoby naprawdę fajnie, gdybym mógł to wykorzystać, aby przyspieszyć przetwarzanie niektórych rzeczy, które robią moi...

r gpu parallel

11

Ile danych jest wystarczających do wyszkolenia mojego modelu uczenia maszynowego?

Od dłuższego czasu pracuję nad uczeniem maszynowym i bioinformatyką, a dziś rozmawiałem z kolegą na temat głównych ogólnych kwestii eksploracji danych. Mój kolega (który jest ekspertem w dziedzinie uczenia maszynowego) powiedział, że jego zdaniem najważniejszym praktycznym aspektem uczenia...

machine-learning data-mining dataset data-cleaning data

11

Spraw, aby Keras działał na wielordzeniowym systemie wielordzeniowym

Pracuję na modelu Seq2Seq przy użyciu LSTM z Keras (przy użyciu tła Theano) i chciałbym zrównoleglić procesy, ponieważ nawet kilka MB danych potrzebuje kilku godzin na szkolenie. Oczywiste jest, że procesory graficzne są znacznie lepsze w równoległości niż procesory. W tej chwili mam tylko...

tensorflow keras theano parallel

11

Jaka jest różnica między wektorem mieszającym a wektorem tfidf

Konwertuję korpus dokumentów tekstowych na wektory słów dla każdego dokumentu. Próbowałem tego za pomocą TfidfVectorizer i HashingVectorizer Rozumiem, że a HashingVectorizernie uwzględnia IDFwyników tak, jak TfidfVectorizerrobi. Powodem, dla którego wciąż pracuję nad HashingVectorizerjest...

nlp scikit-learn text-mining tfidf

11

Jaka jest różnica między Dilated Convolution a Deconvolution?

Te dwie operacje splotu są obecnie bardzo powszechne w głębokim uczeniu się. O rozszerzonej warstwie splotowej przeczytałem w tym artykule: WAVENET: GENERACYJNY MODEL SUROWEGO AUDIO a Dekonwolucja znajduje się w tym artykule: W pełni konwolucyjne sieci dla segmentacji semantycznej Oba wydają...

machine-learning deep-learning convnet computer-vision convolution

11

Liczba i rozmiar gęstych warstw w CNN

Większość sieci, które widziałem, ma jedną lub dwie gęste warstwy przed ostatnią warstwą softmax. Czy istnieje jakiś zasadny sposób wyboru liczby i wielkości gęstych warstw? Czy dwie gęste warstwy są bardziej reprezentatywne niż jedna dla tej samej liczby parametrów? Czy należy stosować usuwanie...

convnet

11

Dziwne zachowanie z optymalizatorem Adama podczas treningu zbyt długo

Próbuję wytrenować pojedynczy perceptron (1000 jednostek wejściowych, 1 wyjście, brak ukrytych warstw) na 64 losowo generowanych punktach danych. Używam Pytorch za pomocą optymalizatora Adama: import torch from torch.autograd import Variable torch.manual_seed(545345) N, D_in, D_out = 64, 1000,...

perceptron pytorch

11

Kiedy mówimy, że zestaw danych nie podlega klasyfikacji?

Wielokrotnie analizowałem zestaw danych, na którym tak naprawdę nie mogłem dokonać żadnej klasyfikacji. Aby sprawdzić, czy mogę uzyskać klasyfikator, zwykle wykonałem następujące czynności: Wygeneruj wykresy pudełkowe etykiety na podstawie wartości liczbowych. Zmniejsz wymiarowość do 2 lub 3, aby...

machine-learning classification deep-learning class-imbalance bayes-error

11

Co to jest LSTM, BiLSTM i kiedy z nich korzystać?

Jestem bardzo nowy w głębokim uczeniu się i jestem szczególnie zainteresowany wiedzą, czym są LSTM i BiLSTM i kiedy z nich korzystać (główne obszary zastosowań). Dlaczego LSTM i BILSTM są bardziej popularne niż RNN? Czy możemy wykorzystać te architektury głębokiego uczenia się do rozwiązywania...

machine-learning deep-learning rnn lstm