Statystyki i duże zbiory danych

20

Założenia regresji wielokrotnej: czym różni się założenie normalności od założenia o stałej wariancji?

Przeczytałem, że są to warunki korzystania z modelu regresji wielokrotnej: reszty modelu są prawie normalne, zmienność reszt jest prawie stała reszty są niezależne i każda zmienna jest liniowo powiązana z wynikiem. Czym różnią się 1 i 2? Możesz go zobaczyć tutaj: Tak więc powyższy wykres...

regression multiple-regression assumptions

20

Drzewa wzmocnione gradientem XGBoost kontra Python Sklearn

Próbuję zrozumieć, jak działa XGBoost. Już rozumiem, w jaki sposób drzewa wzmocnione gradientem działają na sklearn Pythona. Nie jest dla mnie jasne, czy XGBoost działa w ten sam sposób, ale szybciej, czy istnieją fundamentalne różnice między nim a implementacją Pythona. Kiedy czytam ten...

scikit-learn boosting gbm xgboost

20

Czy codzienne prawdopodobieństwo jest tylko sposobem radzenia sobie z nieznanym (nie mówiąc tutaj o fizyce kwantowej)?

Wydaje się, że w codziennym prawdopodobieństwie (nie w fizyce kwantowej) prawdopodobieństwa są tak naprawdę tylko substytutem nieznanego. Weźmy na przykład rzut monetą. Mówimy, że jest „losowy”, 50% zmiana głowy i 50% szans na reszkę. Gdybym jednak dokładnie znał gęstość, rozmiar i kształt monety;...

probability philosophical

20

Jaka jest różnica między inicjatorem skalowania wariancji a inicjatorem Xaviera?

W implementacji ResNet przez Tensorflow widzę , że używają inicjalizatora skalowania wariancji, a także, że inicjator Xavier jest popularny. Nie mam za dużo doświadczenia, co jest lepsze w

machine-learning neural-networks deep-learning conv-neural-network tensorflow

20

Dlaczego działa inżynieria funkcji?

Ostatnio dowiedziałem się, że jednym ze sposobów znajdowania lepszych rozwiązań problemów ML jest tworzenie funkcji. Można to zrobić, na przykład sumując dwie funkcje. Na przykład, mamy dwie cechy: „atak” i „obrona” jakiegoś bohatera. Następnie tworzymy dodatkową funkcję o nazwie „total”, która...

machine-learning feature-construction

20

Kiedy powinienem używać wariacyjnego autoencodera w przeciwieństwie do autoencodera?

Rozumiem podstawową strukturę wariacyjnego autoencodera i normalnego (deterministycznego) autoencodera oraz matematykę za nimi, ale kiedy i dlaczego wolałbym jeden typ autoencodera od drugiego? Mogę tylko pomyśleć o wcześniejszym rozkładzie ukrytych zmiennych autoencodera wariacyjnego, który...

deep-learning autoencoders variational-bayes

20

FPR (współczynnik fałszywie dodatnich wyników) vs FDR (odsetek fałszywych wyników wyszukiwania)

Poniższy cytat pochodzi ze słynnego artykułu badawczego Znaczenie statystyczne dla badań całego genomu Storey i Tibshirani (2003): Na przykład fałszywie dodatni wskaźnik wynoszący 5% oznacza, że średnio 5% prawdziwie zerowych cech w badaniu zostanie nazwanych znaczącymi. FDR (wskaźnik...

hypothesis-testing false-discovery-rate type-i-and-ii-errors confusion-matrix false-positive-rate

20

Bayesian myśli o przeuczeniu

Poświęciłem dużo czasu na opracowanie metod i oprogramowania do walidacji modeli predykcyjnych w tradycyjnej dziedzinie statystyki częstokroć. Wprowadzając w życie więcej pomysłów bayesowskich i nauczając, dostrzegam kilka kluczowych różnic do przyjęcia. Po pierwsze, bayesowskie modelowanie...

bayesian cross-validation predictive-models validation regression-strategies

20

Estymatory maksymalnego prawdopodobieństwa - wielowymiarowy gaussowski

Kontekst Wielowymiarowy gaussowski pojawia się często w uczeniu maszynowym, a następujące wyniki są używane w wielu książkach i kursach ML bez pochodnych. Biorąc pod uwagę dane w postaci macierzy o wymiarach , jeżeli założymy, że dane są zgodne ze zmiennym rozkładem Gaussa zmiennym o...

normal-distribution maximum-likelihood estimators multivariate-normal

20

Dlaczego minimalizacja MAE prowadzi do prognozowania mediany, a nie średniej?

Z podręcznika Prognozowanie: Zasady i praktyka autorstwa Roba J Hyndmana i George'a Athanasopoulosa , w szczególności rozdziału dotyczącego pomiaru dokładności : Metoda prognozy, która minimalizuje MAE, doprowadzi do prognoz mediany, a minimalizacja RMSE doprowadzi do prognoz średniej Czy ktoś...

forecasting mean median rms mae

20

Przykład nieujemnego rozkładu dyskretnego, w którym średnia (lub inny moment) nie istnieje?

Pracowałem trochę w scipy i nadeszła rozmowa z członkiem podstawowej grupy scipy, czy nieujemna dyskretna zmienna losowa może mieć nieokreślony moment. Myślę, że ma rację, ale nie ma pod ręką dowodu. Czy ktoś może pokazać / udowodnić to twierdzenie? (lub jeśli to twierdzenie nie jest prawdziwe,...

mathematical-statistics expected-value

20

Przykład, w którym zasada prawdopodobieństwa * naprawdę * ma znaczenie?

Czy istnieje przykład, w którym dwa różne testy dające się obronić z proporcjonalnymi prawdopodobieństwami prowadziłyby do wyraźnie odmiennych (i równie dających się obronić) wniosków, na przykład, gdzie wartości p są daleko od siebie rzędu wielkości, ale siła alternatyw jest podobna? Wszystkie...

mathematical-statistics likelihood philosophical likelihood-principle

20

Porównanie SHAP (Shapley Additive Explanation) i LIME (Local Interpretable Model-Agnostic Explanations)

Czytam o dwóch popularnych technikach interpretacji modeli post hoc: LIME i SHAP Mam problem ze zrozumieniem kluczowej różnicy w tych dwóch technikach. Aby zacytować Scott Lundberg , mózgiem shap: Wartości SHAP pochodzą z zalet LIME w szacunkach lokalnych czarnej skrzynki, ale także z...

model-interpretation shapley-value lime

20

lme () i lmer () dają sprzeczne wyniki

Pracowałem z niektórymi danymi, które mają pewne problemy z powtarzanymi pomiarami. W ten sposób zauważyłem bardzo różne zachowanie między danymi testowymi lme()i ich lmer()używanie i chcę wiedzieć, dlaczego. Fałszywy zestaw danych, który utworzyłem, zawiera pomiary wzrostu i masy ciała dla 10...

r mixed-model lme4-nlme

20

Znalezienie sposobu na symulację liczb losowych dla tego rozkładu

Usiłuję napisać program w języku R, który symuluje pseudolosowe liczby z rozkładu za pomocą funkcji rozkładu skumulowanego: fa( x ) = 1 - exp(−ax−bp+1xp+1),x≥0F(x)=1−exp⁡(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 gdziea , b > 0 , p ∈ ( 0 , 1...

r random-generation

20

Niedopasowanie i niedopasowanie

Przeprowadziłem pewne badania na temat niedopasowania i niedopasowania i zrozumiałem, czym dokładnie są, ale nie mogę znaleźć powodów. Jakie są główne powody niedopasowania i niedopasowania? Dlaczego napotykamy te dwa problemy podczas szkolenia

machine-learning dataset overfitting

20

Czy model jest dopasowany do danych, czy dane są dopasowane do modelu?

Czy istnieje różnica koncepcyjna lub proceduralna między dopasowaniem modelu do danych a dopasowaniem danych do modelu? Przykład pierwszego sformułowania można znaleźć w https://courses.washington.edu/matlab1/ModelFitting.html , a drugiego w

terminology

20

Jakie jest intuicyjne znaczenie liniowej zależności między logami dwóch zmiennych?

Mam dwie zmienne, które nie wykazują dużej korelacji, gdy są nanoszone względem siebie, ale bardzo wyraźna liniowa zależność, kiedy rysuję logi każdej zmiennej przeciw drugiej. Skończyłem więc na modelu tego typu: log(Y)=alog(X)+blog⁡(Y)=alog⁡(X)+b\log(Y) = a \log(X) + b , co jest świetne...

regression correlation log

20

Czy warto klasyfikować sygnał 1D za pomocą CNN?

Pracuję nad klasyfikacją etapu snu. Czytałem niektóre artykuły badawcze na ten temat, wiele z nich używało SVM lub metody ensemble. Czy dobrym pomysłem jest użycie splotowej sieci neuronowej do klasyfikacji jednowymiarowego sygnału EEG? Jestem nowy w tego rodzaju pracy. Wybacz mi, jeśli poproszę o...

neural-networks svm conv-neural-network signal-processing

20

Dlaczego funkcja softmax jest używana do obliczania prawdopodobieństw, chociaż każdą wartość możemy podzielić przez sumę wektora?

Zastosowanie funkcji softmax na wektorze spowoduje „prawdopodobieństwa” i wartości od do . 000111 Ale możemy również podzielić każdą wartość przez sumę wektora, co da prawdopodobieństwa i wartości od do .000111 Przeczytałem tutaj odpowiedź , ale mówi ona, że powodem jest to, że jest...

machine-learning neural-networks softmax