Statystyki i duże zbiory danych

11

Dlaczego wybór funkcji jest ważny dla zadań klasyfikacji?

Uczę się o wyborze funkcji. Rozumiem, dlaczego byłoby to ważne i przydatne do budowania modeli. Ale skupmy się na nadzorowanych zadaniach uczenia się (klasyfikacji). Dlaczego wybór funkcji jest ważny dla zadań klasyfikacji? Widzę dużo literatury na temat wyboru funkcji i jej zastosowania do...

feature-selection accuracy regression-strategies

11

Jaki jest rozkład dla maksimum (minimum) dwóch niezależnych normalnych zmiennych losowych?

Załóżmy konkretnie XXX i YYYsą normalnymi zmiennymi losowymi (niezależne, ale niekoniecznie identycznie rozmieszczone). Biorąc pod uwagę dowolnyaaa, czy istnieje fajna formuła dla P(max(X,Y)≤x)P(max(X,Y)≤x)P(\max(X,Y)\leq x)lub podobne koncepcje? Czy wiemy, że max(X,Y)max(X,Y)\max(X,Y) jest...

normal-distribution extreme-value

11

Grupowanie bardzo wypaczonych, zliczanie danych: jakieś sugestie (transformacja itp.)?

Podstawowy problem Oto mój podstawowy problem: próbuję zgrupować zestaw danych zawierający niektóre bardzo wypaczone zmienne z licznikami. Zmienne zawierają wiele zer i dlatego nie są zbyt pouczające dla mojej procedury klastrowania - która prawdopodobnie jest algorytmem k-średnich. Dobra,...

clustering data-transformation k-means count-data compositional-data

11

Jakie są zalety różnych podejść do wykrywania kolinearności?

Chcę wykryć, czy kolinearność jest problemem w mojej regresji OLS. Rozumiem, że czynniki inflacyjne wariancji i wskaźnik warunków są dwiema powszechnie stosowanymi miarami, ale trudno mi znaleźć coś konkretnego na podstawie zalet każdego podejścia lub tego, jakie powinny być wyniki. Bardzo...

multiple-regression references least-squares multicollinearity vif

11

Kiedy stosować zejście gradientu vs Monte Carlo jako technikę numerycznej optymalizacji

Gdy zestawu równań nie można rozwiązać analitycznie, możemy zastosować algorytm spadku gradientu. Wydaje się jednak, że istnieje również metoda symulacji Monte Carlo, która może być wykorzystana do rozwiązania problemów, które nie mają rozwiązań analitycznych. Jak powiedzieć, kiedy należy...

monte-carlo gradient-descent

11

Algorytmy osadzania słów pod względem wydajności

Próbuję osadzić około 60 milionów fraz w przestrzeni wektorowej , a następnie obliczyć podobieństwo między nimi. Używam sklearn's CountVectorizerz niestandardową wbudowaną funkcją tokenizera, która produkuje unigramy i bigramy. Okazuje się, że aby uzyskać sensowne reprezentacje, muszę pozwolić na...

machine-learning natural-language word2vec word-embeddings cosine-similarity

11

Co faktycznie oblicza wzór y ~ x + 0 w R?

Jaka jest różnica statystyczna między regresją liniową w R z formulaustawieniem na y ~ x + 0zamiast y ~ x? Jak interpretować te dwa różne

multiple-regression generalized-linear-model intercept

11

Liczba parametrów w sztucznej sieci neuronowej dla AIC

Jak obliczyć liczbę parametrów w sztucznej sieci neuronowej, aby obliczyć jej

neural-networks aic

11

Jak dopasować przybliżony plik PDF (tj. Oszacowanie gęstości) przy użyciu pierwszych k (empirycznych) momentów?

Mam sytuację, w której jestem w stanie oszacować (pierwsze) momentów zbioru danych i chciałbym użyć go do oszacowania funkcji gęstości.kkk Natknąłem się już na rozkład Pearsona , ale zdałem sobie sprawę, że opiera się on tylko na pierwszych 4 momentach (z pewnymi ograniczeniami dotyczącymi...

pdf kernel-smoothing moments

11

Nieparametryczne wartości p ładowania początkowego a przedziały ufności

Kontekst Jest to nieco podobne do tego pytania , ale nie sądzę, że jest to dokładna kopia. Kiedy szukasz instrukcji, jak wykonać test hipotezy ładowania początkowego, zwykle stwierdza się, że dobrze jest użyć rozkładu empirycznego dla przedziałów ufności, ale że musisz poprawnie załadować ładunek...

confidence-interval p-value bootstrap

11

Czy zawsze lepiej jest wyodrębnić więcej czynników, jeśli istnieją?

W przeciwieństwie do analizy głównych komponentów rozwiązania modeli analizy czynnikowej niekoniecznie są zagnieżdżone. Oznacza to, że ładunki (na przykład) dla pierwszego czynnika niekoniecznie będą identyczne, gdy tylko pierwszy czynnik zostanie wyodrębniony w porównaniu z pierwszymi dwoma...

references factor-analysis psychometrics

11

Materiały do nauki o technikach wielu celów?

Szukam zasobów (książek, notatek z wykładów itp.) Na temat technik, które mogą obsługiwać dane, które mają wiele celów (np .: trzy zmienne zależne: 2 dyskretne i 1 ciągłe). Czy ktoś ma jakieś zasoby / wiedzę na ten temat? Wiem, że można do tego wykorzystać sieci neuronowe....

regression machine-learning predictive-models references

11

Dwie definicje wartości p: jak udowodnić ich równoważność?

Czytam książkę Larry'ego Wassermana, All of Statistics , a obecnie o wartościach p (strona 187). Pozwól mi najpierw wprowadzić kilka definicji (cytuję): Definicja 1 Funkcja mocy testu z obszarem odrzucenia jest zdefiniowana przez Rozmiar testu jest określony na Mówi się, że test ma poziom...

hypothesis-testing mathematical-statistics p-value

11

Sukces prób Bernoulliego z różnymi prawdopodobieństwami

Jeśli przeprowadzonych zostanie 20 niezależnych prób Bernoulliego, każde z innym prawdopodobieństwem sukcesu, a tym samym porażki. Jakie jest prawdopodobieństwo, że dokładnie n z 20 prób zakończyło się sukcesem? Czy istnieje lepszy sposób obliczania tych prawdopodobieństw niż po prostu sumowanie...

probability distributions bernoulli-distribution poisson-binomial

11

Wykreślanie wyników mających jedynie średnie i standardowe odchylenie

Staram się wizualizować odpowiedni wykres dla obserwacji w poniższej tabeli średnich i odchyleń standardowych wyników wycofania: RecallControlMean37SD8ExperimentalMean21SD6ControlExperimentalMeanSDMeanSDRecall378216\begin{array} {c|c c|c c|} & \text{Control} & & \text{Experimental} & \\ &...

data-visualization standard-deviation mean descriptive-statistics barplot

11

Zmierz jednorodność rozkładu w dni powszednie

Mam podobny problem do zadanego tutaj pytania: Jak mierzy się nierównomierność rozkładu? Mam zestaw rozkładów prawdopodobieństwa w dniach tygodnia. Chcę zmierzyć, jak blisko jest każdy rozkład (1 / 7,1 / 7, ..., 1/7). W tej chwili korzystam z odpowiedzi na powyższe pytanie; norma L2, która ma...

probability distributions random-variable uniform measurement

11

Jakie są zalety i wady stosowania punktowej wzajemnej informacji na macierzy współbieżności słów przed SVD?

Jednym ze sposobów generowania zanurzeń słowo jest następująco ( lustro ): Zdobądź ciała, np. „Lubię latać. Lubię NLP. Lubię głębokie uczenie się”. Zbuduj z niego macierz współbieżności słów: Wykonaj SVD na XXX i zachowaj pierwsze kkk kolumn U. U1:|V|,1:kU1:|V|,1:kU_{1:|V|,1:k} Pomiędzy...

natural-language svd mutual-information word-embeddings language-models

11

Jak interpretować współczynnik drugiego stopnia w regresji zmiennych instrumentalnych za pomocą instrumentu binarnego i binarnej zmiennej endogennej?

(dość długi post, przepraszam. Zawiera wiele podstawowych informacji, więc możesz przejść do pytania na dole). Wprowadzenie: Pracuję nad projektem, w którym próbujemy zidentyfikować wpływ binarnej zmiennej endogennej na ciągły wynik, . Stworzyliśmy instrument , który naszym zdaniem jest przypisany...

econometrics interpretation binary-data instrumental-variables

11

Przybliżony

Od niechcenia czytałem artykuł (z ekonomii), który miał następujące przybliżenie dla :log(E(X))log⁡(E(X))\log(E(X)) ,log(E(X))≈E(log(X))+0.5var(log(X))log⁡(E(X))≈E(log⁡(X))+0.5var(log⁡(X))\log(E(X)) \approx E(\log(X))+0.5 \mathrm{var}(\log(X)) które według autora jest dokładne, jeśli X jest...

lognormal approximation taylor-series

11

Asymptotyka łacińskiego Hypercube

Próbuję skonstruować dowód na problem, nad którym pracuję, a jednym z założeń, które robię, jest to, że zbiór punktów, z których próbuję, jest gęsty na całej przestrzeni. Praktycznie używam łacińskiego próbkowania hipersześcianu, aby uzyskać punkty w całej przestrzeni próbki. Chciałbym wiedzieć,...

sampling asymptotics latin-square latin-hypercube