Jaka jest różnica między danymi dyskretnymi a danymi
Odnosi się do danych wygenerowanych z dystrybucji, która ma policzalną przestrzeń na próbki. Dyskretny znacznik danych może obejmować dane kategoryczne, nominalne (np. Rozkład rasy w próbie osób) lub porządkowe (np. Status społeczno-ekonomiczny), lub rzeczywistą dyskretną zmienną losową, taką jak zbiór zliczeń zdarzeń (np. liczba błędów na stronie tekstu). Jednak dane dyskretne nie muszą być liczbami całkowitymi.
Jaka jest różnica między danymi dyskretnymi a danymi
Mam zestaw danych X, który ma 10 wymiarów, z których 4 to wartości dyskretne. W rzeczywistości te 4 zmienne dyskretne są porządkowe, tzn. Wyższa wartość implikuje wyższy / lepszy semantyczny. 2 z tych zmiennych dyskretnych są jakościowe w tym sensie, że dla każdej z tych zmiennych odległość np. Od...
Porównuję próbkę i sprawdzam, czy rozprowadza się ją jako jakąś dyskretną dystrybucję. Nie jestem jednak pewien, czy Kołmogorow-Smirnov ma zastosowanie. Wikipedia wydaje się sugerować, że tak nie jest. Jeśli nie, to jak mogę przetestować rozkład
Niektóre techniki modelowania predykcyjnego są bardziej zaprojektowane do obsługi ciągłych predyktorów, podczas gdy inne są lepsze do obsługi zmiennych jakościowych lub dyskretnych. Oczywiście istnieją techniki przekształcania jednego typu na inny (dyskretyzacja, zmienne fikcyjne itp.). Czy są...
Pytania dla początkujących: Chcę przetestować, czy dwa dyskretne zestawy danych pochodzą z tej samej dystrybucji. Zaproponowano mi test Kołmogorowa-Smirnowa. Conover ( Practical Nonparametric Statistics , 3d) wydaje się mówić, że do tego celu można zastosować test Kołmogorowa-Smirnowa, ale jego...
Rozumiem, że w uczeniu maszynowym może być problem, jeśli zestaw danych ma wysoce skorelowane funkcje, ponieważ skutecznie kodują te same informacje. Ostatnio ktoś zauważył, że gdy wykonujesz kodowanie na gorąco na zmiennej kategorialnej, masz skorelowane cechy, więc powinieneś upuścić jedną z...
Czy ta dyskretna dystrybucja ma nazwę? Dlai∈1...Ni∈1...Ni \in 1...N f(i)=1N∑Nj=i1jf(i)=1N∑j=iN1jf(i) = \frac{1}{N} \sum_{j = i}^N \frac{1}{j} Natrafiłem na tę dystrybucję z następujących: Mam listę pozycji uszeregowanych według funkcji użyteczności. Chcę losowo wybrać jeden z elementów, kierując...
Próbuję przeprowadzić dyskretną analizę przeżycia czasowego przy użyciu modelu regresji logistycznej i nie jestem pewien, czy całkowicie rozumiem ten proces. Byłbym bardzo wdzięczny za pomoc w kilku podstawowych pytaniach. Oto konfiguracja: Patrzę na członkostwo w grupie w ciągu pięciu lat. Każdy...
tl; dr Jaki jest zalecany sposób postępowania z discretedanymi podczas wykrywania nieprawidłowości? Jaki jest zalecany sposób postępowania categoricaldanymi podczas wykrywania nieprawidłowości? Ta odpowiedź sugeruje użycie dyskretnych danych tylko do filtrowania wyników. Być może zastąpisz...
Mam następujący histogram danych zliczania. I chciałbym dopasować do niego dyskretny rozkład. Nie jestem pewien, jak powinienem to zrobić. Czy powinienem najpierw nałożyć na histogram rozkład dyskretny, powiedzmy ujemny rozkład dwumianowy, aby uzyskać parametry rozkładu dyskretnego, a następnie...
Potrzebuję wzoru na prawdopodobieństwo zdarzenia w n-zmiennym rozkładzie Bernoulliego przy danych prawdopodobieństwa dla pojedynczego elementu i dla par elementów . Równoważnie mogę dać średnią i kowariancji .X∈{0,1}nX∈{0,1}nX\in\{0,1\}^n P ( X i = 1 ∧ X j = 1 ) = p i j...
Właśnie rozpoczął budowę modeli Stan ; aby zbudować znajomość narzędzia, pracuję nad niektórymi ćwiczeniami z analizy danych bayesowskich (wydanie 2). W Waterbuck wykonywania zakłada, że dane , z nieznany. Ponieważ Hamiltonian Monte Carlo nie zezwala na parametry dyskretne, zadeklarowałem jako...
Szukam optymalnej metody binowania (dyskretyzacji) zmiennej ciągłej w odniesieniu do danej zmiennej binarnej odpowiedzi (celu) i maksymalnej liczby interwałów jako parametru. przykład: mam zestaw obserwacji ludzi ze zmiennymi „wzrost” (ciągłe cyfry) i „has_back_pains” (binarne). Chcę dyskretyzować...
Pytanie: jak wygląda dwumianowy rozkład dwumianowy w przestrzeni trójwymiarowej? Poniżej znajduje się konkretna funkcja, którą chciałbym wizualizować dla różnych wartości parametrów; mianowicie , p 1 i p 2 .nnnp1p1p_{1}p2p2p_{2} f(x1,x2) = n !x1! x2)!px11px2)2),x1+ x2)= n ,p1+ p2)=...
Natknąłem się na tę dystrybucję w grze komputerowej i chciałem dowiedzieć się więcej o jej zachowaniu. To zależy od decyzji, czy określone zdarzenie powinno nastąpić po określonej liczbie akcji gracza. Szczegóły poza tym nie są istotne. Wydaje się, że ma zastosowanie w innych sytuacjach, i uważam...
Mój kurs statystyki nauczył mnie, że dyskretna zmienna losowa ma skończoną liczbę opcji ... Nie zdawałem sobie z tego sprawy. Wydawało mi się, że jak zestaw liczb całkowitych może być nieskończony. Googlowanie i sprawdzanie kilku stron internetowych, w tym kilku z kursów uniwersyteckich, nie...
Załóżmy, że masz zestaw danych z ciągłego rozkładu o gęstości obsługiwanej na który nie jest znany, ale jest dość duży, więc gęstość jądra (na przykład) szacunek jest dość dokładny. Dla konkretnego zastosowania muszę przekształcić obserwowane dane w skończoną liczbę kategorii, aby uzyskać nowy...
Wydaje mi się, że aby wybrać odpowiednie narzędzia statystyczne, muszę najpierw ustalić, czy mój zestaw danych jest dyskretny czy ciągły. Czy możesz mi nauczyć, jak mogę sprawdzić, czy dane są dyskretne czy ciągłe z
Powiedzmy, że mamy uporządkowaną listę przedmiotów [a, b, c, ... x, y, z, ...] Szukam rodziny dystrybucji z obsługą na powyższej liście, regulowanej przez niektóre parametry alfa, dzięki czemu: Dla alfa = 0 przypisuje prawdopodobieństwo 1 do pierwszego elementu, a powyżej, i 0 do reszty....
Posiadam zestaw danych dyskretnych (porządkowych, meristycznych i nominalnych) zmiennych opisujących morfologiczne charaktery skrzydeł na kilku blisko spokrewnionych gatunkach owadów. Chcę przeprowadzić jakąś analizę, która dałaby mi wizualną reprezentację podobieństwa różnych gatunków w oparciu o...