Używam karetki, aby uruchomić sprawdzony krzyżowo losowy las w zbiorze danych. Zmienna Y jest czynnikiem. W moim zestawie danych nie ma NaN, Inf ani NA. Jednak podczas uruchamiania losowego lasu dostaję
Error in randomForest.default(m, y, ...) :
NA/NaN/Inf in foreign function call (arg 1)
In addition: There were 28 warnings (use warnings() to see them)
Warning messages:
1: In data.matrix(x) : NAs introduced by coercion
2: In data.matrix(x) : NAs introduced by coercion
3: In data.matrix(x) : NAs introduced by coercion
4: In data.matrix(x) : NAs introduced by coercion
Czy ktoś ma pomysły, czy ten błąd jest spowodowany przez NA wprowadzony przez przymus? Jeśli tak, jak mogę zapobiec takiemu przymusowi?
r
random-forest
caret
regression
prediction
fitting
social-science
poisson-distribution
distributions
characteristic-function
bayesian
prior
regression
normal-distribution
interaction
nonparametric
skewness
svm
standard-deviation
standard-error
regression-coefficients
igraph
natural-language
word2vec
word-embeddings
regression
machine-learning
sampling
r
regression
machine-learning
random-forest
ensemble
sampling
unbiased-estimator
proof
estimators
mse
probability
conditional-probability
bayes
anova
missing-data
neural-networks
recommender-system
r
confidence-interval
sample
multiple-imputation
r
time-series
forecasting
mase
Info5ek
źródło
źródło
Prawdopodobnie przyczyną jest to, że masz pewne zmienne znakowe w ramce danych.
Konwertuj wszystkie zmienne znakowe na czynniki w jednym wierszu:
library(dplyr) data_fac=data_char %>% mutate_if(is.character, as.factor)
źródło
mutate_if()
do tego ... dzięki!Jak pokazano w ostrzeżeniu, wystąpiło 28 błędów, którymi była liczba kolumn z typami danych znaków („chr”). Zmuszenie tych kolumn do czynników pozwoliło na rozpoczęcie biegu.
źródło