Próbuję uruchomić xgboost w scikit learn. I używam tylko Pand do ładowania danych do ramki danych. Jak mam używać pand df z xgboost. Jestem zdezorientowany procedurą DMatrix wymaganą do uruchomienia xgboost algo.
scikit-learn
pandas
xgboost
Ghostintheshell
źródło
źródło
xgb.DMatrix(X_train.values, y_train.values)
, widzęTypeError: can not initialize DMatrix from dict
.values
)Jest dobra wiadomość, że jest biblioteka
pandas_ml
obsługująca XGBoost, prawdopodobnie usprawni to przepływ pracy.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
źródło
Możesz teraz używać Pandas DataFrames bezpośrednio z XGBoost. Zdecydowanie działa z xgboost 0.81.
Na przykład gdzie X_train, X_val, y_train i y_val to DataFrames:
źródło