Jestem rozważa budowę interfejsów MATLAB i R do Ross Quinlan „s C5.0 (dla tych, którzy nie są zaznajomieni z nim, C5.0 to pakiet algorytm drzewo decyzyjne i oprogramowanie; przedłużeniem C4.5 ) i usiłuję poznaj elementy, które musiałbym napisać.
Jedyną dokumentacją, którą znalazłem dla C5.0 jest tutaj , która jest tutorialem dla See5 (interfejs Windows do C5.0?). Plik tar jest dostarczany z plikiem Makefile, ale nie ma plików Readme ani żadnej dodatkowej dokumentacji.
Z tego, co przeczytałem w powyższym samouczku, C5.0 używa reprezentacji opartej na ASCII do obsługi danych wejściowych i wyjściowych, a także rozważam zbudowanie interfejsu, który przekazuje dane binarne bezpośrednio między MATLAB lub R i C5.0. Czy reprezentacja danych C5.0 jest wykorzystywana przez inne oprogramowanie do uczenia maszynowego / klasyfikacji?
Czy ktoś próbował wcześniej zbudować interfejs MATLAB lub R do ID3, C4.5 lub C5.0?
Dzięki
źródło
Odpowiedzi:
To brzmi jak świetny pomysł, zwłaszcza, że strona, do której prowadzisz link, pokazuje, że C5.0 jest teraz na licencji GPL.
Mam pewne doświadczenie w pakowaniu oprogramowania C / C ++ do R przy użyciu Rcpp ; Z chęcią pomogę.
źródło
Interfejs kodu C / C ++ do MATLAB jest dość prosty, wystarczy, że utworzysz funkcję bramy MEX do obsługi konwersji parametrów i parametrów zwracanych. Mam doświadczenie w tworzeniu plików MEX, aby zrobić coś takiego i chętnie pomogę.
źródło
AKTUALIZACJA:
Teraz w CRAN:
http://cran.r-project.org/web/packages/C50/index.html
ORYGINALNY:
Pracujemy nad tym już od jakiegoś czasu (zaczynając od Cubist, a potem C5.0).
Jeśli chcesz przyczynić się:
https://r-forge.r-project.org/projects/rulebasedmodels/
został utworzony niedawno i powinniśmy sprawdzać początkowy kod w.
Od jakiegoś czasu mieliśmy dostęp do źródeł kubistycznych (ale była wyraźna zgoda, aby nie łączyć go z innymi programami) i debatowaliśmy nad różnymi opcjami włączenia kodu, ale myślę
źródło
Dokumentacja C5.0 (Linux) znajduje się na stronie http://rulequest.com/see5-unix.html
źródło