Budowanie interfejsów MATLAB i R do C5.0 Rossa Quinlana

10

Jestem rozważa budowę interfejsów MATLAB i R do Ross Quinlan „s C5.0 (dla tych, którzy nie są zaznajomieni z nim, C5.0 to pakiet algorytm drzewo decyzyjne i oprogramowanie; przedłużeniem C4.5 ) i usiłuję poznaj elementy, które musiałbym napisać.

Jedyną dokumentacją, którą znalazłem dla C5.0 jest tutaj , która jest tutorialem dla See5 (interfejs Windows do C5.0?). Plik tar jest dostarczany z plikiem Makefile, ale nie ma plików Readme ani żadnej dodatkowej dokumentacji.

Z tego, co przeczytałem w powyższym samouczku, C5.0 używa reprezentacji opartej na ASCII do obsługi danych wejściowych i wyjściowych, a także rozważam zbudowanie interfejsu, który przekazuje dane binarne bezpośrednio między MATLAB lub R i C5.0. Czy reprezentacja danych C5.0 jest wykorzystywana przez inne oprogramowanie do uczenia maszynowego / klasyfikacji?

Czy ktoś próbował wcześniej zbudować interfejs MATLAB lub R do ID3, C4.5 lub C5.0?

Dzięki

Amelio Vazquez-Reina
źródło
Czy ten projekt trwa? Próbowałem zainstalować pakiet C5.0 w języku R, ale nie powiodło się.
Czy kiedykolwiek dokonałeś implementacji C5 dla Matlaba? Gdybyś to zrobił, byłoby to niezwykle przydatne. Patrzę teraz na połączenie C5 z Matlabem, ale C5 wydaje się nieco niechlujny (nie można po prostu przesyłać do niego plików tekstowych, ponieważ używa trudnego formatowania).
dcm29

Odpowiedzi:

11

To brzmi jak świetny pomysł, zwłaszcza, że ​​strona, do której prowadzisz link, pokazuje, że C5.0 jest teraz na licencji GPL.

Mam pewne doświadczenie w pakowaniu oprogramowania C / C ++ do R przy użyciu Rcpp ; Z chęcią pomogę.

Dirk Eddelbuettel
źródło
1
wielkie dzięki za zaoferowanie pomocy. W naszym laboratorium jest kilku studentów, którzy mogą się temu przyjrzeć. Damy Ci znać, jak tylko coś
wymyślimy
5

Interfejs kodu C / C ++ do MATLAB jest dość prosty, wystarczy, że utworzysz funkcję bramy MEX do obsługi konwersji parametrów i parametrów zwracanych. Mam doświadczenie w tworzeniu plików MEX, aby zrobić coś takiego i chętnie pomogę.

Dikran Torbacz
źródło
to brzmi świetnie! Dzięki za chęć pomocy. W naszym laboratorium jest kilku studentów, którzy mogą się z Tobą skontaktować, jeśli będziemy potrzebować pomocy.
Amelio Vazquez-Reina
4

AKTUALIZACJA:

Teraz w CRAN:

http://cran.r-project.org/web/packages/C50/index.html

ORYGINALNY:

Pracujemy nad tym już od jakiegoś czasu (zaczynając od Cubist, a potem C5.0).

Jeśli chcesz przyczynić się:

https://r-forge.r-project.org/projects/rulebasedmodels/

został utworzony niedawno i powinniśmy sprawdzać początkowy kod w.

Od jakiegoś czasu mieliśmy dostęp do źródeł kubistycznych (ale była wyraźna zgoda, aby nie łączyć go z innymi programami) i debatowaliśmy nad różnymi opcjami włączenia kodu, ale myślę

topepo
źródło