Tabela 18.1 w Elementy uczenia statystycznego podsumowuje wydajność kilku klasyfikatorów w zestawie danych 14 klas. Porównuję nowy algorytm z lasso i elastyczną siecią dla takich problemów z klasyfikacją wieloklasową.
Korzystając z glmnet
wersji 1.5.3 (R 2.13.0), nie jestem w stanie odtworzyć punktu 7. ( wielomianowy L_1) w tabeli, w której podano liczbę użytych genów wynoszącą 269, a błąd testu wynosi 13 z 54. Wykorzystane dane to ten zestaw danych z 14-rakowymi mikromacierzami . Cokolwiek próbowałem, otrzymuję najlepiej działający model wykorzystujący w sąsiedztwie 170-180 genów z błędem testowym 16 na 54.
Należy zauważyć, że na początku rozdziału 18.3 na stronie 654 opisano pewne wstępne przetwarzanie danych.
Skontaktowałem się z autorami - jak dotąd bez odpowiedzi - i pytam, czy ktokolwiek może potwierdzić problem z odtworzeniem tabeli lub podać rozwiązanie dotyczące sposobu jej odtworzenia.
Odpowiedzi:
czy sprawdziłeś pakiet R książki? zawiera wszystkie zestawy danych, funkcje i większość używanych tam skryptów ...
źródło