Właśnie odkryłem comment
funkcję w R. Przykład:
x <- matrix(1:12, 3,4)
comment(x) <- c("This is my very important data from experiment #0234",
"Jun 5, 1998")
x
comment(x)
Po raz pierwszy przyszedłem przez tę funkcję i zastanawiałem się, jakie są jej typowe / użyteczne zastosowania. Ponieważ wyszukiwanie „komentarza R” w google i znalezienie odpowiednich wyników jest dość trudne, miałem nadzieję, że ktoś tutaj podzieli się swoim doświadczeniem.
Odpowiedzi:
Na drugim miejscu @Gavin, Frank Harrell opracował wydajne sposoby obsługi danych data.frame w R w swoim pakiecie Hmisc . Na przykład funkcje
label()
iunits()
pozwalają dodawać dedykowane atrybuty do obiektów R. Uważam je za bardzo przydatne przy tworzeniu podsumowania data.frame (np. Zdescribe()
).Innym przydatnym sposobem użycia takiego dodatkowego atrybutu jest zastosowanie znacznika czasu w zestawie danych. Dodam także atrybut takich rzeczy jak losowe ziarno, liczba foldów (gdy używam k-kold lub LOO cross-validation).
źródło
Uważam, że to
comment()
dobry sposób na dołączenie tych informacji do ramki danych do wykorzystania w przyszłości.źródło
comment()
to nie komentarze w kodzie. Do obiektu przypisuje się określony atrybut, którym może być wektor, jeden element na kolumnę ramki danych zawierającej informacje o jednostkach. Łatwo jest wyodrębnić te informacje, więc nie rozumiem, dlaczego wdrożenie czegoś byłoby trudne lub niemożliwe?R
- zdecydowanie nie jest właściwym miejscem do utrzymywania baz danych i wykonywania tego typu procesów, nawet jeśli jest w stanie to zrobić. Najlepszym uzupełnieniem jest dobry system zarządzania bazą danych do takich prac.comment()
i in. są przydatne w przypadku notatek i informacji ad hoc, ale do obsługi danych na większą skalę wymagany jest odpowiedni system. Co ciekawe, musimy zająć się tym teraz w ramach grupy badawczej i doradztwa, dla których pracuję w odniesieniu do naszych danych chemicznych i potrzebuję wprowadzić je do odpowiedniej bazy danych.Podobne udogodnienia istnieją w innych pakietach, takich jak polecenie -notes- w programie Stata . Używamy tego do udokumentowania pełnych szczegółów zmiennej, np. Szczegółów testu dla pomiaru biochemicznego lub dokładnego sformułowania pytania zadawanego dla danych z kwestionariusza. Jest to często zbyt wiele informacji dla nazwy lub etykiety zmiennej, z których jedna lub obie są wyświetlane w wynikach każdej analizy dotyczącej zmiennej, a zatem najlepiej jest je odpowiednio skrócić.
źródło
Jedną z rzeczy, które często robię, jest śledzenie poleceń używanych do generowania danych i obiektów, i uważam, że komentarz jest przydatnym narzędziem do tego.
„Matched.call.data” i „generate.command.string” załatwią sprawę. Nie jest idealny, ale pomocny i służy do „comment ()”. :)
źródło
Pozwólcie, że zasugeruję moje ogólne rozwiązanie do zarządzania obiektami w
repo
pakiecie R: Za jego pomocą możesz przypisać każdej zmiennej długą nazwę, opis, zestaw tagów, zdalny adres URL, relacje zależności, a także dołączyć liczby lub ogólne pliki zewnętrzne. Na przykład kod źródłowy może być przechowywany jako element repozytorium i dołączany do wytwarzanych przez niego zasobów. Znajdź najnowszą stabilną wersję CRAN (install.packages("repo")
) lub najnowszą wersję github . Krótki przegląd tutaj . Mam nadzieję, że to pomoże.źródło