Odpowiedzi na to pytanie dotyczące SO zwróciły zestaw około 125 jedno- lub dwuliterowych nazw: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-objects
[1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C"
[14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv"
[27] "d" "D" "dc" "dd" "de" "df" "dg" "dn" "do" "ds" "dt" "e" "E"
[40] "el" "ES" "F" "FF" "fn" "gc" "gl" "go" "H" "Hi" "hm" "I" "ic"
[53] "id" "ID" "if" "IJ" "Im" "In" "ip" "is" "J" "lh" "ll" "lm" "lo"
[66] "Lo" "ls" "lu" "m" "MH" "mn" "ms" "N" "nc" "nd" "nn" "ns" "on"
[79] "Op" "P" "pa" "pf" "pi" "Pi" "pm" "pp" "ps" "pt" "q" "qf" "qq"
[92] "qr" "qt" "r" "Re" "rf" "rk" "rl" "rm" "rt" "s" "sc" "sd" "SJ"
[105] "sn" "sp" "ss" "t" "T" "te" "tr" "ts" "tt" "tz" "ug" "UG" "UN"
[118] "V" "VA" "Vd" "vi" "Vo" "w" "W" "y"
I kod importowy R:
nms <- c("Ad","am","ar","as","bc","bd","bp","br","BR","bs","by","c","C","cc","cd","ch","ci","CJ","ck","Cl","cm","cn","cq","cs","Cs","cv","d","D","dc","dd","de","df","dg","dn","do","ds","dt","e","E","el","ES","F","FF","fn","gc","gl","go","H","Hi","hm","I","ic","id","ID","if","IJ","Im","In","ip","is","J","lh","ll","lm","lo","Lo","ls","lu","m","MH","mn","ms","N","nc","nd","nn","ns","on","Op","P","pa","pf","pi","Pi","pm","pp","ps","pt","q","qf","qq","qr","qt","r","Re","rf","rk","rl","rm","rt","s","sc","sd","SJ","sn","sp","ss","t","T","te","tr","ts","tt","tz","ug","UG","UN","V","VA","Vd","vi","Vo","w","W","y")
Ponieważ chodziło o wymyślenie niezapomnianej listy nazw obiektów, których należy unikać, a większość ludzi nie jest tak dobra w zrozumieniu solidnego bloku tekstu, chciałbym to sobie wyobrazić.
Niestety nie jestem do końca pewien, jak to najlepiej zrobić. Myślałem o czymś w rodzaju wykresu łodygi i liścia, tylko dlatego, że nie ma powtarzalnych wartości, każdy „liść” został umieszczony w odpowiedniej kolumnie, a nie pozostawiony jako uzasadniony. Lub adaptacja w stylu chmury słów, w której litery są sortowane zgodnie z ich rozpowszechnieniem.
W jaki sposób można to najlepiej i najwyraźniej wizualizować?
Wizualizacje spełniające którekolwiek z poniższych kryteriów są zgodne z duchem tego pytania:
Główny cel: Zwiększenie zdolności zapamiętywania zestawu nazw poprzez ujawnienie wzorców w danych
Alternatywny cel: Podkreśl interesujące cechy zestawu nazw (np. Które pomagają zwizualizować rozkład, najczęściej używane litery itp.)
Preferowane są odpowiedzi w języku R, ale mile widziane są wszystkie ciekawe pomysły.
Ignorowanie nazw jednoliterowych jest dozwolone, ponieważ łatwiej je podać jako osobną listę.
źródło
Ok, oto moje bardzo szybkie spojrzenie na wizualizację podobną do „układu okresowego”, opartą na pytaniu SO i komentarzach innych. Głównym problemem jest duża różnica w liczbie zmiennych między pakietami, która utrudnia wizualizację ... Zdaję sobie sprawę, że jest to bardzo zgrubne, więc możesz ją dowolnie zmieniać.
Oto aktualne wyjście (z mojej listy pakietów)
I kod
Teraz mamy taką ramkę danych:
Możemy teraz podzielić dane według pakietów
Widzimy, że większość zmiennych pochodzi z pakietu podstawowego i pakietu statystyk
Wreszcie procedura rysowania
źródło
Oto histogram oparty na literze. Rozważano zmianę pierwszych liter według numeru, ale odmówiono, ponieważ jest to już zakodowane w elemencie pionowym.
źródło
Układ okresowy dla 100, Alex. Jednak nie mam na to kodu. :(
Można by pomyśleć, że pakiet „układu okresowego” może już istnieć w CRAN. Pomysł na schemat kolorystyczny i układ takich danych może być interesujący i użyteczny.
Można je pokolorować według paczki i posortować pionowo według częstotliwości, np. W próbce kodu w CRAN lub tak, jak pojawiają się w lokalnej bazie kodu.
źródło
Dwie pierwsze strony w rozdziale 2 ITILA MacKaya zawierają ładne diagramy pokazujące warunkowe prawdopodobieństwa wszystkich par znaków w języku angielskim. Może się przydać.
Wstyd mi, że nie pamiętam, jakiego programu użyto do ich wytworzenia.
źródło