Inną alternatywą jest użycie przechwytywania wyrażeń podrzędnych z funkcjami wyrażeń regularnych regmatches
i regexec
.
# the original example
x <- 'hello stackoverflow'
# grab the substrings
myStrings <- regmatches(x, regexec('(^.)(.*)', x))
Zwraca cały ciąg, pierwszy znak i wynik „popped” w postaci listy o długości 1.
myStrings
[[1]]
[1] "hello stackoverflow" "h" "ello stackoverflow"
co jest równoważne z list(c(x, substr(x, 1, 1), substr(x, 2, nchar(x))))
. Oznacza to, że zawiera super zestaw żądanych elementów, a także pełny ciąg.
Dodanie sapply
pozwoli tej metodzie działać dla wektora znakowego o długości> 1.
# a slightly more interesting example
xx <- c('hello stackoverflow', 'right back', 'at yah')
# grab the substrings
myStrings <- regmatches(x, regexec('(^.)(.*)', xx))
Zwraca listę z dopasowanym pełnym ciągiem jako pierwszym elementem i pasującymi wyrażeniami podrzędnymi przechwyconymi przez ()
następujące elementy. Więc w wyrażeniu regularnym '(^.)(.*)'
, (^.)
pasuje do pierwszego znaku i (.*)
dopasowuje pozostałe znaki.
myStrings
[[1]]
[1] "hello stackoverflow" "h" "ello stackoverflow"
[[2]]
[1] "right back" "r" "ight back"
[[3]]
[1] "at yah" "a" "t yah"
Teraz możemy użyć zaufanej metody sapply
+ [
do wyciągnięcia żądanych podciągów.
myFirstStrings <- sapply(myStrings, "[", 2)
myFirstStrings
[1] "h" "r" "a"
mySecondStrings <- sapply(myStrings, "[", 3)
mySecondStrings
[1] "ello stackoverflow" "ight back" "t yah"
sapply
do wyodrębniania. „Wystrzelenie” pierwszego znaku, jak określono w pytaniu, polega na powtórzeniu tego procesu na powstałym wektorze (mySecondStrings).