Jaki jest najprostszy sposób przekonwertowania ciągu Java ze wszystkich wielkich liter (słów oddzielonych podkreśleniem) na CamelCase (bez separatorów słów)?

152

Tytuł mówi wszystko. Jaki jest najprostszy / najbardziej elegancki sposób, w jaki mogę przekonwertować w Javie ciąg znaków z formatu "THIS_IS_AN_EXAMPLE_STRING"na format „ ThisIsAnExampleString”? Wydaje mi się, że musi istnieć co najmniej jeden sposób, aby to zrobić, używając String.replaceAll()i wyrażenia regularnego.

Moje wstępne przemyślenia są następujące: _dodaj znak podkreślenia ( ) na początku, zamień cały ciąg na małe litery, a następnie użyj funkcji replaceAll do konwersji każdego znaku poprzedzonego podkreśleniem z jego wersją wielką.

Matt Ball
źródło
12
Od redakcji, 2015-03: „Wstępne przemyślenia” powyżej są super głupie. Wiele się nauczysz o tworzeniu oprogramowania w ciągu sześciu lat.
Matt Ball
4
Ten moment, kiedy pytasz `` jaki idiota to napisał '' i sprawdzasz w kontroli źródła, że ​​to młody, głupi, który zrobiłeś. Byłem tam, zrobiłem to.
pierus
@MattBall: Podoba mi się początkowa wersja przemyślenia, nie wymaga ona biblioteki i po prostu potrzebuje konkatenacji ciągów i dwóch zastąpień wyrażeń regularnych.
Konrad Höffner

Odpowiedzi:

192

Inną opcją jest użycie Google Guava com.google.common.base.CaseFormat

George Hawkins zostawił komentarz z tym przykładem użycia:

CaseFormat.UPPER_UNDERSCORE.to(CaseFormat.UPPER_CAMEL, "THIS_IS_AN_EXAMPLE_STRING");
Arnout Engelen
źródło
3
Przykład można znaleźć w komentarzu George'a Hawkinsa [użytkownik: 245602]. stackoverflow.com/questions/1143951/…
Michael Scheper,
5
Tęsknię za odpowiedziami w czystej Javie, ponieważ tworzę dla Androida.
eliocs,
1
Ta odpowiedź jest dla mnie najbardziej przydatna. Mógłbym bardzo dobrze napisać własny kod, ale jeśli ktoś już to zrobił, na pewno nie chcę wymyślać koła na nowo.
James Dunn
1
@ CléssioMendes. Czy rozważałeś poruszenie tego tematu na github.com/google/guava/issues ?
Arnout Engelen,
128

Spójrz na WordUtils w bibliotece języków Apache Commons :

W szczególności metoda capitalizeFully (String str, char [] delimiters) powinna wykonać zadanie:

String blah = "LORD_OF_THE_RINGS";
assertEquals("LordOfTheRings", WordUtils.capitalizeFully(blah, new char[]{'_'}).replaceAll("_", ""));

Zielony pasek!

Dan Gravell
źródło
55
Nie proszę pana! Powinniśmy sami przepisać te istniejące, już działające narzędzia, ponieważ jesteśmy odpowiednimi programistami!
skaffman
24
Jest 16:42 w piątkowe popołudnie. Pozwolę wszystkim to przepisać, wychodzę na piwo \ o /;)
Dan Gravell
1
Co więcej, nie mam nawet dostępu do tego konkretnego pakietu z moją obecną konfiguracją, a ponieważ naprawdę (jeszcze) nie potrzebuję niczego poza metodą capitalizeFully, nic nie tracę, pisząc go sam.
Matt Ball,
7
Szanuję twoją decyzję Matt, to prawdopodobnie właściwa decyzja na twoim stanowisku. Jednak weź pod uwagę następujące kwestie: * Ktoś inny z Twojego zespołu decyduje, że potrzebuje procedury zamiany wielkości liter. Wdrażają to. Masz teraz ~ 20 linii do utrzymania. Gdybyś używał biblioteki, miałbyś ~ 2. I nie zapomnij o testach jednostkowych! * Zaakceptowana odpowiedź ma wadę polegającą na tym, że nazwa metody nie opisuje, co robi kod. Dobrze ponownie użyty interfejs API, taki jak zwykłe rzeczy, rzadko ma takie wady. Chodzi o to, że konserwacja to największy koszt oprogramowania. Ogólnie rzecz biorąc, ponowne użycie jest dobrym pomysłem.
Dan Gravell
2
Aby „uzyskać dostęp do tego konkretnego pakietu”, upuść repo1.maven.org/maven2/commons-lang/commons-lang/2.5/… do swojej ścieżki klas. Artefakt Mavena to common-lang: commons-lang: 2.5 i jest łatwo dostępny w Maven Central.
Hendy Irawan
90
static String toCamelCase(String s){
   String[] parts = s.split("_");
   String camelCaseString = "";
   for (String part : parts){
      camelCaseString = camelCaseString + toProperCase(part);
   }
   return camelCaseString;
}

static String toProperCase(String s) {
    return s.substring(0, 1).toUpperCase() +
               s.substring(1).toLowerCase();
}

Uwaga : musisz dodać walidację argumentów.

Krzyż
źródło
1
Niezła odpowiedź, ale byłoby trochę lepiej, gdyby nazwa metody opisywała fakt, że łańcuch został podzielony lub że logika została poddana zewnętrznej kontroli, a wywołania metody wyrównane jako potok, np. „THIS_IS_AN_EXAMPLE_STRING” .removeUnderscores (). ToCamelCase () To jest bardziej wielokrotnego użytku.
Dan Gravell
1
Niekoniecznie jest to lepsze (chociaż tak, jest bardziej wielokrotnego użytku). Jeśli chodzi o konwencje formatowania nazw, wielkie litery mogą / nie oznaczają, że nie używa się znaków podkreślenia; na odwrocie monety znajdują się konwencje, które określają użycie znaków podkreślenia. Więc moim zdaniem jest to tylko metoda konwersji z jednego formatu na inny.
Matt Ball
58
Biblioteka Google guava ma bardziej ogólne wyliczenie narzędzi do konwersji między powszechnymi konwencjami. W tym przypadku byś zrobił String result = CaseFormat.UPPER_UNDERSCORE.to(CaseFormat.UPPER_CAMEL, "THIS_IS_AN_EXAMPLE_STRING");. Zobacz com.google.common.base.CaseFormat javadoc .
George Hawkins
1
Ta odpowiedź napotka problemy, gdy jest używana w lokalizacjach takich jak turecki ... Jeśli twój kod ma być używany w wielu lokalizacjach, użyj toUpperCase (Locale) i toLowercase (Locale) .. a nie tych, które zależą od domyślnego locale.
vkraemer
2
@DanGravell: po usunięciu podkreślenia nie można już odróżnić słów.
njzk2
18

Z Apache Commons Lang3 lib jest to bardzo proste.

import org.apache.commons.lang3.StringUtils;
import org.apache.commons.lang3.text.WordUtils;

public String getName(String text) {
  return StringUtils.remove(WordUtils.capitalizeFully(text, '_'), "_");
}

Przykład:

getName("SOME_CONSTANT");

Daje:

"SomeConstant"
librucha
źródło
2
W przypadku nazwy zmiennej nie jest to poprawne, ponieważ nazwa musi zaczynać się od małych liter.
Seby,
9
public static void main(String[] args) {
    String start = "THIS_IS_A_TEST";
    StringBuffer sb = new StringBuffer();
    for (String s : start.split("_")) {
        sb.append(Character.toUpperCase(s.charAt(0)));
        if (s.length() > 1) {
            sb.append(s.substring(1, s.length()).toLowerCase());
        }
    }
    System.out.println(sb);
}
Yishai
źródło
3
test s.length nie jest konieczny
njzk2
9

Oto fragment kodu, który może pomóc:

String input = "ABC_DEF";
StringBuilder sb = new StringBuilder();
for( String oneString : input.toLowerCase().split("_") )
{
    sb.append( oneString.substring(0,1).toUpperCase() );
    sb.append( oneString.substring(1) );
}

// sb now holds your desired String
Alex B.
źródło
To rozwiązanie jest odpowiednie dla obudowy ALL_UPPER do Camel. Ale niewielka zmiana w programie może również obsłużyć MixED_case lub small_case (snake case). Zasugerowałem zmianę, jeśli jest to dozwolone.
sud007
6

Przykład języka Java 1.8 przy użyciu strumieni

String text = "THIS_IS_SOME_TEXT";

String bactrianCamel = Stream.of(text.split("[^a-zA-Z0-9]"))
        .map(v -> v.substring(0, 1).toUpperCase() + v.substring(1).toLowerCase())
        .collect(Collectors.joining());
String dromedaryCamel = bactrianCamel.toLowerCase().substring(0, 1) + bactrianCamel.substring(1); 

System.out.printf("%s is now %s%n", text, dromedaryCamel); 

THIS_IS_SOME_TEXT jest teraz thisIsSomeText

Mikrofon
źródło
Podoba mi się ta odpowiedź, ale ma wadę, jeśli ciąg wejściowy jest już w przypadku wielbłąda, w którym to przypadku zmniejsza wielkość całego wejścia. np. abcDef staje się abcdef.
mrswadge
Test przeprowadzony text.matches( "([a-z]+[a-zA-Z0-9]+)+" )przed osłoną wielbłąda jest prawdopodobnie rozsądnym obejściem problemu z dolną osłoną.
mrswadge
2

Nie jestem pewien, ale myślę, że mogę zużywać mniej pamięci i uzyskać niezawodną wydajność, robiąc to znak po znaku. Robiłem coś podobnego, ale w pętlach w wątkach w tle, więc na razie próbuję. Miałem pewne doświadczenia z tym, że String.split był droższy niż oczekiwano. Pracuję na Androidzie i spodziewam się, że czkawka GC będzie większym problemem niż użycie procesora.

  public static String toCamelCase(String value) {
    StringBuilder sb = new StringBuilder();

    final char delimChar = '_';
    boolean lower = false;
    for (int charInd = 0; charInd < value.length(); ++charInd) {
      final char valueChar = value.charAt(charInd);
      if (valueChar == delimChar) {
        lower = false;
      } else if (lower) {
        sb.append(Character.toLowerCase(valueChar));
      } else {
        sb.append(Character.toUpperCase(valueChar));
        lower = true;
      }
    }

    return sb.toString();
  }

Wskazówka, że ​​String.split jest kosztowna, polega na tym, że jego wejście jest wyrażeniem regularnym (a nie char, jak String.indexOf) i zwraca tablicę (zamiast powiedzieć iterator, ponieważ pętla używa tylko jednej rzeczy naraz). Plus przypadki, takie jak „AB_AB_AB_AB_AB_AB ...” zmniejszają wydajność dowolnej kopii zbiorczej, aw przypadku długich ciągów wykorzystują o rząd wielkości więcej pamięci niż ciąg wejściowy.

Podczas gdy pętla przez znaki nie ma przypadku kanonicznego. Więc dla mnie narzut niepotrzebnego wyrażenia regularnego i tablicy wydaje się generalnie mniej korzystny (rezygnacja z możliwej wydajności masowego kopiowania). Zainteresowany opiniami / poprawkami, dzięki.

leorleor
źródło
2
public String withChars(String inputa) {
    String input = inputa.toLowerCase();
    StringBuilder sb = new StringBuilder();
    final char delim = '_';
    char value;
    boolean capitalize = false;
    for (int i=0; i<input.length(); ++i) {
        value = input.charAt(i);
        if (value == delim) {
            capitalize = true;
        }
        else if (capitalize) {
            sb.append(Character.toUpperCase(value));
            capitalize = false;
        }
        else {
            sb.append(value);
        }
    }

    return sb.toString();
}

public String withRegex(String inputa) {
    String input = inputa.toLowerCase();
    String[] parts = input.split("_");
    StringBuilder sb = new StringBuilder();
    sb.append(parts[0]);
    for (int i=1; i<parts.length; ++i) {
        sb.append(parts[i].substring(0,1).toUpperCase());
        sb.append(parts[i].substring(1));
    }

    return sb.toString();
}

Czasy: w milisekundach.

Iterations = 1000
WithChars: start = 1379685214671 end = 1379685214683 diff = 12
WithRegex: start = 1379685214683 end = 1379685214712 diff = 29

Iterations = 1000
WithChars: start = 1379685217033 end = 1379685217045 diff = 12
WithRegex: start = 1379685217045 end = 1379685217077 diff = 32

Iterations = 1000
WithChars: start = 1379685218643 end = 1379685218654 diff = 11
WithRegex: start = 1379685218655 end = 1379685218684 diff = 29

Iterations = 1000000
WithChars: start = 1379685232767 end = 1379685232968 diff = 201
WithRegex: start = 1379685232968 end = 1379685233649 diff = 681

Iterations = 1000000
WithChars: start = 1379685237220 end = 1379685237419 diff = 199
WithRegex: start = 1379685237419 end = 1379685238088 diff = 669

Iterations = 1000000
WithChars: start = 1379685239690 end = 1379685239889 diff = 199
WithRegex: start = 1379685239890 end = 1379685240585 diff = 695

Iterations = 1000000000
WithChars: start = 1379685267523 end = 1379685397604 diff = 130081
WithRegex: start = 1379685397605 end = 1379685850582 diff = 452977
Srisa
źródło
Super, czy to iteracja z wejściem „THIS_IS_AN_EXAMPLE_STRING”?
leorleor,
@leorleor Iteration = 1000000000 WithChars: start = 1387547394726 end = 1387547889896 diff = 495170 WithRegex: start = 1387547889897 end = 1387548944739 diff = 1054842
Srisa
1

Możesz użyć org.modeshape.common.text.Inflector .

Konkretnie:

String camelCase(String lowerCaseAndUnderscoredWord,
    boolean uppercaseFirstLetter, char... delimiterChars) 

Domyślnie ta metoda konwertuje ciągi na UpperCamelCase.

Artefakt Mavena to: org.modeshape: modeshape-common: 2.3.0

w repozytorium JBoss: https://repository.jboss.org/nexus/content/repositories/releases

Oto plik JAR: https://repository.jboss.org/nexus/content/repositories/releases/org/modeshape/modeshape-common/2.3.0.Final/modeshape-common-2.3.0.Final.jar

Hendy Irawan
źródło
1

Możesz także spróbować:

 public static String convertToNameCase(String s)
    {
        if (s != null)
        {
            StringBuilder b = new StringBuilder();
            String[] split = s.split(" ");
            for (String srt : split)
            {
                if (srt.length() > 0)
                {
                    b.append(srt.substring(0, 1).toUpperCase()).append(srt.substring(1).toLowerCase()).append(" ");
                }
            }
            return b.toString().trim();
        }
        return s;
    }
Ashish
źródło
1
protected String toCamelCase(String input) {
    if (input == null) {
        return null;
    }

    if (input.length() == 0) {
        return "";
    }

    // lowercase the first character
    String camelCaseStr = input.substring(0, 1).toLowerCase();

    if (input.length() > 1) {
        boolean isStartOfWord = false;

        for (int i = 1; i < input.length(); i++) {
            char currChar = input.charAt(i);
            if (currChar == '_') {
                // new word. ignore underscore
                isStartOfWord = true;
            } else if (Character.isUpperCase(currChar)) {
                // capital letter. if start of word, keep it
                if (isStartOfWord) {
                    camelCaseStr += currChar;
                } else {
                    camelCaseStr += Character.toLowerCase(currChar);
                }
                isStartOfWord = false;
            } else {
                camelCaseStr += currChar;
                isStartOfWord = false;
            }
        }
    }

    return camelCaseStr;
}
Muzikant
źródło
1
public String CamelCase(String str)
{
    String CamelCase="";
    String parts[] = str.split("_");
    for(String part:parts)
    {
        String as=part.toLowerCase();
        int a=as.length();
        CamelCase = CamelCase + as.substring(0, 1).toUpperCase()+ as.substring(1,a);    
    }
    return CamelCase;
}

Jest to najprostszy program do konwersji na CamelCase. mam nadzieję, że ci to pomoże ...

XORG_99
źródło
0

Przekształci się Enum Constantw Camel Case. Byłoby pomocne dla każdego, kto szuka takiej funkcjonalności.

public enum TRANSLATE_LANGUAGES {
        ARABIC("ar"), BULGARIAN("bg"), CATALAN("ca"), CHINESE_SIMPLIFIED("zh-CN"), CHINESE_TRADITIONAL("zh-TW"), CZECH("cs"), DANISH("da"), DUTCH("nl"), ENGLISH("en"), ESTONIAN("et"), FINNISH("fi"), FRENCH(
                "fr"), GERMAN("de"), GREEK("el"), HAITIAN_CREOLE("ht"), HEBREW("he"), HINDI("hi"), HMONG_DAW("mww"), HUNGARIAN("hu"), INDONESIAN("id"), ITALIAN("it"), JAPANESE("ja"), KOREAN("ko"), LATVIAN(
                "lv"), LITHUANIAN("lt"), MALAY("ms"), NORWEGIAN("no"), PERSIAN("fa"), POLISH("pl"), PORTUGUESE("pt"), ROMANIAN("ro"), RUSSIAN("ru"), SLOVAK("sk"), SLOVENIAN("sl"), SPANISH("es"), SWEDISH(
                "sv"), THAI("th"), TURKISH("tr"), UKRAINIAN("uk"), URDU("ur"), VIETNAMESE("vi");

        private String code;

        TRANSLATE_LANGUAGES(String language) {
            this.code = language;
        }

        public String langCode() {
            return this.code;
        }

        public String toCamelCase(TRANSLATE_LANGUAGES lang) {
            String toString = lang.toString();
            if (toString.contains("_")) {
                String st = toUpperLowerCase(toString.split("_"));
            }

            return "";
        }

        private String toUpperLowerCase(String[] tempString) {
            StringBuilder builder = new StringBuilder();

            for (String temp : tempString) {

                String char1 = temp.substring(0, 1);
                String restString = temp.substring(1, temp.length()).toLowerCase();
                builder.append(char1).append(restString).append(" ");

            }

            return builder.toString();
        }
    }
AZ_
źródło
0

Jeszcze jedno rozwiązanie tego problemu może wyglądać następująco.

public static String toCamelCase(String str, String... separators) {
    String separatorsRegex = "\\".concat(org.apache.commons.lang3.StringUtils.join(separators, "|\\"));
    List splits = Arrays.asList(str.toLowerCase().split(separatorsRegex));
    String capitalizedString = (String)splits.stream().map(WordUtils::capitalize).reduce("", String::concat);
    return capitalizedString.substring(0, 1).toLowerCase() + capitalizedString.substring(1);
}
Sajani
źródło
0
public static final String  UPPER_CAMEL = "initUp";
public static final String  LOWER_CAMEL = "initLow";

public String toCamel(String src, String separator, String format) {
    StringBuilder builder = new StringBuilder(src.toLowerCase());
    int len = builder.length();

    for (int idx = builder.indexOf(separator); idx > 0 && idx < len; idx = builder.indexOf(separator, idx)) {
        builder = builder.replace(idx, idx + 2, (String.valueOf(builder.charAt(idx + 1)).toUpperCase()));
    }

    switch (format) {
    case LOWER_CAMEL:
        builder.setCharAt(0, Character.toLowerCase(builder.charAt(0)));
        break;
    default:
        builder.setCharAt(0, Character.toUpperCase(builder.charAt(0)));
        break;
    }

    return builder.toString();

}

Wywołanie jako

toCamel("THIS_IS_AN_EXAMPLE_STRING", "_", UPPER_CAMEL)

Czas wykonania: 14 ms

Arindam
źródło
0

Prosty snnipet:

 public static String camelCase(String in) {
    if (in == null || in.length() < 1) { return ""; } //validate in
    String out = "";
    for (String part : in.toLowerCase().split("_")) {
        if (part.length() < 1) { //validate length
            continue;
        }
        out += part.substring(0, 1).toUpperCase();
        if (part.length() > 1) { //validate length
            out += part.substring(1);
        }
    }
    return out;
}
fitorec
źródło
-2

Java 8 dla wielu ciągów:

import com.google.common.base.CaseFormat;



String camelStrings = "YOUR_UPPER, YOUR_TURN, ALT_TAB";

List<String> camelList = Arrays.asList(camelStrings.split(","));
camelList.stream().forEach(i -> System.out.println(CaseFormat.UPPER_UNDERSCORE.to(CaseFormat.UPPER_CAMEL, i) + ", "));
DET66
źródło
1
Zduplikowana odpowiedź
Mark Jeronimus
-2
    protected String toCamelCase(CaseFormat caseFormat, String... words){
        if (words.length  == 0){
          throw new IllegalArgumentException("Word list is empty!");
        }

        String firstWord = words[0];
        String [] restOfWords = Arrays.copyOfRange(words, 1, words.length);

        StringBuffer buffer = new StringBuffer();
        buffer.append(firstWord);
        Arrays.asList(restOfWords).stream().forEach(w->buffer.append("_"+ w.toUpperCase()));

        return CaseFormat.UPPER_UNDERSCORE.to(caseFormat, buffer.toString());

    }
Vladimir
źródło
1
CaseFormatnie jest standardowym interfejsem API. Zduplikowana odpowiedź, jeśli to guawa.
Mark Jeronimus