Zamień tylko niektóre grupy na Regex

191

Załóżmy, że mam następujące wyrażenie regularne:

-(\d+)-

i chcę, aby zastąpić, przy użyciu C #, Grupę 1 (\d+)z AA, aby uzyskać:

-AA-

Teraz zastępuję go za pomocą:

var text = "example-123-example";
var pattern = @"-(\d+)-";
var replaced = Regex.Replace(text, pattern, "-AA-"); 

Ale tak naprawdę nie podoba mi się to, ponieważ jeśli _(\d+)_zamiast tego zmienię wzór, aby dopasować , będę musiał również zmienić ciąg zastępujący _AA_, co jest sprzeczne z zasadą DRY.

Szukam czegoś takiego:

Zachowaj dopasowany tekst dokładnie tak, jak jest, ale zmień Grupę 1 według this texti Grupę 2 według another text...

Edycja:
To był tylko przykład. Po prostu szukam ogólnego sposobu robienia tego, co powiedziałem powyżej.

Powinien działać dla:

anything(\d+)more_text i każdy wzór, jaki możesz sobie wyobrazić.

Wszystko, co chcę zrobić, to zastąpić tylko grupy i zachować resztę meczu.

Oscar Mederos
źródło

Odpowiedzi:

307

Dobrym pomysłem może być zamknięcie wszystkiego w grupach, bez względu na to, czy trzeba je zidentyfikować, czy nie. W ten sposób możesz użyć ich w zastępującym ciągu. Na przykład:

var pattern = @"(-)(\d+)(-)";
var replaced = Regex.Replace(text, pattern, "$1AA$3"); 

lub za pomocą MatchEvaluator:

var replaced = Regex.Replace(text, pattern, m => m.Groups[1].Value + "AA" + m.Groups[3].Value);

Innym sposobem, nieco niechlujnym, może być użycie lookbehind / lookahead:

(?<=-)(\d+)(?=-)

bluepnume
źródło
17
Zredagowałem twoją odpowiedź, aby podać więcej informacji, ale to, co powiedziałeś, jest całkowicie poprawne. Nie wiem, jak tęskniłem za tym, że mogłem umieścić wszystko w grupach, bez względu na to, czy ich użyję, czy nie :) . Moim zdaniem to rozwiązanie jest znacznie lepsze i czystsze niż korzystanie z funkcji lookahead i lookbehinds.
Oscar Mederos
mała literówka, twój zastępczy wzór powinien wynosić 1 $ AA 3 $
Myster
1
Aby to zadziałało, musiałem dodać .Valuedo m.Groups[1]itp.
jbeldock
11
Warto również zauważyć - jeśli tekst zastępujący zaczyna się od cyfry, pierwsze rozwiązanie („1 USD A 3 USD”) nie będzie działać zgodnie z przeznaczeniem!
Bertie,
2
@OscarMederos możesz również używać grup nie przechwytujących - dobre dla grup, których nie używasz. W (?:foo)(bar), $1zastąpi bar. więcej szczegółów
Patrick
34

Możesz to zrobić za pomocą lookahead i lookbehind :

var pattern = @"(?<=-)\d+(?=-)";
var replaced = Regex.Replace(text, pattern, "AA"); 
Łukasz
źródło
19

Potrzebowałem tego i stworzyłem dla niego następującą metodę rozszerzenia:

public static class RegexExtensions
{
    public static string ReplaceGroup(
        this Regex regex, string input, string groupName, string replacement)
    {
        return regex.Replace(
            input,
            m =>
            {
                var group = m.Groups[groupName];
                var sb = new StringBuilder();
                var previousCaptureEnd = 0;
                foreach (var capture in group.Captures.Cast<Capture>())
                {
                    var currentCaptureEnd =
                        capture.Index + capture.Length - m.Index;
                    var currentCaptureLength =
                        capture.Index - m.Index - previousCaptureEnd;
                    sb.Append(
                        m.Value.Substring(
                            previousCaptureEnd, currentCaptureLength));
                    sb.Append(replacement);
                    previousCaptureEnd = currentCaptureEnd;
                }
                sb.Append(m.Value.Substring(previousCaptureEnd));

                return sb.ToString();
            });
    }
}

Stosowanie:

var input = @"[assembly: AssemblyFileVersion(""2.0.3.0"")][assembly: AssemblyFileVersion(""2.0.3.0"")]";
var regex = new Regex(@"AssemblyFileVersion\(""(?<version>(\d+\.?){4})""\)");


var result = regex.ReplaceGroup(input , "version", "1.2.3");

Wynik:

[assembly: AssemblyFileVersion("1.2.3")][assembly: AssemblyFileVersion("1.2.3")]
Daniel Hilgarth
źródło
Podoba mi się ta implementacja, ale nie zastępuje ona wielu dopasowań. Opublikowałem wersję, która ma
Vladimir
13

Jeśli nie chcesz zmieniać wzorca, możesz użyć właściwości Indeks grupy i Długość dopasowanej grupy.

var text = "example-123-example";
var pattern = @"-(\d+)-";
var regex = new RegEx(pattern);
var match = regex.Match(text);

var firstPart = text.Substring(0,match.Groups[1].Index);    
var secondPart = text.Substring(match.Groups[1].Index + match.Groups[1].Length);
var fullReplace = firstPart + "AA" + secondPart;
Dick Verweij
źródło
Pamiętaj, że zakłada to i będzie działać tylko przy pierwszym wystąpieniu meczu.
Bartosz
5

Oto kolejna fajna czysta opcja, która nie wymaga zmiany wzoru.

        var text = "example-123-example";
        var pattern = @"-(\d+)-";

        var replaced = Regex.Replace(text, pattern, (_match) =>
        {
            Group group = _match.Groups[1];
            string replace = "AA";
            return String.Format("{0}{1}{2}", _match.Value.Substring(0, group.Index - _match.Index), replace, _match.Value.Substring(group.Index - _match.Index + group.Length));
        });
curlyhairedgenius
źródło
0

wykonaj poniższe kodowanie, aby uzyskać oddzielną grupę zastępczą.

new_bib = Regex.Replace(new_bib, @"(?s)(\\bibitem\[[^\]]+\]\{" + pat4 + @"\})[\s\n\v]*([\\\{\}a-zA-Z\.\s\,\;\\\#\\\$\\\%\\\&\*\@\\\!\\\^+\-\\\=\\\~\\\:\\\" + dblqt + @"\\\;\\\`\\\']{20,70})", delegate(Match mts)
                    {
                           var fg = mts.Groups[0].Value.ToString(); 
                           var fs = mts.Groups[1].Value.ToString();
                           var fss = mts.Groups[2].Value.ToString();
                               fss = Regex.Replace(fss, @"[\\\{\}\\\#\\\$\\\%\\\&\*\@\\\!\\\^+\-\\\=\\\~\\\:\\\" + dblqt + @"\\\;\\\`\\\']+", "");
                           return "<augroup>" + fss + "</augroup>" + fs;
                    }, RegexOptions.IgnoreCase);
BalaS
źródło
0

Oto wersja podobna do Daniela, ale zastępująca wiele dopasowań:

public static string ReplaceGroup(string input, string pattern, RegexOptions options, string groupName, string replacement)
{
    Match match;
    while ((match = Regex.Match(input, pattern, options)).Success)
    {
        var group = match.Groups[groupName];

        var sb = new StringBuilder();

        // Anything before the match
        if (match.Index > 0)
            sb.Append(input.Substring(0, match.Index));

        // The match itself
        var startIndex = group.Index - match.Index;
        var length = group.Length;
        var original = match.Value;
        var prior = original.Substring(0, startIndex);
        var trailing = original.Substring(startIndex + length);
        sb.Append(prior);
        sb.Append(replacement);
        sb.Append(trailing);

        // Anything after the match
        if (match.Index + match.Length < input.Length)
            sb.Append(input.Substring(match.Index + match.Length));

        input = sb.ToString();
    }

    return input;
Vladimir
źródło