Java: metoda pobierania pozycji dopasowania w ciągu znaków?

138
String match = "hello";
String text = "0123456789hello0123456789";

int position = getPosition(match, text); // should be 10, is there such a method?
hhh
źródło

Odpowiedzi:

259

Rodzina metod, która to robi, to:

Zwraca indeks pierwszego ( lub ostatniego ) wystąpienia określonego podciągu w tym ciągu [wyszukiwanie w przód ( lub wstecz ) począwszy od określonego indeksu].


String text = "0123hello9012hello8901hello7890";
String word = "hello";

System.out.println(text.indexOf(word)); // prints "4"
System.out.println(text.lastIndexOf(word)); // prints "22"

// find all occurrences forward
for (int i = -1; (i = text.indexOf(word, i + 1)) != -1; i++) {
    System.out.println(i);
} // prints "4", "13", "22"

// find all occurrences backward
for (int i = text.length(); (i = text.lastIndexOf(word, i - 1)) != -1; i++) {
    System.out.println(i);
} // prints "22", "13", "4"
smary wielogenowe
źródło
2
lolz, właśnie zrealizowałem przypisanie w pętli while, a następnie wysyłasz zadanie w pętli for +1
hhh
4
@polygenelubricants - Twoje przykłady „znajdź wszystkie wystąpienia” są sprytne. Ale gdybyś to przejrzał, dostałbyś wykład o łatwości utrzymania kodu.
Stephen C
3
Jak byś to napisał? Szczerze pytam, ponieważ nie miałem wcześniej doświadczenia w profesjonalnym recenzowaniu kodu.
polygenelubricants
1
W funkcji znajdź wszystkie wystąpienia zamiast i ++ możemy napisać i + = word.length (). Powinno być nieco szybsze.
Może spoczywać w pokoju
Pierwsza pętla nie znajdzie wszystkich pozycji, jeśli pasuje do jednego znaku. Nie potrzebujesz +1 w drugiej instrukcji pętli for, ponieważ trzecia instrukcja zlicza i ++ try for String text = "0011100"; pasujące słowo char "1" wypisze 2,4 zamiast 2,3,4
Strauteka
40

Działa to przy użyciu wyrażenia regularnego.

String text = "I love you so much";
String wordToFind = "love";
Pattern word = Pattern.compile(wordToFind);
Matcher match = word.matcher(text);

while (match.find()) {
     System.out.println("Found love at index "+ match.start() +" - "+ (match.end()-1));
}

Wynik :

Znaleziono „miłość” pod indeksem 2–5

Główna zasada :

  • Wyszukiwanie regularne od lewej do prawej, a po użyciu dopasowanych znaków nie można go ponownie użyć.
Aldwane Viegan
źródło
19
To działa niesamowicie, ale w tym zdaniu otrzymałem komunikat „Mam chłopaka” :-)
Gaurav Pangam
8

Znalezienie jednego indeksu

Jak powiedzieli inni, użyj, text.indexOf(match)aby znaleźć pojedyncze dopasowanie.

String text = "0123456789hello0123456789";
String match = "hello";
int position = text.indexOf(match); // position = 10

Znajdowanie wielu indeksów

Z powodu komentarza @ StephenC dotyczącego możliwości utrzymania kodu i moich własnych trudności ze zrozumieniem odpowiedzi @polygenelubricants , chciałem znaleźć inny sposób na uzyskanie wszystkich indeksów dopasowania w ciągu tekstowym. Robi to następujący kod (zmodyfikowany na podstawie tej odpowiedzi ):

String text = "0123hello9012hello8901hello7890";
String match = "hello";

int index = text.indexOf(match);
int matchLength = match.length();
while (index >= 0) {  // indexOf returns -1 if no match found
    System.out.println(index);
    index = text.indexOf(match, index + matchLength);
}
Suragch
źródło
2

Użyj string.indexOf, aby uzyskać indeks początkowy.

Anthony Pegram
źródło
2

Możesz uzyskać wszystkie dopasowania w pliku, po prostu przypisując wewnętrzną pętlę while, fajne:

$ javac MatchTest.java 
$ java MatchTest 
1
16
31
46
$ cat MatchTest.java 
import java.util.*;
import java.io.*;

public class MatchTest {
    public static void main(String[] args){
        String match = "hello";
        String text = "hello0123456789hello0123456789hello1234567890hello3423243423232";
        int i =0;
        while((i=(text.indexOf(match,i)+1))>0)
            System.out.println(i);
    }
}
hhh
źródło
2
Sposób przesunięcia iprzez +1prace, ale w dość okrężną drogą. Jak pokazałeś tutaj, zgłasza pierwszy helloo i == 1. O wiele bardziej spójne jest, jeśli zawsze używasz indeksowania opartego na 0.
polygenelubricants
1
... ukradnie twoją rzecz: P Dziękuję.
hhh
2
int match_position=text.indexOf(match);
Powiedział
źródło
1
Proszę wyjaśnij, co zrobiłeś
Fabio
1
@Fabio getPosition (match, text) {int match_position = text.indexOf (match); return match_position;}
Powiedział
1
import java.util.StringTokenizer;

public class Occourence {

  public static void main(String[] args) {
    String key=null,str ="my name noorus my name noorus";        
    int i=0,tot=0;

    StringTokenizer st=new StringTokenizer(str," ");
    while(st.hasMoreTokens())
    {   
        tot=tot+1;
        key = st.nextToken();
        while((i=(str.indexOf(key,i)+1))>0)
        {
            System.out.println("position of "+key+" "+"is "+(i-1));
        }
    }

    System.out.println("total words present in string "+tot);
  }
}
Chan
źródło
1
Czy możesz wyjaśnić, dlaczego to działa i co się dzieje w osłonie wewnętrznej pętli? Dla początkującego czytelnika przydatne może być wyjaśnienie.
Paul Hicks,
1
int indexOf (String str, int fromIndex): Zwraca indeks w tym ciągu pierwszego wystąpienia określonego podciągu, zaczynając od określonego indeksu. Jeśli tak się nie stanie, zwracane jest -1. Tutaj wewnętrzna pętla while byłaby w stanie pobrać całe wystąpienie tokenu (tutaj określone przez zmienną o nazwie „klucz”).
Khan
1

Mam duży kod, ale działa dobrze ....

   class strDemo
   { 
       public static void main(String args[])
       {
       String s1=new String("The Ghost of The Arabean Sea");
           String s2=new String ("The");
           String s6=new String ("ehT");
           StringBuffer s3;
           StringBuffer s4=new StringBuffer(s1);
           StringBuffer s5=new StringBuffer(s2);
           char c1[]=new char[30];
           char c2[]=new char[5];
           char c3[]=new char[5];
           s1.getChars(0,28,c1,0);
           s2.getChars(0,3,c2,0);
           s6.getChars(0,3,c3,0); s3=s4.reverse();      
           int pf=0,pl=0;
           char c5[]=new char[30];
           s3.getChars(0,28,c5,0);
           for(int i=0;i<(s1.length()-s2.length());i++)
           {
               int j=0;
               if(pf<=1)
               {
                  while (c1[i+j]==c2[j] && j<=s2.length())
                  {           
                    j++;
                    System.out.println(s2.length()+" "+j);
                    if(j>=s2.length())
                    {
                       System.out.println("first match of(The) :->"+i);

                     }
                     pf=pf+1;         
                  }   
             }                
       }       
         for(int i=0;i<(s3.length()-s6.length()+1);i++)
        {
            int j=0;
            if(pl<=1)
            {
             while (c5[i+j]==c3[j] && j<=s6.length())
             {
                 j++;
                 System.out.println(s6.length()+" "+j);
                 if(j>=s6.length())
                 {
                         System.out.println((s3.length()-i-3));
                         pl=pl+1;

                 }   
                }                 
              }  
           }  
         }
       }
Nitika Goswami
źródło
2
umieść wyjaśnienie / komentarz w swoim kodzie ułatwi ludziom zrozumienie Twojego kodu, zwłaszcza że jest to długi kod :)
himawan_r
1
//finding a particular word any where inthe string and printing its index and occurence  
class IndOc
{
    public static void main(String[] args) 
    {
        String s="this is hyderabad city and this is";
        System.out.println("the given string is ");
        System.out.println("----------"+s);
        char ch[]=s.toCharArray();
        System.out.println(" ----word is found at ");
        int j=0,noc=0;
        for(int i=0;i<ch.length;i++)
        {
            j=i;

            if(ch[i]=='i' && ch[j+1]=='s')
            {
                System.out.println(" index "+i);
            noc++;  
            }

        }
        System.out.println("----- no of occurences are "+noc);

    }
}
shravan
źródło
3
Chociaż ten kod może odpowiedzieć na pytanie, dostarczenie dodatkowego kontekstu dotyczącego tego, jak i / lub dlaczego rozwiązuje problem, poprawiłoby długoterminową wartość odpowiedzi.
Peter Brittain
1
    String match = "hello";
    String text = "0123456789hello0123456789hello";

    int j = 0;
    String indxOfmatch = "";

    for (int i = -1; i < text.length()+1; i++) {
        j =  text.indexOf("hello", i);
        if (i>=j && j > -1) {
            indxOfmatch += text.indexOf("hello", i)+" ";
        }
    }
    System.out.println(indxOfmatch);
Shukhrat Aliyev
źródło
0

Jeśli masz zamiar szukać „n” dopasowań szukanego ciągu, polecam użycie wyrażeń regularnych . Mają stromą krzywą uczenia się, ale pozwolą Ci zaoszczędzić godziny, jeśli chodzi o złożone wyszukiwania.

JPeraita
źródło
2
Sugestia: uwzględnij przykład pobierania pozycji z wyrażenia regularnego. Po prostu „spróbuj użyć wyrażeń regularnych” jest raczej prostym komentarzem i nie odpowiada na pytanie OP.
Brad Koch,
0

dla wielu wystąpień i znak znaleziony w ciągu ?? tak lub nie

import java.io.BufferedReader;
import java.io.InputStreamReader;

public class SubStringtest {

    public static void main(String[] args)throws Exception {
    BufferedReader br=new BufferedReader(new InputStreamReader(System.in));
     System.out.println("enter the string");
    String str=br.readLine();
    System.out.println("enter the character which you want");
    CharSequence ch=br.readLine();   
    boolean bool=str.contains(ch);
    System.out.println("the character found is " +bool);
    int position=str.indexOf(ch.toString());

    while(position>=0){
        System.out.println("the index no of character is " +position); 
        position=str.indexOf(ch.toString(),position+1);
    }


    }

}
Sarthak Ghosh
źródło
0
public int NumberWordsInText(String FullText_, String WordToFind_, int[] positions_)
   {
    int iii1=0;
    int iii2=0;
    int iii3=0;
    while((iii1=(FullText_.indexOf(WordToFind_,iii1)+1))>0){iii2=iii2+1;}
    // iii2 is the number of the occurences
    if(iii2>0) {
        positions_ = new int[iii2];
        while ((iii1 = (FullText_.indexOf(WordToFind_, iii1) + 1)) > 0) {
            positions_[iii3] = iii1-1;
            iii3 = iii3 + 1;
            System.out.println("position=" + positions_[iii3 - 1]);
        }
    }
    return iii2;
}
yacine
źródło
Mam nadzieję, że to rozwiąże problem, ale proszę dodać wyjaśnienie swojego kodu, aby użytkownik uzyskał doskonałe zrozumienie, czego naprawdę chce.
Jaimil Patel