XPath - wybieranie elementów o równej wartości

110

W Xpath chcę wybrać elementy, które mają określoną wartość.

Przykładowe dane XML:

<aaa id="11" >
    <aaa id="21" >
        <aaa id="31" ></aaa>
        <bbb id="32" >
            <aaa id="41" ></aaa>
            <bbb id="42" ></bbb>
            <ccc id="43" ></ccc>
            <ddd id="44" >qwerty</ddd>
            <ddd id="45" ></ddd>
            <ddd id="46" ></ddd>
        </bbb>
    </aaa>
    <bbb id="22" >
         <aaa id="33" >qwerty</aaa>
         <bbb id="34" ></bbb>
         <ccc id="35" ></ccc>
         <ddd id="36" ></ddd>
         <ddd id="37" ></ddd>
         <ddd id="38" ></ddd>
    </bbb>
    <ccc id="23" >qwerty</ccc>
    <ccc id="24" ></ccc>
 </aaa>

Teraz, używając XPath:

//ccc[.='qwerty']

Uzyskuję prawidłowe, oczekiwane rezultaty:

Name    Value
ccc     qwerty

Teraz, używając XPath:

//aaa[.='qwerty']

Otrzymuję nieoczekiwane wyniki:

Name    Value
aaa      
aaa     qwerty

Szczególnie interesuje mnie to, jak wybrać dowolny element o tej wartości

XPath:

//*[.='qwerty']

Otrzymuję bardzo dziwne nieoczekiwane wyniki:

Name    Value
aaa
bbb
ddd     qwerty
bbb     qwerty
aaa     qwerty
ccc     qwerty

Czy ktoś może wyjaśnić te wyniki i jak naprawić moje wyrażenia XPath, aby uzyskać bardziej oczekiwane wyniki?

deweloper
źródło
1
Ponieważ XPath . =różni się od XPath text() =. Zobacz pasujące węzły tekstowe różni się od pasujących wartości ciągów, aby dowiedzieć się, dlaczego.
kjhughes

Odpowiedzi:

178

Specyfikacja XPath. definiuje wartość ciągu elementu jako konkatenację (w kolejności dokumentu) wszystkich jego elementów podrzędnych węzła tekstowego .

To wyjaśnia „dziwne wyniki”.

„Lepsze” wyniki można uzyskać za pomocą poniższych wyrażeń:

//*[text() = 'qwerty']

Powyższe zaznacza każdy element w dokumencie, który ma co najmniej jedno potomne węzeł tekstowy o wartości „qwerty”.

//*[text() = 'qwerty' and not(text()[2])]

Powyższe zaznacza każdy element w dokumencie, który ma tylko jedno potomne węzeł tekstowy, a jego wartością jest: 'qwerty'.

Dimitre Novatchev
źródło
3
@iHeartGreek: Cieszę się, że to działa. A co z akceptacją / głosowaniem za? text()jest jednym z możliwych testów węzłów w XPath, co oznacza „czy to jest węzeł tekstowy?”. Inne nodetests są comment(), processing-instruction()albo po prostu node().
Dimitre Novatchev
15

Próbować

//*[text()='qwerty']ponieważ .jest twoim obecnym elementem

Gregoire
źródło