XPath (XML Path Language) je počítačový jazyk, pomocí kterého lze adresovat části XML dokumentu. Pomocí tohoto jazyka lze z XML dokumentu vybírat jednotlivé elementy a pracovat s jejich hodnotami a atributy. XPath se používá v mnoha aplikacích XML, mezi nejvýznamnější patří využití v XSLT. Jazyk XPath je standardem vydaným organizací W3C.
Syntaxe jazyka
Základní součástí jazyka je path expression, „výraz popisující cestu“. Taková cesta se zapisuje jako posloupnost přechodů mezi jednotlivými sadami uzlů, oddělených lomítky. Každý přechod je určen pomocí tří složek (některé ovšem nemusí být uvedeny, pokud mají implicitní hodnotu):
- osa (axis),
- test (node test),
- predikát (predicate).
Nejjednodušší zápis používá pouze položky test a má tvar např. /A/B/C
, což označuje množinu elementů C
, které jsou uvnitř elementu B
, které jsou uvnitř elementu A
, který je kořenovým elementem dokumentu. Tento zápis se podobá zápisu cesty k souboru v souborovém systému, nebo zápisu URL. Ve složitějších dotazech může být místo jména dítěte (tj. implicitní osy child
) použit název jiné osy oddělený čtyřtečkou ::
od jména, případně predikát zapsaný jako seznam podmínek v hranatých závorkách. Příkladem takového složitějšího dotazu je /A/B/following-sibling::*[1]
, který vybere všechny (libovolně pojmenované – specifikováno *
) elementy, které jsou prvním elementem následujícím po elementu B
, který je uvnitř kořenového elementu A
.
Specifikace osy
Specifikace osy popisuje směr pohybu po stromové reprezentaci XML dokumentu. Je definováno celkem 13 os:
Specifikace os v XPath
Název osy
|
Zkratka
|
Význam
|
Poznámky
|
ancestor |
|
předek (tj. rodič, jeho rodič, …) |
|
ancestor-or-self |
|
předek nebo aktuální uzel |
|
attribute
|
@
|
atribut
|
attribute::abc lze zkráceně zapsat @abc
|
child |
|
dítě (bezprostřední potomek) |
child::xyz lze zkráceně zapsat xyz
|
descendant |
|
potomek (tj. dítě, jeho dítě, …) |
|
descendant-or-self
|
//
|
potomek nebo aktuální uzel
|
/descendant-or-self::node()/ lze zkráceně zapsat //
|
following |
|
libovolný následující uzel |
|
following-sibling |
|
následující sourozenec |
|
namespace |
|
jmenný prostor |
|
parent
|
..
|
rodič (bezprostřední předek)
|
parent::node() lze zkráceně zapsat ..
|
preceding |
|
libovolný předcházející uzel |
|
preceding-sibling |
|
předcházející sourozenec |
|
self
|
.
|
aktuální uzel
|
self::node() lze zkráceně zapsat .
|
Příklad: Zápis //a/@href
vybere atribut se jménem href
ve všech elementech a
v celém stromě dokumentu.
Zápis . (což je zkratka pro self::node()) se nejčastěji používá v predikátech pro odkaz na právě vybraný uzel.
Například h3[.='See also']
vybere element se jménem h3
v aktuálním kontextu, jehož textový obsah je See also
.
Další výrazy
Kromě výrazů popisujících cestu jsou v XPath definovány také běžnější číselné, logické a jiné výrazy, které se používají nejčastěji v rámci predikátů. Příkladem je výraz popisující cestu //zboží[@sleva >= @cena div 2]
, který najde všechny elementy zboží
, jejichž atribut sleva
má hodnotu nejméně poloviny hodnoty atributu cena
. V podobných výrazech lze používat operátory a funkce ze standardní knihovny.
Příklady
Příklady několika málo XPath výrazů:
- Kořenový element:
/*
- Element
foo
kdekoliv: //foo
- Atribut
edits
elementu group
s atributem name
rovným main
: group[@name="main"]/@edits
Externí odkazy