XPath

XPath
Paradigmadotazovací jazyk
VývojářW3C
První oznámení1999
Poslední verze3.1 (21. března 2017)
Ovlivněn jazykyXSLT, XPointer
Ovlivnil jazykyXML Schema, XForms

XPath (XML Path Language) je počítačový jazyk, pomocí kterého lze adresovat části XML dokumentu. Pomocí tohoto jazyka lze z XML dokumentu vybírat jednotlivé elementy a pracovat s jejich hodnotami a atributy. XPath se používá v mnoha aplikacích XML, mezi nejvýznamnější patří využití v XSLT. Jazyk XPath je standardem vydaným organizací W3C.

Syntaxe jazyka

Základní součástí jazyka je path expression, „výraz popisující cestu“. Taková cesta se zapisuje jako posloupnost přechodů mezi jednotlivými sadami uzlů, oddělených lomítky. Každý přechod je určen pomocí tří složek (některé ovšem nemusí být uvedeny, pokud mají implicitní hodnotu):

  • osa (axis),
  • test (node test),
  • predikát (predicate).

Nejjednodušší zápis používá pouze položky test a má tvar např. /A/B/C, což označuje množinu elementů C, které jsou uvnitř elementu B, které jsou uvnitř elementu A, který je kořenovým elementem dokumentu. Tento zápis se podobá zápisu cesty k souboru v souborovém systému, nebo zápisu URL. Ve složitějších dotazech může být místo jména dítěte (tj. implicitní osy child) použit název jiné osy oddělený čtyřtečkou :: od jména, případně predikát zapsaný jako seznam podmínek v hranatých závorkách. Příkladem takového složitějšího dotazu je /A/B/following-sibling::*[1], který vybere všechny (libovolně pojmenované – specifikováno *) elementy, které jsou prvním elementem následujícím po elementu B, který je uvnitř kořenového elementu A.

Specifikace osy

Specifikace osy popisuje směr pohybu po stromové reprezentaci XML dokumentu. Je definováno celkem 13 os:

Specifikace os v XPath
Název osy Zkratka Význam Poznámky
ancestor předek (tj. rodič, jeho rodič, …)
ancestor-or-self předek nebo aktuální uzel
attribute @ atribut attribute::abc lze zkráceně zapsat @abc
child dítě (bezprostřední potomek) child::xyz lze zkráceně zapsat xyz
descendant potomek (tj. dítě, jeho dítě, …)
descendant-or-self // potomek nebo aktuální uzel /descendant-or-self::node()/ lze zkráceně zapsat //
following libovolný následující uzel
following-sibling následující sourozenec
namespace jmenný prostor
parent .. rodič (bezprostřední předek) parent::node() lze zkráceně zapsat ..
preceding libovolný předcházející uzel
preceding-sibling předcházející sourozenec
self . aktuální uzel self::node() lze zkráceně zapsat .

Příklad: Zápis //a/@href vybere atribut se jménem href ve všech elementech a v celém stromě dokumentu. Zápis . (což je zkratka pro self::node()) se nejčastěji používá v predikátech pro odkaz na právě vybraný uzel. Například h3[.='See also'] vybere element se jménem h3 v aktuálním kontextu, jehož textový obsah je See also.

Další výrazy

Kromě výrazů popisujících cestu jsou v XPath definovány také běžnější číselné, logické a jiné výrazy, které se používají nejčastěji v rámci predikátů. Příkladem je výraz popisující cestu //zboží[@sleva >= @cena div 2], který najde všechny elementy zboží, jejichž atribut sleva má hodnotu nejméně poloviny hodnoty atributu cena. V podobných výrazech lze používat operátory a funkce ze standardní knihovny.

Příklady

Příklady několika málo XPath výrazů:

  • Kořenový element: /*
  • Element foo kdekoliv: //foo
  • Atribut edits elementu group s atributem name rovným main: group[@name="main"]/@edits

Externí odkazy