字符值引用
字符值引用(numeric character reference, NCR)是在标记语言SGML以及派生的如HTML与XML中常见的一种转义序列结构,用来表示Unicode的通用字符集 (UCS)中的单个字符. NCR可以表示在一个特定文档中不能直接编码的字符,而该标记语言阅读器软件把每个NCR当作一个字符来处理。 例如,在ISO/IEC 8859-1编码的网页文件中使用了俄文字母或者希腊字母。由于该编码不支持这些字母,就需要用NCR来表示。网页浏览器可以正确地把这些NCR绘制为相应的西里尔字母或希腊字母。 例子在SGML、HTML、XML中,下述是希腊字母Sigma的有效的字符值引用:
描述标记语言使用的字符编码方法(如ISO-8859),常常不能表示所有的Unicode字符,这就需要使用“转义”机制来处理这些不能编码的字符。 基于SGML的标记语言允许使用7比特ASCII字符(即Unicode的前128个码位)的序列来表示或者说引用任何Unicode字符。基于Unicode字符"码位"的字符引用被称作字符值引用。HTML 4与所有版本的XHTML及XML,这些Unicode字符的码位可以表示为十进制或十六进制。语法如下: 字符U+0026 (&), 后跟随U+0023 (#),后跟随下列选择之一:
上述两种选择情形之后,跟随字符U+003B (;)。 老的版本的HTML不支持十六进制表示法. 另外一种字符引用被称作字符实体引用,允许字符用其名字而不是码位的值来引用。HTML定义了一些字符实体,但是并不多;其它字符只能直接用NCR来引用。 限制通用字符集(UCS)是SGML以及HTML 4的文档字符集,因此缺省地, 用这些标记语言写的文档的所有字符,必须出自UCS. 同时SGML并不禁止引用一个Unicode中未赋予字符的码位, 例如 还存在其它的限制情况。例如在HTML 4中, 參考文獻
参閲外部連結
|