Unicode 通过已有的书写系统和添加带音标字符的额外的区段支持一些音标文字 和标记法。这些语音学符号产生于已有的文字,通常是拉丁文、希腊文或西里尔文。Unicode中没有专门的“国际音标字符”。除官方标准的国际音标外,这些区段还包括了已被现今标准规范废除的国际音标符号、乌拉尔音标 、过去使用的汉语音调符号等。
音标字符
国际音标 利用来自其他书写系统最常用的标音字母。国际音标常使用拉丁字母、希腊字母和西里尔字母,组合用变音符号还补充语音文本的意义。最后,这些标音字母利用为表达语言学含义特别修订的字母。一个“修饰字母”不是作为独立的字母,但作为前面字符的修饰[ 1] 产生有区别的字素,尤其是在国际音标中。例如,ʰ 不是用来表达它本身,但修饰了前面的符号。因此,tʰ 是单独的区别于t 的国际音标符号。然而,这些“修饰字母”的一部分也用于全音素文字。例如,ʿ 用来转写闪米特语的ayin 或夏威夷语okina ,或者 ˚ 转写阿布哈兹语 ә 。
从国际音标到Unicode
辅音
下表包含了国际音标 用的音位的Unicode码点。加粗的码点表示Unicode图标提供应用程序注释,如U+026D ɭ LATIN SMALL LETTER L WITH RETROFLEX HOOK ,HTML:ɭ
用于“浊卷舌边音”。粗斜体表示字符名称本身标示了发音,如U+0298 ʘ LATIN LETTER BILABIAL CLICK ,HTML:ʘ
双唇
唇齿
齿
齿龈
龈后
卷舌
唇硬腭
塞音
p 0070
b 0062
p̪ 0070 032A
b̪ 0062 032A
t̪ 0074 032A
d̪ 0064 032A
t 0074
d 0064
ʈ 0288
ɖ 0256
内爆音
ɓ̥ 0253 0325
ɓ 0253
ɗ̪ 0257 032A
ɗ 0257
*
挤喉音
pʼ 0070 02BC
t̪ʼ 0074 032A 02BC
tʼ 0074 02BC
ʈʼ 0288 02BC
鼻音
m̥ 006D 0325
m 006D
ɱ̊ 0271 030A
ɱ 0271
n̪̊ 006E 032A 030A
n̪ 006E 032A
n̥ 006E 0325
n 006E
ɳ̊ 0273 030A
ɳ 0273
颤音
ʙ 0299
r̥ 0072 0325
r 0072
*
闪音
ⱱ̟ 2C71 031F
ⱱ 2C71
ɾ 027E
ɽ 027D
边闪音
ɺ 027A
*
擦音
ɸ 0278
β 03B2
f 0066
v 0076
θ 03B8
ð 00F0
s 0073
z 007A
ʃ 0283
ʒ 0292
ʂ 0282
ʐ 0290
边擦音
ɬ 026C
ɮ 026E
*
挤喉擦音
sʼ 0073 02BC
ʃʼ 0283 02BC
挤喉边擦音
ɬʼ 026C 02BC
敲击音
ʬ 02AC
ʭ 02AD
近音
β̞̊ 03B2 031E 030A
β̞ 03B2 031E
ʋ̥ 028B 0325
ʋ 028B
ð̞ 00F0 031E
ɹ̥ 0279 0325
ɹ 0279
ɻ̊ 027B 030A
ɻ 027B
ɥ̊ 0265 030A
ɥ 0265
边近音
l̥ 006C 0325
l 006C
ɭ 026D
搭嘴音
ʘ 0298
ǀ 01C0
ǃ 01C3
ǃ / ǂ 01C3 / 01C2
边搭嘴音
*
ǁ 01C1
元音
下表描述了元音及其Unicode / UCS码点。表格中成对的元音分别地表示不圆唇和圆唇的变化。另外,带Unicode名称的字符以粗体标出。带有额外应用程序注释的字符以粗斜体标出。直接借用其他文字(拉丁字母、希腊字母或西里尔字母)的以斜体标出。
Unicode区段
不同于标准拉丁字母或希腊字母如m和ɛ,这些符号放在特定的语音学用区段:
从Unicode区段到文字
语音学用的字符放在六个Unicode区段 中。
国际音标扩展(U+0250–02AF)
占位修饰符号(U+02B0–02FF)
占位修饰符号区段里面的字符用来和前面的字母组成一个单元(即“修饰”)。如字符U+02B0 ʰ MODIFIER LETTER SMALL H 不是简单的表示上标h(h ),但是作为送气音符号放在字母后面表示送气,像是pʰ 。这个区段包含了:
拉丁上标修饰符号(U+02B0–U+02B8): ʰ 送气 ʱ 呼气音 ʲ 腭音化 ʳ, ʴ, ʵ, ʶ 儿化或 r-offglides ʷ 唇化 ʸ 腭化,美式标音系统 用(U+02B2)
杂项语音学修饰符(U+02B9–U+02D7):ʹ ʺ ʻ ʼ ʽ ʾ ʿ ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ ː ˑ ˒ ˓ ˔ ˕ ˖ ˗
间隔用变音符号(U+02D8–U+02DD):˘ 抑扬符 ˙ 上点 ˚ 上圈 ; ˛ ogonek ˜ 腭化符 ; ˝ 双尖音符
基于1989年国际音标附加的(U+02DE–U+02E4):˞ ˟ ˠ ˡ ˢ ˣ ˤ
声调符号 (U+02E5–U+02E9):˥ ˦ ˧ ˨ ˩
扩展注音符号 声调标记:U+02EA ˪ YIN DEPARTING TONE MARK ,U+02EB ˫ YANG DEPARTING TONE MARK
国际音标修饰字符:U+02EC ˬ MODIFIER LETTER VOICING ,不送气
其他修饰符号:U+02EE ˮ MODIFIER LETTER DOUBLE APOSTROPHE ,用于涅涅茨语
乌拉尔音标 修饰符号(U+02EF–U+02FF):˯ ˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
音标扩展(U+1D00–1D7F)
这个区段和下面的音标扩展增补包括了:
小型大写字母“ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ”
倒转的小写字母“ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ”
额外的小型大写字母“ʁ ʛ ᴀ ᴁ ᴃ ᴄ ᴅ ᴆ ᴇ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ ᴐ ᴘ ᴙ ᴚ ᴛ ᴜ ᴠ ᴡ ᴢ ᴣ ᴦ ᴧ ᴨ ᴩ ᴪ”
带硬腭音钩的小写字母“ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ”
带卷舌钩的小写字母“ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶩ ᶯ ᶼ”
音标扩展增补(U+1D80–1DBF)
音標擴展補充 Phonetic Extensions Supplement [1] Unicode Consortium 官方碼表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+1D8x
ᶀ
ᶁ
ᶂ
ᶃ
ᶄ
ᶅ
ᶆ
ᶇ
ᶈ
ᶉ
ᶊ
ᶋ
ᶌ
ᶍ
ᶎ
ᶏ
U+1D9x
ᶐ
ᶑ
ᶒ
ᶓ
ᶔ
ᶕ
ᶖ
ᶗ
ᶘ
ᶙ
ᶚ
ᶛ
ᶜ
ᶝ
ᶞ
ᶟ
U+1DAx
ᶠ
ᶡ
ᶢ
ᶣ
ᶤ
ᶥ
ᶦ
ᶧ
ᶨ
ᶩ
ᶪ
ᶫ
ᶬ
ᶭ
ᶮ
ᶯ
U+1DBx
ᶰ
ᶱ
ᶲ
ᶳ
ᶴ
ᶵ
ᶶ
ᶷ
ᶸ
ᶹ
ᶺ
ᶻ
ᶼ
ᶽ
ᶾ
ᶿ
注釋
1.^ 依據 Unicode 15.0
声调修饰符号(U+A700–A71F)
U+A700到U+A707的8个符号不是标准的国际音标符号。它们只是在早期被用于标示汉语的声调调类(不是调值,平上去入、各分阴阳,所以一共8个符号),标准国际音标规范中没有这8个符号。
U+A717到U+A71A不是标准的国际音标符号,它们用于记录奇南特克语 的声调符号。
U+A71B到U+A71F不是标准的国际音标符号,它们用于记录非洲语言的声调
聲調修飾符號 Modifier Tone Letters [1] Unicode Consortium 官方碼表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+A70x
꜀
꜁
꜂
꜃
꜄
꜅
꜆
꜇
꜈
꜉
꜊
꜋
꜌
꜍
꜎
꜏
U+A71x
꜐
꜑
꜒
꜓
꜔
꜕
꜖
ꜗ
ꜘ
ꜙ
ꜚ
ꜛ
ꜜ
ꜝ
ꜞ
ꜟ
註釋
1.^ 依據 Unicode 15.0
上标和下标(U+2070–209F)
上標和下標 Superscripts and Subscripts [1] [2] [3] Unicode Consortium 官方碼表 (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+207x
⁰
ⁱ
⁴
⁵
⁶
⁷
⁸
⁹
⁺
⁻
⁼
⁽
⁾
ⁿ
U+208x
₀
₁
₂
₃
₄
₅
₆
₇
₈
₉
₊
₋
₌
₍
₎
U+209x
ₐ
ₑ
ₒ
ₓ
ₔ
ₕ
ₖ
ₗ
ₘ
ₙ
ₚ
ₛ
ₜ
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未分配的碼位
3.^ 字符¹(U+00B9 ),²(U+00B2 )與³(U+00B3 )位於拉丁字母補充-1
参见
参考资料
外部链接