CP932, Code Page 932, neboli Windows-31J je rozšíření kódování Shift-JIS vytvořené firmou Microsoft. Zahrnuje znakové sady JIS X 0201:1997, JIS X 0208:1997, speciální znaky NEC (řádek 13), NEC výběr rozšíření IBM (řádky 89-92) a rozšíření IBM (řádky 115-119). IANA používá pro toto kódování označení Windows-31J nebo csWindows31J, jeho MIB identifikátor je 2024.[1]
Tabulka kódování
CP932 používá jedno- a dvoubytové kódy. Kódům 0-127 a 160-223 jsou přiřazeny znaky s jednobytovými kódy, ostatní hodnoty jsou prvním bytem dvoubytových kódů. Celé kódování definuje celkem 7980 znaků. Dvoubytový znak s kódem 0x82D7 (první byte: 0x82, druhý byte: 0xD7) v CP932 odpovídá znaku U+3079 v Unicode (hiragana písmeno BE, べ).
„ŘZ“ označuje řídicí znak, „NZ“ označuje kód ve standardu nedefinovaný.
Znak s kódem 0x5C je sice mapován na kódový bod U+005C v Unicode, ale obvykle je zobrazován jako znak yen.[1]
Mapování na Unicode
Následující tabulka ukazuje mapování jednobytových kódů 0x80–0xFF z CP932 na Unicode. Kompletní mapování včetně dvoubytových kódů (jejichž úvodní byte je v tabulce označen „DBCSLB“ – anglicky Double Byte Character Set Lead Byte) je na serveru Unicode.[2]
CP932
|
Hex
|
Znak
|
Unicode
|
Hex
|
Znak
|
Unicode
|
Hex
|
Znak
|
Unicode
|
Hex
|
Znak
|
Unicode
|
0x80
|
NZ
|
0xA0
|
NZ
|
0xC0
|
タ
|
U+FF80
|
0xE0
|
DBCSLB
|
0x81
|
DBCSLB
|
0xA1
|
。
|
U+FF61
|
0xC1
|
チ
|
U+FF81
|
0xE1
|
DBCSLB
|
0x82
|
DBCSLB
|
0xA2
|
「
|
U+FF62
|
0xC2
|
ツ
|
U+FF82
|
0xE2
|
DBCSLB
|
0x83
|
DBCSLB
|
0xA3
|
」
|
U+FF63
|
0xC3
|
テ
|
U+FF83
|
0xE3
|
DBCSLB
|
0x84
|
DBCSLB
|
0xA4
|
、
|
U+FF64
|
0xC4
|
ト
|
U+FF84
|
0xE4
|
DBCSLB
|
0x85
|
DBCSLB
|
0xA5
|
・
|
U+FF65
|
0xC5
|
ナ
|
U+FF85
|
0xE5
|
DBCSLB
|
0x86
|
DBCSLB
|
0xA6
|
ヲ
|
U+FF66
|
0xC6
|
ニ
|
U+FF86
|
0xE6
|
DBCSLB
|
0x87
|
DBCSLB
|
0xA7
|
ァ
|
U+FF67
|
0xC7
|
ヌ
|
U+FF87
|
0xE7
|
DBCSLB
|
0x88
|
DBCSLB
|
0xA8
|
ィ
|
U+FF68
|
0xC8
|
ネ
|
U+FF88
|
0xE8
|
DBCSLB
|
0x89
|
DBCSLB
|
0xA9
|
ゥ
|
U+FF69
|
0xC9
|
ノ
|
U+FF89
|
0xE9
|
DBCSLB
|
0x8A
|
DBCSLB
|
0xAA
|
ェ
|
U+FF6A
|
0xCA
|
ハ
|
U+FF8A
|
0xEA
|
DBCSLB
|
0x8B
|
DBCSLB
|
0xAB
|
ォ
|
U+FF6B
|
0xCB
|
ヒ
|
U+FF8B
|
0xEB
|
DBCSLB
|
0x8C
|
DBCSLB
|
0xAC
|
ャ
|
U+FF6C
|
0xCC
|
フ
|
U+FF8C
|
0xEC
|
DBCSLB
|
0x8D
|
DBCSLB
|
0xAD
|
ュ
|
U+FF6D
|
0xCD
|
ヘ
|
U+FF8D
|
0xED
|
DBCSLB
|
0x8E
|
DBCSLB
|
0xAE
|
ョ
|
U+FF6E
|
0xCE
|
ホ
|
U+FF8E
|
0xEE
|
DBCSLB
|
0x8F
|
DBCSLB
|
0xAF
|
ッ
|
U+FF6F
|
0xCF
|
マ
|
U+FF8F
|
0xEF
|
DBCSLB
|
0x90
|
DBCSLB
|
0xB0
|
ー
|
U+FF70
|
0xD0
|
ミ
|
U+FF90
|
0xF0
|
DBCSLB
|
0x91
|
DBCSLB
|
0xB1
|
ア
|
U+FF71
|
0xD1
|
ム
|
U+FF91
|
0xF1
|
DBCSLB
|
0x92
|
DBCSLB
|
0xB2
|
イ
|
U+FF72
|
0xD2
|
メ
|
U+FF92
|
0xF2
|
DBCSLB
|
0x93
|
DBCSLB
|
0xB3
|
ウ
|
U+FF73
|
0xD3
|
モ
|
U+FF93
|
0xF3
|
DBCSLB
|
0x94
|
DBCSLB
|
0xB4
|
エ
|
U+FF74
|
0xD4
|
ヤ
|
U+FF94
|
0xF4
|
DBCSLB
|
0x95
|
DBCSLB
|
0xB5
|
オ
|
U+FF75
|
0xD5
|
ユ
|
U+FF95
|
0xF5
|
DBCSLB
|
0x96
|
DBCSLB
|
0xB6
|
カ
|
U+FF76
|
0xD6
|
ヨ
|
U+FF96
|
0xF6
|
DBCSLB
|
0x97
|
DBCSLB
|
0xB7
|
キ
|
U+FF77
|
0xD7
|
ラ
|
U+FF97
|
0xF7
|
DBCSLB
|
0x98
|
DBCSLB
|
0xB8
|
ク
|
U+FF78
|
0xD8
|
リ
|
U+FF98
|
0xF8
|
DBCSLB
|
0x99
|
DBCSLB
|
0xB9
|
ケ
|
U+FF79
|
0xD9
|
ル
|
U+FF99
|
0xF9
|
DBCSLB
|
0x9A
|
DBCSLB
|
0xBA
|
コ
|
U+FF7A
|
0xDA
|
レ
|
U+FF9A
|
0xFA
|
DBCSLB
|
0x9B
|
DBCSLB
|
0xBB
|
サ
|
U+FF7B
|
0xDB
|
ロ
|
U+FF9B
|
0xFB
|
DBCSLB
|
0x9C
|
DBCSLB
|
0xBC
|
シ
|
U+FF7C
|
0xDC
|
ワ
|
U+FF9C
|
0xFC
|
NZ
|
0x9D
|
DBCSLB
|
0xBD
|
ス
|
U+FF7D
|
0xDD
|
ン
|
U+FF9D
|
0xFD
|
NZ
|
0x9E
|
DBCSLB
|
0xBE
|
セ
|
U+FF7E
|
0xDE
|
゙
|
U+FF9E
|
0xFE
|
NZ
|
0x9F
|
DBCSLB
|
0xBF
|
ソ
|
U+FF7F
|
0xDF
|
゚
|
U+FF9F
|
0xFF
|
NZ
|
Odkazy
Reference
V tomto článku byl použit překlad textu z článku CP932 na polské Wikipedii.
- ↑ a b Microsoft Corporation. Update to windows-31J charset registration [online]. IANA [cit. 2017-04-26]. Dostupné online.
- ↑ Shawn Steele (Microsoft). cp932 to Unicode table [online]. [cit. 2017-04-26]. Dostupné online.
Související články
Externí odkazy