KS X 1001은 한국 산업 규격으로 지정된 한국어 문자 집합으로서, 정식 규격명은 ‘정보 교환용 부호계 (한글 및 한자)’이며, 옛 이름인 KS C 5601로도 알려져 있다. 1974년에 처음으로 제정되었고, 2004년에 개정된 KS X 1001:2004가 최신 규격이다.
이 규격은 2바이트 부호계로서, x2121 - x7E7E 영역에서 8,836문자의 표현을 규정하는데, 문자는 제어 문자와 도형 문자로 분류하며, 도형 문자는 특수 문자, 괘선 조각, 숫자, 한글 낱자, 한글 글자 마디, 한자, 기본 로마 문자, 확장 로마 문자, 그리스 문자, 가나 문자, 키릴 문자로 구성되어 있다. 한글 부분은 기본적으로 2바이트 완성형 코드이지만, 부속서 3에서 2바이트 조합형 코드도 보조 부호계로서 규정되어 있다.
KS X 1001은 유니코드를 제외하고 대한민국에서 사용되는 거의 유일한 문자 집합이다. KS X 1001 기반의 문자 인코딩으로는 EUC-KR(완성형)과 ISO-2022-KR(과거 인터넷 메일에서 쓰던 문자 인코딩)이 있다. MS 윈도우에서 사용하는 CP949은 EUC-KR의 확장으로 2바이트로 표현할 수 없는 한글 글자 마디 8,822자를 추가한 것이다.
구성
KS X 1001은 전형적인 94×94 문자 집합이며, 각 행들은 다음과 같이 구성되어 있다.
0x21 ~ 0x2C: 특수 문자(문장 부호, 그림 문자 등), 한글 낱자, 괘선 조각, 외국 문자(히라가나, 가타카나, 그리스 문자, 키릴 문자 등)
0x30 ~ 0x48: 한글 글자 마디 영역. 자주 쓰이는 2350자만 가나다 순서대로 배열했다. 하지만 이것 때문에 이 영역에서 벗어난 글자를 정확히 인식하지 못하는 문제가 생겼다.[1]
0x49: 사용자 정의 영역 A
0x4A ~ 0x7D: 한자 영역. 4888자를 한글 독음 순서대로 배열했으며, 독음이 여러 개인 한자는 독음에 따라 중복되어 있다.
0x7E: 사용자 정의 영역 B
특수 문자 영역은 개정판마다 계속 추가되고 있다. KS X 1001:1998에서는 ®('등록 상표' 줄임표), €(유로 기호)가, KS X 1001:2002에서는 ㉾('우편 번호' 줄임표, U+327E)가 추가되었다.
한글 채움 문자
이 규격에는 완성형 한글 코드인 기본 부호계에 포함되지 않은 한글에 대해서 글자 마디마다 맨 앞에 '채움' 문자를 덧붙여 교환하는 방식이 규정되어 있다. 즉, 한글 채움 문자(24-54, EUC-KR에서는 A4 D4)를 사용해서 "(채움) 초성 중성 종성"과 같이 한글 영역에 들어 있지 않은 한글을 표시하는 것은 가능하다. 예를 들어 '(채움) ㅆ ㅠ (채움)'은 KS X 1001에서 나타낼 수 없는 '쓔'라는 글자를 나타낸다. 이러한 확장 방법은 2004년 개정에서도 유지되어 있다.
부속서
이 규격의 부속서 3에서는 2바이트 조합형을 보조 부호계로 규정하고 있는데, 1992년 개정부터 기존 상용 조합형을 반영하여 표준화하였다. 아울러 부속서 4에서는 7비트 한글 낱자 부호계를 포함하여 2바이트 부호계가 적용되지 않는 특수 장비 등에 대한 한글 코드를 규정하고 있다.
완성형 한글 2350자
초성+중성+종성 완성자 '뢨', '썅', '쏀', '쓩', '쭁'은 포함되어 있으나, 이 글자들에서 종성을 뺀 '뢔', '쌰', '쎼', '쓔', '쬬'는 포함되어 있지 않다. 이는 입력 시에 문제를 일으킬 수 있다.
0x
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
B0A
가
각
간
갇
갈
갉
갊
감
갑
값
갓
갔
강
갖
갗
B0B
같
갚
갛
개
객
갠
갤
갬
갭
갯
갰
갱
갸
갹
갼
걀
B0C
걋
걍
걔
걘
걜
거
걱
건
걷
걸
걺
검
겁
것
겄
겅
B0D
겆
겉
겊
겋
게
겐
겔
겜
겝
겟
겠
겡
겨
격
겪
견
B0E
겯
결
겸
겹
겻
겼
경
곁
계
곈
곌
곕
곗
고
곡
곤
B0F
곧
골
곪
곬
곯
곰
곱
곳
공
곶
과
곽
관
괄
괆
B1A
괌
괍
괏
광
괘
괜
괠
괩
괬
괭
괴
괵
괸
괼
굄
B1B
굅
굇
굉
교
굔
굘
굡
굣
구
국
군
굳
굴
굵
굶
굻
B1C
굼
굽
굿
궁
궂
궈
궉
권
궐
궜
궝
궤
궷
귀
귁
귄
B1D
귈
귐
귑
귓
규
균
귤
그
극
근
귿
글
긁
금
급
긋
B1E
긍
긔
기
긱
긴
긷
길
긺
김
깁
깃
깅
깆
깊
까
깍
B1F
깎
깐
깔
깖
깜
깝
깟
깠
깡
깥
깨
깩
깬
깰
깸
B2A
깹
깻
깼
깽
꺄
꺅
꺌
꺼
꺽
꺾
껀
껄
껌
껍
껏
B2B
껐
껑
께
껙
껜
껨
껫
껭
껴
껸
껼
꼇
꼈
꼍
꼐
꼬
B2C
꼭
꼰
꼲
꼴
꼼
꼽
꼿
꽁
꽂
꽃
꽈
꽉
꽐
꽜
꽝
꽤
B2D
꽥
꽹
꾀
꾄
꾈
꾐
꾑
꾕
꾜
꾸
꾹
꾼
꿀
꿇
꿈
꿉
B2E
꿋
꿍
꿎
꿔
꿜
꿨
꿩
꿰
꿱
꿴
꿸
뀀
뀁
뀄
뀌
뀐
B2F
뀔
뀜
뀝
뀨
끄
끅
끈
끊
끌
끎
끓
끔
끕
끗
끙
B3A
끝
끼
끽
낀
낄
낌
낍
낏
낑
나
낙
낚
난
낟
날
B3B
낡
낢
남
납
낫
났
낭
낮
낯
낱
낳
내
낵
낸
낼
냄
B3C
냅
냇
냈
냉
냐
냑
냔
냘
냠
냥
너
넉
넋
넌
널
넒
B3D
넓
넘
넙
넛
넜
넝
넣
네
넥
넨
넬
넴
넵
넷
넸
넹
B3E
녀
녁
년
녈
념
녑
녔
녕
녘
녜
녠
노
녹
논
놀
놂
B3F
놈
놉
놋
농
높
놓
놔
놘
놜
놨
뇌
뇐
뇔
뇜
뇝
B4A
뇟
뇨
뇩
뇬
뇰
뇹
뇻
뇽
누
눅
눈
눋
눌
눔
눕
B4B
눗
눙
눠
눴
눼
뉘
뉜
뉠
뉨
뉩
뉴
뉵
뉼
늄
늅
늉
B4C
느
늑
는
늘
늙
늚
늠
늡
늣
능
늦
늪
늬
늰
늴
니
B4D
닉
닌
닐
닒
님
닙
닛
닝
닢
다
닥
닦
단
닫
달
닭
B4E
닮
닯
닳
담
답
닷
닸
당
닺
닻
닿
대
댁
댄
댈
댐
B4F
댑
댓
댔
댕
댜
더
덕
덖
던
덛
덜
덞
덟
덤
덥
B5A
덧
덩
덫
덮
데
덱
덴
델
뎀
뎁
뎃
뎄
뎅
뎌
뎐
B5B
뎔
뎠
뎡
뎨
뎬
도
독
돈
돋
돌
돎
돐
돔
돕
돗
동
B5C
돛
돝
돠
돤
돨
돼
됐
되
된
될
됨
됩
됫
됴
두
둑
B5D
둔
둘
둠
둡
둣
둥
둬
뒀
뒈
뒝
뒤
뒨
뒬
뒵
뒷
뒹
B5E
듀
듄
듈
듐
듕
드
득
든
듣
들
듦
듬
듭
듯
등
듸
B5F
디
딕
딘
딛
딜
딤
딥
딧
딨
딩
딪
따
딱
딴
딸
B6A
땀
땁
땃
땄
땅
땋
때
땍
땐
땔
땜
땝
땟
땠
땡
B6B
떠
떡
떤
떨
떪
떫
떰
떱
떳
떴
떵
떻
떼
떽
뗀
뗄
B6C
뗌
뗍
뗏
뗐
뗑
뗘
뗬
또
똑
똔
똘
똥
똬
똴
뙈
뙤
B6D
뙨
뚜
뚝
뚠
뚤
뚫
뚬
뚱
뛔
뛰
뛴
뛸
뜀
뜁
뜅
뜨
B6E
뜩
뜬
뜯
뜰
뜸
뜹
뜻
띄
띈
띌
띔
띕
띠
띤
띨
띰
B6F
띱
띳
띵
라
락
란
랄
람
랍
랏
랐
랑
랒
랖
랗
B7A
래
랙
랜
랠
램
랩
랫
랬
랭
랴
략
랸
럇
량
러
B7B
럭
런
럴
럼
럽
럿
렀
렁
렇
레
렉
렌
렐
렘
렙
렛
B7C
렝
려
력
련
렬
렴
렵
렷
렸
령
례
롄
롑
롓
로
록
B7D
론
롤
롬
롭
롯
롱
롸
롼
뢍
뢨
뢰
뢴
뢸
룀
룁
룃
B7E
룅
료
룐
룔
룝
룟
룡
루
룩
룬
룰
룸
룹
룻
룽
뤄
B7F
뤘
뤠
뤼
뤽
륀
륄
륌
륏
륑
류
륙
륜
률
륨
륩
B8A
륫
륭
르
륵
른
를
름
릅
릇
릉
릊
릍
릎
리
릭
B8B
린
릴
림
립
릿
링
마
막
만
많
맏
말
맑
맒
맘
맙
B8C
맛
망
맞
맡
맣
매
맥
맨
맬
맴
맵
맷
맸
맹
맺
먀
B8D
먁
먈
먕
머
먹
먼
멀
멂
멈
멉
멋
멍
멎
멓
메
멕
B8E
멘
멜
멤
멥
멧
멨
멩
며
멱
면
멸
몃
몄
명
몇
몌
B8F
모
목
몫
몬
몰
몲
몸
몹
못
몽
뫄
뫈
뫘
뫙
뫼
B9A
묀
묄
묍
묏
묑
묘
묜
묠
묩
묫
무
묵
묶
문
묻
B9B
물
묽
묾
뭄
뭅
뭇
뭉
뭍
뭏
뭐
뭔
뭘
뭡
뭣
뭬
뮈
B9C
뮌
뮐
뮤
뮨
뮬
뮴
뮷
므
믄
믈
믐
믓
미
믹
민
믿
B9D
밀
밂
밈
밉
밋
밌
밍
및
밑
바
박
밖
밗
반
받
발
B9E
밝
밞
밟
밤
밥
밧
방
밭
배
백
밴
밸
뱀
뱁
뱃
뱄
B9F
뱅
뱉
뱌
뱍
뱐
뱝
버
벅
번
벋
벌
벎
범
법
벗
BAA
벙
벚
베
벡
벤
벧
벨
벰
벱
벳
벴
벵
벼
벽
변
BAB
별
볍
볏
볐
병
볕
볘
볜
보
복
볶
본
볼
봄
봅
봇
BAC
봉
봐
봔
봤
봬
뵀
뵈
뵉
뵌
뵐
뵘
뵙
뵤
뵨
부
북
BAD
분
붇
불
붉
붊
붐
붑
붓
붕
붙
붚
붜
붤
붰
붸
뷔
BAE
뷕
뷘
뷜
뷩
뷰
뷴
뷸
븀
븃
븅
브
븍
븐
블
븜
븝
BAF
븟
비
빅
빈
빌
빎
빔
빕
빗
빙
빚
빛
빠
빡
빤
BBA
빨
빪
빰
빱
빳
빴
빵
빻
빼
빽
뺀
뺄
뺌
뺍
뺏
BBB
뺐
뺑
뺘
뺙
뺨
뻐
뻑
뻔
뻗
뻘
뻠
뻣
뻤
뻥
뻬
뼁
BBC
뼈
뼉
뼘
뼙
뼛
뼜
뼝
뽀
뽁
뽄
뽈
뽐
뽑
뽕
뾔
뾰
BBD
뿅
뿌
뿍
뿐
뿔
뿜
뿟
뿡
쀼
쁑
쁘
쁜
쁠
쁨
쁩
삐
BBE
삑
삔
삘
삠
삡
삣
삥
사
삭
삯
산
삳
살
삵
삶
삼
BBF
삽
삿
샀
상
샅
새
색
샌
샐
샘
샙
샛
샜
생
샤
BCA
샥
샨
샬
샴
샵
샷
샹
섀
섄
섈
섐
섕
서
석
섞
BCB
섟
선
섣
설
섦
섧
섬
섭
섯
섰
성
섶
세
섹
센
셀
BCC
셈
셉
셋
셌
셍
셔
셕
션
셜
셤
셥
셧
셨
셩
셰
셴
BCD
셸
솅
소
속
솎
손
솔
솖
솜
솝
솟
송
솥
솨
솩
솬
BCE
솰
솽
쇄
쇈
쇌
쇔
쇗
쇘
쇠
쇤
쇨
쇰
쇱
쇳
쇼
쇽
BCF
숀
숄
숌
숍
숏
숑
수
숙
순
숟
술
숨
숩
숫
숭
BDA
숯
숱
숲
숴
쉈
쉐
쉑
쉔
쉘
쉠
쉥
쉬
쉭
쉰
쉴
BDB
쉼
쉽
쉿
슁
슈
슉
슐
슘
슛
슝
스
슥
슨
슬
슭
슴
BDC
습
슷
승
시
식
신
싣
실
싫
심
십
싯
싱
싶
싸
싹
BDD
싻
싼
쌀
쌈
쌉
쌌
쌍
쌓
쌔
쌕
쌘
쌜
쌤
쌥
쌨
쌩
BDE
썅
써
썩
썬
썰
썲
썸
썹
썼
썽
쎄
쎈
쎌
쏀
쏘
쏙
BDF
쏜
쏟
쏠
쏢
쏨
쏩
쏭
쏴
쏵
쏸
쐈
쐐
쐤
쐬
쐰
BEA
쐴
쐼
쐽
쑈
쑤
쑥
쑨
쑬
쑴
쑵
쑹
쒀
쒔
쒜
쒸
BEB
쒼
쓩
쓰
쓱
쓴
쓸
쓺
쓿
씀
씁
씌
씐
씔
씜
씨
씩
BEC
씬
씰
씸
씹
씻
씽
아
악
안
앉
않
알
앍
앎
앓
암
BED
압
앗
았
앙
앝
앞
애
액
앤
앨
앰
앱
앳
앴
앵
야
BEE
약
얀
얄
얇
얌
얍
얏
양
얕
얗
얘
얜
얠
얩
어
억
BEF
언
얹
얻
얼
얽
얾
엄
업
없
엇
었
엉
엊
엌
엎
BFA
에
엑
엔
엘
엠
엡
엣
엥
여
역
엮
연
열
엶
엷
BFB
염
엽
엾
엿
였
영
옅
옆
옇
예
옌
옐
옘
옙
옛
옜
BFC
오
옥
온
올
옭
옮
옰
옳
옴
옵
옷
옹
옻
와
왁
완
BFD
왈
왐
왑
왓
왔
왕
왜
왝
왠
왬
왯
왱
외
왹
왼
욀
BFE
욈
욉
욋
욍
요
욕
욘
욜
욤
욥
욧
용
우
욱
운
울
BFF
욹
욺
움
웁
웃
웅
워
웍
원
월
웜
웝
웠
웡
웨
C0A
웩
웬
웰
웸
웹
웽
위
윅
윈
윌
윔
윕
윗
윙
유
C0B
육
윤
율
윰
윱
윳
융
윷
으
윽
은
을
읊
음
읍
읏
C0C
응
읒
읓
읔
읕
읖
읗
의
읜
읠
읨
읫
이
익
인
일
C0D
읽
읾
잃
임
입
잇
있
잉
잊
잎
자
작
잔
잖
잗
잘
C0E
잚
잠
잡
잣
잤
장
잦
재
잭
잰
잴
잼
잽
잿
쟀
쟁
C0F
쟈
쟉
쟌
쟎
쟐
쟘
쟝
쟤
쟨
쟬
저
적
전
절
젊
C1A
점
접
젓
정
젖
제
젝
젠
젤
젬
젭
젯
젱
져
젼
C1B
졀
졈
졉
졌
졍
졔
조
족
존
졸
졺
좀
좁
좃
종
좆
C1C
좇
좋
좌
좍
좔
좝
좟
좡
좨
좼
좽
죄
죈
죌
죔
죕
C1D
죗
죙
죠
죡
죤
죵
주
죽
준
줄
줅
줆
줌
줍
줏
중
C1E
줘
줬
줴
쥐
쥑
쥔
쥘
쥠
쥡
쥣
쥬
쥰
쥴
쥼
즈
즉
C1F
즌
즐
즘
즙
즛
증
지
직
진
짇
질
짊
짐
집
짓
C2A
징
짖
짙
짚
짜
짝
짠
짢
짤
짧
짬
짭
짯
짰
짱
C2B
째
짹
짼
쨀
쨈
쨉
쨋
쨌
쨍
쨔
쨘
쨩
쩌
쩍
쩐
쩔
C2C
쩜
쩝
쩟
쩠
쩡
쩨
쩽
쪄
쪘
쪼
쪽
쫀
쫄
쫌
쫍
쫏
C2D
쫑
쫓
쫘
쫙
쫠
쫬
쫴
쬈
쬐
쬔
쬘
쬠
쬡
쭁
쭈
쭉
C2E
쭌
쭐
쭘
쭙
쭝
쭤
쭸
쭹
쮜
쮸
쯔
쯤
쯧
쯩
찌
찍
C2F
찐
찔
찜
찝
찡
찢
찧
차
착
찬
찮
찰
참
찹
찻
C3A
찼
창
찾
채
책
챈
챌
챔
챕
챗
챘
챙
챠
챤
챦
C3B
챨
챰
챵
처
척
천
철
첨
첩
첫
첬
청
체
첵
첸
첼
C3C
쳄
쳅
쳇
쳉
쳐
쳔
쳤
쳬
쳰
촁
초
촉
촌
촐
촘
촙
C3D
촛
총
촤
촨
촬
촹
최
쵠
쵤
쵬
쵭
쵯
쵱
쵸
춈
추
C3E
축
춘
출
춤
춥
춧
충
춰
췄
췌
췐
취
췬
췰
췸
췹
C3F
췻
췽
츄
츈
츌
츔
츙
츠
측
츤
츨
츰
츱
츳
층
C4A
치
칙
친
칟
칠
칡
침
칩
칫
칭
카
칵
칸
칼
캄
C4B
캅
캇
캉
캐
캑
캔
캘
캠
캡
캣
캤
캥
캬
캭
컁
커
C4C
컥
컨
컫
컬
컴
컵
컷
컸
컹
케
켁
켄
켈
켐
켑
켓
C4D
켕
켜
켠
켤
켬
켭
켯
켰
켱
켸
코
콕
콘
콜
콤
콥
C4E
콧
콩
콰
콱
콴
콸
쾀
쾅
쾌
쾡
쾨
쾰
쿄
쿠
쿡
쿤
C4F
쿨
쿰
쿱
쿳
쿵
쿼
퀀
퀄
퀑
퀘
퀭
퀴
퀵
퀸
퀼
C5A
큄
큅
큇
큉
큐
큔
큘
큠
크
큭
큰
클
큼
큽
킁
C5B
키
킥
킨
킬
킴
킵
킷
킹
타
탁
탄
탈
탉
탐
탑
탓
C5C
탔
탕
태
택
탠
탤
탬
탭
탯
탰
탱
탸
턍
터
턱
턴
C5D
털
턺
텀
텁
텃
텄
텅
테
텍
텐
텔
템
텝
텟
텡
텨
C5E
텬
텼
톄
톈
토
톡
톤
톨
톰
톱
톳
통
톺
톼
퇀
퇘
C5F
퇴
퇸
툇
툉
툐
투
툭
툰
툴
툼
툽
툿
퉁
퉈
퉜
C6A
퉤
튀
튁
튄
튈
튐
튑
튕
튜
튠
튤
튬
튱
트
특
C6B
튼
튿
틀
틂
틈
틉
틋
틔
틘
틜
틤
틥
티
틱
틴
틸
C6C
팀
팁
팃
팅
파
팍
팎
판
팔
팖
팜
팝
팟
팠
팡
팥
C6D
패
팩
팬
팰
팸
팹
팻
팼
팽
퍄
퍅
퍼
퍽
펀
펄
펌
C6E
펍
펏
펐
펑
페
펙
펜
펠
펨
펩
펫
펭
펴
편
펼
폄
C6F
폅
폈
평
폐
폘
폡
폣
포
폭
폰
폴
폼
폽
폿
퐁
C7A
퐈
퐝
푀
푄
표
푠
푤
푭
푯
푸
푹
푼
푿
풀
풂
C7B
품
풉
풋
풍
풔
풩
퓌
퓐
퓔
퓜
퓟
퓨
퓬
퓰
퓸
퓻
C7C
퓽
프
픈
플
픔
픕
픗
피
픽
핀
필
핌
핍
핏
핑
하
C7D
학
한
할
핥
함
합
핫
항
해
핵
핸
핼
햄
햅
햇
했
C7E
행
햐
향
허
헉
헌
헐
헒
험
헙
헛
헝
헤
헥
헨
헬
C7F
헴
헵
헷
헹
혀
혁
현
혈
혐
협
혓
혔
형
혜
혠
C8A
혤
혭
호
혹
혼
홀
홅
홈
홉
홋
홍
홑
화
확
환
C8B
활
홧
황
홰
홱
홴
횃
횅
회
획
횐
횔
횝
횟
횡
효
C8C
횬
횰
횹
횻
후
훅
훈
훌
훑
훔
훗
훙
훠
훤
훨
훰
C8D
훵
훼
훽
휀
휄
휑
휘
휙
휜
휠
휨
휩
휫
휭
휴
휵
C8E
휸
휼
흄
흇
흉
흐
흑
흔
흖
흗
흘
흙
흠
흡
흣
흥
C8F
흩
희
흰
흴
흼
흽
힁
히
힉
힌
힐
힘
힙
힛
힝
자모별 통계
초성
자모
개수
ㄱ
171
ㄲ
120
ㄴ
141
ㄷ
128
ㄸ
86
ㄹ
127
ㅁ
129
ㅂ
129
ㅃ
73
ㅅ
163
ㅆ
86
ㅇ
208
ㅈ
135
ㅉ
82
ㅊ
112
ㅋ
107
ㅌ
106
ㅍ
105
ㅎ
142
합계
2350
중성
자모
개수
ㅏ
242
ㅐ
172
ㅑ
77
ㅒ
15
ㅓ
212
ㅔ
140
ㅕ
131
ㅖ
44
ㅗ
184
ㅘ
81
ㅙ
42
ㅚ
101
ㅛ
65
ㅜ
177
ㅝ
56
ㅞ
41
ㅟ
105
ㅠ
84
ㅡ
166
ㅢ
30
ㅣ
185
합계
2350
종성
자모
개수
(없음)
349
ㄱ
204
ㄲ
13
ㄳ
6
ㄴ
277
ㄵ
2
ㄶ
10
ㄷ
36
ㄹ
262
ㄺ
21
ㄻ
50
ㄼ
9
ㄽ
3
ㄾ
3
ㄿ
1
ㅀ
11
ㅁ
222
ㅂ
209
ㅄ
3
ㅅ
200
ㅆ
106
ㅇ
241
ㅈ
27
ㅊ
15
ㅋ
3
ㅌ
27
ㅍ
20
ㅎ
20
합계
2350
단점
KS X 1001에 모든 현대 한글을 표현할 수 있는 방법이 존재하는데도 모질라 파이어폭스 등을 제외한 대부분의 프로그램들이 구현하지 않고 있다. 따라서 KS X 1001은 사실상 2350자의 한글만 지원하기 때문에 모든 현대 한글을 제대로 표현할 수 없다는 비판이 제기되었다. 또한 2350자 바깥의 한글을 처리하는 방법이 프로그램마다 여러 가지로 나뉘면서 서로 다른 프로그램 사이에서 인코딩의 호환성이 보장되지 않는 문제가 생기기도 했다. 또한, 필요한 특수 문자는 배제되고 자판으로 손수 입력 가능한 특수 문자가 너무 많이 포함되었다는 비판도 존재한다.[2]
그 외에도 독음이 여러 개인 한자가 독음에 따라 중복되어 있기 때문에 나타나는 처리상의 문제도 있는데, 유니코드에 이런 특성이 고려되어 모든 중복된 한자가 유니코드 호환성 영역에 수록되기도 했다.