본문 바로가기

Programming/XML

인코딩 및 유니코드2

 (2) KS C 5601과 EUC-KR 인코딩

한국 표준문자 집합(KS C 5601)은 한국 표준 협의회가 한국 공업 표준(Korea Industrial Standard)으로 정한 정보처리 분야(C)의 5601번 표준안이다.

'KS C 5601'은 'KSC-5601' 또는 'KSC5601' 등으로 줄여서 불리기도 한다. 'KS C 5601' 표준의 내용을 살펴보면, 2 바이트를 사용해서 완성형 한글을 표현하는 방법을 기술하고 있다.

 

이 표준안 내용에는 순수한 한글 코드에 대한 내용뿐 ASCII 문자에 대한 내용은 전혀 담고 있지 않다. ASCII 문자에 대한 표준은 'KS C 5635'에 있다. 'KS C 5636'은  ASCII 문자 집합에서 역슬래시 대신에 한국의 통화기호 원 표시를 대치해 넣은 것으로 사실상 ASCII 문자 집합 코드와 같다고 볼 수 있다.

EUC-KR 인코딩은 Bell Laboratories에서 확장 유닉스 코드 (Extended UNIX Code)라 하여, 유닉스 운영체제에서 영어는 KS C 5636을, 한글은 KS C 5601을 사용하는 것을 말한다. 즉 ASCII문자 코드는 1바이트로 표현하고 'KS C 5601'에 언급되어 있는 한글 문자 코드는 2바이트로 표현한다.

이것은 한국 표준 협회에서 "유닉스 상에서의 한글사용"이라는 제목으로 KS C 5861로 등록되어 있다.

 

ASCII

7bit를 사용한 인코딩

 

KS C 5636

ASCII 문자에 대한

한국 공업 표준 정보처리 분야의 5636번 표준안

back slash를 한국 원화 기호로 대체한 형태

 

KS C 5601

2byte로 완성형 한글을 표현한

한국 공업 표준 정보처리 분야의 5601번 표준안

 

KS C 5861

영어는 KS C 5636를 적용하고

한글은 KS C 5601을 적용한다는

한국 공업 표준 정보처리 분야의 5861번 표준안

 

EUC-KR

Extended Unix Code

KS C 5861의 내용과 같음

 

 

이 글은 스프링노트에서 작성되었습니다.