본문 바로가기

Programming/XML

인코딩 및 유니코드4

 (4) XML 문서 인코딩

XML 권고안은 모든 XML 문서는 유니코드 인코딩 방식인 UTF-8 인코딩 방식으로 저장할 것을 기본으로 하고 있다.

만약 XML 문서가 UTF-8 방식으로 저장되지 않았다면 encoding 속성에 실제 인코딩 방식을 반드시 기술해야 한다. 그렇지 않으면 XML 파서는 XML 문서를 해석하지 못한다.

UTF-8 방식과 euc-kr 방식의 차이점은 

euc-kr은 ASCII : 1바이트 한글 : 2바이트인 반면에,

UTF-8은 ASCII : 1바이트 한글 : 3바이트이기 때문에 XML 파서는 XML 문서가 혼재된 방식으로 즉, euc-kr 인코딩으로 문서 저장을 하고 encoding 속성을 UTF-8으로 선언하게 되었을 때 오류가 나게 되는 것이다.

이 글은 스프링노트에서 작성되었습니다.