Java ‐ 문자 인코딩 - dnwls16071/Backend_Study_TIL GitHub Wiki

📚 컴퓨터와 문자 인코딩

  • 문자 인코딩 : 문자 집합을 통해 문자를 숫자로 변환하는 것
  • 문자 디코딩 : 문자 집합을 통해 숫자를 문자로 변환하는 것

결론 : UTF-8이 현대 사실상 표준 인코딩 기술이 된 이유

  • 저장 공간 절약과 네트워크 효율성 : UTF-8은 ASCII 문자를 포함한 많은 서양 언어 문자에 대해 1바이트를 사용한다. 반면 UTF-16은 최소 2바이트를 사용하므로 주로 ASCII 문자로 이루어진 영문 텍스트에서는 UTF-8이 2배 더 효율적이다. 특히 데이터를 네트워크로 전달할 때 매우 큰 효율 차이를 보인다.
  • ASCII와의 호환성 : UTF-8은 ASCII와 호환된다. UTF-8로 인코딩된 텍스트에서 ASCII 범위에 있는 문자는 기존 ASCII와 동일한 방식으로 처리된다. 예를 들어, 문자 "A"는 65로 인코딩된다. 많은 레거시 시스템은 ASCII 기반으로 구축되어 있다. UTF-8은 이러한 시스템과의 호환성을 유지하면서도 전 세계의 모든 문자를 표현할 수 있다.