일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- Custom Package
- Job 시스템
- 환급챌린지
- 프레임워크
- 커스텀 패키지
- adfit
- base64
- 패스트캠퍼스
- 직장인공부
- TextMeshPro
- 직장인자기계발
- AES
- DotsTween
- Tween
- 오공완
- 샘플
- RSA
- Unity Editor
- 가이드
- 최적화
- job
- sha
- Framework
- 암호화
- Dots
- 패스트캠퍼스후기
- ui
- 2D Camera
- C#
- unity
- Today
- Total
EveryDay.DevUp
[Unity] 문자 인코딩 ( Character Enconding ) 본문
Character Encoding 은 사람이 사용하는 글자를 컴퓨터에서 사용할 수 있도록 변환하는 것
▶ 기계는 0, 1로만 데이터를 저장하기 때문에 "안녕하세요" 같은 단어를 컴퓨터에 저장한다고 하면 특정한 규칙에 따라 0, 1로 변환되는 과정이 필요.
● 문자 인코딩의 종류
▶ ASCII ( 아스키 )
: 미국 ANSI에서 표준화한 정보교환용 7비트 부호체계
: 1바이트로 문자를 표현하는데, 그 중 1bit는 통신 오류 검출용, 7bit가 문자를 표시
: 2의 7승인 127개의 문자 표시가 가능. ( 52개의 영문 알파벳 대소문자와, 10개의 숫자, 32개의 특수문자, 그리고 하나의 공백 사용 가능 )
참고 자료 : https://namu.wiki/w/%EC%95%84%EC%8A%A4%ED%82%A4%20%EC%BD%94%EB%93%9C
아스키 코드 - 나무위키
UTF-8의 경우 ASCII 영역은 그대로 1바이트를 사용하기 때문에 호환이 된다. 반대로 말하자면 UTF-8 문서라도 ASCII 영역에 해당하는 문자만 적혀 있고 BOM까지 없다면 그냥 ASCII 문서와 다를 게 없다. ��
namu.wiki
▣ Unicode
: Unicode 이전에는 ASCII의 1Byte에 영어 대신 자국의 글자를 대체해서 사용. 이로 인해 사용자간의 통신에서 ASCII의 의미가 달라지는 문제가 발생
ex) 영어권에서 Hello 를 ASCII로 보냈는데, 한국에서는 Hello가 아닌 "ㅁㅈㄷㄱㅂ"라는 글자로 보이는 현상
: 전 세계의 모든 문자를 다룰 수 있는 표준이 필요하게 되어 Unicode가 생김
: Unicode는 특정한 규칙에 의해 글자와 코드가 1:1로 매칭되는 코드표로 현재도 계속 업데이트 중
참고 자료 : https://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C
유니코드 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. 다른 뜻에 대해서는 U;Nee Code 문서를 참조하십시오. 유니코드(Unicode)는 전 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준�
ko.wikipedia.org
▶ UTF-8
: 가변 길이 문자 인코딩 방식으로 1바이트에서 4바이트를 사용하여 문자를 표시
: 영문/숫자/기호는 1바이트를 사용, 한글과 한자 등은 3바이트로 사용
참고 자료 : https://ko.wikipedia.org/wiki/UTF-8
UTF-8 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. 둘러보기로 가기 검색하러 가기 UTF-8은 유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나로, 켄 톰프슨과 롭 파이크가 만들었다. UTF-8은 Universal Coded Character
ko.wikipedia.org
▶ UTF-16
: 가변 길이 문자 인코딩 방식으로, UTF-8과 달리 문자 하나를 표현할 때 2바이트, 4바이트 2가지만을 사용
참고 자료 : https://ko.wikipedia.org/wiki/UTF-16
UTF-8 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. 둘러보기로 가기 검색하러 가기 UTF-8은 유니코드를 위한 가변 길이 문자 인코딩 방식 중 하나로, 켄 톰프슨과 롭 파이크가 만들었다. UTF-8은 Universal Coded Character
ko.wikipedia.org
▶ UTF-32
: 문자 하나를 4바이트를 사용
참고 자료 : https://ko.wikipedia.org/wiki/UTF-32
UTF-32 - 위키백과, 우리 모두의 백과사전
ko.wikipedia.org
'R&D' 카테고리의 다른 글
[Unity] 폰트 ( 이미지 Font, Dynamic Font ) (0) | 2020.05.08 |
---|---|
[Unity] 게임 데이터는 어떻게 관리할 것인가. (0) | 2020.05.06 |
[Unity] 게임 암호화 (0) | 2020.05.02 |
[Unity] 컴퓨터에서 사용하는 데이터의 단위 (0) | 2020.05.02 |
[Unity] 게임 뷰 정의 (0) | 2020.04.26 |