코드 ch20
TRANSCRIPT
CODE
Ch 20
Chapter 20
아스키 코드와 문자의 변환
문자를 디지털형태로 나타내기 위해선?
각 글자를 특정 부호를 이용하여 표현할 수 있는
표현 체계를 개발 해야 한다.
각각의 부호는 몇 비트를 사용해야 할까요?
1) 글자체의 효과를 사용하지 않고 평범한 문자만 사용합니다.
Call me Ishmael == Call me Ishmael
2) 특수문자등을 사용하지않고 영문자 만을 사용합니다.
ë ü å (X)
1) 5비트를 사용하는 보도 부호
다양한 부호들
1) 5비트를 사용하는 보도 부호
다양한 부호들
문제점?
I SPENT $25 TODAY. 를 연속해서 두 번 쓴다면?
줄 바꿈 후 문자변경을 부호를 사용 해줘야만 함!
=> 경제적이긴 하지만 숫자 구두점등에 고유 부호를 할당하는게 좋음!
2) 7비트를 사용하는 아스키 부호
다양한 부호들
소문자 26 ( a~z )
+ 대문자 26 ( A~Z )
+ 숫자 10 ( 0~9 )
+ α (구두점)
= 64개 이상
따라서 아스키 부호는 7비트를 사용
2) 7비트를 사용하는 아스키 부호
다양한 부호들
2) 7비트를 사용하는 아스키 부호
다양한 부호들
2) 7비트를 사용하는 아스키 부호
다양한 부호들
문제점?
1) 미국 실정에만 맞춰져 있음
2) 비영어권 국가에 대한 고려가 이루어 지지 않았음
확장된 아스키 코드가 고안됨
여러 확장안 사이의 호환성 문제가 발생!
유니코드가 개발됨
3) 16비트를 사용하는 유니코드
다양한 부호들
문제점?
문자를 저장하는데 2바이트가 필요함
=> 모호성을 없앨 수 있기 때문에 지불 할 가치가 있음
4) 유니코드를 위한 가변 길이 문자 인코딩 방식 UTF-8
다양한 부호들
유니 코드는 모든 문자를 저장하는데 2바이트가 필요함
이를 보완 하고자 등장한 인코딩 방식이 UTF-8
Ex)
UTF-8에서 0000h ~ 007Fh 까지의 ASCII 문자는 1바이트를 사용
The End…..