文字エンコーディング
DESCRIPTION
文字エンコーディング. 2010 年 7 月. 目次. 文字セット 文字コード 文字エンコーディング. 文字セット. 漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと 「文字集合」とも呼ばれる 国や言語によってさまざまな文字セットがある 文字セットによって含まれる文字が異なる JIS 漢字コード – ひらがなや漢字など ASCII – 英数字、記号など Unicode – 世界の主要言語の文字. 文字セット(例). ASCII. Unicode. a. A. 1. “. い. JIS 漢字コード. う. あ. ア. - PowerPoint PPT PresentationTRANSCRIPT
文字エンコーディング
2010 年 7 月
目次
文字セット文字コード文字エンコーディング
文字セット
漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと
「文字集合」とも呼ばれる国や言語によってさまざまな文字セットが
ある文字セットによって含まれる文字が異なる
JIS 漢字コード – ひらがなや漢字などASCII – 英数字、記号などUnicode – 世界の主要言語の文字
文字セット(例)
ア
あ
川う
い
翻山
JIS 漢字コード
ASCII
A a
1 “
Unicode
é И
“ɛ
アあ
川
うい
翻山
Aa
1
文字コード
それぞれの文字や記号に割り当てられた固有の数字のこと
文字セットによって、同じ文字に対して異なる数字が割り当てられる場合がある
JIS 漢字コード
ASCII Unicode
あ 2422 (存在しない)
3042
ア 2522 (存在しない)
30A2
A (半角)
(存在しない)
41 0041
( 16 進数で表記)
文字エンコーディング
文字コードをコンピュータが利用できるデータに変換(符号化)する方式
「文字符号化方式」とも呼ばれるJIS 漢字コードおよび ASCII を符号化する方式
Shift_JISEUC-JP ISO-2022-JP
Unicode を符号化する方式UTF-8UTF-16
JIS 漢字コード+ ASCII
Unicode
文字エンコーディング(例)
文字コード
Shift_JIS EUC-JP ISO-2022-JP
あ 2422 82A0 A4A2 2422
ア 2522 8341 A5A2 2522
A 41 41 41 41
文字コード UTF-8 UTF-16
あ 3042 E38182 3042
ア 30A2 E382A2 30A2
A 41 41 0041
注意
この資料は文字コードの概念を説明するためのものです
分かりやすく説明するため、詳細を割愛しています
詳細についてはウィキペディアの下記のページを参照してください「文字コード」「文字集合」「文字符号化方式」