文字エンコーディング

8
文文文文文文文文文文 2010 文 7 文

Upload: armand-bean

Post on 03-Jan-2016

42 views

Category:

Documents


0 download

DESCRIPTION

文字エンコーディング. 2010 年 7 月. 目次. 文字セット 文字コード 文字エンコーディング. 文字セット. 漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと 「文字集合」とも呼ばれる 国や言語によってさまざまな文字セットがある 文字セットによって含まれる文字が異なる JIS 漢字コード – ひらがなや漢字など ASCII – 英数字、記号など Unicode – 世界の主要言語の文字. 文字セット(例). ASCII. Unicode. a. A. 1. “. い. JIS 漢字コード. う. あ. ア. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 文字エンコーディング

文字エンコーディング

2010 年 7 月

Page 2: 文字エンコーディング

目次

文字セット文字コード文字エンコーディング

Page 3: 文字エンコーディング

文字セット

漢字、ひらがな、カタカナ、英数字、記号などの文字の集まりのこと

「文字集合」とも呼ばれる国や言語によってさまざまな文字セットが

ある文字セットによって含まれる文字が異なる

JIS 漢字コード – ひらがなや漢字などASCII – 英数字、記号などUnicode – 世界の主要言語の文字

Page 4: 文字エンコーディング

文字セット(例)

川う

翻山

JIS 漢字コード

ASCII

A a

1 “

Unicode

é И

“ɛ

アあ

うい

翻山

Aa

1

Page 5: 文字エンコーディング

文字コード

それぞれの文字や記号に割り当てられた固有の数字のこと

文字セットによって、同じ文字に対して異なる数字が割り当てられる場合がある

JIS 漢字コード

ASCII Unicode

あ 2422 (存在しない)

3042

ア 2522 (存在しない)

30A2

A (半角)

(存在しない)

41 0041

( 16 進数で表記)

Page 6: 文字エンコーディング

文字エンコーディング

文字コードをコンピュータが利用できるデータに変換(符号化)する方式

「文字符号化方式」とも呼ばれるJIS 漢字コードおよび ASCII を符号化する方式

Shift_JISEUC-JP ISO-2022-JP

Unicode を符号化する方式UTF-8UTF-16

Page 7: 文字エンコーディング

JIS 漢字コード+ ASCII

Unicode

文字エンコーディング(例)

文字コード

Shift_JIS EUC-JP ISO-2022-JP

あ 2422 82A0 A4A2 2422

ア 2522 8341 A5A2 2522

A 41 41 41 41

文字コード UTF-8 UTF-16

あ 3042 E38182 3042

ア 30A2 E382A2 30A2

A 41 41 0041

Page 8: 文字エンコーディング

注意

この資料は文字コードの概念を説明するためのものです

分かりやすく説明するため、詳細を割愛しています

詳細についてはウィキペディアの下記のページを参照してください「文字コード」「文字集合」「文字符号化方式」