東京node学園#6 文字コードと node

25

Upload: koichik

Post on 17-Jun-2015

4.956 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: 東京Node学園#6 文字コードと Node
Page 2: 東京Node学園#6 文字コードと Node

06/25 (UTC) リリース

Page 3: 東京Node学園#6 文字コードと Node
Page 4: 東京Node学園#6 文字コードと Node

符号化文字集合

エンコーディング方式

Page 5: 東京Node学園#6 文字コードと Node

ASCII

ISO-8859-1

JIS X 0201

JIS X 0208

JIS X 0213

Page 6: 東京Node学園#6 文字コードと Node

Shift_JIS

EUC-JP

ISO-2022-JP

Page 7: 東京Node学園#6 文字コードと Node

世界中の文字を集めた符号化文字集合

2バイトの符号

日本語・中国語・韓国語の漢字は統合

Page 8: 東京Node学園#6 文字コードと Node

世界中の文字を集めた符号化文字集合

4バイトの符号

Unicodeに先行していたが支持されず

Page 9: 東京Node学園#6 文字コードと Node
Page 10: 東京Node学園#6 文字コードと Node

Unicodeのエンコーディング方式

バイト単位で可変長のエンコーディング

Page 11: 東京Node学園#6 文字コードと Node
Page 12: 東京Node学園#6 文字コードと Node

2byte (16bit) では足りない

BMP (基本多言語面)

Page 13: 東京Node学園#6 文字コードと Node

2バイト単位のエンコーディング方式

サロゲートペア

Page 14: 東京Node学園#6 文字コードと Node
Page 15: 東京Node学園#6 文字コードと Node

UTF-8ではサロゲートペアは不要

3バイト長までしかサポートしていない環境もある

非BMPを3バイトのペア(計6バイト)でエンコーディング

Page 16: 東京Node学園#6 文字コードと Node

エンコーディング方式が揃う

UTF-16

UTF-32

Unicode 3.2 ('02)

Page 17: 東京Node学園#6 文字コードと Node

emojiが追加 (非BMP)

Page 18: 東京Node学園#6 文字コードと Node

ECMA262

string型

Page 19: 東京Node学園#6 文字コードと Node

~v3.8

v3.9~

Page 20: 東京Node学園#6 文字コードと Node

Node v0.6

Node v0.8

Page 21: 東京Node学園#6 文字コードと Node

Buffer

ストリーム (string_decoder)

Page 22: 東京Node学園#6 文字コードと Node

Node v0.6

Node v0.8

Page 23: 東京Node学園#6 文字コードと Node

Node v0.6

Node v0.8

Page 24: 東京Node学園#6 文字コードと Node

他のエンコーディング

node-iconv

ストリームでの利用は注意

Page 25: 東京Node学園#6 文字コードと Node