フォント整備作業の報告 1.進捗 - ipa...2011/03/08 ·...
TRANSCRIPT
1
2011 年 3 月 4日
文字情報基盤(IPA 事務局)
フォント整備作業の報告
1.進捗 表 1 進捗表
2.文字情報基盤文字数と符号化について
1〜5 8〜12 15〜19 22〜26 6〜10 13〜17 20〜24 10〜14 17〜21 24〜28 7〜11 14〜18
制作字数 週合計 3,962 4,282 2,917 3,737 3,828 3,347 3,613 3,103 3,714 3,544 1,116 ー
累 計 3,962 8,244 11,161 14,898 22,956 26,303 29,916 36,464 40,178 43,722 48,653 ー
制作検査 週合計
1,400 5,706 2,821 3,860 3,905 3,398 3,648 3,040 3,040 4,560 3,053 ー
累 計 1,400 7,106 9,927 13,787 21,992 25,390 29,038 34,200 37,240 41,800 48,653 ー
4,300 2,122 3,800
18,087 31,160 45,600
4,230 3,445 3,815
19,128 33,361 47,537
11月 12月 1月 2月
29〜3 27〜7 31〜4
月 10月
日 26〜29 1〜5 8〜12 15〜1922〜26 6〜10 13〜1720〜24 10〜1417〜2124〜28 7〜11 14〜1821〜25 7〜11 14
1 A)
2 ( 1) 「 文字一覧表」 から テ ン プ レ ート データ 作成
3「 文字一覧表」 のグリ フ 画像 → 1 文字毎のグリ フ 画像を テ ン プ レ ート データ と する 。
4 合成貼り 込みリ ス ト 用 整理番号順の整理
5 ( 2) I DSリ ス ト 整備
6「 漢字情報テ ーブ ル」 から 必要最小限のデータ を 抜き 出し 、 漢字データ ベース プ ロ ジ ェ ク ト のI DSを 付加し た Excel フ ァ イ ルを 作成し 、 平成明朝図形に合わせて I DS を 手直し する 。
7 符号化さ れて いな いグリ フ に I DS を 付加する 。
8 B)
9
10
11 C)
12 ( 1) 合成貼り 込み計画の作成
13 ( 2) 部首構成要素リ ス ト 、 補間パーツ データ を 整備
14 ( 3) 合成貼り 込みリ ス ト を 整備
15 ( 4) 合成貼り 込みの実行、 作業者への提供
16 D)
17
18 ( 2) 陰線処理と 品質チ ェ ッ ク
19 E)
20
21 ( 2) 陰線処理と 品質チ ェ ッ ク
22 F)
23
24
25
26
27
28 G)
29
30
31
32
33
34
35 H)
36
37
グリ フ 作成の準備作業
I PAex明朝パーツ データ の準備
I PAex明朝パーツ データ の合成貼り 込み
文字図形微調整作業( 49, 000字)
非漢字追加作成作業
フ ォ ン ト フ ァ イ ルへの実装
チ ェ ッ ク ・ 検証作業
MJメ タ データ の作成/漢字の貼り 込み作業
①② 6, 355字: 部首分解. t t f → BEにて 編集( 切断面整理)
①③ 3, 685字: I PAex明朝. t t f → BEにて 編集( 部首分解・ 切断面整理)
( 1) 補間エ ディ タ と 微調整作業
①〜⑥ OpenTypeフ ォ ン ト の作成
⑦〜⑨ 全グリ フ のSVGフ ァ イ ルの作成
⑩ すべて のパーツ データ から SVGフ ァ イ ルの作成
( 1) 公開する 文字情報の符号化情報と 同一に符号化さ れて いる か確認
( 6) 作成フ ォ ン ト フ ァ イ ルの確認
29〜3 27〜7 31〜4 28〜4
11月 12月 1月 2月 3月
④ 検証作業
フ ォ ン ト 制作作業 作業項目
⑪ OpenType等価のグリ フ を 部首分解し た 漢字を 収容する . t t f の作成
⑫ . t t f の文字と 分解し た グリ フ のパーツ 関係を I DS記述し た csvフ ァ イ ル作成
( 2) 外字のSVGフ ァ イ ルの確認
( 3) 追加非漢字の符号化確認
( 4) I VS符号化の確認
( 5) 各OSおよ び各ア プ リ で の動作確認
①〜③ 貼り 込み
( 1) 作成作業
2
【符号化方針】
①ISO/IEC10646 CJK統合漢字に規格化されているものを符号化する。
②UCS の一つの符号位置に対応する文字が複数あるもののうち、異体字の関係を持つこと
がUnicodeの IVDで明確とされているもの(Hanyo-Denshiとして IVD登録されている)
については IVS方式による符号化を行う。
③汎用電子の漢字情報テーブルでUCSの一つの符号位置に重複して対応づけられている文
字のうち、IVD 登録されていない文字についての符号化方針は下記とする。
A)常用漢字の通用字体に指定されている字形は、当該字形を採用
B)ISO/IEC 10646 規格書に対応する JIS の例示字形が明確な場合(JIS X 0213/0212
は JIS の例示字形に近いものを採用。
C)ISO/IEC 10646規格書に対応する JIS の例示字形がない場合。
精査に時間を要するため、3月末版では符号化せずに GIDのみ付与する形で供給。
【非漢字】
①非漢字グリフ数:2002
②非漢字符号位置数:1672
注:非漢字については、同一グリフに複数の符号を付与している場合、縦書き用文字やリ
ガチャ(合計:354 グリフ)等同一符号からコンテクストにより異なるグリフが選択され
る場合等、符号と1対1対応しないグリフがあり、グリフ数と符号位置数は一致しない。
IPAmj明朝フォントに収納した非漢字は、JIS X0212および JIS X0213の非漢字と、IPAex
明朝フォントにすでに収納されていた非漢字。
7,296文字
23,480文字 25,662文字 2,274文字1672文字
文字基盤文字(xx,xxx文字)
BMP (全65,536文字) CJK統合漢字拡張B,C,D (全47,000文字) IVD
住基統一(漢字のみ)(19,432文字)
戸籍統一(漢字のみ)(55,267文字)
汎用電子情報交換環境整備プログラムで整理された漢字
(58,712文字)
文字情報基盤漢字(58,712文字)
非漢字(2002図形)縦用、リガチャ
を含む
登記固有文字
(10,330)
58,712文字に固有の識別番号を振ったという意味。複数の識別番号に同一のグリフが割り当ててある場合もある(住基文字については500文字)。
異なる識別番号に同一グリフの割り当てられている文字のうち、住基文字由来の文字約500文字については、作り分けを行う予定(4月以降)
今回は符号化対象外
現在、一部(漢字においては5,039文字)が、UCSにおけるハングル文字スペース相当の領域に割り当てられている。
ISO/IEC 10646
図 1 文字数と符号化
3
表 2 文字情報基盤の漢字の文字数と符号化の関係
基底文字バリエーション 基底文字
バリエーション
文字情報基盤対象汎用電子情報交換環境整備プログラムの漢字情報テーブルのうち戸籍番号、住基コードが付与されている文字が対象。
1 UCS付き1.1 UCS重複なし 19859 - 25614 - 45473 - 45473 -1.2 UCS重複あり -
1.2.1.1 IVD登録されている文字
1885 2239 33 35 4192 - 4192
(1)Unicode ConsortiumへのHanyo-DenshiのIVD登録(Version:2010-11-14 )は、1918基底文字に対して4195文字である。本表中では以下(a)(b)(c)の3文字分がカウントされていない。なお、3文字の作字・符号化方針として、(a)(b)は実装、(c)は実装しないこととした。 (a)汎用電子には無いが、JIS補助漢字のグリフでISO/IEC10646のJ欄に使われている文字 :51DE_E0105(Hanyo-Denshi) (b)「1.1 UCS重複なし」に属す互換漢字で、異なる符号位置のIVSが振られている文字 : MJ番号mj30310、UCS:FA6D、8218_E0103(Hanyo-Denshi) (c)汎用電子にはあるが文字情報基盤の対象外(登記のみ)の文字 : 汎用電子の整理番号18177、771F_E0104(Hanyo-Denshi)(2)備忘録:互換漢字でUCS番号とHanyo-DenshiのIVSのUCS番号が異なっている文字がある。 MJ番号:mj30273,UCS:FA4A,Hanyo-Denshi:7422_E0103
1.2.1.2 IVD登録されていない文字
- - - - - 380 380IVD登録されている基底文字の符号位置を持つが、Hanyo-DenshiとしてIVD登録されていない文字は文字図形として扱う。
1.2.2.1 JIS X0213またはJIS X0212に符号位置を持つUCSの文字
1736 - 15 - 1751 1997 3748
(1)1.2.2に属する文字は、全5793文字(異なり数2742)(2)例外的に、JIS X0213またはJIS X0212に符号位置を持たないがいわゆるIBM外字としてIPAex明朝フォントに含まれている3箇所の符号位置の6文字を本分類に含めた。符号位置と符号化文字の関係について以下に示す。 MJ番号:mj23770をU+8807に符号化。重複符号のMJ番号:mj23771は文字図形のみ。 MJ番号:mj30192をU+FA0Eに符号化。重複符号のMJ番号:mj30191は文字図形のみ。 MJ番号:mj30237をU+FA27に符号化。重複符号のMJ番号:mj30236は文字図形のみ。(3)重複文字の【符号化方針】③B)の例外処理として、以下の文字については、IPAex明朝フォントにある文字図形と同じ形の文字図形を符号化した。 MJ番号:09495をU+5953に符号化。MJ番号:09496(X0212:24-85)は文字図形のみ。 MJ番号:11532をU+605Dに符号化。MJ番号:11530(X0212:29-71)とMJ番号:11531は文字図形のみ。 MJ番号:26100をU+9067に符号化。MJ番号:26101(X0212:65-66)は文字図形のみ。 MJ番号:26893をU+92D5に符号化。MJ番号:26892(X0212:68-32)は文字図形のみ。
1.2.2.2 JIS0213またはJIS0212に符号位置を持たないUCSの文字
- - - - - 2045 2045 【符号化方針】③C)に従い、文字図形として扱う
1.2の合計 3621 2239 48 35 5943 4422 10365 -
1の合計 23480 2239 25662 35 51416 4422 55838 -
2.UCSなし 2874 2874 -合計 7296 58712 -
分類 符号化文字
符号化外文字数
総文字数 備考BMP内 サロゲート
符号化文字数合計
1.2.1 IVD登録されている基底文字の符号位置を持つ文字
1.2.2 上記(1.2.1)以外のUCS符号位置を持つ文字
注)2011年の『平成22年度 社会環境整備・産業競争力 強化型規格開発事業 汎用電子情報交換環境整備プログラム フォローアップ(略称:汎用電子2010)成果報告書』で13文字(うち本事業の対象1文字)が削除された。本作業では、汎用電子2010を反映済みである。