2014.05.27 字形dbテストサイトの構築と状況

12
文字情報技術の最新動向 字形 DB テストサイト の構築と状況 文字情報技術促進協議会 田原恭二

Upload: japan-electronic-publishing-association

Post on 06-May-2015

146 views

Category:

Internet


1 download

DESCRIPTION

2014.05.27 文字情報技術の最新動向 田原 恭二 氏 日本電子出版協会

TRANSCRIPT

Page 1: 2014.05.27 字形DBテストサイトの構築と状況

文字情報技術の最新動向

字形DBテストサイトの構築と状況

文字情報技術促進協議会 田原恭二

Page 2: 2014.05.27 字形DBテストサイトの構築と状況

こんな字形 DB の構築を検討しています

属性属性属性属性

噂噂龍龒属性属性属性属性

属性属性属性属性

属性属性属性属性

● 「文字とその文字の属性」および「文字と文字の関係性」を登録● 出版業界で使われる文字にフォーカス● クラウド型でどこでも使える

Page 3: 2014.05.27 字形DBテストサイトの構築と状況

字形 DB テストサイトのデモ

まずはそのテストサイト

をご覧ください。

Page 4: 2014.05.27 字形DBテストサイトの構築と状況

経緯

当協議会では平成 24 年度に経済産業省で行った「外字・異体字利用環境整備事業」の成果物の利活用検討を実施

[着眼点]IVS による文字入力などで、利用者の文字選びを支援するツールとして活用できるのではないか?

● いつでも・どこでも使えて● 特別なツールを必要とせず● 正確で使いやすい “ みんなの辞書 ” 的なもの

経済産業省の実証実験システムを参考にしてクラウドで動くレプリカ「字形 DBテストサイト」を作成して検討中

Page 5: 2014.05.27 字形DBテストサイトの構築と状況

字形 DB の管理項目(属性情報)

id 管理項目 内容1 部首 部首2 画数 総画数 総画数3 部首内画数 部首内の画数4 読み 読み(複数)5 漢字構成記述文字 グリフの構成を示す図形パターン6

符号位置CID CID 番号

7 UNICODE UNICODE8 JIS JIS コード9 異体字情報 IVS 情報 AJ1/IVD 登録異体字セレクタ10 その他関連文字 その他の関連する文字情報11

字体変更情報

JIS X 0208 JIS X 0208 の符号位置12 JIS X 0213:2000 JIS X 0213:2000 の符号位置13 JIS X 0213:2004 JIS X 0213:2004 の符号位置14 康熙別掲字 JIS X 0213:2000 の「附属書 7」の情報15 互換漢字 JIS X 0213:2004 表外漢字 UCS 互換漢字16 文字クラス W3C JLReq に示される文字クラス17

書体サンプル

小塚明朝

1 文字 128 × 128 ピクセルの PNG 画像

18 秀英明朝19 凸版明朝20 イワタ明朝21 筑紫明朝22 リュウミン23 ヒラギノ明朝24 MS明朝25 IPA 明朝

Page 6: 2014.05.27 字形DBテストサイトの構築と状況

書体サンプル(書体見本帳っぽくなっています)

永永永永永永永

小塚明朝 秀英明朝 凸版明朝 イワタ明朝

筑紫明朝 リュウミン ヒラギノ明朝

永MS明朝

Page 7: 2014.05.27 字形DBテストサイトの構築と状況

文字の情報交換において文字化けや外字が発生するメカニズム

A さん B さん

● A さんと B さんの文字環境がちがう● A さんも B さんも、この文字は入力できない

注)これらはデジタル環境での情報交換を前提としています。

Page 8: 2014.05.27 字形DBテストサイトの構築と状況

身近なフロー(隣接する工程を A さん B さんに置き換えてみてください)

企画

執筆

編集

制作

印刷

流通

企画

執筆

編集

制作

流通

表示

● 出版印刷物の例

● 電子書籍の例

Page 9: 2014.05.27 字形DBテストサイトの構築と状況

文字化や外字の対応方法

● 表示可能な文字に置き換える● 外字画像で貼り込む● 専用フォントを作成● フォント埋込み● IVS で対応注)いちど変えてしまったものは元に戻せない場合があるので注意が必要です。

Page 10: 2014.05.27 字形DBテストサイトの構築と状況

字形 DB に期待すること

● 文字の意味や文字と文字の関係性が「みえる化」され各社サービスに字形 DB が活用されることによって、IVS が使いやすくなり利用が広がる

● 印刷物や電子書籍の制作でデータ変換や校正作業に字形 DB を活用することによって、効率的で適切な対応が行えるようになる

● 各社の書体が横並びで見られるので書体見本帳的な使われ方もでき、各社の書体利用が進む

Page 11: 2014.05.27 字形DBテストサイトの構築と状況

今後の活動予定

1. 精度アップ(DB 登録内容)

2. 利便性アップ(機能面)

3. パブリックレビューの実施

Page 12: 2014.05.27 字形DBテストサイトの構築と状況

[参考]デジタル・ネットワーク社会における出版物の利活用促進のための外字・異体字利用環境整備事業

[概要]デジタル化・ネットワーク化された環境において、日本の出版文化や文字文化の特徴だる多様な漢字表現は端末機器上に電子的に表示するために規格の平準化・限定化が要求される。他方、著作者・出版社によっては自らの意図を正確に表現したい、学術上の正確さを表現したい等の要求がある。また、読者の中には電子的環境における漢字の表現方法に対して高い多様性を求めているものもいる。 出版物における外字・異体字の表現は電子的環境においても歴史的な文章における字体、著作者の意図、出版社の方針等を正確に反映することが重要であるが、他方、ビジネスの場においては先取性のある商品開発や広く迅速に伝播する流通システムを構築することも重要な要素となるため、適切な外字・異体字の配信のあり方を検討する際には表現の多様性確保とバランスをとりながら進めることが重要である。 これらの観点に基づき外字の収集・整理方法、文字図形共有基盤の運営方法、利用端末での外字実装方法等、出版物のデジタル化における外字・異体字の円滑な配信のための利用環境整備に関する実証実験等を実施する。