電子出版交換フォーマット jepax

38
1 電電電電電電電電電電電電 JepaX 日日日日日日日日 日日日日日日日日日日日日日日日日日日日 日日日日日日日日日 () 電電

Upload: hayley

Post on 04-Feb-2016

54 views

Category:

Documents


0 download

DESCRIPTION

電子出版交換フォーマット JepaX. 日本電子出版協会 出版データフォーマット標準化研究委員会 (イースト株式会社) 渋谷 誠. 日本電子出版協会( JEPA). 1987年設立 日本の電子出版の普及促進と情報提供 が目的 出版社、印刷会社、コンピュータメーカー、ソフトハウスなど137社が参加 http://www.jepa.or.jp/. 立ち上がる電子書籍市場. 米国 Rocket eBook 発売(昨年) http://www.rocket-ebook.com/ Open eBook 仕様発表(9月) http://www.openebook.org/ - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 電子出版交換フォーマット JepaX

1

電子出版交換フォーマット

JepaX

日本電子出版協会出版データフォーマット標準化研究委員会

(イースト株式会社)

渋谷 誠

Page 2: 電子出版交換フォーマット JepaX

2

日本電子出版協会 (JEPA)

• 1987 年設立• 日本の電子出版の普及促進と情報提供

が目的• 出版社、印刷会社、コンピュータメーカー、

ソフトハウスなど137社が参加• http://www.jepa.or.jp/

Page 3: 電子出版交換フォーマット JepaX

3

立ち上がる電子書籍市場• 米国

– Rocket eBook 発売(昨年)• http://www.rocket-ebook.com/

– Open eBook 仕様発表(9月)• http://www.openebook.org/

– Microsoft Reader 発表(9月)• http://www.microsoft.com/reader/

Page 4: 電子出版交換フォーマット JepaX

4

立ち上がる電子書籍市場• 国内

– ブックオンデマンド総合実証実験• http://www.ebj.gr.jp/

– Web サイトでの電子書籍販売• コンテンツパラダイス (http://conpara.topica.ne.jp/)

• ザウルス文庫 (http://www.zaurusworld.ne.jp/)

• まんがの国  (http://manga.accessticket.com/)

• EBOOK.CO.JP   (http://www.ebook.co.jp/)

• 電子書店パピレス (http://www.papy.co.jp/)

Page 5: 電子出版交換フォーマット JepaX

5

電子書籍市場の課題

• 電子読書インフラの整備– 携帯型ビューワー– 縦組み、ルビ、外字サポート– 著作権保護、課金システム

• コンテンツの充実– 既存書籍のデジタル化– 新刊書のデジタル版同時発売

Page 6: 電子出版交換フォーマット JepaX

6

既存書籍のデジタル化

• どのフォーマットにするか?• 現在使用可: 

プレーンテキスト、 HTML 、 T-Time 、 Book Jacket

• 将来登場予定: Open eBook 日本語、 NetEB 、文庫本 DTD電子書籍コンソーシアムのテキスト系フォーマット

• ルビはどうする?• 外字はどうする?

Page 7: 電子出版交換フォーマット JepaX

7

共通フォーマットへの期待

• 中立的な中間フォーマット• 各種の「配布フォーマット」に変換可能• 日本語独自の問題への対処

– 外字、ルビ、縦組み、文字コード• 「単純ですぐに使える」ものであること• 仕様が一日も早く決まること

Page 8: 電子出版交換フォーマット JepaX

8

JEPA での仕様策定作業

• 3月: – 検討開始  TEI, DocBook, ISO-12083 などを調査

• 5月: – 0.1 仕様 第1回ミーティング メーリングリストで検討開始

• 7月: – 0.7 仕様  JEPA で説明会開催 サンプル文書、 XSL も公開

• 8月:– 0.8 仕様  DTD 公開 

• 9月:– 第2回ミーティング  0.9 仕様一般公開

Page 9: 電子出版交換フォーマット JepaX

9

公開しているもの(1)

• http://x.jepa.or.jp/jepax/

• 仕様– 0.9 仕様書

• JepaX フォーマット• HTML フォーマット• Word フォーマット

– 0.9 DTD

Page 10: 電子出版交換フォーマット JepaX

10

公開しているもの(2)• サンプル文書

– 基本サンプル • 全要素を使った文書 • JepaX 0.9 仕様書 • テンプレート

– 実用書 • 「ワープロここが不思議」 (講談社ブルーバックス) • 「パソコン悠々漢字術」 (一部のみ・公開準備中)

– 小説 – 論文

Page 11: 電子出版交換フォーマット JepaX

11

公開しているもの(3)

• 他フォーマットへの変換として– XSL スタイルシートのサンプル

• JepaX → HTML

• JepaX → T-Time

• JepaX → Open eBook

Page 12: 電子出版交換フォーマット JepaX

12

JepaX のコンセプト

Page 13: 電子出版交換フォーマット JepaX

13

中間フォーマットの意義

• どのフォーマットでも同じ作業が必要– ルビ、外字を探す– 段落を区切って見出しを取り出す– 書誌情報を作成

• これらが完了後の状態で蓄積• 必要に応じて配布フォーマットへ変換

– フォーマット依存のスタイル・レイアウト情報を付加

• 交換用フォーマットとしても安心して使える– 表計算の CSV 、ワープロの RTF のようなもの

Page 14: 電子出版交換フォーマット JepaX

14

HTML ではだめなのか?

• タグの多さと用法の混乱• 論理構造が記述しにくい• 日本語用仕様の欠如• 書誌情報が記述できない

Page 15: 電子出版交換フォーマット JepaX

15

JepaX の基本方針

• 交換・蓄積用フォーマット• 各種の最終配布フォーマットへ変換可• 必要最低限の簡潔さ• Free & Open

• 外字の指定方法を規定• 使用文字コードの規定• 半年で完成させる

Page 16: 電子出版交換フォーマット JepaX

16

JepaX 仕様の詳細

Page 17: 電子出版交換フォーマット JepaX

17

文書形式

• 検証済み XML 文書– DTDは仕様とともに公開<!DOCTYPE jepax PUBLIC “-//JEPA//DTD JepaX 1.0//JA”

“http://x.jepa.or.jp/jepax/jepax10.dtd” >

• ファイルの Encoding– Unicode(UTF-16) を推奨– 使用できる文字についての規定あり

Page 18: 電子出版交換フォーマット JepaX

18

全体構造• トップレベルに6つの要素

jepax

jepaxinfo front

body

backbookinfo cover

Page 19: 電子出版交換フォーマット JepaX

19

jepaxinfo 要素• ファイル自身に関するメタ情報

– 使用文字コード • <char-exp type="windows"/>

– 推奨される組み方向• <pref-layout flow="horz"/>

– 外字指定の方式• <giset-desc value="mojikyo">…

– 追加した独自属性• <xtype-desc element="div" value=" ト書き ">…

• <class-desc element="em" value="blink">…

Page 20: 電子出版交換フォーマット JepaX

20

bookinfo 要素

• 書誌情報– 現在は必要最低限のものだけ

• <isbn>

• <c-code>

• <book-title>

• <book-subtitle>

• <edition>

• <series-title>

• <book-author>

• <pub-date>

• <publisher>

Page 21: 電子出版交換フォーマット JepaX

21

cover ,front, body, back 要素

• それぞれ div 要素のみからなる– <cover>

• 「カバー」や「見返し」や「帯」などに書かれていた内容

– <front>• 「まえがき」「序文」「目次」などの本文の前に配置される内容

– <body>• 文書の主たる内容

– <back>• 「あとがき」「解説」「索引」などの本文の後に配置される内容

Page 22: 電子出版交換フォーマット JepaX

22

div 要素

div

head

subtitle authortitle p

div

+

+ note

ブロック要素 リスト要素

Page 23: 電子出版交換フォーマット JepaX

23

階層定義の例<div type=”章” >

<head> <no>第一章 </no> <title>電子出版の歴史 </title></head><div type=”節” >

<head> <no>1. </no> <title>黎明期 </title> <subtitle>CD-ROM辞書の時代 </subtitle>

</head> ・・・

(本文 )・・・

</div>

</div>

Page 24: 電子出版交換フォーマット JepaX

24

論理構造の表現

• div 要素ひとつだけを使う• 入れ子にして階層を表現• 属性 type で階層に意味を付加

• " 部 ", "章 ", "節 ", "項 1", "項 2", "項 3",…

• "序文 ", "謝辞 ", "献辞 ", " 目次 ", " あとがき ", …

• "囲み "," とびら ","索引 ",…

• 以上にあてはまらない場合は、属性 xtype で任意の名称も設定可能

Page 25: 電子出版交換フォーマット JepaX

25

div 要素以下の階層

文字列 (CDATA) インライン要素(11種)

ブロック要素(4種)

div 要素

リスト要素(3種)

Page 26: 電子出版交換フォーマット JepaX

26

リスト要素

• HTML のリストを踏襲• ただし、内容モデルは異なる

– 順序なしリスト• <ul>, <li>

– 順序つきリスト• <ol>, <li>

– 定義リスト• <dl>, <dt>, <dd>

Page 27: 電子出版交換フォーマット JepaX

27

ブロック要素(1)• パラグラフ  

– <p>

• 整形テキスト  – <pre>

• 表  – <table>, <caption> ,<tr>, <th>, <td>

Page 28: 電子出版交換フォーマット JepaX

28

ブロック要素(2)

• 外部ファイルデータ  – <float>, <caption>, <res>

<float><caption>    <no>図1 </no>   <title>JepaX のロゴ </title></caption><res mimetype="image/gif" src="jepaxlogo.gif">

</float>

Page 29: 電子出版交換フォーマット JepaX

29

インライン要素(1)

• 汎用インライン要素– <span>

– 属性 type で意味を指定 ,   xtype で独自定義可

<span type=”URL”>http://www.jepa.or.jp/</span>

• 強調– <em>

– 強調方法の指定はない

<em>何の料金も </em>支払う必要がない

Page 30: 電子出版交換フォーマット JepaX

30

インライン要素(2)

• 参照(内部リンク) – <ref>

– 属性 idref で参照先を指定<ref idref=”fig13” type=”figure”>図 13</ref>参照

• キーワード – <key>

– 属性 reading で「読み」を指定<key reading=" サカモトリョウマ ">坂本龍馬 </key>

Page 31: 電子出版交換フォーマット JepaX

31

インライン要素(3)

• 縦横文字切り替え– <byflow>, <ht>, <vt>– 縦組み用と横組み用の文字列を併記

<byflow> <ht>上の </ht> <vt>右の </vt> </byflow>表において

• 割注– <mlg>– 括弧内で2行に分けて表記する注

Page 32: 電子出版交換フォーマット JepaX

32

インライン要素(4)• ルビ

– <ruby>, <rb>, <rt>– W3C案に準拠

<ruby><rb>株式会社 </rb><rt>かぶしきがいしゃ </rt></ruby>

• 上付き、下付き– <sup>, <sub>

Page 33: 電子出版交換フォーマット JepaX

33

インライン要素( 5 )• 改行

– <br>

• インライン画像– <img>

<img mimetype="image/gif" src="jepaxlogo.gif">

Page 34: 電子出版交換フォーマット JepaX

34

インライン要素( 6 )• 字形イメージ

– <gi>

– 属性 set で「字形分類体系」を指定– <jepaxinfo> 中にその「分類体系」の説明を記述

<giset-desc value="mojikyo"> … </giset-desc>– 属性 name で字形イメージの番号/名称を指定– 属性 alt で「代替表示文字列」を指定

森  <gi set="mojikyo" name="58562" alt="鴎 " /> 外深 <gi set="mojikyo" name="04894" alt=" (土川) " />経済特区

Page 35: 電子出版交換フォーマット JepaX

35

文字指定の方法(1)

• 通常の文字コード– 環境によっては表示できないこともある

• 文字名称を使う– 欧文のみ&aacute   ; &uuml;

&copy; &trade;

Page 36: 電子出版交換フォーマット JepaX

36

文字指定の方法(2)

• UCS 文字番号– XML の仕様で規定されている方法&#x3231;

• <gi> 要素– JepaX で規定した方法<gi set="mojikyo" name="47268" />

Page 37: 電子出版交換フォーマット JepaX

37

JepaX での文字コード

• 3つのタイプを設定– 完全 Unicode環境用– Windows環境用– 汎用環境用

• <jepaxinfo> 中にどれであるかを記述 <char-exp type="windows"/>

• 相互変換は可能

Page 38: 電子出版交換フォーマット JepaX

38

表示環境と文字指定表示環境 Unicode Windows 汎用Encoding Unicode Unicode,

Shift-JISUnicode,JIS,Shift-JIS,EUC

ASCII 文字コード 文字コード 文字コード

非 ASCII欧文 文字コード ISO文字名 ISO文字名

半角カタカナ 文字コード 文字コード UCS番号

JIS1,2水準 文字コード 文字コード 文字コード

Windows拡張 文字コード 文字コード UCS番号

その他の Unicode 文字コード UCS番号 UCS番号

Unicode以外 <gi>要素 <gi>要素 <gi>要素