電子出版交換フォーマット jepax
DESCRIPTION
電子出版交換フォーマット JepaX. 日本電子出版協会 出版データフォーマット標準化研究委員会 (イースト株式会社) 渋谷 誠. 日本電子出版協会( JEPA). 1987年設立 日本の電子出版の普及促進と情報提供 が目的 出版社、印刷会社、コンピュータメーカー、ソフトハウスなど137社が参加 http://www.jepa.or.jp/. 立ち上がる電子書籍市場. 米国 Rocket eBook 発売(昨年) http://www.rocket-ebook.com/ Open eBook 仕様発表(9月) http://www.openebook.org/ - PowerPoint PPT PresentationTRANSCRIPT
1
電子出版交換フォーマット
JepaX
日本電子出版協会出版データフォーマット標準化研究委員会
(イースト株式会社)
渋谷 誠
2
日本電子出版協会 (JEPA)
• 1987 年設立• 日本の電子出版の普及促進と情報提供
が目的• 出版社、印刷会社、コンピュータメーカー、
ソフトハウスなど137社が参加• http://www.jepa.or.jp/
3
立ち上がる電子書籍市場• 米国
– Rocket eBook 発売(昨年)• http://www.rocket-ebook.com/
– Open eBook 仕様発表(9月)• http://www.openebook.org/
– Microsoft Reader 発表(9月)• http://www.microsoft.com/reader/
4
立ち上がる電子書籍市場• 国内
– ブックオンデマンド総合実証実験• http://www.ebj.gr.jp/
– Web サイトでの電子書籍販売• コンテンツパラダイス (http://conpara.topica.ne.jp/)
• ザウルス文庫 (http://www.zaurusworld.ne.jp/)
• まんがの国 (http://manga.accessticket.com/)
• EBOOK.CO.JP (http://www.ebook.co.jp/)
• 電子書店パピレス (http://www.papy.co.jp/)
5
電子書籍市場の課題
• 電子読書インフラの整備– 携帯型ビューワー– 縦組み、ルビ、外字サポート– 著作権保護、課金システム
• コンテンツの充実– 既存書籍のデジタル化– 新刊書のデジタル版同時発売
6
既存書籍のデジタル化
• どのフォーマットにするか?• 現在使用可:
プレーンテキスト、 HTML 、 T-Time 、 Book Jacket
• 将来登場予定: Open eBook 日本語、 NetEB 、文庫本 DTD電子書籍コンソーシアムのテキスト系フォーマット
• ルビはどうする?• 外字はどうする?
7
共通フォーマットへの期待
• 中立的な中間フォーマット• 各種の「配布フォーマット」に変換可能• 日本語独自の問題への対処
– 外字、ルビ、縦組み、文字コード• 「単純ですぐに使える」ものであること• 仕様が一日も早く決まること
8
JEPA での仕様策定作業
• 3月: – 検討開始 TEI, DocBook, ISO-12083 などを調査
• 5月: – 0.1 仕様 第1回ミーティング メーリングリストで検討開始
• 7月: – 0.7 仕様 JEPA で説明会開催 サンプル文書、 XSL も公開
• 8月:– 0.8 仕様 DTD 公開
• 9月:– 第2回ミーティング 0.9 仕様一般公開
9
公開しているもの(1)
• http://x.jepa.or.jp/jepax/
• 仕様– 0.9 仕様書
• JepaX フォーマット• HTML フォーマット• Word フォーマット
– 0.9 DTD
10
公開しているもの(2)• サンプル文書
– 基本サンプル • 全要素を使った文書 • JepaX 0.9 仕様書 • テンプレート
– 実用書 • 「ワープロここが不思議」 (講談社ブルーバックス) • 「パソコン悠々漢字術」 (一部のみ・公開準備中)
– 小説 – 論文
11
公開しているもの(3)
• 他フォーマットへの変換として– XSL スタイルシートのサンプル
• JepaX → HTML
• JepaX → T-Time
• JepaX → Open eBook
12
JepaX のコンセプト
13
中間フォーマットの意義
• どのフォーマットでも同じ作業が必要– ルビ、外字を探す– 段落を区切って見出しを取り出す– 書誌情報を作成
• これらが完了後の状態で蓄積• 必要に応じて配布フォーマットへ変換
– フォーマット依存のスタイル・レイアウト情報を付加
• 交換用フォーマットとしても安心して使える– 表計算の CSV 、ワープロの RTF のようなもの
14
HTML ではだめなのか?
• タグの多さと用法の混乱• 論理構造が記述しにくい• 日本語用仕様の欠如• 書誌情報が記述できない
15
JepaX の基本方針
• 交換・蓄積用フォーマット• 各種の最終配布フォーマットへ変換可• 必要最低限の簡潔さ• Free & Open
• 外字の指定方法を規定• 使用文字コードの規定• 半年で完成させる
16
JepaX 仕様の詳細
17
文書形式
• 検証済み XML 文書– DTDは仕様とともに公開<!DOCTYPE jepax PUBLIC “-//JEPA//DTD JepaX 1.0//JA”
“http://x.jepa.or.jp/jepax/jepax10.dtd” >
• ファイルの Encoding– Unicode(UTF-16) を推奨– 使用できる文字についての規定あり
18
全体構造• トップレベルに6つの要素
jepax
jepaxinfo front
body
backbookinfo cover
19
jepaxinfo 要素• ファイル自身に関するメタ情報
– 使用文字コード • <char-exp type="windows"/>
– 推奨される組み方向• <pref-layout flow="horz"/>
– 外字指定の方式• <giset-desc value="mojikyo">…
– 追加した独自属性• <xtype-desc element="div" value=" ト書き ">…
• <class-desc element="em" value="blink">…
20
bookinfo 要素
• 書誌情報– 現在は必要最低限のものだけ
• <isbn>
• <c-code>
• <book-title>
• <book-subtitle>
• <edition>
• <series-title>
• <book-author>
• <pub-date>
• <publisher>
21
cover ,front, body, back 要素
• それぞれ div 要素のみからなる– <cover>
• 「カバー」や「見返し」や「帯」などに書かれていた内容
– <front>• 「まえがき」「序文」「目次」などの本文の前に配置される内容
– <body>• 文書の主たる内容
– <back>• 「あとがき」「解説」「索引」などの本文の後に配置される内容
22
div 要素
div
head
subtitle authortitle p
div
+
+ note
ブロック要素 リスト要素
23
階層定義の例<div type=”章” >
<head> <no>第一章 </no> <title>電子出版の歴史 </title></head><div type=”節” >
<head> <no>1. </no> <title>黎明期 </title> <subtitle>CD-ROM辞書の時代 </subtitle>
</head> ・・・
(本文 )・・・
</div>
</div>
24
論理構造の表現
• div 要素ひとつだけを使う• 入れ子にして階層を表現• 属性 type で階層に意味を付加
• " 部 ", "章 ", "節 ", "項 1", "項 2", "項 3",…
• "序文 ", "謝辞 ", "献辞 ", " 目次 ", " あとがき ", …
• "囲み "," とびら ","索引 ",…
• 以上にあてはまらない場合は、属性 xtype で任意の名称も設定可能
25
div 要素以下の階層
文字列 (CDATA) インライン要素(11種)
ブロック要素(4種)
div 要素
リスト要素(3種)
26
リスト要素
• HTML のリストを踏襲• ただし、内容モデルは異なる
– 順序なしリスト• <ul>, <li>
– 順序つきリスト• <ol>, <li>
– 定義リスト• <dl>, <dt>, <dd>
27
ブロック要素(1)• パラグラフ
– <p>
• 整形テキスト – <pre>
• 表 – <table>, <caption> ,<tr>, <th>, <td>
28
ブロック要素(2)
• 外部ファイルデータ – <float>, <caption>, <res>
<float><caption> <no>図1 </no> <title>JepaX のロゴ </title></caption><res mimetype="image/gif" src="jepaxlogo.gif">
</float>
29
インライン要素(1)
• 汎用インライン要素– <span>
– 属性 type で意味を指定 , xtype で独自定義可
<span type=”URL”>http://www.jepa.or.jp/</span>
• 強調– <em>
– 強調方法の指定はない
<em>何の料金も </em>支払う必要がない
30
インライン要素(2)
• 参照(内部リンク) – <ref>
– 属性 idref で参照先を指定<ref idref=”fig13” type=”figure”>図 13</ref>参照
• キーワード – <key>
– 属性 reading で「読み」を指定<key reading=" サカモトリョウマ ">坂本龍馬 </key>
31
インライン要素(3)
• 縦横文字切り替え– <byflow>, <ht>, <vt>– 縦組み用と横組み用の文字列を併記
<byflow> <ht>上の </ht> <vt>右の </vt> </byflow>表において
• 割注– <mlg>– 括弧内で2行に分けて表記する注
32
インライン要素(4)• ルビ
– <ruby>, <rb>, <rt>– W3C案に準拠
<ruby><rb>株式会社 </rb><rt>かぶしきがいしゃ </rt></ruby>
• 上付き、下付き– <sup>, <sub>
33
インライン要素( 5 )• 改行
– <br>
• インライン画像– <img>
<img mimetype="image/gif" src="jepaxlogo.gif">
34
インライン要素( 6 )• 字形イメージ
– <gi>
– 属性 set で「字形分類体系」を指定– <jepaxinfo> 中にその「分類体系」の説明を記述
<giset-desc value="mojikyo"> … </giset-desc>– 属性 name で字形イメージの番号/名称を指定– 属性 alt で「代替表示文字列」を指定
森 <gi set="mojikyo" name="58562" alt="鴎 " /> 外深 <gi set="mojikyo" name="04894" alt=" (土川) " />経済特区
35
文字指定の方法(1)
• 通常の文字コード– 環境によっては表示できないこともある
• 文字名称を使う– 欧文のみá ; ü
© ™
36
文字指定の方法(2)
• UCS 文字番号– XML の仕様で規定されている方法㈱
• <gi> 要素– JepaX で規定した方法<gi set="mojikyo" name="47268" />
37
JepaX での文字コード
• 3つのタイプを設定– 完全 Unicode環境用– Windows環境用– 汎用環境用
• <jepaxinfo> 中にどれであるかを記述 <char-exp type="windows"/>
• 相互変換は可能
38
表示環境と文字指定表示環境 Unicode Windows 汎用Encoding Unicode Unicode,
Shift-JISUnicode,JIS,Shift-JIS,EUC
ASCII 文字コード 文字コード 文字コード
非 ASCII欧文 文字コード ISO文字名 ISO文字名
半角カタカナ 文字コード 文字コード UCS番号
JIS1,2水準 文字コード 文字コード 文字コード
Windows拡張 文字コード 文字コード UCS番号
その他の Unicode 文字コード UCS番号 UCS番号
Unicode以外 <gi>要素 <gi>要素 <gi>要素