數位出版與電子書標準格式規 範及相關技術 · 中繼檔 格式轉換 書籍版權...
TRANSCRIPT
-
數位出版與電子書標準格式規範及相關技術
財團法人資訊工業策進會
創新應用服務研究所
周世俊
-
Agenda
• 電子書閱讀器主流產品及支援格式• 數位出版與電子書格式標準• 數位閱讀平台技術
-
電子書閱讀器主流產品及支援格式
-
Sony Reader系列‧ 基本介紹
– Sony Reader: Sony公司推出的電子閱讀裝置
‧ 支援格式– DRM Text : ePub (Adobe DRM protected), PDF (Adobe DRM protected), BBeB Book (PRS DRM protected)
– Image : JPEG, PNG, GIF, BMP– Unsecured Audio : Unsecured Adudio: MP3 (Non encrypted), AAC (Non encrypted)
– Unsecured Text : ePub, BBeB Book, PDF, TXT, RTF, Micrsoft®Word, (Conversion to the Reader requires Word installed on your PC)
‧ 功能特色– 黑白8色灰階(省電,低溫)– 觸控面版– 提供畫線備忘,寫註解功能– 支援記憶卡提高容量
‧ 營運特色– 可擴充記憶體,電子書隨身攜帶– 使用PC網路下載書籍,再透過USB傳到Sony Reader上
-
Amazon Kindle系列‧ 基本介紹
– Amazon公司推出的電子閱讀裝置
‧ 支援格式– Kindle (AZW), TXT, Audible (formats 4, Audible Enhanced (AAX)), MP3, unprotected MOBI, PRC natively
– PDF, HTML, DOC, JPEG, GIF, PNG, BMP 需經過轉檔
‧ 功能特色– 黑白16灰階(省電,低溫)
– 文章朗讀功能,目前可閱讀(及朗讀)書籍,blog,雜誌或其他內容
– 字典註解功能
– Whisper Sync Kindles 讓手機等多樣的裝置,閱讀同一本電子書(同步化)
‧ 營運特色– 強大的background (Amazon book store)連結網
路直接下載$9.99~$13.99 newspaper monthly $2.99 each book
– 免費的無線行動寬頻服務。Kindle使用美國電信公司Sprint的3G網路,這項月費60美元的服務由Amazon買單,因此Kindle可在美國任何地方上網
-
iRex系列‧ 基本介紹
– iRex Technologies公司推出的電子閱讀裝置
‧ 功能特色– 黑白16灰階(省電,低溫)
– 觸控面版
– 有SDK,可自行開發 (JAVA, Linux)
– 可擴充記憶體
– 無線網路與行動網路 (WiFi/3G)
– 可畫線註記 (觸控筆)
– 翻頁杆設計,最接近傳統書籍翻頁
‧ 營運特色– 與Barnes&Noble連鎖書店合作,擁有超過75萬種電子書可供下載
– 可透過無線網路或是行動網路進行購買
– 可讀取自己的文檔、部落格,遠超出電子書原有的範疇
‧ 支援格式– 支援.PDF, TXT, HTML, MOBI pocket;
– 圖檔支援.JPG, .BMP, and .PNG
-
電子書閱讀器 Sony Reader Amazon Kindle iRex DR800
灰階 16 16 16
觸控面版 YES NO YES
擴充記憶體 YES NO YES
無線上網 3G(AT&T) EVDO/CDMA 3G
支援格式
BBeB (LRF/LRX), PDF, EPUB, TXT, RTF, JPG, BMP, GIF, PNG, MP3,
AAC
Kindle (AZW and TOPAZ), PRC/MOBI (non DRM), TXT,
PDF, Audible (format 4, Audible Enhanced (AAX)),
MP3;
eReader, ePub, PDF, HTML, TXT, JPG, BMP, PNG
支援DRM BBeB, EPUB, PDF AZW and TOPAZ (USA only)
eReader, Adobe ADEPT
(EPUB/PDF), MobiPocket
USB USB 2.0 USB 2.0 USB 2.0
硬體閱讀器規格比較表
-
電子書閱讀軟體介紹
• Adobe Digital Editions• FBReader• Stanza
-
Adobe Digital Editions‧ 基本介紹
– Adobe公司推出的電子書閱讀軟體
‧ 功能特色– 整合Flash
– 觀看PDF檔,可自訂呈現方式(ex:畫面大小)
– 支援DRM (Adobe)
– 書籤及畫線註記功能
– 多國語言
‧ 營運特色– 免費使用,可整合Adobe自家產品,包含:DRM, Adobe InDesign(製作電子書), Flash,若要完整版本則需要付費。
– 除了桌機與筆電之外,與Sony合作。
– 有DRM防止盜烤
‧ 支援格式– 支援.pdf, .epub及XHTML-based格式
– 支援SWF (flash)
-
FBReader‧ 基本介紹
– Opensource軟體
‧ 功能特色– 跨平台(Linux, Mac, Windows及多種linux-based的行動裝置)
– 可直接讀取tar, zip, gzip與bzip2的內容
– 多國語言偵測
– 有超連結及全文檢索功能
– 畫面可旋轉(90, 180, 270)
– 末來將整合字典,自動播放功能
– 支援表格呈現(future version)
‧ 營運特色– 為Opensource,其License為GNU GPL。
‧ 支援格式– 支援.epub, pdf, Non-DRM的Mobipocket, html, chm, rtf, lrf, fb2
– 支援格式仍在增加中
-
Stanza‧ 基本介紹
– Lexcycle公司推出的電子書閱讀軟體,於2009年4月被Amazon收購
‧ 功能特色– 動態瀏覽書籍封面
– 自訂閱讀風格
– 可更換書籍封面
– 有同步記錄書籤,搜尋書籍功能
– 透過無線網路可同步閱讀資訊
– 線上購物,可自行新增購書網站
– Support DRM (iPhone/iPod)
‧ 營運特色– 原本以iPhone及iPod Touch為目標,善用App Store的通路,於New York Times及App store上大獲好評
– 被Amazon收購後,將被整進於Kindle之中
‧ 支援格式– 支援 .epub, HTML, PDF, Microsoft Word, and Rich Text Format
– DRM 目前只支援.pdb (iphone/iPod only)
-
Comparison
SoftwareAdobe Digital Editions
FBReader Stanza
廠商 Adobe Opensource Lexcycle/Amazon
免費 YES YES YES
DRM YES NO NO
Opensource NO YES NO
支援格式 Pdf and epubEpub, fb2, pdf, non-
DRM Mobi, chm, html, lrf
epub, .azw.html, .pdf, .txt, .rtf…等
智慧型手機另有專用型PDF
viewer Android iPhone/iPod, Kindle
專用型電子書閱讀器
Astak, Booken, COOL-ER, Elonex, Hanlin, iRex, Lbook,
Sony
iRex iLiad None
-
數位出版與電子書格式標準
-
IDPF與EPUB介紹
成員
電子書產業領導地位的國際性商業與標準組織,為了使電子書能夠成功的開拓市場,並便於閱讀系統(Reading System)之間的資料互通,制定OeBPS(Open eBook Publication Structure)標準,後演變成epub標準,作為電子書內容描述的標準規範。
Stanza FBReader閱讀器
epub意圖是作為一個文件格式資源和最終用戶的格式交換使用。基於這個原因,檔案收集到一個容器(container),便於傳播和使用。這種container通常是一個壓縮文件,但已被擴展重新命名為”.epub”。
-
EPUB Architecture (1)走OCF1.0(Open Container Format)規範(電子書容器格式),架構如下:
改副檔名.epub .zip ZIP解壓縮
下載
存放容器信息可另存放其他文件如下:(1)manifest.xml,文件列表(2)metadata.xml,後設資料(3)signatures.xml,數位簽章(4)encryption.xml,加密(5)rights.xml,權限管理
css,images對於書本的外觀定義
opf和ncx都是在說明文檔的順序和內容
opf檔:書籍基本資料及章節如何連接
ncx:書籍章節資料
Xml:書籍內文
說明此份文件格式為epub
-
EPUB Architecture (2)
Mimetype: 用於判斷檔案類型,告知此檔案為epub,同時可用zip去解壓縮。
container.xml:定義電子書的內容根目錄、rootfile及檔案類型。
-
EPUB Architecture (3)
fb.opf: 定義所有的內容元件,包含書籍的metadata的資訊,檔案描述。
fb.ncx: 定義電子書的目
錄章節資料。
-
EPUB Architecture (4)
main1.xml: 電子書正文,格式為XHTML。
-
格式 PDF EPUB AZW CEB
特色
•可跨平台•支援電子表單•文件內超連結的功能•文字檔中的格式、字體、版型和圖片可向量放大
•有目錄、書籤與批註等功•文件可設定不可複製、不可列印、需要密碼等功能
•可以儲存高解析度的圖檔直接輸出使用
•可跨平台•相容性大(supports CSS
styles, images in JPG, GIF, PNG and SVG format, and full XHTML.)
•防止盜拷•商業策略
• Kindle 2 supports the Kindle (AZW), TXT, Audible (formats 4, Audible Enhanced (AAX)), MP3, unprotected MOBI, PRC, PDF, HTML, DOC, JPEG, GIF, PNG, and BMP (through conversion) formats.
• 北大方正研發”高保真”技術,最大限度的保持原來的樣式
•與北大方正的DRM結合• Apabi Reader的指定閱讀軟件
• Apabi Reader具有字體縮放、作筆記、書籍管理、翻譯和文字部分拷貝功能
•網路書目來源多
缺點
•檔案複雜度與大小較耗資源• Adobe 1.4版之前有專利保護
無法進行文繞圖的編排 not fully support Portable Document Format (PDF),
•只有Apabi Reader能觀看•封閉格式 (北大方正的
DRM)• 不支援電子表單
用途•文件交換•文件列印•文件閱讀
•電子書閱讀呈現•電子書中介格式•可直接編輯內容
•電子書閱讀呈現•搭配kindle可做語音
•電子公文交換•電子出版
廠商
• Adobe, Enfocus, EskoArtwork, Art Work Conversion…等
• Kindle, Sony Reader, iRex
• IDPF聯盟: Adobe, Amazon, Sony, Taiwan Digital Publishing Forum
• Sony Reader, iPhone(stanza), PC(Windows, Mac)
•Amazon •Kindle, iPhone
•北大方正•PC (Windows)
未來性
已成開放標準(ISO 32000-1) 各大硬體廠商陸續支援讀取, 發展性高
只提供給Amazon的kindle閱讀裝置使用,發展受侷限
中國大陸,部分的公部門採用CEB作為電子公文傳遞格式
-
數位出版與電子書相關技術
-
數位閱讀服務架構數位閱讀服務平台
中繼檔格式轉換
書籍版權設定/管理
Reader
User
書籍購買入口網會員認證
金流機制
會員資料庫
個人雲端書櫃 3GWiFi
3GWiFi
版權同步管理
電話帳單付款
Provider
書籍電子檔
書籍資料庫
硬體DRM
本機書櫃
內容漫遊服務
.txt、.pdf、.ppt
、.html、.xml
.epub
.pdf
格式轉換服務
搜尋服務
-
Epub轉檔流程
Converter ReaderReader
Creator
Creator FBreader
-
epub轉檔問題討論
‧使用Calibre open source 轉檔軟體進行轉檔測試‧以四種電子書閱讀軟體做顯示測試–Adobe Digital Editions–FBReader–Stanza–Ebook Viewer
‧測試案例–狀況一:Docx轉epub–狀況二:帶圖片的PDF轉epub–狀況三:HTML轉epub–狀況四:HTML DIV標籤之顯示問題–狀況五:Google圖書提供的epub
-
Docx轉epub之閱讀器顯示問題Adobe
Ebook viewer
FB Reader
Stanza
-
帶圖片的PDF轉epub之顯示問題Adobe
Ebook viewer
FB Reader
Stanza
-
HTML轉epub之顯示問題Adobe
Ebook viewer
FB Reader
Stanza
-
HTML DIV標籤之顯示問題Adobe
Ebook viewer
FB Reader
Stanza
-
Google圖書提供的epubAdobe
Ebook viewer
FB Reader
Stanza
-
Epub原始檔案分析‧轉檔後的epub檔案,其CSS 內無字體顏色、字型、大小等相關設定,表示轉換過程中,格式的設定沒有一起轉換。
‧轉檔後的epub檔案有包含 img Tag,部分reader卻未顯示,
‧以 Browser 開啟epub內的XHTML檔,與 Word所呈現的格式仍不相同
1. 轉檔時未將格式資訊一同轉換2. Reader 的顯示支援程度也不相同
-
問題探討‧Converter and Reader
–中文字型支援問題 (Adobe Digital Editions)
‧編碼Windows UTF-8、ANSI UTF-8–圖型格式支援問題
‧epub只支援3種:jpg, gif, png
–版面遺失
‧HTML → ePub 有分頁問題
‧格式未能完整轉換,如:Cascading Style Sheets(字體大小,字型,顏色⋯等)
-
數位閱讀服務平台架構
Sync service
Search service
CMS + Repository
Converter service
內容加密
DRM License
數位內容上架
Metadata儲存
電子書下載
專有名詞莘取
知識地圖生成
建立Index
.pdf
.html書籍列表
同步(DRM及Content)
DRM Check
Decompress
Buy & DL
同步DRM
書籤
書籍加註
Pdf ePub 呈現界面最佳化
index
(DRM + Content)
會員資料庫
電子書資料庫
epub資料庫
-
~Thank You~