數位出版與電子書標準格式規 範及相關技術 · 中繼檔 格式轉換 書籍版權...

32
數位出版與電子書標準格式規 範及相關技術 財團法人資訊工業策進會 創新應用服務研究所 周世俊

Upload: others

Post on 29-Jan-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

  • 數位出版與電子書標準格式規範及相關技術

    財團法人資訊工業策進會

    創新應用服務研究所

    周世俊

  • Agenda

    • 電子書閱讀器主流產品及支援格式• 數位出版與電子書格式標準• 數位閱讀平台技術

  • 電子書閱讀器主流產品及支援格式

  • Sony Reader系列‧ 基本介紹

    – Sony Reader: Sony公司推出的電子閱讀裝置

    ‧ 支援格式– DRM Text : ePub (Adobe DRM protected), PDF (Adobe DRM protected), BBeB Book (PRS DRM protected)

    – Image : JPEG, PNG, GIF, BMP– Unsecured Audio : Unsecured Adudio: MP3 (Non encrypted), AAC (Non encrypted)

    – Unsecured Text : ePub, BBeB Book, PDF, TXT, RTF, Micrsoft®Word, (Conversion to the Reader requires Word installed on your PC)

    ‧ 功能特色– 黑白8色灰階(省電,低溫)– 觸控面版– 提供畫線備忘,寫註解功能– 支援記憶卡提高容量

    ‧ 營運特色– 可擴充記憶體,電子書隨身攜帶– 使用PC網路下載書籍,再透過USB傳到Sony Reader上

  • Amazon Kindle系列‧ 基本介紹

    – Amazon公司推出的電子閱讀裝置

    ‧ 支援格式– Kindle (AZW), TXT, Audible (formats 4, Audible Enhanced (AAX)), MP3, unprotected MOBI, PRC natively

    – PDF, HTML, DOC, JPEG, GIF, PNG, BMP 需經過轉檔

    ‧ 功能特色– 黑白16灰階(省電,低溫)

    – 文章朗讀功能,目前可閱讀(及朗讀)書籍,blog,雜誌或其他內容

    – 字典註解功能

    – Whisper Sync Kindles 讓手機等多樣的裝置,閱讀同一本電子書(同步化)

    ‧ 營運特色– 強大的background (Amazon book store)連結網

    路直接下載$9.99~$13.99 newspaper monthly $2.99 each book

    – 免費的無線行動寬頻服務。Kindle使用美國電信公司Sprint的3G網路,這項月費60美元的服務由Amazon買單,因此Kindle可在美國任何地方上網

  • iRex系列‧ 基本介紹

    – iRex Technologies公司推出的電子閱讀裝置

    ‧ 功能特色– 黑白16灰階(省電,低溫)

    – 觸控面版

    – 有SDK,可自行開發 (JAVA, Linux)

    – 可擴充記憶體

    – 無線網路與行動網路 (WiFi/3G)

    – 可畫線註記 (觸控筆)

    – 翻頁杆設計,最接近傳統書籍翻頁

    ‧ 營運特色– 與Barnes&Noble連鎖書店合作,擁有超過75萬種電子書可供下載

    – 可透過無線網路或是行動網路進行購買

    – 可讀取自己的文檔、部落格,遠超出電子書原有的範疇

    ‧ 支援格式– 支援.PDF, TXT, HTML, MOBI pocket;

    – 圖檔支援.JPG, .BMP, and .PNG

  • 電子書閱讀器 Sony Reader Amazon Kindle iRex DR800

    灰階 16 16 16

    觸控面版 YES NO YES

    擴充記憶體 YES NO YES

    無線上網 3G(AT&T) EVDO/CDMA 3G

    支援格式

    BBeB (LRF/LRX), PDF, EPUB, TXT, RTF, JPG, BMP, GIF, PNG, MP3,

    AAC

    Kindle (AZW and TOPAZ), PRC/MOBI (non DRM), TXT,

    PDF, Audible (format 4, Audible Enhanced (AAX)),

    MP3;

    eReader, ePub, PDF, HTML, TXT, JPG, BMP, PNG

    支援DRM BBeB, EPUB, PDF AZW and TOPAZ (USA only)

    eReader, Adobe ADEPT

    (EPUB/PDF), MobiPocket

    USB USB 2.0 USB 2.0 USB 2.0

    硬體閱讀器規格比較表

  • 電子書閱讀軟體介紹

    • Adobe Digital Editions• FBReader• Stanza

  • Adobe Digital Editions‧ 基本介紹

    – Adobe公司推出的電子書閱讀軟體

    ‧ 功能特色– 整合Flash

    – 觀看PDF檔,可自訂呈現方式(ex:畫面大小)

    – 支援DRM (Adobe)

    – 書籤及畫線註記功能

    – 多國語言

    ‧ 營運特色– 免費使用,可整合Adobe自家產品,包含:DRM, Adobe InDesign(製作電子書), Flash,若要完整版本則需要付費。

    – 除了桌機與筆電之外,與Sony合作。

    – 有DRM防止盜烤

    ‧ 支援格式– 支援.pdf, .epub及XHTML-based格式

    – 支援SWF (flash)

  • FBReader‧ 基本介紹

    – Opensource軟體

    ‧ 功能特色– 跨平台(Linux, Mac, Windows及多種linux-based的行動裝置)

    – 可直接讀取tar, zip, gzip與bzip2的內容

    – 多國語言偵測

    – 有超連結及全文檢索功能

    – 畫面可旋轉(90, 180, 270)

    – 末來將整合字典,自動播放功能

    – 支援表格呈現(future version)

    ‧ 營運特色– 為Opensource,其License為GNU GPL。

    ‧ 支援格式– 支援.epub, pdf, Non-DRM的Mobipocket, html, chm, rtf, lrf, fb2

    – 支援格式仍在增加中

  • Stanza‧ 基本介紹

    – Lexcycle公司推出的電子書閱讀軟體,於2009年4月被Amazon收購

    ‧ 功能特色– 動態瀏覽書籍封面

    – 自訂閱讀風格

    – 可更換書籍封面

    – 有同步記錄書籤,搜尋書籍功能

    – 透過無線網路可同步閱讀資訊

    – 線上購物,可自行新增購書網站

    – Support DRM (iPhone/iPod)

    ‧ 營運特色– 原本以iPhone及iPod Touch為目標,善用App Store的通路,於New York Times及App store上大獲好評

    – 被Amazon收購後,將被整進於Kindle之中

    ‧ 支援格式– 支援 .epub, HTML, PDF, Microsoft Word, and Rich Text Format

    – DRM 目前只支援.pdb (iphone/iPod only)

  • Comparison

    SoftwareAdobe Digital Editions

    FBReader Stanza

    廠商 Adobe Opensource Lexcycle/Amazon

    免費 YES YES YES

    DRM YES NO NO

    Opensource NO YES NO

    支援格式 Pdf and epubEpub, fb2, pdf, non-

    DRM Mobi, chm, html, lrf

    epub, .azw.html, .pdf, .txt, .rtf…等

    智慧型手機另有專用型PDF

    viewer Android iPhone/iPod, Kindle

    專用型電子書閱讀器

    Astak, Booken, COOL-ER, Elonex, Hanlin, iRex, Lbook,

    Sony

    iRex iLiad None

  • 數位出版與電子書格式標準

  • IDPF與EPUB介紹

    成員

    電子書產業領導地位的國際性商業與標準組織,為了使電子書能夠成功的開拓市場,並便於閱讀系統(Reading System)之間的資料互通,制定OeBPS(Open eBook Publication Structure)標準,後演變成epub標準,作為電子書內容描述的標準規範。

    Stanza FBReader閱讀器

    epub意圖是作為一個文件格式資源和最終用戶的格式交換使用。基於這個原因,檔案收集到一個容器(container),便於傳播和使用。這種container通常是一個壓縮文件,但已被擴展重新命名為”.epub”。

  • EPUB Architecture (1)走OCF1.0(Open Container Format)規範(電子書容器格式),架構如下:

    改副檔名.epub .zip ZIP解壓縮

    下載

    存放容器信息可另存放其他文件如下:(1)manifest.xml,文件列表(2)metadata.xml,後設資料(3)signatures.xml,數位簽章(4)encryption.xml,加密(5)rights.xml,權限管理

    css,images對於書本的外觀定義

    opf和ncx都是在說明文檔的順序和內容

    opf檔:書籍基本資料及章節如何連接

    ncx:書籍章節資料

    Xml:書籍內文

    說明此份文件格式為epub

  • EPUB Architecture (2)

    Mimetype: 用於判斷檔案類型,告知此檔案為epub,同時可用zip去解壓縮。

    container.xml:定義電子書的內容根目錄、rootfile及檔案類型。

  • EPUB Architecture (3)

    fb.opf: 定義所有的內容元件,包含書籍的metadata的資訊,檔案描述。

    fb.ncx: 定義電子書的目

    錄章節資料。

  • EPUB Architecture (4)

    main1.xml: 電子書正文,格式為XHTML。

  • 格式 PDF EPUB AZW CEB

    特色

    •可跨平台•支援電子表單•文件內超連結的功能•文字檔中的格式、字體、版型和圖片可向量放大

    •有目錄、書籤與批註等功•文件可設定不可複製、不可列印、需要密碼等功能

    •可以儲存高解析度的圖檔直接輸出使用

    •可跨平台•相容性大(supports CSS

    styles, images in JPG, GIF, PNG and SVG format, and full XHTML.)

    •防止盜拷•商業策略

    • Kindle 2 supports the Kindle (AZW), TXT, Audible (formats 4, Audible Enhanced (AAX)), MP3, unprotected MOBI, PRC, PDF, HTML, DOC, JPEG, GIF, PNG, and BMP (through conversion) formats.

    • 北大方正研發”高保真”技術,最大限度的保持原來的樣式

    •與北大方正的DRM結合• Apabi Reader的指定閱讀軟件

    • Apabi Reader具有字體縮放、作筆記、書籍管理、翻譯和文字部分拷貝功能

    •網路書目來源多

    缺點

    •檔案複雜度與大小較耗資源• Adobe 1.4版之前有專利保護

    無法進行文繞圖的編排 not fully support Portable Document Format (PDF),

    •只有Apabi Reader能觀看•封閉格式 (北大方正的

    DRM)• 不支援電子表單

    用途•文件交換•文件列印•文件閱讀

    •電子書閱讀呈現•電子書中介格式•可直接編輯內容

    •電子書閱讀呈現•搭配kindle可做語音

    •電子公文交換•電子出版

    廠商

    • Adobe, Enfocus, EskoArtwork, Art Work Conversion…等

    • Kindle, Sony Reader, iRex

    • IDPF聯盟: Adobe, Amazon, Sony, Taiwan Digital Publishing Forum

    • Sony Reader, iPhone(stanza), PC(Windows, Mac)

    •Amazon •Kindle, iPhone

    •北大方正•PC (Windows)

    未來性

    已成開放標準(ISO 32000-1) 各大硬體廠商陸續支援讀取, 發展性高

    只提供給Amazon的kindle閱讀裝置使用,發展受侷限

    中國大陸,部分的公部門採用CEB作為電子公文傳遞格式

  • 數位出版與電子書相關技術

  • 數位閱讀服務架構數位閱讀服務平台

    中繼檔格式轉換

    書籍版權設定/管理

    Reader

    User

    書籍購買入口網會員認證

    金流機制

    會員資料庫

    個人雲端書櫃 3GWiFi

    3GWiFi

    版權同步管理

    電話帳單付款

    Provider

    書籍電子檔

    書籍資料庫

    硬體DRM

    本機書櫃

    內容漫遊服務

    .txt、.pdf、.ppt

    、.html、.xml

    .epub

    .pdf

    格式轉換服務

    搜尋服務

  • Epub轉檔流程

    Converter ReaderReader

    Creator

    Creator FBreader

  • epub轉檔問題討論

    ‧使用Calibre open source 轉檔軟體進行轉檔測試‧以四種電子書閱讀軟體做顯示測試–Adobe Digital Editions–FBReader–Stanza–Ebook Viewer

    ‧測試案例–狀況一:Docx轉epub–狀況二:帶圖片的PDF轉epub–狀況三:HTML轉epub–狀況四:HTML DIV標籤之顯示問題–狀況五:Google圖書提供的epub

  • Docx轉epub之閱讀器顯示問題Adobe

    Ebook viewer

    FB Reader

    Stanza

  • 帶圖片的PDF轉epub之顯示問題Adobe

    Ebook viewer

    FB Reader

    Stanza

  • HTML轉epub之顯示問題Adobe

    Ebook viewer

    FB Reader

    Stanza

  • HTML DIV標籤之顯示問題Adobe

    Ebook viewer

    FB Reader

    Stanza

  • Google圖書提供的epubAdobe

    Ebook viewer

    FB Reader

    Stanza

  • Epub原始檔案分析‧轉檔後的epub檔案,其CSS 內無字體顏色、字型、大小等相關設定,表示轉換過程中,格式的設定沒有一起轉換。

    ‧轉檔後的epub檔案有包含 img Tag,部分reader卻未顯示,

    ‧以 Browser 開啟epub內的XHTML檔,與 Word所呈現的格式仍不相同

    1. 轉檔時未將格式資訊一同轉換2. Reader 的顯示支援程度也不相同

  • 問題探討‧Converter and Reader

    –中文字型支援問題 (Adobe Digital Editions)

    ‧編碼Windows UTF-8、ANSI UTF-8–圖型格式支援問題

    ‧epub只支援3種:jpg, gif, png

    –版面遺失

    ‧HTML → ePub 有分頁問題

    ‧格式未能完整轉換,如:Cascading Style Sheets(字體大小,字型,顏色⋯等)

  • 數位閱讀服務平台架構

    Sync service

    Search service

    CMS + Repository

    Converter service

    內容加密

    DRM License

    數位內容上架

    Metadata儲存

    電子書下載

    專有名詞莘取

    知識地圖生成

    建立Index

    .pdf

    .html書籍列表

    同步(DRM及Content)

    DRM Check

    Decompress

    Buy & DL

    同步DRM

    書籤

    書籍加註

    Pdf ePub 呈現界面最佳化

    index

    (DRM + Content)

    會員資料庫

    電子書資料庫

    epub資料庫

  • ~Thank You~