中文資訊標準發展現況及推動措施

28
中中中中中中中中中中中中中中中 缺缺缺缺缺 缺缺缺缺缺 缺缺缺缺缺 缺缺缺缺缺 缺缺缺 (Pan Cheng-Wu) [email protected],02-23823739 www.cns11643.gov.tw,www.cns11643.gov.tw/s eeker 缺缺缺缺缺缺缺缺缺缺缺缺缺缺 EDP Center,DGBAS,EY 2002/8/3

Upload: mavis

Post on 05-Jan-2016

37 views

Category:

Documents


0 download

DESCRIPTION

中文資訊標準發展現況及推動措施. 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 潘城武 (Pan Cheng-Wu) [email protected],02-23823739 www.cns11643.gov.tw,www.cns11643.gov.tw/seeker 行政院主計處電子處理資料中心 EDP Center,DGBAS,EY 2002/8/3. 目錄. 中文現況 推動組織 中文資訊應用環境 推動措施. 中文碼 (Code). 註:本表未納入 IBM 、 NEC 、王安等主機碼。. 40*40 明 ( 宋 ) 體 點矩陣字型. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 中文資訊標準發展現況及推動措施

中文資訊標準發展現況及推動措施

缺字上網找 萬碼國標轉 傳播即時現 網網可通譯

潘城武 (Pan Cheng-Wu)[email protected],02-23823739

www.cns11643.gov.tw,www.cns11643.gov.tw/seeker行政院主計處電子處理資料中心

EDP Center,DGBAS,EY2002/8/3

Page 2: 中文資訊標準發展現況及推動措施

目錄

中文現況推動組織中文資訊應用環境推動措施

Page 3: 中文資訊標準發展現況及推動措施

中文碼 (Code)中文碼 碼長、字數 現 況

BIG-5 2 BYTE(1)13,051 字(2) 自用字區: 5,809 字

個人電腦普遍使用之中文內碼

B IG-5E (1)13,053 字+ 3,954 字(2) 自用字區: 1,855 字

補充 BIG5 之不足

CCCII 3 BYTE , 53,940 字 專供圖書館作業使用,用戶有國家圖書館、各國立大學圖書館等

EUC 4 BYTE , 55,196 字 用於 UNIX 電腦系統,為戶役政作業所用。

UNICODE 2 BYTE   26,781 字4 BYTE   48,800 字

由 Unicode 技術委員會負責推動 Unicode成國際標準

ISO10646 4 BYTE  漢字 70,205 字擴編 (18,000 字 +30,000 字 )

國際標準,多國共同使用

CNS11643 2 BYTE , 76,067 字 國家標準,字集大

註:本表未納入 IBM 、 NEC 、王安等主機碼。

Page 4: 中文資訊標準發展現況及推動措施

字型 (Font)

40*40 明 ( 宋 ) 體點矩陣字型

字面 / 字數製作單位

1~2(13,051 字 )

3(6,148 字 )

4~7(34,976 字 )

15(6,831 字 )

12~14(10,659 字 )

本中心 於 1981 年完成 於 1988 年

完成 

於 1999 年完成  

內政部    於 1991 年

完成  於 2001 年

完成

備 註 1~7 字面:國家標準; 12~15 字面:使用者加字區 ( 準國家標準 )已製作約 4,000 ISO10646 簡化字,預計 2002 年底完成約 13,000 字在CNS11643 未含 ISO10646 他國用字

Page 5: 中文資訊標準發展現況及推動措施

字型 (Font)楷體向量字型

字面 / 字數

製作單位1~2

(13,067 字 )3~4

(13,446 字 )5

(8,603 字 )

6~7(12,927 字

)

12~15(17,490 字

)

本中心  

於 2000 年完成 ( 國語會 協 助 審查 )

於 2001 年完成 ( 國語會 協 助 審查 )

 預定 2001年完成

國語會

1 、 1993 年完成字稿。2 、預定 2002年完成數位化。

預定 2003年

下半年製作

預定 2003年

下半年製作

預定 2003年上半年

製作 

備 註 1~7 字面:國家標準; 12~15 字面:使用者加字區 ( 準國家標準 )已製作約 4,000 ISO10646 簡化字,預計 2002 年底完成約 13,000 字在 CNS11643 未含 ISO10646 他國用字

Page 6: 中文資訊標準發展現況及推動措施

字型 (Font)

明 ( 宋 ) 體向量字型

字面 / 字數製作單位

1~2 、部分 3(17,266 字 )

部分 3 、 4~7( 約 31,000 字 )

12~15(17,490 字 )

國語會1 、 82 年完成字稿。2 、預定於 1~7 楷體製作完成後予以數位化。

預 定 於 1~7 楷 體 完成後開始製作  

備 註 1~7 字面:國家標準; 12~15 字面:使用者加字區 ( 準國家標準 )

Page 7: 中文資訊標準發展現況及推動措施

標準 (Standard)

•CNS11643 「中文標準交換碼」•CNS11643-1 「中文標準交換碼使用方法」•CNS14366 「中文分詞處理原則」•CNS14147-1 「資訊技術-字型資訊交換碼-第一部:架構」•CNS14147-2 「資訊技術-字型資訊交換碼-第二部:交換格式」•CNS14147-3 「資訊技術-字型資訊交換碼-第三部:字符形狀表示」•CNS14583 「中文自造字字型傳輸交換格式」

Page 8: 中文資訊標準發展現況及推動措施

推動組織標準局於八十一年成立「資訊及通信標準推行委員會」,下設「中文資訊標準分組」為推動中文資訊共通環境之建置,院處電子中心於八十九年八月成立「中文環境建置工作小組」,並下設 ISO10646(Unicode) 等技術組。

成員:經濟部標檢局、教育部國語推行委員會、研究發展考核委員會資訊管理處、內政部戶役政資訊小組、文化建設委員會資訊小組、財政部財稅資料中心、國家圖書館資訊組、中央研究院計算中心、 中推會、 資策會。

Page 9: 中文資訊標準發展現況及推動措施

中文資訊應用環境功能提供字文字碼屬性:字碼 (CNS11643 、 BIG-5 、B IG-5E 、 EUC 、 Unicode 、 GBK) 、部首、筆劃、一字多音、輸入法 ( 倉頡、注音 ) 、聲音 (2002/12) 、 字義 (2002/12) 等屬性。新增中文字碼作業程序自造字整理及管理機制各類字碼轉換表及工具網頁自造字轉換工具跨平台全字庫文書編輯軟體 (2002/9)中文資訊共通平台 (2002/12)

Page 10: 中文資訊標準發展現況及推動措施

新增字

http://www.cns11643.gov.tw/seeker ( 漢字庫網站)

http://www.cns11643.gov.tw ( 全字庫網站)

中文資訊應用環境架構圖

Linux 6.2 ISO10646(Seeker)•可查詢字數: 70,205 字•C1 暫編字: 26,097 字

•Linux 6.2•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字

一般使用者

查詢

機關團體使用者

全字庫應用工具 4.0

全字庫應用工具 4.0

網頁設計者

網頁自造字轉換工具

大型資訊系統 (如戶政、地政 )

跨平台文書編輯軟體

中文資訊共通平台

Page 11: 中文資訊標準發展現況及推動措施

☆ 一般使用者

☆ 機關內部自造字管理者 ( 之前已自行造字 )

全字庫網站( http://www.cns11643.gov.tw)

☆ 機關內部自造字管理者 ( 未曾自行造字 )

<< 自造字分享 >>

☆ 機關內部使用者( 無自行造字者 )

☆ 機關內部使用者( 有自行造字者 )

<< 自造字分享 >>

☆ 機關內部使用者 ☆ 機關內部使用者

<< 查詢自造字 >>

個人自造字對照表

•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字

自造字自造字

自造字

<<自造字彙總工具>> <<字形轉入工具>>

<<字形轉入工具>><<對照表匯入工具>>

<<舊文件改用共用字集工具>><<原自造字對照表建立工具>>

不同使用者間文件交換 <<轉碼工具>>

適用作業系統: Win95 、 Win98 、 Win NT 、 Win Me 、 Win2000

全字庫應用工具 4.0

<<回中文資訊應用環境架構圖>>

<<字形轉入工具>><<對照表匯入工具>>

Page 12: 中文資訊標準發展現況及推動措施

原始網頁內容☆ 網頁設計者

造字法 游錫?☆ 一般使用者

瀏覽器

游錫 ( 方方土 ) 游錫 ( 方方土 )拼湊法

全字庫工具法

自行造字

全字庫網站( http://www.cns11643.gov.tw)

•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字

自造字

<<網頁自造字轉換工具>>

網頁自造字即時轉換

全字庫文書編輯軟體法 自造字輸入及顯示介面

網頁自造字顯示機制

<<回中文資訊應用環境架構圖>>

Page 13: 中文資訊標準發展現況及推動措施

大型資訊系統資料庫 (如戶政、地政 )

一般使用者

承辦人員

承辦人員

資料異動

專屬系統查詢、異動、列印資料

資料查詢

新增字

http://www.cns11643.gov.tw/seeker (漢字庫網站)

http://www.cns11643.gov.tw (全字庫網站)

【對照表轉換】

•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字

•可查詢字數: 70,205字•C1 暫編字: 26,097 字

作業平台: Win95 、 Win98 、 WinMe 、 WinNT 、 Win2000 、 Linux 、 Unix ......

前端資料接收器

大型資訊系統 WWW 網站 ( 如戶政、地政 )

字型輸入機制

瀏覽器

瀏覽器

字型顯示機制

中文共通平台架構圖

<<回中文資訊應用環境架構圖>>

Page 14: 中文資訊標準發展現況及推動措施

<<回全字庫應用工具架構圖>>

CNS11643 國標碼全字庫

<<回中文資訊平台架構圖>> <<回網頁自造字顯示機制>> << 回中文共通平台架構圖 >>

Page 15: 中文資訊標準發展現況及推動措施

ISO10646 漢字庫網站

<<回全字庫應用工具架構圖>><<回中文資訊平台架構圖>> <<回網頁自造字顯示機制>> << 回中文共通平台架構圖 >>

Page 16: 中文資訊標準發展現況及推動措施

轉碼工具

提供純文字文件轉換為 CNS 碼,或 CNS 碼與 BIG-5 、 EUC 、 Unicode 、 GBK 等常用中文內碼互轉。

<<回全字庫應用工具架構圖>>

Page 17: 中文資訊標準發展現況及推動措施

對照表匯入工具

提供自造字管理者保留機關內舊有自造字,並建立與 CNS 之對照表。

<<回全字庫應用工具架構圖>>

Page 18: 中文資訊標準發展現況及推動措施

自造字彙整工具

提供單位自造字管理者整合內部個人電腦上原有的自造字。

<<回全字庫應用工具架構圖>>

Page 19: 中文資訊標準發展現況及推動措施

字形轉入工具

將自造字字型安裝於個人電腦系統造字區中。<<回全字庫應用工具架構圖>>

Page 20: 中文資訊標準發展現況及推動措施

原自造字對照表建立工具

<<回全字庫應用工具架構圖>>

Page 21: 中文資訊標準發展現況及推動措施

舊文件改共用字集工具

<<回全字庫應用工具架構圖>>

Page 22: 中文資訊標準發展現況及推動措施

提供網頁自造字轉換工具,解決網頁缺字顯示。

<<回網頁自造字顯示機制>>

網頁自造字轉換工具

Page 23: 中文資訊標準發展現況及推動措施

自造字網頁

<<回網頁自造字顯示機制>>

Page 24: 中文資訊標準發展現況及推動措施

跨平台全字庫文書編輯軟體

<< 回中文資訊應用環架構 >>

Page 25: 中文資訊標準發展現況及推動措施

BIG-5 CNS11643 Unicode EUC GBK ISO10646

A140 1-2121 3000

A141 1-2122 FF0C

A142 1-2123 3001

A143 1-2124 3002

A149 1-212A FF01

A14A 1-212B FE30

<< 回中文資訊應用環境架構圖 >>

對照表範例

Page 26: 中文資訊標準發展現況及推動措施

ISO10646 漢字庫網頁

Page 27: 中文資訊標準發展現況及推動措施

推動措施擴增中文字集 ( 如公司行號、化學名、動物學名、宗教用字 ) 、字型 ( 製作明體與楷體向量字型 ) 、及屬性 ( 讀音、字義、相關詞、簡繁對照等 ) ,充實全字庫網站內容。藉由全字庫文書編輯軟體之輸入及顯示模組,開發政府旗艦計畫下之中文資訊共通平台。提供業界加值全字庫之機制,如字型、輸入法、 語音輸出等。賡續參與國際漢字編碼會議 (IS0/IEC JTC1/SC2/WG2 委員會、 UNICODE技術委員會 ) ,使國內電腦中文標準與國際標準接軌。

Page 28: 中文資訊標準發展現況及推動措施

推動措施制定 CNS14649-1「資訊技術-廣用多八位元編碼字元集 (UCS)-第1部:架構及基本多語文字面」 (ISO10646-1) 。研擬「資訊技術-廣用多八位元編碼字元集 (UCS)-第2部:輔助字面」 (ISO10646-2) 。審查完成「中文資訊排序屬性標準」草案。研擬「網域名稱專用繁簡字碼對照表」草案。依 CNS11643 字面,制定「中文字集字型國家標準」。