中文資訊標準發展現況及推動措施
DESCRIPTION
中文資訊標準發展現況及推動措施. 缺字上網找 萬碼國標轉 傳播即時現 網網可通譯 潘城武 (Pan Cheng-Wu) [email protected],02-23823739 www.cns11643.gov.tw,www.cns11643.gov.tw/seeker 行政院主計處電子處理資料中心 EDP Center,DGBAS,EY 2002/8/3. 目錄. 中文現況 推動組織 中文資訊應用環境 推動措施. 中文碼 (Code). 註:本表未納入 IBM 、 NEC 、王安等主機碼。. 40*40 明 ( 宋 ) 體 點矩陣字型. - PowerPoint PPT PresentationTRANSCRIPT
中文資訊標準發展現況及推動措施
缺字上網找 萬碼國標轉 傳播即時現 網網可通譯
潘城武 (Pan Cheng-Wu)[email protected],02-23823739
www.cns11643.gov.tw,www.cns11643.gov.tw/seeker行政院主計處電子處理資料中心
EDP Center,DGBAS,EY2002/8/3
目錄
中文現況推動組織中文資訊應用環境推動措施
中文碼 (Code)中文碼 碼長、字數 現 況
BIG-5 2 BYTE(1)13,051 字(2) 自用字區: 5,809 字
個人電腦普遍使用之中文內碼
B IG-5E (1)13,053 字+ 3,954 字(2) 自用字區: 1,855 字
補充 BIG5 之不足
CCCII 3 BYTE , 53,940 字 專供圖書館作業使用,用戶有國家圖書館、各國立大學圖書館等
EUC 4 BYTE , 55,196 字 用於 UNIX 電腦系統,為戶役政作業所用。
UNICODE 2 BYTE 26,781 字4 BYTE 48,800 字
由 Unicode 技術委員會負責推動 Unicode成國際標準
ISO10646 4 BYTE 漢字 70,205 字擴編 (18,000 字 +30,000 字 )
國際標準,多國共同使用
CNS11643 2 BYTE , 76,067 字 國家標準,字集大
註:本表未納入 IBM 、 NEC 、王安等主機碼。
字型 (Font)
40*40 明 ( 宋 ) 體點矩陣字型
字面 / 字數製作單位
1~2(13,051 字 )
3(6,148 字 )
4~7(34,976 字 )
15(6,831 字 )
12~14(10,659 字 )
本中心 於 1981 年完成 於 1988 年
完成
於 1999 年完成
內政部 於 1991 年
完成 於 2001 年
完成
備 註 1~7 字面:國家標準; 12~15 字面:使用者加字區 ( 準國家標準 )已製作約 4,000 ISO10646 簡化字,預計 2002 年底完成約 13,000 字在CNS11643 未含 ISO10646 他國用字
字型 (Font)楷體向量字型
字面 / 字數
製作單位1~2
(13,067 字 )3~4
(13,446 字 )5
(8,603 字 )
6~7(12,927 字
)
12~15(17,490 字
)
本中心
於 2000 年完成 ( 國語會 協 助 審查 )
於 2001 年完成 ( 國語會 協 助 審查 )
預定 2001年完成
國語會
1 、 1993 年完成字稿。2 、預定 2002年完成數位化。
預定 2003年
下半年製作
預定 2003年
下半年製作
預定 2003年上半年
製作
備 註 1~7 字面:國家標準; 12~15 字面:使用者加字區 ( 準國家標準 )已製作約 4,000 ISO10646 簡化字,預計 2002 年底完成約 13,000 字在 CNS11643 未含 ISO10646 他國用字
字型 (Font)
明 ( 宋 ) 體向量字型
字面 / 字數製作單位
1~2 、部分 3(17,266 字 )
部分 3 、 4~7( 約 31,000 字 )
12~15(17,490 字 )
國語會1 、 82 年完成字稿。2 、預定於 1~7 楷體製作完成後予以數位化。
預 定 於 1~7 楷 體 完成後開始製作
備 註 1~7 字面:國家標準; 12~15 字面:使用者加字區 ( 準國家標準 )
標準 (Standard)
•CNS11643 「中文標準交換碼」•CNS11643-1 「中文標準交換碼使用方法」•CNS14366 「中文分詞處理原則」•CNS14147-1 「資訊技術-字型資訊交換碼-第一部:架構」•CNS14147-2 「資訊技術-字型資訊交換碼-第二部:交換格式」•CNS14147-3 「資訊技術-字型資訊交換碼-第三部:字符形狀表示」•CNS14583 「中文自造字字型傳輸交換格式」
推動組織標準局於八十一年成立「資訊及通信標準推行委員會」,下設「中文資訊標準分組」為推動中文資訊共通環境之建置,院處電子中心於八十九年八月成立「中文環境建置工作小組」,並下設 ISO10646(Unicode) 等技術組。
成員:經濟部標檢局、教育部國語推行委員會、研究發展考核委員會資訊管理處、內政部戶役政資訊小組、文化建設委員會資訊小組、財政部財稅資料中心、國家圖書館資訊組、中央研究院計算中心、 中推會、 資策會。
中文資訊應用環境功能提供字文字碼屬性:字碼 (CNS11643 、 BIG-5 、B IG-5E 、 EUC 、 Unicode 、 GBK) 、部首、筆劃、一字多音、輸入法 ( 倉頡、注音 ) 、聲音 (2002/12) 、 字義 (2002/12) 等屬性。新增中文字碼作業程序自造字整理及管理機制各類字碼轉換表及工具網頁自造字轉換工具跨平台全字庫文書編輯軟體 (2002/9)中文資訊共通平台 (2002/12)
新增字
http://www.cns11643.gov.tw/seeker ( 漢字庫網站)
http://www.cns11643.gov.tw ( 全字庫網站)
中文資訊應用環境架構圖
Linux 6.2 ISO10646(Seeker)•可查詢字數: 70,205 字•C1 暫編字: 26,097 字
•Linux 6.2•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字
一般使用者
查詢
機關團體使用者
全字庫應用工具 4.0
全字庫應用工具 4.0
網頁設計者
網頁自造字轉換工具
大型資訊系統 (如戶政、地政 )
跨平台文書編輯軟體
中文資訊共通平台
☆ 一般使用者
☆ 機關內部自造字管理者 ( 之前已自行造字 )
全字庫網站( http://www.cns11643.gov.tw)
☆ 機關內部自造字管理者 ( 未曾自行造字 )
<< 自造字分享 >>
☆ 機關內部使用者( 無自行造字者 )
☆ 機關內部使用者( 有自行造字者 )
<< 自造字分享 >>
☆ 機關內部使用者 ☆ 機關內部使用者
<< 查詢自造字 >>
個人自造字對照表
•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字
自造字自造字
自造字
<<自造字彙總工具>> <<字形轉入工具>>
<<字形轉入工具>><<對照表匯入工具>>
<<舊文件改用共用字集工具>><<原自造字對照表建立工具>>
不同使用者間文件交換 <<轉碼工具>>
適用作業系統: Win95 、 Win98 、 Win NT 、 Win Me 、 Win2000
全字庫應用工具 4.0
<<回中文資訊應用環境架構圖>>
<<字形轉入工具>><<對照表匯入工具>>
原始網頁內容☆ 網頁設計者
造字法 游錫?☆ 一般使用者
瀏覽器
游錫 ( 方方土 ) 游錫 ( 方方土 )拼湊法
全字庫工具法
自行造字
全字庫網站( http://www.cns11643.gov.tw)
•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字
自造字
<<網頁自造字轉換工具>>
網頁自造字即時轉換
全字庫文書編輯軟體法 自造字輸入及顯示介面
網頁自造字顯示機制
<<回中文資訊應用環境架構圖>>
大型資訊系統資料庫 (如戶政、地政 )
一般使用者
承辦人員
承辦人員
資料異動
專屬系統查詢、異動、列印資料
資料查詢
新增字
http://www.cns11643.gov.tw/seeker (漢字庫網站)
http://www.cns11643.gov.tw (全字庫網站)
【對照表轉換】
•目前收集字數: 76,067 字•可下載字數: 58,067 字 (1) 明體可下載字數: 58,067字 (2) 楷體可下載字數: 13,446字 九月初預定完成: 8,603 字•公告字數: 18,000 字•符號下載: 230 字
•可查詢字數: 70,205字•C1 暫編字: 26,097 字
作業平台: Win95 、 Win98 、 WinMe 、 WinNT 、 Win2000 、 Linux 、 Unix ......
前端資料接收器
大型資訊系統 WWW 網站 ( 如戶政、地政 )
字型輸入機制
瀏覽器
瀏覽器
字型顯示機制
中文共通平台架構圖
<<回中文資訊應用環境架構圖>>
<<回全字庫應用工具架構圖>>
CNS11643 國標碼全字庫
<<回中文資訊平台架構圖>> <<回網頁自造字顯示機制>> << 回中文共通平台架構圖 >>
ISO10646 漢字庫網站
<<回全字庫應用工具架構圖>><<回中文資訊平台架構圖>> <<回網頁自造字顯示機制>> << 回中文共通平台架構圖 >>
轉碼工具
提供純文字文件轉換為 CNS 碼,或 CNS 碼與 BIG-5 、 EUC 、 Unicode 、 GBK 等常用中文內碼互轉。
<<回全字庫應用工具架構圖>>
對照表匯入工具
提供自造字管理者保留機關內舊有自造字,並建立與 CNS 之對照表。
<<回全字庫應用工具架構圖>>
自造字彙整工具
提供單位自造字管理者整合內部個人電腦上原有的自造字。
<<回全字庫應用工具架構圖>>
字形轉入工具
將自造字字型安裝於個人電腦系統造字區中。<<回全字庫應用工具架構圖>>
原自造字對照表建立工具
<<回全字庫應用工具架構圖>>
舊文件改共用字集工具
<<回全字庫應用工具架構圖>>
提供網頁自造字轉換工具,解決網頁缺字顯示。
<<回網頁自造字顯示機制>>
網頁自造字轉換工具
自造字網頁
<<回網頁自造字顯示機制>>
跨平台全字庫文書編輯軟體
<< 回中文資訊應用環架構 >>
BIG-5 CNS11643 Unicode EUC GBK ISO10646
A140 1-2121 3000
A141 1-2122 FF0C
A142 1-2123 3001
A143 1-2124 3002
A149 1-212A FF01
A14A 1-212B FE30
<< 回中文資訊應用環境架構圖 >>
對照表範例
ISO10646 漢字庫網頁
推動措施擴增中文字集 ( 如公司行號、化學名、動物學名、宗教用字 ) 、字型 ( 製作明體與楷體向量字型 ) 、及屬性 ( 讀音、字義、相關詞、簡繁對照等 ) ,充實全字庫網站內容。藉由全字庫文書編輯軟體之輸入及顯示模組,開發政府旗艦計畫下之中文資訊共通平台。提供業界加值全字庫之機制,如字型、輸入法、 語音輸出等。賡續參與國際漢字編碼會議 (IS0/IEC JTC1/SC2/WG2 委員會、 UNICODE技術委員會 ) ,使國內電腦中文標準與國際標準接軌。
推動措施制定 CNS14649-1「資訊技術-廣用多八位元編碼字元集 (UCS)-第1部:架構及基本多語文字面」 (ISO10646-1) 。研擬「資訊技術-廣用多八位元編碼字元集 (UCS)-第2部:輔助字面」 (ISO10646-2) 。審查完成「中文資訊排序屬性標準」草案。研擬「網域名稱專用繁簡字碼對照表」草案。依 CNS11643 字面,制定「中文字集字型國家標準」。