資料結構化社群會議簡報 v1.5 20160707
TRANSCRIPT
1政府機關網站資料結構化社群討論會議: 2016.7.9
壹、研究流程貳、歸納整理參、實作檢測方式
簡報大綱
2
3
壹、研究流程• 政府機關網站資料Markup Vocabularies建立流程圖
網站資料結構化動態資料
靜態資料 NewsArticle, Event, Person,
QAPage…
新聞文章、活動訊息、人物介紹… 實作查詢功能
對照「政府網站版型與內容管理規範」取出 schema.org中具備的 Type
盤點 4個政府機關網站架構,進一步歸類對照「政府網站版型與內容管理規範」取出schema.org中所具備的Property
加入schema.org之 markup vocabulary
4
貳、歸納整理 -1
資料來源:本研究整理
• 政府網站架構與 schema.org之 Type對應表政府網站架構 Schema.org
公告資訊>最新消息/新聞稿 Thing > CreativeWork > Article > NewsArticle
公告資訊>活動訊息 Thing > Event
機關介紹>重要人事 Thing > Person
機關業務資訊> *常見問答 Thing > CreativeWork > WebPage > QAPage
機關業務資訊>出版品 Thing > CreativeWork > PublicationIssue
機關聯絡資訊 Thing > Organization > LocalBusiness > GovernmentOffice
相關連結 Thing > Organization > LocalBusiness > GovernmentOffice
*便民服務>申辦項目/下載表格
Thing > CreativeWork > MediaObject > DataDownload
民意交流> *意見信箱 Thing > CreativeWork > Message
影音專區 Thing > CreativeWork > MediaObject
5
貳、歸納整理 -2
資料來源:本研究整理
• 網站架構歸類本研究者歸類 4個網站共通性架構
(政府資料開放平臺、勞動部、中央氣象局、原子能委員會 )
新聞文章 最新消息、公布欄、新聞稿活動訊息 活動訊息人物介紹 正副首長介紹、首長介紹機關聯絡資訊 組織簡介、職掌及組織、組織架構相關連結 外部連結、核能相關網站、好站介紹常見問答 常見問答、 FAQ
資料下載 表單下載、線上服務、資料申購民意信箱 我還想要、民意信箱、意見信箱、意見箱出版品 政府資訊公開、出版品索取、出版品影音 懶人包、影音
其他任務與沿革、重要業務、 RSS、電子報訂閱、電子報、施政主軸、施政績效、施政目標、業務專區、源子能法規、政府資訊、勞動統計專網、資訊公開、氣候統計、網站使用統計、資料分類統計、雙語詞彙、交流討論、網站安全政策、隱私權保護政策、政府網站資料開放宣告
6
貳、歸納整理 -3• 新聞文章 (參照標準:
Thing>CreativeWork>Article>NewsArticle)基本欄位建議表註 1 Property 描述 Expected Type 備註*內文 *articleBody 文章內容 Text
*類別 *articleSection 文章分類 Text
*標題 *Headline 文章標題 Text
*發布日期 *datePublished 發布日期 Date
*單位(科室) *Author 發布作者/單位 Person or Organization
附件圖片 image 文章相關圖片 URL or ImageObject
附件圖片說明 description 附件圖片說明 Text
附件檔案 isBasedOn 文章相關影音媒體 CreativeWork or Product or URL
附件檔案說明 description 附件圖片說明 Text
相關連結 url 連結 URL
註 1:政府網站版型與內容管理規範*:必要欄位
7
貳、歸納整理 -4• 活動訊息 (參照標準: Thing>Event)
基本欄位建議表註 1 Property 描述 Expected Type 備註*單位(科室) *organizer 活動組織者/單位 Organization or
person
*標題 *name 活動名稱 Text
*內文 *description 活動簡介 Text
*開始日期 *startDate 活動開始日期 Date
*截止日期 *endDate 活動結束日期 Date
附件圖片 image 活動相關圖片 URL or ImageObject
附件圖片說明 description 附件圖片說明 Text
附件檔案附件檔案說明相關連結 url 相關連結 URL
聯絡資訊註 1:政府網站版型與內容管理規範*:必要欄位
8
貳、歸納整理 -5• 人物介紹 (參照標準: Thing>Person)
基本欄位建議表註 1 Property 描述 Expected Type 備註*姓名 *name 姓名 Text
-- *jobTitle 職稱 Text
*學歷 *alumniOf 學歷 Organization or EducationalOrganization
*經歷 memberOf 經歷 Organization or ProgramMembership
*照片 *image 照片 URL or ImageObject
聯絡資訊email 電子信箱 Text
faxNumber 傳真 Text
telephone 電話號碼 Text
近年著作相關文章註 1:政府網站版型與內容管理規範*:必要欄位
9
貳、歸納整理 -6• 機關聯絡資訊 (參照標準:
Thing>Organization>LocalBusiness>GovernmentOffice)基本欄位建議表註 1 Property 描述 Expected Type 備註*單位 *legalName 機關正式名稱 Text 若為科(課)室,則
直屬機關名稱為必填*科(課)室 parentOrganization 直屬機關名稱 Organization
*科(課)室 subOrganization 下屬機關名稱 Organization
*機關地址/地址/服務地點 *address 機關地址 Place or Text or
PostalAddress
*總機/專線/網路電話/分機 *telephone 機關電話號碼 Text
*傳真 *faxNumber 機關傳真號碼 Text
*Email *email 機關電子信箱 Text
*位置圖 *hasMap 機關位置圖 URL or Map
*服務時間 *openingHour 服務時間 Text
註 1:政府網站版型與內容管理規範*:必要欄位
10
貳、歸納整理 -7• 相關連結 (參照標準:
Thing>Organization>LocalBusiness>GovernmentOffice)
基本欄位建議表註 1 Property 描述 Expected Type 備註*網址 *relatedLink 網址 URL
*機關名稱 *parentOrganization 直屬機關 Organization 直屬機關、下屬機關及相關機關擇一必填*機關名稱 *subOrganization 下屬機關 Organization
*機關名稱 *department 相關機關 Organization
類別 areaServed 所提供的服務項目、地域
AdministrativeArea or GeoShape or Place or Text
內文說明 description 描述 Text
圖片 Image 圖片 URL or ImageObject
註 1:政府網站版型與內容管理規範*:必要欄位
11
貳、歸納整理 -8• 常見問答 (參照標準: Thing>CreativeWork>WebPage>QAPage)
基本欄位建議表註 1 Property 描述 Expected Type 備註*類別 *name 問題/主題 Text
*問題 *text 問題陳述 Text
*回覆 *suggestedAnswer 回覆 Text
相關連結 relatedLink 相關連結 URL
-- author 發布人/機關 Person or Organization
-- dateCreated 發布日期 Text
-- fileFormat 附檔格式 Text
註 1:政府網站版型與內容管理規範*:必要欄位
12
貳、歸納整理 -9• 資料下載 (參照標準:
Thing>CreativeWork>MediaObject>DataDownload)
基本欄位建議表註 1 Property 描述 Expected Type 備註-- *name 資料名稱 Text
-- *embedUrl 檔案位置 URL
-- encodingFormat 檔案格式 Text
-- contentSize 檔案大小 Text
-- uploadDate 上傳日期 Date
-- fileFormat 附檔格式 Text
註 1:政府網站版型與內容管理規範*:必要欄位
13
貳、歸納整理 -10
• 民意信箱 (參照標準: Thing>CreativeWork>Message)
基本欄位建議表註 1 Property 描述 Expected Type 備註*姓名 *sender 寄件人姓名 Andience or
Organization or Person
*意見內容 *comment 意見內容 Comment
*Email *email 電子信箱 Text
意見類別 keywords 意見類別 Text
上傳檔案 messageAttachment 訊息附件 CreativeWork
聯絡電話-- dateSent 發送日期 DateTime
-- dateReceived 接收日期 DateTime
-- dateRead 閱讀日期 DateTime
註 1:政府網站版型與內容管理規範*:必要欄位
14
貳、歸納整理 -11
• 出版品資訊 (參照標準: Thing>CreativeWork>PublicationIssue)
基本欄位建議表註 1 Property 描述 Expected Type 備註*標題(出版品名稱) *name 標題(出版品名
稱)Text
*單位 *publisher 發行單位 Person or Organization
*內文 *description 出版品文字說明 Text
*發行日期 *datePublished 發行日期 Date
-- issueNumber 發行刊號 Integer or Text
相關連結 url 相關連結 URL
附件檔案 associatedMedia 附件檔案 MediaObject
附件檔案說明 text 附件檔案說明 Text
註 1:政府網站版型與內容管理規範*:必要欄位
15
貳、歸納整理 -12
• 影音 (參照標準: Thing>CreativeWork>MediaObject)
基本欄位建議表註 1 Property 描述 Expected Type 備註*檔案名稱 *name 檔案名稱 Text
*影音檔 *embedUrl 網頁內嵌影音檔 URL
*contentUrl 外部超連結影音檔 URL
*影音檔案說明 *description 檔案說明 Text
-- fileFormat 檔案格式 Text
註 1:政府網站版型與內容管理規範*:必要欄位
16
貳、歸納整理 -13
• 其他 (參照標準: Thing>CreativeWork>Website)
基本欄位建議表註 1 Property 描述 Expected Type 備註-- *name 標題/主題 Text
-- *text 內容 Text
-- image 圖片 URL or ImageObject
-- url 相關連結 URL
-- associateMedia 相關多媒體資源 MediaObject
註 1:政府網站版型與內容管理規範*:必要欄位
17
參、實作檢測方式 -11. Google Structured Data Testing Tool(1)檢測標的
- 網頁內容結構化程度(支援 microdata / JSON-LD語法)- 找出有標記問題的語法
(2) 檢測方法a. 貼上網頁 URL或是 HTML source codeb.驗證後查看結果c. 根據錯誤報告修改錯誤標記
18
參、實作檢測方式 -22. Structured Data Linter(1)檢測標的
- 網頁內容結構化程度(支援 microdata / RDFa / JSON-LD語法)- 找出有標記問題的語法
(2) 檢測方法a. 貼上網頁 URL或是 HTML source codeb.驗證後查看結果c. 根據錯誤報告修改錯誤標記
19
參、實作檢測方式 -33. SEO SiteCheckup(1)檢測標的
- 檢測結構化網業是否能表現在搜尋引擎優化上 (SEO)- 找出有標記問題的語法,提供錯誤報告
(2) 檢測方法a. 貼上網頁 URLb.測試後查看報告
網站 SEO總體表現
網站是否包含非通用類型 meta tag
20
參、實作檢測方式 -44. Import.io(1)檢測標的
- 結構化網頁是否利於機器直接抓取(2) 檢測方法
a. 輸入網址b.查看機器讀取結果,判斷結構化程度
原始網頁呈現 機器抓取結果
21
謝謝!敬請指導!