koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · motto s d í l í me -l...

64
Koncepce sémantického slovníku pojmů Vytvořeno v rámci projektu Implementace strategií v oblasti otevřených dat II CZ.03.4.74/0.0/0.0/15_025/0004172 Klíčová aktivita: KA 03 Zasazení otevřených dat do kontextu Národního architektonického plánu Indikátor: 6 05 00 Počet napsaných a zveřejněných analytických a strategických dokumentů (vč. evaluačních) Verze výstupu: 02 1

Upload: others

Post on 04-Dec-2020

5 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Koncepce sémantického slovníku pojmů

Vytvořeno v rámci projektu

Implementace strategií v oblasti otevřených dat II CZ.03.4.74/0.0/0.0/15_025/0004172

Klíčová aktivita: KA 03 Zasazení otevřených dat do kontextu Národního architektonického plánu Indikátor: 6 05 00 Počet napsaných a zveřejněných analytických a strategických dokumentů (vč. evaluačních) Verze výstupu: 02

1

Page 2: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Historie dokumentu

Verze

Datum Popis změn

01 7.1.2018 Počáteční verze

02 ● Revize architektury SGoV ● Nová vrstva sémantického slovníku pojmů - Slovník veřejného

sektoru ● Změna base IRI slovníku z https://data.gov.cz/slovník/

na https://slovnik.gov.cz/

2

Page 3: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Seznam zkratek AIS Agendový Informační systém

API Application Programming Interface

CDO Chief Data Officer

IRI Internationalized Resource Identifier, Mezinárodní identifikátor zdroje

ISDP Informační systém o datových prvcích

ISVS Informační systém veřejné správy

NKOD Národní katalog otevřených dat

OVM Orgán veřejné moci

OWL Web Ontology Language

RDF Resource Description Framework

REST Representational State Transfer

SGoV Semantic Government Vocabulary, Sémantický slovník pojmů veřejné správy

SKOS Simple Knowledge Organization System

UFO Unified Foundational Ontology, Sjednocená základní ontologie

XML Extensible Markup Language

Seznam prefixů použitých v tomto dokumentu skos http://www.w3.org/2004/02/skos/core#

owl http://www.w3.org/2002/07/owl#

dcterms http://purl.org/dc/terms/

rdf http://www.w3.org/1999/02/22-rdf-syntax-ns#

rdfs http://www.w3.org/2000/01/rdf-schema# z-sgov https://slovnik.gov.cz/základní/

z-sgov-pojem https://slovnik.gov.cz/základní/pojem/

v-sgov https://slovnik.gov.cz/veřejný-sektor/

3

Page 4: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

v-sgov-pojem https://slovnik.gov.cz/veřejný-sektor/pojem/

a-sgov-<A> https://slovnik.gov.cz/agendový/<A>/, kde <A> označuje číslo agendy, např. https://slovnik.gov.cz/agendový/101/

a-sgov-<A>-pojem https://slovnik.gov.cz/agendový/<A>/, kde <A> označuje číslo agendy, např. https://slovnik.gov.cz/agendový/101/pojem/

l-sgov-sbírka-<Č>-<R> https://slovnik.gov.cz/legislativní/sbírka/<Č>/<R>/, kde <R> označuje rok vydání a <Č> označuje číslo částky např. https://slovnik.gov.cz/legislativní/sbírka/247/1995

l-sgov-sbírka-<Č>-<R>-

pojem https://slovnik.gov.cz/legislativní/sbírka/<Č>/<R>/poj

em/, kde <R> označuje rok vydání a <Č> označuje číslo částky např. https://slovnik.gov.cz/legislativní/sbírka/247/1995/pojem/

d-sgov-<P>-<D> https://slovnik.<P>.cz/datový/<D>/, kde <P> označuje doménu poskytovatele datové sady a <D> označuje blíže neurčený identifikátor datové sady či více datových sad u poskytovatele skládající se pouze z alfanumerických znaků a symbolu “-”.

d-sgov-<P>-<D>-pojem https://slovnik.<P>.cz/datový/<D>/pojem/, kde <P> označuje doménu poskytovatele datové sady a <D> označuje blíže neurčený identifikátor datové sady či více datových sad u poskytovatele skládající se pouze z alfanumerických znaků a symbolu “-”.

4

Page 5: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Motto Sdílíme-li data, sdílejme i jejich význam.

1. Úvod Sémantický slovník pojmů veřejné správy (SGoV) je prostředek pro postupnou harmonizaci významu (sémantiky) dat vedených v informačních systémech veřejné správy (ISVS). SGoV lze chápat jako katalog odborného pojmosloví používané v rámci veřejné správy, zahrnující pojmy, jejich definice, vazby pojmů na legislativu, vzájemné sémantické vazby pojmů mezi sebou i sémantické vazby pojmů na standardní veřejné slovníky používané v zahraničí (především z iniciativy EU, např. ISA Core Vocabularies), kde sémantická vazba značí souvislost mezi pojmy s určitým konkrétním definovaným významem. SGoV má podobu formální, strojově čitelné datové sady. Je zveřejňován jako otevřená data, viz § 3 odst. 11 zákona č. 106/1999 Sb. o svobodném přístupu k informacím. SGoV je přirozenou evolucí současného stavu, kdy je v Registru práv a povinností veden výčet údajů vedených k agendám v Registru práv a povinností dle § 51 odst. 5 písm. g), h) 1

a i) zákona č. 111/2009 Sb. o základních registrech. SGoV údaje rozpracovává do podoby strojově čitelných informačních modelů (ontologických modelů), které je možno sdílet prostřednictvím běžných principů, protokolů a technologií sítě WWW. Pro účely harmonizace sémantiky dat vedených v ISVS jsou logická schémata popisující strojové (syntaktické) vyjádření dat vedených v ISVS propojována na pojmy SGoV. Tím je realizováno propojení sémantiky (významu) dat napříč jednotlivými ISVS. Díky tomu, že SGoV integruje údaje vedené k agendám v Registru práv a povinností dle § 51 odst. 5 písm. g), h) a i) zákona č. 111/2009 Sb. o základních registrech, které jsou legislativně ukotveny, je vazba každého pojmu SGoV na legislativu buď přímo uvedena, nebo je dohledatelná přes souvisejicí pojmy pomocí dokumentovaných vazeb. SGoV je budován postupným doplňováním pojmů z jednotlivých domén a sémantických souvislostí mezi těmito pojmy. SGoV sám o sobě nezajišťuje syntaktickou ani sémantickou interoperabilitu, neboť logická schémata nejsou nutně, a zvlášť na počátku budování sémantického slovníku pojmů, propojena úplně, tj. nejsou propojeny všechny prvky logických schémat na přesný sémantický popis pomocí pojmů ze sémantického slovníku pojmů. SGoV je tedy pouze prostředkem usnadňujícím zajišťování syntaktické a sémantické interoperability dat. Jeho hlavním přínosem je snazší vyhledávání dat na základě významových souvislostí, zvýšení jejich přepoužitelnosti a jejich snazší propojování.

1 V tomto dokumentu se pojem agenda používá výlučně ve smyslu § 2 písm. e) zákona č. 111/2009 Sb. o základních registrech.

5

Page 6: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

SGoV opírá význam pojmů používaných pro popis datových sad o právní předpisy a umožňuje sledovat a identifikovat význam pojmu jako takového i všech variant jeho významu ve smyslu jednotlivých znění daného právního předpisu. SGoV je v první řadě určen pro podporu kvalitní publikace otevřených dat. Údaje zveřejňované jako kvalitní otevřená data musejí být opatřena publikovaným logickým schématem popisujícím strojově čitelným způsobem jejich syntaxi a strukturu. Sémanticky významné prvky logického schématu by měly být propojeny strojově čitelným způsobem na pojmy SGoV a tato propojení by pak měla být též publikována jako součást logického schématu. S využitím SGoV bude rozšířena funkcionalita NKOD o zobrazování kvalitnější dokumentace sémantiky datových sad a širší možnosti vyhledávání souvisejících datových sad. Konzumenti otevřených dat budou využívat SGoV pro integraci otevřených dat získaných od různých poskytovatelů.

1.1. Účel dokumentu Tento dokument si klade za cíl představit principy a architekturu sémantického slovníku pojmů, příklady jednotlivých dílčích slovníků, metodiku jeho tvorby a údržby, včetně technických prostředků pro jeho realizaci. Dokument rovněž ukazuje zasazení SGoV do kontextu Informační koncepce České republiky a na příkladech vysvětluje možnosti jeho využití pro popis logických schémat otevřených dat. Dokument je určen zejména IT specialistům, datovým architektům, znalostním inženýrům a odborníkům na otevřená data a ostatním pracovníkům zajišťujícím sémantickou interoperabilitu dat ve veřejném sektoru.

1.2. Cíle sémantického slovníku pojmů Sémantický slovník pojmů si klade za cíl udržovat a dokumentovat význam odborného pojmosloví veřejné správy, sdílet jej napříč orgány veřejné správy i směrem k veřejnosti s těmito hlavními cíli.

● poskytnout nástroj pro sdílení významu pojmů v rámci Národní architektury veřejné správy ČR,

● zakotvit význam datových sad veřejné správy a dalších artefaktů eGovernmentu ve sdíleném odborném pojmosloví. To mj. umožní následné sdílení významu dat s třetími stranami, např. s evropskými institucemi.

● umožnit tvorbu katalogu datových sad veřejné správy. Katalogem datových sad veřejné správy je myšlena otevřená datová sada, která popisuje veškeré legislativou vymezené datové sady, t.j. nikoliv pouze otevřené datové sady, a zveřejňuje jejich existenci strojově čitelným způsobem (neposkytuje však skutečný obsah těchto datových sad). Katalog se může stát nástrojem pro efektivní řízení a kontrolu procesu otevírání dat a rovněž nástrojem usnadňujícím informovanost a sdílení datových sad napříč veřejnou správou.

Specifickými cíli směrem k otevřeným datům jsou pak zejména:

6

Page 7: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

● zlepšit vyhledatelnost otevřených datových sad vytvářených nebo spravovaných orgány veřejné moci ČR,

● zvýšení kvality popisu otevřených datových sad ○ omezení duplicit v pojmenovávání stejných prvků různými jmény, nebo

různých prvků stejnými jmény ○ propojování souvisejících atributů dvou - dosud nepropojených - datových sad

významovou vazbou ○ sjednocení způsobu modelování jednotlivých datových sad. ○ omezení většího počtu významů jedné hodnoty datového atributu.

1.3. Příklady souvisejících aktivit Potřeba využívat sdílené pojmosloví při komunikaci a sdílení dat napříč sektory veřejné správy byla na identifikována na mnoha úrovních. Např. dokument Information principles for the UK public sector, 2011 vytvořený britskou vládou zmiňuje nutnost sdílených slovníků v jednom ze svých sedmi principů správy a sdílení informací veřejného sektoru. Příkladem sdíleného slovníku může být novozélandský tezaurus pro e-government, viz GEA-NZ Reference Models and Taxonomies, 2017, jednoduché slovníky pro e-government jsou rovněž vytvářeny na Slovensku, viz Centrálny model údajov verejnej správy, 2017. Evropská komise publikovala v roce 2014 několik specifikací základních slovníků pro e-government (tzv. e-Government Core Vocabularies), viz Handbook on using the Core Vocabularies, 2014. Tyto slovníky si kladou za cíl nabídnout základní datové prvky a jejich atributy v unifikované podobě, tj. s jedinečnou identifikací, možnými lexikalizacemi, definicemi a vztahy k ostatním datovým prvkům. Společným cílem těchto sémantických slovníků pojmů (od glosářů, po složité výpočetní modely) je stabilizovat význam odborného pojmosloví. V českém prostředí existuje od roku 2007 Informační systém o datových prvcích (ISDP). Související metodický pokyn popisuje životní cyklus tzv. datových prvků, tedy pojmů používaných pro popis dat, formalizovaných pomocí XML.Oproti ISDP je zde představený sémantický slovník pojmů budován od základních významových struktur na základě výzkumu v oblasti kognitivních věd a nabízí formální reprezentaci pojmů a vztahů v podobě otevřených propojených dat. Sémantický slovník pojmů navíc oproti ISDP nepředepisuje konkrétní datové struktury a jejich syntax, ale umožňuje nad různými datovými strukturami různých správců a poskytovatelů dat postupně budovat sémantickou vrstvu, která popisuje jejich význam.

2. Základní principy V této sekci jsou představeny klíčové principy sémantického slovníku pojmů, spolu s odůvodněním jejich smyslu a základními myšlenkami jejich realizace. Tyto principy vycházejí jednak ze souvisejících aktivit, viz Sekce Příklady souvisejících aktivit, jednak z cílů uvedených v sekci Cíle sémantického slovníku pojmů.

7

Page 8: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Sémantický slovník pojmů sestává z dílčích slovníků, které sdružují odborné pojmy dle různých kontextů (např. dle zákona, který pojmy definuje). Odborné pojmy jsou popsány

atributy a jsou navzájem propojeny sémantickými vazbami, které popisují významové souvislosti těchto pojmů.

(GI) Globální identita

Princip Každý odborný pojem sémantického slovníku pojmů má přiřazenu globální identitu, tedy identitu, kterou lze pojem identifikovat v rámci daného orgánu veřejné moci, v rámci celé veřejné správy i pro sdílení významu pojmu s veřejností a třetími stranami. Tento globální identifikátor musí umožnit snadné získání informace o významu daného pojmu. Globální identifikátor v průběhu času může označovat jediný odborný pojem - jediný význam. V případě zavedení nového odborného pojmu je vždy vytvořen nový globální identifikátor.

Odůvodnění Smyslem globální identity pojmu je umožnit sdílení pojmu a jeho významu definovaného jedním OVM pro zakotvení významu pojmů spravovaných jinými OVM.

Realizace Globální identita odborného pojmu je zajištěna identifikátorem odborného pojmu, který bude tvořen v souladu s principy propojených dat, viz Linked Data Principles, 2009. Ty zahrnují identifikaci pomocí HTTP IRI, a dereferencovatelnost těchto IRI.

Příklad IRI https://slovnik.gov.cz/legislativní/sbírka/247/1995/pojem/volební-kraj identifikuje odborný pojem označující volební kraj ve smyslu slovníku zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky.

V následujícím textu budeme využívat standardní techniky zkracování IRI pomocí prefixů. Např. https://slovnik.gov.cz/legislativní/sbírka/247/1995/pojem/volební-kraj

bychom zkrátili jako l-sgov-sbírka-247-1995-pojem:volební-kraj s využitím prefixu l-sgov-sbírka-247-1995-pojem označujícího základ IRI https://slovnik.gov.cz/legislativní/sbírka/247/1995/pojem/. Prefixy použité v tomto dokumentu jsou uvedeny v sekci Seznam prefixů.

(UV) Ukotvení významu

Princip Každý odborný pojem je doplněn strojově čitelnými vlastnostmi a vztahy, které ukotvují jeho význam. Je-li význam odborného pojmu definován ve veřejném normativním dokumentu, je odborný pojem doplněn rovněž odkazem na tento dokument (zákon, vyhláška, jiný předpis)

8

Page 9: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

nebo jeho část, kde je význam pojmu definován. Vlastnosti a vztahy odborného pojmu jsou globálně identifikovatelné podobně jako odborný pojem samotný (princip GI).

Odůvodnění Ukotvení významu v podobě definic a normativní dokumentace je nutné pro stabilizaci významu daného pojmu a zajištění konzistentní interpretace datových sad, které se na daný odborný pojem vážou.

Realizace Význam odborného pojmu je určen vlastnostmi a vztahy,např. charakteristickým typem pojmu či významovými vztahy na ostatní odborné pojmy. Tyto charakteristiky jsou modelovány pomocí metod ontologického inženýrství. Každá vlastnost a vztah sám o sobě představuje odborný pojem s významem ukotveným v souladu s principy uvedených v této sekci. Kromě vlastností a vztahů je pojem popsán metadaty, zahrnujícími např. název, definici či normativní odkaz, příklad užití.

Příklad Identifikátor pojmu: l-sgov-sbírka-247-1995-pojem:volební-kraj Název pojmu: Volební kraj Normativní odkaz: Zákon č. 247/1995 Sb. o volbách do Parlamentu České republiky Příklad: Jedním z volebních krajů je Hlavní město Praha Typ: z-sgov-pojem:typ-objektu

(PZ) Princip určené zodpovědnosti

Princip Každá ucelená a konzistentní sada odborných pojmů, jejich vlastností a vztahů je popsána v rámci jednoho slovníku. Za správu každého slovníku, jeho aktuálnost a konzistenci je zodpovědný jeden orgán veřejné moci (správce slovníku).

Odůvodnění Tento princip zajistí vnitřní konzistenci odborných pojmů v rámci daného slovníku, zajistí vyhledatelnost a využitelnost pojmů pro ostatní OVM a třetí strany. V neposlední řadě umožní nastavit procesy pro správu pojmů v rámci jednotlivých OVM.

Realizace Slovník představuje konzistentní soubor odborných pojmů, jejich vlastností a vztahů s dalšími odbornými pojmy z daného slovníku a z jiných slovníků. Odborný pojem je v rámci slovníku unikátní. Každý slovník je spravován jedním OVM, který má zodpovědnost za aktuálnost, konzistenci a publikaci jeho obsahu ve smyslu této koncepce. Způsob určení zodpovědnosti OVM za jednotlivé slovníky je popsán v sekci Architektura sémantického slovníku pojmů. Každý slovník je sám o sobě otevřenou datovou sadou.

9

Page 10: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Příklad Agendový slovník agendy A-1183 je spravován MV ČR, ohlašovatelem agendy A-1183. Slovník obsahuje odborné pojmy týkající se agendy voleb do Parlamentu České republiky. Příkladem takového odborného pojmu je pojem a-sgov-1183-pojem:politický-subjekt.

3. Architektura sémantického slovníku pojmů Sémantický slovník pojmů označuje soubor informačních artefaktů sloužících ke sdílení významu pojmů používaných v rámci veřejné správy České republiky. Slovník je vrstven do několika úrovní, lišících se životním cyklem odborných pojmů a rozsahem jejich využití.

3.1. Úrovně sémantického slovníku pojmů Navrhovaná architektura vychází z aktuálních úrovní popisu procesů veřejné správy - v legislativě jsou definovány a používány pojmy, které jsou dále přejímány a interpretovány v popisu agend veřejné správy. Agendy jako takové dále poskytují strukturovaný popis aktivit a činností, v rámci kterých vznikají datové sady, příp. další artefakty spravované veřejnou správou. Na základě této logiky navrhujeme architekturu sestávající z těchto úrovní:

● Základní sémantický slovník pojmů (Z-SGoV) ○ Definuje pojmy obecné, vyjadřující základní, doménově nezávislé významy. ○ Není specifický pro veřejnou správu a je poplatný zvolené metodice

ontologického inženýrství. ○ Jeho správcem je CDO.

● Sémantický slovník pojmů veřejného sektoru (V-SGoV) ○ Definuje pojmy sdílené napříč veřejným sektorem, základní pojmy právní

teorie, popisu dat a evidence objektů v datových sadách veřejné správy ○ Tvoří společný pojmoslovný rámec pro veřejnou správu ČR. ○ Není specifický pro žádnou agendu ani konkrétní právní předpis. ○ K definici pojmů a souvislostí využívá pojmy a vazby definované v Z-SGoV. ○ Jeho správcem je CDO.

● Sémantické slovníky pojmů legislativy (L-SGoV) ○ Definují pojmy popsané v jednotlivých právních předpisech. Tyto slovníky jsou

základem pro sémantické slovníky pojmů agend. ○ K definici pojmů a souvislostí využívají pojmy a vazby definované v V-SGoV,

dalších L-SGoV, případně Z-SGoV. ○ Pro každý právní předpis je vytvářen samostatný L-SGoV.

■ Definuje pojmy zaváděné či používané daným právním předpisem. ■ Tvoří společný pojmoslovný rámec právního předpisu. ■ Jejich správcem je CDO.

● Sémantické slovníky pojmů agend (A-SGoV) ○ Definují pojmy specifické pro agendy (ve smyslu § 2 písm. e) zákona č.

111/2009 Sb. o základních registrech).

10

Page 11: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

○ K definici pojmů a souvislostí využívají pojmy a vazby definované v V-SGoV, L-SGoV, v dalších A-SGoV, příp. v Z-SGoV.

○ Pro každou agendu je vytvářen samostatný A-SGoV ■ Definuje pojmy sdílené v rámci agendy. ■ Není specifický pro žádný ISVS ani žádnou datovou sadu. ■ Tvoří společný pojmoslovný rámec agendy. ■ Jeho správcem je ohlašovatel agendy ve smyslu § 48 písm. f) zákona

č. 111/2009 Sb. o základních registrech. ● Sémantické slovníky pojmů datových sad (D-SGoV)

○ Definují pojmy specifické pro jednotlivé datové sady vedené v agendových ISVS (AIS) ve smyslu § 2 písm. f) zákona č. 111/2009 Sb. o základních registrech a dalších ISVS.

○ K definici pojmů a souvislostí využívají pojmy a vazby definované v V-SGoV, L-SGoV, A-SGoV, dalších D-SGoV, případně Z-SGoV.

○ Samostatný D-SGoV je vytvářen pro jednu nebo více datových sad daného poskytovatele společně.

■ Definuje pojmy popisující specifický význam datových sad, pokud není tento význam v A-SGoV rozpracován do detailu nutného pro zveřejňování datové sady.

■ Jeho správcem je poskytovatel datové sady.

Následující diagram schématicky znázorňuje jednotlivé úrovně (odlišené barvami) a ukázky závislostí mezi jednotlivými slovníky. Vazba “využívá” v diagramu znázorňuje pro přehlednost pouze primární zdroj přepoužívaných pojmů - každá vrstva může využít pojmy z aktuální vrstvy a všech předchozích vrstev (např. A1 může využít pojmy ze slovníků A2, L1, L2, Sémantický slovník pojmů veřejného sektoru, Základní sémantický slovník pojmů).

11

Page 12: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

3.2. Struktura jedné úrovně SGoV Každý slovník v každé úrovni SGoV má stejnou strukturu - obsahuje tři základní artefakty:

● Glosář pojmů (GP) ○ Glosář pojmů je seznamem odborných pojmů, opatřených popisem. Dle

principu (UV) Ukotvení významu je popis pojmu v glosáři tvořen vlastnostmi a vztahy, které specifikují význam pojmu - identifikační název, definice (nebo vymezující popis), nebo zdroj definice (např. normativním odkazem do legislativy), typ pojmu (jiný pojem, který charakterizuje povahu nově definovaného pojmu).

○ Identifikační název pojmu je jednoznačný v rámci identifikačních názvů všech pojmů z daného glosáře, viz (PZ) Princip určené zodpovědnosti.

● Ontologický model (OM) ○ Ontologický model popisuje významové vztahy (viz (UV) Ukotvení významu)

pojmů z glosáře do podoby tzv. konceptuálního modelu. Pojem konceptuální model (nebo též informační model) je běžné používán v softwarovém

12

Page 13: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

inženýrství. Konceptuální model je standardní součástí dokumentace informací spravovaných v informačních systémech jako data a žádný softwarový projekt s více účastníky se bez něj nemůže obejít. Ontologický konceptuální model (dále nazýván jen ontologický model) zajišťuje sdílení významu pojmů v rámci širší komunity tím, že je postaven na principech kognitivních věd, popisujících modely lidského myšlení. To rovněž usnadňuje jeho integraci s existujícími slovníky. V případě SGoV je komunitou veřejná správa a uživatelé jejích dat (např. uživatelé otevřených dat).

● Mapování ontologického modelu na stávající odborné doménové slovníky (MM) ○ Mapování ontologického modelu na doménové slovníky umožňuje sdílet

význam odborných pojmů, resp. dat, které tyto odborné pojmy popisují, s třetími stranami - v případě SGoV se jedná zejména o evropské a světové organizace používající již dříve standardizované slovníky. Mapování není v této verzi koncepce detailně popsáno. Příklad vztahu vztahu základního slovníku a ISA Core Vocabularies, které byly navrženy s cílem poskytnout sdílený pojmoslovný rámec pro evropskou veřejnou správu, je uveden v sekci Příloha č. 1. Základní slovník.

Následující schéma ukazuje strukturu sdílení znalosti mezi jednotlivými slovníky a jejich částmi.

13

Page 14: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Pro účely této koncepce a demonstrace využití jednotlivých částí sémantického slovníku pojmů pro účely otevřených dat je

● glosář vyjádřen v jazyce SKOS (SKOS Simple Knowledge Organization System Reference, W3C Recommendation, 2009), viz sekce Vyjádření sémantického

14

Page 15: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

slovníku pojmů jako otevřená data. Pro účely představení základních principů SGoV uvádíme v této sekci ukázky jednotlivých glosářů v podobě tabulky, ve které je každý řádek reprezentací jednoho pojmu a každý sloupec odpovídá jednomu významotvornému atributu, který je pro pojmy evidován

● ontologický model je vyjádřen v jazyce OWL (OWL 2 Web Ontology Language Document Overview (Second Edition), W3C Recommendation, 2012), viz sekce Vyjádření sémantického slovníku pojmů jako otevřená data. Pro účely představení základních principů SGoV uvádíme v této sekci ukázky ontologických modelů v podobě diagramů modelovacího jazyka UML, konkrétně jazyka pro modelování diagramů tříd.

3.3. Základní sémantický slovník pojmů (Z-SGoV) Tato sekce popisuje principy základního sémantického slovníku pojmů. Pro tento účel jsou vybrány některé klíčové odborné pojmy ze slovníku. Úplný popis příkladu základního slovníku používaného v této koncepci lze nalézt v kapitole Příloha č. 1. Základní slovník a metodologii jeho tvorby v kapitole Správa slovníků. Základní sémantický slovník pojmů popisuje pojmosloví obecné, které není specifické ani pro doménu veřejné správy. Jedná se o pojmy obecné povahy, které nemají normativní definici v české legislativě (např. Člověk, Událost), sdružují však společné rysy ostatních pojmů, které v legislativě zakotveny jsou (např. Fyzická osoba, dle Hlavy II, část první, Zákon č. 89/2012 Sb. je rolí člověka od okamžiku narození do okamžiku úmrtí, přejímá tedy od typu Člověk jeho vlastnosti, např. národnost, datum narození či velikost bot). Pojmy, které jsou normativně zavedeny v legislativě, jsou součástí jednotlivých legislativních slovníků. Obecné pojmy a jejich vzájemné vazby jsou vytvářeny na základě výsledků a metod ontologického inženýrství v oblasti základních ontologií. Základní slovník je založen na části základních ontologií rodiny Unified Foundational Ontology (UFO). Tato rodina základních ontologických modelů popisuje klíčové oblasti znalostního popisu reálného světa. Pro účely SGoV tato koncepce přejímá a rozšiřuje některé části ontologií rodiny UFO v české verzi:

● UFO-A - sloužící k popisu statických strukturálních modelů - objektů, vlastností, vztahů, atp., viz Ontological foundations for structural conceptual models, 2005

● UFO-B - sloužící k popisu časově proměnných údajů - událostí, stavů objektů, atp. viz Representing the UFO-B Foundational Ontology of Events in SROIQ, 2017

● UFO-MLT - popisující modelování typů - typů objektů, událostí, atp. viz Extending the Foundations of Ontology-based Conceptual Modeling with a Multi-Level Theory, 2015

Kromě této široké škály modelů pro jednotlivé klíčové oblasti lidské kognice byly ontologie UFO vybrány z těchto důvodů:

● jsou z velké části kompatibilní s ostatními základními ontologiemi, např. DOLCE, či BFO, jsou však lépe dokumentovány v aktuální odborné literatuře.

● nad ontologií UFO-A byl vystavěn jazyk OntoUML umožňující efektivně tvořit strukturální modely. V tomto dokumentu tento jazyk nevyužíváme, neboť jeho

15

Page 16: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

současná podoba neumožňuje formalizovat další ontologické modely rodiny UFO (tedy ani UFO-B a UFO-MLT zmíněné výše a klíčové pro tuto koncepci). I tak však může být vhodným nástrojem pro dílčí strukturální modely částí legislativních, agendových a datových slovníků.

Základní slovník v představené podobě je výběrem konstruktů ontologií rodiny UFO. Některé části ontologií UFO nejsou do slovníku zahrnuty, neboť by zvýšily složitost popisu, aniž by poskytly zřejmé výhody vzhledem k použitím v oblasti otevřených dat. Slovník je plně kompatibilní s ontologiemi UFO, což do budoucna zajišťuje možnost jeho dalšího rozšiřování.Technické detaily jednotlivých modelovacích rozhodnutí základního slovníku pojmů nejsou součástí tohoto koncepčního dokumentu a budou řešeny v návazných dokumentech.

3.3.1. Základní glosář pojmů (Z-GP) Základní glosář zahrnuje popisné odborné pojmy a jejich vzájemné vazby. Klíčové pojmy a vazby jsou uvedeny v následujících odstavcích. Pojmy ze základního glosáře uvedené v této sekci jsou definovány jako ontologické kategorie identifikované v rámci tvorby ontologií rodiny UFO. Pro pojmy základního glosáře se evidují zejména:

● Název pojmu označuje identifikační název pojmu v češtině. Více názvů pojmu se nevylučuje, ale jeden z nich musí být vybrán v rámci daného slovníku jako identifikační.

● Definice je definiční text popisující význam pojmu pomocí pozitivních a negativních vymezení vůči ostatním pojmům.

● Příklady ukazují použití názvu pojmu v přirozeném textu a v kontextu názvů ostatních pojmů

Název pojmu Definice Příklady

prvek Prvkem (analogicky s UFO Entity) je míněn jakýkoliv identifikovatelný koncept, který používáme pro popis světa.

viz proměnný prvek, neproměnný prvek

proměnný prvek

Proměnným prvkem (analogicky s UFO Endurant) je prvek, který vzniká a zaniká a může měnit své vlastnosti v čase.

objekty reálného světa (jednotlivé dopravní prostředky, jednotliví lidé), jejich vlastnosti (viz vlastnost), či vzájemné vztahy (viz vztah).

objekt Objektem (analogicky s UFO Object) rozumíme proměnný prvek, jehož existence není přímo závislá na existenci jiných prvků. Objekt může existovat i jako součást jiného

konkrétní lidé (např. Jan Novák), předměty, dopravní prostředky (např. Škoda Octavia, výr. číslo

12345), dokumenty (např. Zákon č. 247/1995 Sb. o volbách do

Parlamentu České republiky ve

znění pozdějších předpisů) nebo

16

Page 17: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

objektu, ale může být vyjmut a existovat i nadále.

části dokumentů (např. § 1 odst. 1 zákona č. 247/1995 Sb. o

volbách do Parlamentu České

republiky ve znění pozdějších

předpisů - odstavec zákona je součástí zákona, tj. jiného objektu, ale jedná se o text, který může existovat i mimo zákon jako takový).

vlastnost/vztah

Oproti objektu vlastností/vztahem (analogicky s UFO Quality/Relation) rozumíme proměnný prvek, jehož existence je přímo závislá na existenci jiného proměnného prvku - existuje-li závislost na jediném proměnném prvku, hovoříme o vlastnosti, existuje-li závislost na více proměnných prvcích, hovoříme o vztahu.

Příkladem vlastnosti je jméno či datum narození konkrétní osoby (např. Datum narození Jana Nováka), barva konkrétního vozidla (např. Barva Škody Octavia, výr. číslo 12345). Všechny tyto proměnné prvky existenčně závisí na objektech a jsou jejich vlastnosti. Příkladem vztahu je jedno konkrétní manželství (např. Manželství Jana Nováka a Dany Dvořákové). Konkrétní manželství je existenčně závislé na dvou konkrétních osobách a jedná se o vztah mezi nimi.

typ Typ (analogicky s UFO Powertype) představuje v čase proměnnou entitu (význam typu se může v čase vyvíjet, například novelizacemi právního předpisu), která je použita pro klasifikaci jiného prvku a definuje tím jejich vlastnosti a možné vztahy s jinými prvky. Různé typy mohou být použity pro klasifikaci různých typů prvků - typy událostí, typy objektů, metatypy (typy jiných typů), atp.

Příkladem typu objektu může být pojem Člověk, který předurčuje Jméno jakožto typ vlastnosti, kterou konkrétní lidé mají a Manželství, jako typ vztahu, do kterého může člověk vstoupit (každý vztah typu Manželství závisí na existenci dvou objektů typu Člověk). Podobně Volby do PSP ČR mohou být typem události.

agent Agent (Analogicky s UFO Agent) představuje v čase proměnný objekt, který je proaktivní a může vykonávat akce.

Agentem může být např. človek František Vomáčka.

17

Page 18: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

pasivní

objekt

Pasivním objektem je objekt, který není agentem

Typem pasivního objektu je např. dokument.

neměnný prvek Neměnný prvek (analogicky s UFO Perdurant) je prvek, který nemění v čase svoje vlastnosti.

viz událost, okamžitý stav proměnného prvku

okamžitý stav

proměnného

prvku

Okamžitý stav proměnného prvku (analogicky se zobecněním UFO Object snapshot) představuje v čase neměnný prvek, který reprezentuje výskyt konkrétního proměnného prvku v konkrétním okamžiku.

Příkladem okamžitého stavu objektu Jan Novák může být stav Jan Novák k 1.1.2017, který označuje soubor konkrétních hodnot okamžitých stavů vlastností objektu Jan Novák v konkrétním okamžiku/časovém intervalu. Příkladem okamžitého stavu vlastnosti Číslo občanského průkazu Jana Nováka k 1.1.2017 může být Číslo občanského průkazu Jana Nováka k 1.1.2017 s hodnotou 123456.

událost Událost (v UFO Event) představuje v čase neměnný prvek, který nastal a který mění některý z proměnných prvků

Příkladem události jsou Volby do PSP ČR na podzim 2017 (z některých kandidátů se stávají poslanci).

vznik

proměnného

prvku / změna

proměnného

prvku / zánik

proměnného

prvku

Vznik/změna/zánik proměnného prvku označuje události, které mění stav proměnného prvku, příp. vytvářejí/ruší jeho existenci.

Příkladem zániku proměnného prvku je Smrt Františka Vomáčky.

akce Akce (v UFO Action) představuje událost vykonanou agentem.

Příkladem akce je podání kandidátní listiny strany XYZ

pro volby do PSP ČR na podzim

2017

časový prvek Časový prvek označuje prvek, který vymezuje časové období - a to buď přímou hodnotou (aktuální rok/den, časový interval), nebo relativně vzhledem k jinému prvku (doba

15.1.1999, nebo 15.1.1999-10.2.2012

18

Page 19: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

existence daného proměnného prvku, trvání události)

prostorový

objekt

Prostorový objekt označuje objekt, který vymezuje prostorovou oblast, a to buď absolutně (GPS, adresa), nebo relativně vzhledem k jinému prvku (prostorové ohraničení proměnného prvku)

Revoluční 1, Praha 1, nebo Oblast Prahy.

je stavem Typ vazby, která spojuje proměnný prvek s jeho okamžitým stavem.

Jméno Jany Novákové k 1.1.2018

→ je stavem → Jméno Jany

Novákové roz. Dvořákové. Samotný stav Jméno Jany Novákové roz. Dvořákové k

1.1.2018 má hodnotu např. “Jana Nováková”. Podobně lze chápat okamžité stavy dalších proměnných prvků jiných typů.

má účastníka Typ vazby, která spojuje událost a jejího účastníka.

Volby do PSP ČR 2017 → má

účastníka → Jan Novák. Konkrétní formu (význam) účasti tento typ vztahu neurčuje.

má počáteční

hodnotu / má

koncovou

hodnotu

Typ vazby, která spojuje událost s příslušnou hodnotou stavu proměnného prvku před začátkem události/resp. po jejím skončení.

Narození Jana Nováka → má

koncovou hodnotu → Jan Novák

po narození.

je ve vztahu

/ má vztažený

prvek / je

vlastností /

má vlastnost

Typ vazby, která spojuje proměnný prvek se svým vztahem (je ve vztahu / má vztažený prvek) , resp. svojí vlastností (je vlastností / má vlastnost), jehož se proměnný prvek účastní.

Příkladem vazby proměnného prvku na vlastnost je Jan Novák → má

vlastnost → číslo bot Jana

Nováka. Příkladem vazby proměnného prvku na vztah je Jan Novák → je ve vztahu →

manželství Jana Nováka a Dany

Dvořákové.

má část Typ vazby, která spojuje prvek s jeho částí. Jedná se o obecnou mereologickou vazbu, povaha vazby část-podčást není specifikována a zahrnuje tak kolekce (městský radní je

Jan Novák → má část → levá

noha Jana Nováka.

19

Page 20: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

částí rady města), strukturální (i funkční) části (srdce je částí člověka), či části neměnných prvků (volba Františka Vomáčky je částí voleb do PSP 2017) atp.

má časové

určení

Typ vazby, která neměnným prvkům přiřazuje časové určení.

Narození Jana Nováka → má

časové určení → 19.1.1990.

má prostorové

určení

Typ vazby, která neměnným prvkům přiřazuje prostorové určení.

Narození Jana Nováka → má

prostorové určení → Praha 4

je instancí

typu

Typ vazby, která dává do souvislosti prvek a jeho typ. Typů prvku může být víc.

Příkladem souvislosti prvku a jeho typu je Jan Novák → je instancí

typu → Volič

je metatypem Typ vztahu, který dává do souvislosti typ a jeho metatyp, tedy typ vyššího řádu. Instancemi metatypu jsou jiné typy.

Typ člověka podle pohlaví →

je metatypem → Člověk

specializuje Typ vztahu, který dává do souvislosti typ a jeho nadtyp, tedy typ širší, obecnější.

Muž → specializuje → Člověk

3.3.2. Základní ontologický model (Z-OM) Základní ontologický model popisuje vazby mezi obecnými pojmy. Model umožňuje reprezentovat objekty a jejich závislé vlastnosti/vztahy, včetně okamžitých stavů těchto objektů,vlastností a vztahů. Všechny proměnné prvky mohou být měněny, vytvářeny či destruovány událostmi, které mají časové a prostorové určení a definují jednotlivé okamžité stavy těchto proměnných prvků. Důležitou roli hrají rovněž typy samotné - proměnné prvky, které lze použít pro označování/kategorizaci jiných proměnných či neměnných prvků. Popis znalosti typicky probíhá na třech úrovních obecnosti. Jednotlivé úrovně jsou představeny v následující tabulce na příkladu pojmu Člověk (typ objektu), který má typ vlastnosti Občanství. Konkrétní člověk Martina Navrátilová má vlastnost Občanství Martiny Navrátilové, které může v různých časových okamžicích nabývat různých hodnot (člověk může měnit občanství v průběhu svého života).

20

Page 21: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Úroveň

obecno

sti

Příklad

informací o

objektu

Příklad

informací o

vlastnosti

objektu

Příklad informací o

vztahu dvou objektů

Příklad informací o

události

Typ Člověk Občanství Manželství Nabytí státního

občanství ČR

Objekt/

Vlastno

st/

Událost/

Vztah

Martina

Navrátilov

á

Národnost

Martiny

Navrátilov

é

Manželství Jana

Nováka a Dany

Dvořákové

Nabytí českého

státního občanství

Martiny Navrátilové

narozením v roce

1956.

Okamžit

ý stav

Martina

Navrátilov

á v roce

1970

česká Manželství Jana

Nováka a Dany

Dvořákové k 1.1.2017

Není aplikovatelná

Úroveň typů

Úroveň typů popisuje pojmy označující typy objektů, vlastností, vztahů a událostí z odborné oblasti, které se daný slovník věnuje. Typ jako takový vykazuje proměnlivost v čase. Příkladem typu je pojem Volič, který klasifikuje jednotlivé občany vzhledem k jejich účasti na volbách. Pojem je definovaný ve slovníku Zákona č. 247/1995 Sb. Ovšem definice v původním znění zákona Volič dle Zákona 247/1995 Sb se liší proti definici ve verzi novelizované Zákonem č. 204/2000 Sb, který rozšiřuje původní definici voliče vzhledem k senátním volbám. Jedná se tedy o dva stavy téhož typu. Rozhodnutí, zda se jedná o jeden typ, nebo o dva nezávislé typy, je vždy na správci slovníku, ve kterém je daný typ zaveden. Většina pojmů vytvářených v rámci SGoV bude specifikována v této úrovni.

Úroveň okamžitých stavů

Na této úrovni jsou specifikovány okamžité stavy objektů, okamžité stavy vztahů mezi nimi, okamžité stavy vlastností a události. Pro propojení okamžitých stavů proměnných prvků a proměnných prvků samotných slouží vazba je stavem.

Pro tvorbu vazeb mezi okamžitými stavy proměnných prvků tyto typy vazeb přepoužíváme. Např. na úrovni proměnných prvků můžeme vytvořit vazbu

● Jan Novák → má vlastnost → číslo bot Jana Nováka.

Význam této vazby je ● V některém okamžiku má objekt Jan Novák Jan Novák některý okamžitý stav

vlastnosti číslo bot Jana Nováka.

21

Page 22: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Pro explicitní vyjádření okamžitého stavu této vlastnosti můžeme stejný typ vazby využít i pro propojení okamžitých stavů proměnných prvků

● Jan Novák v roce 2017 → má vlastnost → číslo bot Jana Nováka v roce

2017.

Jiným příkladem, využívajícím typ vazby je instancí typu, může být vazba ● Jan Novák → je instancí typu → Volič dle zákona č.247/1995 Sb.

Tato vazba má (analogicky k předchozímu příkladu) význam ● V některém okamžiku má objekt Jan Novák Jan Novák některý okamžitý stav typu

Volič dle zákona 247/1995.

Na úrovni okamžitých stavů lze vazbu vyjádřit jako

● Jan Novák v roce 2017 → je instancí typu → Volič dle zákona č.247/1995 Sb. ve znění zákona č.90/2017 Sb.

Takové využívání stejných typů vazeb zjednodušuje chápání výsledných vazeb pro uživatele. Současně pro obě úrovně vyjádření nevytváří problém, neboť každý prvek je buď proměnný, nebo neměnný, ale nikoliv obojí současně, tedy z typů prvků účastnících se dané vazby lze dovodit, o jakou úroveň se jedná.

Vizualizace klíčových částí základního modelu V tomto odstavci jsou popsány základní vztahy v ontologickém modelu na jednoduché vizualizaci základního modelu v diagramu tříd jazyku UML. U jednotlivých pojmů barva určuje, do jaké úrovně instance daného pojmu (dle typu) patří - typy (oranžová), ostatní objekty (modrá), vlastnosti/vztahy (tmavě modrá), události (světle modrá), okamžité stavy (šedá) a ostatní (černá).

Pojmy s charakterem typ (např. objektu, vlastnosti, vztahu, události) z glosáře pojmů jsou modelovány jako UML třídy a vazby základního modelu jsou popsány v podobě UML atributů a UML asociací .

22

Page 23: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Pro přesnější kategorizaci typů základní slovník zavádí hierarchii typů. Tato hierarchie bude dále rozšiřována a specializována.

Jedno z možných vyjádření pojmů a vazeb základního slovníku v jazyce OWL viz OWL 2 Web Ontology Language Document Overview (Second Edition), W3C Recommendation, 2012 pro účely otevřených dat je uvedeno v sekci Vyjádření základního sémantického slovníku pojmů.

3.4. Sémantický slovník pojmů veřejného sektoru (V-SGoV) Sémantický slovník pojmů veřejného sektoru představuje konceptuální model konsensuálního pojmosloví používaného napříč veřejnou správou zejména v oblasti základních pojmů teorie práva, struktury dat a jejich evidence. Jedná se o některé společné pojmy, které nejsou legislativně ukotveny, mají však široce přijímaný význam, např. pojem Člověk, Organizace, Dokument, atp. Pro základní orientaci v pojmosloví veřejné správy a jeho struktuře byly pro účely koncepce sestaveny jednoduché analýzy pojmosloví údajů o agendách, které obsahuje Příloha č. 2. Registr práv a povinností (Údaje o agendách). Jeho jednotlivé části jsou axiomatizované pomocí pojmů a vazeb základního slovníku. Jistá dvojakost je ve V-SGoV způsobena tím, že některé z pojmů teorie práva V-SGoV mají stejný identifikační název jako pojmy z některého L-SGoV. Příkladem budiž pojem

Fyzická osoba, který je součástí V-SGoV (viz např. Subjekty, objekty a obsah právních vztahů), a rovněž součástí L-SGoV-2012-89 (viz. např. Zákon č. 89/2012 Sb. Občanský zákoník, 2012). Zatímco v prvním případě se jedná o konsenzuální pojem právní teorie (a tedy nezávislý na změnách legislativy), ve druhém případě se jedná o význam striktně vázaný na příslušný právní předpis. Struktura dat a evidence je popsána pojmy, které jsou třeba k popisu datových sad, slovníků, registrů, rejstříků a jejich vazby na ostatní části SGoV.

3.4.1. Glosář pojmů veřejného sektoru (V-GP) V-GP je uveden ve struktuře analogické k Z-GP.

Název pojmu Definice Příklady

23

Page 24: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

právní skutečnost / právní jednání / protiprávní jednání / protiprávní stav / právní událost

Právní skutečnost je událostí, která vytváří/mění/ruší právní vztahy. Ostatní uvedené pojmy popisují konkrétní druhy právních skutečností.

smrt Františka Vomáčky jako

právní skutečnost pro zánik

pracovní smlouvy mezi

Františkem Vomáčkou a jeho

zaměstnavatelem.

primární objekt práva / sekundární objekt práva

Objekty práva popisují to, co je realizováno pomocí práv a povinností v právním vztahu

Primárním objektem práva právního vztahu vytvořeného kupní smlouvou na vozidlo je příslušné vozidlo.

subjekt práva / fyzická osoba / právnická osoba

Osoba vstupující do právního vztahu

Konkrétní fyzická osoba František Vomáčka

právo / povinnost

Právo a povinnost jsou vlastnosti subjektu práva, které získá účastí v právním vztahu

právo Františka Vomáčky na

užívání vozidla XYZ je vlastností subjektu František Vomáčka

způsobilost k právům a povinnostem / způsobilost k právnímu jednání / způsobilost k protiprávnímu jednání

Jedná se o vlastnosti subjektu práva, které popisují jednotlivé způsobilosti

způsobilost k protiprávnímu

jednání Františka Vomáčky je vlastnosti subjektu František Vomáčka

právní vztah / výkon svrchované moci

Jedná se o speciální typy vztahů, které jsou vázány na subjekty a objekty práva a které vznikají na základě právních skutečností

právní vztah mezi Františkem

Vomáčkou a prodejcem

automobilů XYZ popisující jejich práva a povinnosti plynoucí z příslušné kupní smlouvy

znalostní struktura

Slovník, glosář nebo model Základní slovník je znalostní strukturou

legislativní znalostní struktura

Znalostní struktura s vazbou na legislativu

Legislativní slovník pro Zákon

247/1995 Sb.

typ znalostní struktury dle úrovně

Instance tohoto typu jsou jednotlivé typy znalostní

Základní struktura je typ struktury pro základní slovník.

24

Page 25: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

struktury - základní, veřejného sektoru, legislativní, agendová, datová

dokument dokumentem rozumíme pasivní informační objekt, (1) který je spravován jedním agentem, (2) předpokládá se u něj vnitřní pojmová konzistence, (3) je určen k interpretaci člověkem

např. Zákon č. 247/1995 Sb.

bezkontextový dokument

integrální dokument, který není částí jiného dokumentu

např. Zákon č. 247/1995 Sb.

kontextový dokument

dokument, který je částí jiného dokumentu

např. §1 Zákona č. 247/1995 Sb.

má kontext typ vztahu, který propojuje dokument s jeho kontextem

§1 Zákona č. 247/1995 Sb. → má kontext → Zákon č. 247/1995 Sb

právní předpis

právní předpis označuje jakýkoliv normativní právní akt

např. Zákon č. 247/1995 Sb.

právní předpis ze Sbírky zákonů

právní předpis, který je součástí Sbírky zákonů ČR

např. Zákon č. 247/1995 Sb.

hlava/paragraf/odstavec/písmeno

kontextové dokumenty, jejichž kontextem je některý právní předpis ze Sbírky zákonů

např. §1 Zákona č. 247/1995 Sb.

informační systém

pasivní objekt, který složen z počítačového hardware a software sloužící k zpracování a šíření informací

např. Agendový informační systém Registru práv a

povinností

datová sada pasivní informační objekt, který je složen z elementárních datových položek

např. Datová sada Registru práv a povinností

má zdrojový předpis

typ vztahu propojující legislativní strukturu a právní předpis, který tato struktura popisuje

legislativní glosář Zákona č. 247/1995 Sb. → má zdrojový předpis → Zákon č. 247/1995 Sb

evidenční systém

datová sada, která eviduje proměnné prvky jednoho typu

např. kandidátní listina strany XYZ v Praze pro volby do PSP ČR 2017

25

Page 26: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

typ evidenčního systému

typ objektu, který kategorizuje evidenční systémy.

např. kandidátní listina pro volby do PSP ČR

eviduje typ vztahu propojující evidenční systém a proměnný prvek, který je tímto systémem evidován

registr obyvatel → eviduje → František Vomáčka

je evidencí pro

typ vztahu propojující typ evidenčního systému a typ objektů, které evidenční systémy tohoto typu evidují.

kandidátní listina pro volby do PSP ČR → eviduje → kandidát pro volby do PSP ČR

má glosář typ vztahu propojující slovník a jeho glosář

Z-SGoV → má glosář → Z-GP

má model typ vztahu propojující slovník a jeho model

Z-SGoV → má model → Z-OM

má část právního předpisu

typ vztahu označující část právního předpisu (hlavu, písmeno, odstavec) daného právního předpisu

Zákon 247/1995 → má část právního předpisu → §1 Zákona 247/1995

3.4.2. Ontologický model veřejného sektoru (V-OM) Následující diagram znázorňuje strukturu ontologického modelu veřejného sektoru pojmů z oblasti teorie práva vyjádřenou pomocí základního slovníku. Ústředním pojmem je zde právní vztah, který vytváří vztah mezi subjekty práva, který se týká primárního

26

Page 27: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

objekt práva. Subjektům práva jsou tímto vztahem přiřazeny práva a povinnosti.

Další částí V-SGoV jsou pojmy popisující slovníky samotné, jejich typy a vazbu na legislativu. Ústředním pojmem je zde znalostní struktura, která je kategorizována podle typu slovníku.

Pro popis evidencí (datových sad evidující datové položky o proměnných prvcích jediného typu) zavádíme pojem Evidenční systém, který eviduje dané proměnné prvky. Na úrovni typů je zavedena paralelní vazba je evidencí pro popisující, jaké typy proměnných

27

Page 28: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

prvků evidenční systémy daného typu popisují, viz obrázek.

Strukturu právních předpisů ukazuje následující diagram. Rozlišuje se kontextový dokument (dokument, který je součástí jiného dokumentu) a bezkontextový dokument (dokument, který je integrální).

Jedno z možných vyjádření pojmů a vazeb základního slovníku v jazyce OWL viz OWL 2 Web Ontology Language Document Overview (Second Edition), W3C Recommendation, 2012 pro účely otevřených dat je uvedeno v kapitole Vyjádření sémantického slovníku pojmů veřejného sektoru.

3.5. Sémantický slovník pojmů legislativy (L-SGoV) Sémantický slovník pojmů legislativy popisuje odborné pojmosloví normativně zavedené v jednom konkrétním právním předpise a tvoří jeho pojmoslovný rámec. Právní předpisy uvažované v této koncepci jsou zejména zákony a vyhlášky ze Sbírky zákonů ČR, dále popsaná koncepce L-SGoV však není na jejich formě nijak závislá a naopak předpokládá rozšiřování typů legislativních dokumentů o další normativní předpisy - evropská legislativa, vnitřní organizační předpisy, atp.

28

Page 29: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Jednotlivé L-SGoV mohou přepoužívat jiné L-SGoV v případech, kdy se právní předpis odkazuje na jiný právní předpis a odkazuje se na pojmy ze slovníku tohoto odkazovaného právního předpisu.

3.5.1. Glosář pojmů legislativy (L-GP) Glosář pojmů daného právního předpisu je tvořen pojmy, které jsou v daném předpise definovány či významově vymezovány, nebo které jsou v daném předpise nějakým způsobem používány. Pro každý pojem jsou v glosáři uvedeny následující údaje:

● název pojmu je slovo nebo slovní spojení v základním tvaru používané v právním předpisu k označení pojmu.

● normativní odkaz, který označuje nejnižší nadřazenou část dokumentu, ve které se lze nalézt všechny výskyty daného pojmu.

● typ - pojem ze základního glosáře (Z-GP), nebo z glosáře veřejného sektoru (V-GP), jehož je daný pojem instancí. Vzhledem k tomu, že Z-GP a V-GP neobsahují dva pojmy se stejným identifikačním názvem, neuvádíme, do kterého z těchto dvou slovníků pojem patří. Je-li tímto pojmem pojem typ, uvádí se rovněž hodnota vztahu specializuje nově zaváděného pojmu. Pro názornost budeme případnou hodnotu tohoto vztahu uvádět v hranatých závorkách za pojmem typ. Tedy např. Má-li pojem volební kraj hodnotu sloupce typ uvedenu typ[objekt] znamená to, že pojem volební kraj je typem (existují tedy jednotlivé instance - např. Hlavní město Praha - které mají charakter volebního kraje), dále říkáme, že tímto typem lze klasifikovat pouze instance typu objekt, nikoliv tedy např. události, či vlastnosti.

Následující tabulka ukazuje jako příklad část glosáře pojmů Zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky.

Název pojmu Normativní odkaz Typ

volební kraj § 26 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[objekt]

kandidátní listina pro volby do Poslanecké sněmovny

§ 32 odst. 1 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[dokument]

kandidát ve volbách do Poslanecké sněmovny

Část 1 Oddíl 2 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[objekt]

název volebního kraje

§ 32 odst. 1 písm. a) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vlastnost]

jméno kandidáta ve volbách do Poslanecké

§ 32 odst. 1 písm. c) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vlastnost]

29

Page 30: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

sněmovny

volby do Poslanecké sněmovny

§ 1 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[objekt]

je členem § 32 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vztah]

člen § 32 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[člověk]

volič § 1 odst. 7 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[člověk]

občan § 1 odst. 7 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[člověk]

registr kandidátů ve volbách do Poslanecké sněmovny

§ 11 odst. 2 písm. h) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[evidenční systém]

registr kandidujících politických stran, politických hnutí a koalic

§ 11 odst. 2 písm. h) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[evidenční systém]

politická strana § 31 odst. 1 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[organizace]

název politické strany

§ 32 odst. 1 písm. b) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vlastnost]

politické hnutí § 31 odst. 1 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[organizace]

název politického hnutí

§ 32 odst. 1 písm. b) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vlastnost]

koalice § 31 odst. 1 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[organizace]

název koalice § 32 odst. 1 písm. b) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vlastnost]

má složení § 31 odst. 2 písm. zákona č. 247/1995 Sb. typ[vztah]

30

Page 31: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

o volbách do Parlamentu České republiky

politický subjekt

zákon č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[organizace]

název politického subjektu

zákon č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vlastnost]

člen politické strany nebo hnutí

§ 32 odst. 1 písm. c) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[člověk]

podání kandidátní listiny pro volby do Poslanecké sněmovny

§ 31 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[událost]

podána do voleb § 31 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[vztah]

volební orgán § 7 odst. 1 zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[agent]

Český statistický úřad

§ 7 odst. 1 písm. d) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

agent, volební orgán

krajský úřad § 7 odst. 1 písm. e) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[volební orgán]

rozhodnutí o registraci kandidátní listiny pro volby do poslanecké sněmovny

§ 33 odst. 3 písm. a) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[událost]

rozhodnutí o odmítnutí kandidátní listiny pro volby do poslanecké sněmovny

§ 33 odst. 3 písm. b) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[událost]

A tato tabulka ukazuje jako příklad část glosáře pojmů Vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR.

31

Page 32: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Název pojmu Normativní odkaz Typ

vylosované číslo politické strany

§ 4 odst. 3 vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR

typ[vlastnost]

vylosované číslo politického hnutí

§ 4 odst. 3 vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR

typ[vlastnost]

vylosované číslo koalice

§ 4 odst. 3 vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR

typ[vlastnost]

zkratka názvu politické strany

§ 5 odst. 1 vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR

typ[vlastnost]

zkratka názvu politického hnutí

§ 5 odst. 1 vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR

typ[vlastnost]

zkratka názvu koalice

§ 5 odst. 1 vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR

typ[vlastnost]

3.5.2. Ontologický model legislativy (L-OM) Ontologický model právního předpisu je konceptuálním modelem legislativy. Ontologický model právního předpisu popisuje souvislosti mezi pojmy definované glosářem pojmů a propojení pojmů na ontologické modely odkazovaných právních předpisů. Na samotný právní předpis se pak jeho ontologický model odkazuje prostřednictvím jeho glosáře pojmů. Právní předpis není vyjádřením konceptuálního modelu. Sice definuje některé pojmy a souvislosti mezi nimi, ale postrádá strukturovanou podobu, která je nutná k popisu datových artefaktů pro účely sdílení jejich významu a efektivního vyhledávání. Touto strukturovanou podobou je ontologický model právního předpisu. Následující obrázek ukazuje jako příklad část ontologického modelu Zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky odpovídající glosáři pojmů z příkladu výše vyjádřenou v podobě UML diagramu tříd.

32

Page 33: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Následující obrázek ukazuje jako příklad část ontologického modelu Vyhlášky č. 233/2000 Sb. o provedení zákona o volbách do Parlamentu ČR odpovídající glosáři pojmů z příkladu výše vyjádřenou v podobě UML diagramu tříd ve zkrácené notaci, kde hrany označují typy vztahů a atributy označují typy vlastností.

3.6. Sémantický slovník pojmů agendy (A-SGoV) Sémantický slovník pojmů agendy tvoří její společný pojmoslovný rámec. Je podmnožinou sémantických slovníků pojmů těch právních předpisů, které agendu definují, a může být doplněn o definice dalších pojmů a další souvislosti, které v legislativě nejsou definovány, ale jsou z pohledu agendy důležité.

33

Page 34: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Příkladem, který využijeme pro popis slovníku agendy, bude agenda 1183 - Volby do Parlamentu České republiky. Tato agenda legislativně vychází ze zákona č. 247/1995 Sb., jehož slovník je představen v kapitole Sémantický slovník pojmů legislativy (L-SGoV). Kromě tohoto právního předpisu existují však pro tuto agendu další právní předpisy, které ovlivňují její výkon, jmenovitě:

● Zákon č. 2/1969 Sb. o zřízení ministerstev a jiných ústředních orgánů státní správy České republiky (kompetenční zákon)

● Vyhláška č. 233/2000 Sb. o provedení některých ustanovení zákona č. 247/1995 Sb., o volbách do Parlamentu České republiky,

● Zákon č. 111/2009 Sb. o základních registrech Každý z těchto předpisů má vlastní legislativní slovník sestávající se z glosáře a z ontologického modelu. Glosář/ontologický model agendy 1183 je pak tvořen sjednocením glosářů/ontologických modelů pro jednotlivé právní předpisy. Agendový glosář může zavádět nové pojmy sloužící ke zjednodušení popisu agendy, nebo k integraci pojmů z jednotlivých legislativních slovníků (např. proto, že jednotlivé legislativní glosáře/ontologické modely obsahují různě identifikované pojmy se stejným významem, nebo různě identifikované pojmy s různým významem ovšem se stejným názvem pojmu, který by při využívání agendy komplikoval porozumění). Ontologický model agendy může významově propojit takto nově vzniklé pojmy.

3.6.1. Glosář pojmů agendy (A-GP) Glosář pojmů agendy je podmnožinou glosářů pojmů těch právních předpisů, které agendu definují, doplněnou o nové pojmy, které v legislativě nejsou definovány, ale jsou z pohledu agendy důležité. Příkladem pojmového sjednocení může být pojem Subjekt údajů registru obyvatel, který je součástí legislativního glosáře pro zákon 111/2009 Sb. Tento pojem zákon 247/1995 Sb. nevyužívá, ovšem předpokládá existenci údajů o něm (§ 12 odst. 5 písm. b). Agendový slovník 1183 zavádí pojem Obyvatel, který je synonymem pojmu Subjekt údajů registru obyvatel v rámci agendy 1183, je však srozumitelnější pro uživatele datových sad vytvářených v rámci této agendy. Příkladem pojmu, který není součástí legislativního glosáře pro zákon 111/2009 Sb., ačkoliv agenda jeho existenci předpokládá (viz. Agenda 1183, Volby do Parlamentu České republiky, verze 22.6.2017) je pojem petent. Ten je součástí agendového slovníku agendy 1183.

Název pojmu Definice Typ

obyvatel Synonymum pojmu subjekt údajů registru obyvatel

typ[objekt]

34

Page 35: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

petent Oprávněný volič, který podepsal petici, ve smyslu § 61 odst. 2 písm. d) zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky

typ[volič]

3.6.2. Ontologický model agendy (A-OM) Ontologický model agendy je podmnožinou ontologických modelů právních předpisů, které agendu definují, doplněnou o nové souvislosti, které v legislativě nejsou definovány, ale jsou z pohledu agendy důležité, a o nové souvislosti, které uvádějí pojmy z ontologických modelů jednotlivých zahrnutých právních předpisů do vzájemného kontextu důležitého z pohledu agendy. Příklad základního slovníku v sekci Základní sémantický slovník pojmů (Z-SGoV) umožňuje využít vztahů mezi typy pro mapování pojmů z agendového slovníku na pojmy slovníků legislativních. Zjednodušený diagram ukazující mapování obou pojmů vypadá takto:

3.7. Sémantický slovník pojmů datové sady (D-SGoV) Sémantický slovník pojmů datové sady tvoří pojmy, které popisují význam datové sady. Obsahuje pojmy ze sémantických slovníků agend, v rámci kterých je datová sada vytvářena, spravována či zveřejňována nebo které obsahují takové pojmy, pomocí kterých může být význam datové sady popsán. Může být dále rozšířen o nové pojmy a souvislosti, které v agendách definovány nejsou, ale jsou pro popis jejího významu pro jejího poskytovatele důležité. Příkladem, který využijeme pro popis slovníku datové sady, bude datová sada Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017, kterou zveřejňuje Český statistický úřad.

3.7.1. Glosář datové sady (D-GP) Glosář datové sady je tvořen vybranými pojmy z glosářů agend souvisejících s datovou sadou a doplňuje je o nové pojmy, které jsou potřebné pro popis významu datové sady. Glosář datové sady Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017 přejímá následující pojmy a jejich atributy z glosáře agendy 1183 (viz Glosář pojmů agendy (A-GP)) a tedy i z glosářů právních předpisů (viz Glosář pojmů legislativy (L-GP)), na kterých je tato agenda postavena :

35

Page 36: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

volební kraj

kandidátní listina pro volby do Poslanecké sněmovny

volby do Poslanecké sněmovny

registr kandidujících politických stran, politických hnutí a koalic

politická strana

název politické strany

politické hnutí

název politického hnutí

koalice

název koalice

má složení

podání kandidátní listiny pro volby do Poslanecké sněmovny

podána do voleb Český statistický úřad

rozhodnutí o registraci kandidátní listiny pro volby do poslanecké

sněmovny

rozhodnutí o odmítnutí kandidátní listiny pro volby do poslanecké sněmovny

vylosované číslo politické strany

vylosované číslo politického hnutí

vylosované číslo koalice

zkratka názvu politické strany

zkratka názvu politického hnutí

zkratka názvu koalice

Glosář pojmů datové sady Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017 je pak tvořen ještě dalšími pojmy, které nejsou součástí glosáře pojmů agendy A1183. Tyto nové pojmy nejsou definovány legislativou (pokud by byly, byly by již součástí glosáře pojmů nějaké agendy). Slouží ke zjednodušení popisu významu datové sady nebo ke sjednocení významu pojmů ze glosářů pojmů různých agend.

Název pojmu Definice Typ

interní kód politického subjektu

Interní kód strany ČSÚ dle číselníku volebních stran

typ[vlastnost]

má stav Stav registrace kandidátní listiny (strany) ve volebním kraji

typ[vztah]

3.7.2. Ontologický model datové sady (D-OM) Ontologický model datové sady je podmnožinou ontologických modelů agend, které jsou důležité pro popis významu datové sady, a rozšiřuje je o popis souvislosti mezi pojmy v glosáři datové sady, které ještě nebyly popsány na vyšších úrovních, tj. na úrovni ontologických modelů příslušných agend nebo legislativních předpisů.

36

Page 37: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

3.8. Popis významu datové sady pomocí sémantického slovníku pojmů

Datová sada je tvořena logicky souvisejícími údaji organizovanými do záznamů se stejnou datovou strukturou. Její poskytovatel ji katalogizuje v Národním katalogu otevřených dat (NKOD), aby usnadnil zájemcům o údaje v datové sadě její nalezení. Poskytuje ji v podobě jednoho či více datových souborů ke stažení na síti WWW, které nazýváme distribuce datové sady.

● Distribuce datové sady se vzájemně liší pouze v datovém formátu, nikoliv ve svém obsahu.

● Každá distribuce musí obsahovat kompletní množinu záznamů, které tvoří datovou sadu.

● Každá distribuce v otevřeném a strojově čitelném formátu musí být opatřena logickým datovým schématem vyjádřeným ve vhodném a běžně používaném jazyku pro popis datových schémat, pokud takový jazyk pro daný formát existuje.

37

Page 38: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Logické datové schéma popisuje strukturovanou reprezentaci datové struktury záznamů tvořících datovou sadu v příslušném formátu, tj. popisuje syntaxi distribuce datové sady. Distribuce musí být vůči svému logickému datovému schématu validní. Význam datové sady je popsán pomocí pojmů ze sémantického slovníku datové sady. Pojmy použité v popisu, které jsou též součástí sémantického slovníku nějaké agendy, rovněž popisují význam datové sady v kontextu této agendy. A pojmy použité v popisu, které jsou také součástí sémantického slovníku nějakého právního předpisu také popisují význam datové sady v kontextu tohoto předpisu. Význam je popisován na dvou úrovních:

● Úroveň datové sady jako celku ● Úroveň jednotlivých prvků logického datového schématu vybrané distribuce datové

sady Způsob popisu významu datové sady na obou úrovních je popsán v následujících podkapitolách.

3.8.1. Popis významu datové sady jako celku Pojmy sémantického slovníku pojmů popisují význam datové sady nezávisle na vyjádření jejího obsahu v distribucích. Glosář pojmů vysvětluje význam datové sady pomocí pojmů, které ho tvoří. Tyto pojmy mají svoji definici a ty, které jsou součástí glosáře pojmů právního předpisu, mají svůj význam vysvětlen i odkazem na konkrétní část předpisu. Ontologický model pak vysvětluje souvislosti mezi těmito pojmy.

3.8.2. Popis významu prvků schématu distribuce datové sady Existence sémantického slovníku datové sady znamená, že je popsán význam datové sady jako celku. V případě, kdy uvažujeme konkrétní distribuci datové sady v konkrétním datovém formátu, můžeme význam datové sady popisovat přesněji na úrovni jednotlivých prvků schématu distribuce. V případě CSV distribuce jsou těmito prvky jednotlivé sloupce tabulky, v případě XML distribuce jsou těmito prvky jednotlivé XML elementy, atributy a typy, atd. Pomocí pojmů sémantického slovníku lze popsat význam jednotlivých prvků tak, že definice prvků jsou mapovány na pojmy sémantického slovníku. Není nutné, aby byly mapovány všechny prvky schématu, ale pouze ty, které jsou významově důležité a jejichž význam chce poskytovatel datové sady popsat. Pro datovou sadu Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017 zveřejňuje Český statistický úřad CSV distribuci. Následující tabulka ukazuje mapování prvků schématu CSV distribuce (tj. sloupců) na sémantický slovník této datové sady popsaný výše.

Prvek datového schématu Popis prvku Odpovídající pojem D-SGoV

38

Page 39: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

KSTRANA Vylosované číslo strany vylosované číslo politického subjektu

VSTRANA Interní kód strany ČSÚ interní kód politického subjektu

NAZEVCELK Název strany 120 znaků název politického subjektu

NAZEV_STRK Název strany 50 znaků zkratka názvu politického subjektu

ZKRATKAK30 Název strany 30 znaků zkratka názvu politického subjektu

ZKRATKAK8 Zkratka názvu 15 znaků zkratka názvu politického subjektu

POCSTRVKO Počet stran v koalici (1=samostatná strana)

---

SLOZENI Interní kódy stran, ze kterých se kandidátní listina skládá

má složení

STAVREG Stav registrace kandidátní listiny (strany) ve volebním kraji – dle pozice v položce (číslo pozice v položce = kód VOLKRAJ) (0=zaregistrovaná, 1=odmítnutá, 2=ve volebním kraji nekandiduje)

rozhodnutí o registraci

kandidátní listiny pro

volby do poslanecké

sněmovny,

rozhodnutí o odmítnutí

kandidátní listiny pro

volby do poslanecké

sněmovny

PLAT_STR Stav platnosti strany (samostatné nebo v koalici) A=platná (vč. všech stran v koalici), N=strany s kódy uvedenými v položce SLOZNEPLAT byly zrušeny nebo jejich činnost pozastavena (původní položka PLATNOST)

---

SLOZNEPLAT Interní kódy stran zrušených nebo s pozastavenou činností (položka PLAT_STR=N)

---

POCMANDCR Počet stranou získaných mandátů

---

39

Page 40: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

4. Vyjádření sémantického slovníku pojmů jako otevřená data

Sémantický slovník pojmů je vyjádřen jako otevřená data na stupni otevřenosti 5*. Vyjadřovat sémantický slovník pojmů na nižších stupních otevřenosti nemá smysl, neboť ve strojově čitelné reprezentaci je nutno zaznamenat především propojení mezi jednotlivými pojmy uvnitř jednoho slovníku i napříč různými slovníky. Slovníky nebudou primárně ukládány v jednom datovém zdroji, ale publikovány na různých místech. Propojení je nutno zaznamenat odděleně od samostatných slovníků, tj. propojení musí být uvažována jako “first-class citizens” uvažované reprezentace. To umožňuje pouze stupeň otevřenosti 5. Tato sekce ukáže reprezentaci jednotlivých částí sémantického slovníku pojmů. Spolu s jazykem RDF, který je pro stupeň otevřenosti 5* vyžadován, budou využity dvě standardizované nadstavby - jazyk SKOS (pro popis glosářů) a jazyk OWL (pro popis ontologických modelů).

4.1. Identifikátory jednotlivých částí sémantického slovníku pojmů

V souladu s podmínkami pro stupeň otevřenosti 5* jsou všechny níže uvedené identifikátory ve formě IRI. Sémantický slovník pojmů jako celek má identifikátor ve tvaru https://slovnik.gov.cz/slovník/.

Jednotlivé části sémantického slovníku pojmů jsou identifikovány takto: ● Identifikátor slovníku. Jednotlivé slovníky mají identifikátory ve tvaru:

○ https://slovnik.gov.cz/základní/slovník pro základní slovník ○ https://slovnik.gov.cz/legislativní/<ID>/slovník pro legislativní

slovník, kde <ID> je identifikátor právního předpisu. Pro identifikaci slovníků jednotlivých zákonů ze Sbírky zákonů ČR se využije identifikátor ve tvaru:

■ https://slovnik.gov.cz/legislativní/sbírka/<Č>/<R>/slovník, kde <Č>/<R> označuje číslo částky ze Sbírky zákonů ČR, např. https://slovnik.gov.cz/legislativní/sbírka/247/1995/slov

ník pro identifikaci legislativního slovníku Zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky.

○ https://slovnik.gov.cz/agendový/<A>/slovník pro agendový slovník, kde <A> je číslo agendy ve smyslu, např. https://slovnik.gov.cz/agendový/1183/slovník označuje slovník agendy 1183.

○ https://slovnik.<P>.cz/datový/<D>/slovník, kde <P> je doména poskytovatele datové sady, <D> je identifikátor datové sady nebo více datových sad vytvořený poskytovatelem a skládající se z alfanumerických znaků a symbolu “-”.

● Identifikátor glosáře. každý glosář daného slovníku má identifikátor <Identifikátor slovníku>/glosář, např.

40

Page 41: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

https://slovnik.gov.cz/legislativní/sbírka/247/1995/glosář

● Identifikátor modelu. každý ontologický model daného slovníku má identifikátor <Identifikátor slovníku>/model, např. https://slovnik.gov.cz/legislativní/základní/model

● Identifikátor pojmu. každý pojem z glosáře daného slovníku má identifikátor <Identifikátor slovníku>/pojem/<Lokální identifikátor pojmu>, kde <Lokální identifikátor pojmu> označuje identifikační název pojmu psaný malými písmeny, ve kterém jsou všechny mezery nahrazeny symbolem “-” (tzv. kebab case), např. https://slovnik.gov.cz/legislativní/sbírka/247/1995/pojem/volební-kr

aj.

4.2. Struktura sémantického slovníku pojmů Sémantický slovník jako celek se skládá z dílčích slovníků dle architektury uvedené v sekci Architektura sémantického slovníku pojmů. Sémantický slovník pojmů jako celek je OWL dokumentem sdružující slovníky na jednotlivých úrovních. <https://slovnik.gov.cz/slovník> rdf:type owl:Ontology;

owl:imports <https://slovnik.gov.cz/základní/slovník>;

owl:imports <https://slovnik.gov.cz/veřejný-sektor/slovník>;

owl:imports <https://slovnik.gov.cz/legislativní/sbírka/247/1995/slovník>;

owl:imports <https://slovnik.gov.cz/agendový/1183/slovník>;

owl:imports

<https://data.czso.cz/slovník/datový/registr-kandidátních-listin-pro-volby-do-poslanecké-sn

ěmovny-parlamentu-čr/slovník> .

Každý ze slovníků je OWL dokumentem, který importuje další dva OWL dokumenty: ● OWL dokument reprezentující ontologický model ● OWL dokument reprezentující glosář pojmů. Tento import je zde pouze pro zajištění

konzistentní struktury slovníku, neboť glosář pojmů je do slovníku importován rovněž tranzitivně z ontologického modelu.

Příkladem budiž legislativní slovník zákona č. 247/1995 Sb. l-sgov-sbírka-247-1995:slovník;

owl:imports l-sgov-sbírka-247-1995:glosář;

owl:imports l-sgov-sbírka-247-1995:model.

Každý OWL dokument odpovídá jedné datové sadě. Každá datová sada má jednu nebo více RDF distribucí. Každá distribuce má stejný obsah, liší se pouze ve zvolené RDF serializaci (např. Turtle nebo JSON-LD). OWL dokumenty jsou vyjádřeny s využitím standardních slovníků OWL (OWL 2 Web Ontology Language Document Overview (Second Edition), W3C Recommendation, 2012), SKOS (SKOS Simple Knowledge Organization System Reference, W3C Recommendation,

41

Page 42: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

2009), RDFS (RDF Schema 1.1, W3C Recommendation, 2014), a DCTERMS (DCMI Metadata Terms, DCMI Recommendation, 2012).

4.3. Obecná pravidla pro vyjádření glosáře pojmů Tato sekce popisuje pravidla pro vyjádření glosářů pojmů slovníků všech úrovní. Pro jednotlivé typy slovníků pak mohou být definovat další specifická pravidla, která budou uvedena v příslušných následujících sekcích.

Dokument glosáře Dokument glosáře pojmů má formu OWL ontologie ve tvaru: <identifikátor glosáře> a z-sgov-pojem:glosář, <identifikátor typu znalostní struktury>, owl:Ontology, skos:ConceptScheme ;

rdfs:label ”<název glosáře>"@cs ; owl:imports <identifikátor glosáře 1>, … ,<identifikátor glosáře n>. kde

● <identifikátor glosáře> je identifikátor glosáře pojmů, ve kterém je pojem definován, dle pravidel pro tvorbu identifikátorů glosářů pojmů uvedených výše,

● <identifikátor typu znalostní struktury> identifikuje pojem, který označuje úroveň glosáře/modelu/slovníku. Úrovně rozlišujeme čtyři, označené typy z-sgov-pojem:základní-struktura, z-sgov-pojem:legislativní-struktura, z-sgov-pojem:agendová-struktura, z-sgov-pojem:datová-struktura.

● <název glosáře> je identifikační název glosáře v češtině ● <identifikátor glosáře 1>, … <identifikátor glosáře n> jsou identifikátory glosářů

pojmů, které aktuální glosář využívá pro typování pojmů. Typicky je jedním z nich <https://slovnik.gov.cz/základní/glosář>

Příkladem anotace glosáře pojmů Zákona č. 247/1995 Sb. je dokument l-sgov-sbírka-247-1995:glosář

a z-sgov-pojem:glosář,z-sgov:legislativní-struktura,

owl:Ontology,skos:ConceptScheme ;

rdfs:label "Glosář pojmů Zákona č. 247/1995 Sb. o volbách do Parlamentu České

republiky"@cs ;

owl:imports z-sgov:glosář.

Pojmy glosáře Pojem definovaný v glosáři pojmů je vyjádřen dle následujícího předpisu: <Identifikátor pojmu> a skos:Concept, <Identifikátor pojmu typu dle základního glosáře pojmů> ; skos:prefLabel "<název pojmu>"@cs ; skos:inScheme <Identifikátor glosáře> . kde

● <Identifikátor pojmu> je globální identifikátor pojmu definovaného v glosáři pojmů dle pravidel pro tvorbu identifikátorů pojmů uvedených výše,

● <název pojmu> je identifikační název pojmu v češtině

42

Page 43: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Např. pojem volební kraj z glosáře pojmů zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:volební-kraj

a skos:Concept, z-sgov-pojem:typ-objektu ;

skos:prefLabel "volební kraj"@cs ;

skos:inScheme l-sgov-sbírka-247-1995:glosář .

Pojem název volebního kraje z glosáře pojmů zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:název-volebního-kraje

a skos:Concept, z-sgov-pojem:typ-vlastnosti ;

skos:prefLabel "název volebního kraje"@cs ;

skos:inScheme l-sgov-sbírka-247-1995:glosář .

Pojem má složení z glosáře pojmů zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:má-složení

a skos:Concept,z-sgov-pojem:typ-vztahu ;

skos:prefLabel "má složení"@cs ;

skos:inScheme l-sgov-sbírka-247-1995:glosář .

Pojem volby do poslanecké sněmovny z glosáře pojmů zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:volby-do-poslanecké-sněmovny

a skos:Concept,z-sgov-pojem:typ-události ;

skos:prefLabel "volby do Poslanecké sněmovny"@cs ;

skos:inScheme l-sgov-sbírka-247-1995:glosář .

Jednotlivé slovníky použité v anotacích mají v glosáři pojmů tyto funkce ● SKOS - poskytuje základní slovníkové anotace a organizaci pojmů. Aktuální návrh

glosáře využívá pouze malou část SKOS slovníku, další případná rozšíření anotací glosáře budou řešena samostatným dokumentem.

● OWL - poskytuje strukturování jednotlivých artefaktů do samostatných dokumentů a mechanismus pro jejich přepoužívání (importování).

Kromě uvedených mohou jednotlivé slovníky pro pojmy evidovat další typy vlastností. V rámci jednoho slovníku však nesmí existovat dva odborné pojmy sdílející stejný název. Mohou se však v různých slovnících vyskytovat pojmy sdílející stejný název.

4.4. Obecná pravidla pro vyjádření ontologického modelu Tato sekce popisuje pravidla pro vyjádření ontologických modelů slovníků všech úrovní. Pro jednotlivé typy slovníků pak mohou být definovat další specifická pravidla, která budou uvedena v příslušných následujících sekcích.

43

Page 44: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

4.4.1. Dokument modelu Ontologický model má formu samostatného OWL dokumentu následující formy: <identifikátor modelu> a z-sgov-pojem:model,<identifikátor typu znalostní struktury>,owl:Ontology ; rdfs:label ”<název modelu>"@cs ; owl:imports <identifikátor glosáře aktuálního slovníku> . kde

● <Identifikátor modelu> je globální identifikátor modelu, dle pravidel pro tvorbu identifikátorů glosářů pojmů uvedených výše,

● <identifikátor typu znalostní struktury> je globální identifikátor úrovně, viz sekce Obecná pravidla pro vyjádření glosáře pojmů

● <název modelu> je identifikační název modelu v češtině ● <identifikátor glosáře aktuálního slovníku> je globální identifikátor glosáře pojmů, nad

kterým je model tvořen. Příkladem ontologického modelu pojmů Zákona č. 247/1995 Sb. je

l-sgov-sbírka-247-1995:model

a z-sgov-pojem:model, z-sgov-pojem:legislativní-struktura, owl:Ontology ;

rdfs:label "Ontologický model Zákona č. 247/1995 Sb. o volbách do Parlamentu České

republiky"@cs ;

owl:imports l-sgov-sbírka-247-1995:glosář,

z-sgov:model .

4.4.2. Pojmy ontologického modelu Pojem definovaný v ontologickém modelu je vyjádřen dle následujícího předpisu: <Identifikátor pojmu> a <Identifikátor pojmu typu dle základního glosáře pojmů> ; rdfs:label "<název pojmu>"@cs ; rdfs:isDefinedBy <Identifikátor modelu> . kde

● <Identifikátor pojmu> je globální identifikátor pojmu definovaného v ontologickém modelu dle pravidel pro tvorbu identifikátorů pojmů uvedených výše,

● <název pojmu> je název pojmu v češtině ● <identifikátor modelu> je identifikátor ontologického modelu

Např. pojem politický subjekt z ontologického modelu zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:politický-subjekt

a z-sgov-pojem:typ-objektu ;

rdfs:label "politický subjekt"@cs ;

rdfs:isDefinedBy

l-sgov-sbírka-247-1995:model .

44

Page 45: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Pojem název politického subjektu z ontologického modelu zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:název-politického-subjektu

a z-sgov-pojem:typ-vlastnosti ;

rdfs:isDefinedBy

l-sgov-sbírka-247-1995:model .

Pojem je členem z ontologického modelu zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření: l-sgov-sbírka-247-1995-pojem:je-členem

a z-sgov-pojem:typ-vztahu ;

rdfs:label "je členem"@cs ;

rdfs:isDefinedBy

l-sgov-sbírka-247-1995:model .

4.4.3. Axiomatizace ontologických vztahů Axiomatizace ontologických vztahů mezi pojmy vyjádřená v ontologickém modelu jsou vyjádřeny s využitím konstruktů jazyka OWL. Vzhledem k tomu, že axiomatizace ontologických modelů je přímo závislá na axiomatizaci základního ontologického modelu, je podrobnější rozbor vyjádření jednotlivých ontologických vazeb uveden v sekci Vyjádření základního ontologického modelu.

4.5. Vyjádření základního sémantického slovníku pojmů Vyjádření Z-SGoV se řídí principy uvedenými v předchozí sekci, zde uvedeme jen některá rozšíření. Strojově čitelné verze vyjádření jsou k dispozici na:

● slovník ○ https://slovník.gov.cz/základní/slovník

● glosář ○ https://slovník.gov.cz/základní/glosář

● model ○ https://slovník.gov.cz/základní/model

4.5.1. Vyjádření základního glosáře pojmů Narozdíl od dalších typů slovníků je základní sémantický slovník pojmů vystavěn na základě základních pojmů, které vyjadřují vztahy a závislosti mezi základními prvky lidského myšlení. Většina pojmů základního slovníku proto nemá normativní odkaz, ale konsensuální definici vycházející z kognitivních modelů lidského myšlení. Vyjádření jednotlivých pojmů rozšiřuje strukturu uvedenou v sekci Obecná pravidla pro vyjádření glosáře pojmů o vyjádření definice na bázi SKOS slovníku: <identifikátor pojmu> skos:definition "<definice pojmu>"@cs .

45

Page 46: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

kde ● <identifikátor pojmu> je globální identifikátor pojmu definovaného v glosáři pojmů dle

pravidel pro tvorbu identifikátorů pojmů uvedených výše, ● <definice pojmu> je normativní definice pojmu v češtině. Definice popisuje význam

pojmu v přirozeném jazyce na obecné úrovni, nejedná se však o pouhý popis omezujících podmínek. Definicí pojmu z-sgov-pojem:proměnný-prvek tak může být např. prvek, který mění své vlastnosti v čase, ovšem nikoliv vlastnost nebo objekt nebo vztah. Definice pojmů mohou být využity i v sémantických slovnících pojmů v jiných úrovních - zejména v úrovni agend a v úrovni datové budou vznikat pojmy, které nemusí mít normativní odkaz do právního předpisu, a proto budou vybaveny normativní definicí.

Např. pojem objekt ze základního glosáře pojmů má následující vyjádření: z-sgov-pojem:objekt

a skos:Concept, z-sgov-pojem:typ ;

skos:prefLabel "objekt"@cs ;

skos:definition "Objekt je proměnný prvek, který může existovat nezávisle na jiném

objektu."@cs ;

skos:inScheme z-sgov:glosář .

4.5.2. Vyjádření základního ontologického modelu Základní ontologický model je vyjádřen v podobě OWL ontologie, která axiomatizuje vazby mezi pojmy základního glosáře.

Úroveň typů Každý z pojmů základního glosáře je typem (tj. je instancí pojmu z-sgov-pojem:typ) . 2

Ontologický model dále uvádí, které typy jsou jimi specializovány , tedy např. objekt je 3

specializací proměnného prvku: z-sgov-pojem:objekt

a z-sgov-pojem:typ ;

z-sgov-pojem:specializuje z-sgov-pojem:proměnný-prvek.

Jiným příkladem je pojem je metatyp, který je specializací pojmu vztah: z-sgov-pojem:je-metatypem

a z-sgov-pojem:typ ;

z-sgov-pojem:specializuje z-sgov-pojem:vztah.

Axiomatické vazby, např. je ve vztahu jsou typovány jako top-level specializace pojmu prvek, neboť jejich ontologická analýza není součástí příkladu základního ontologického modelu uvedeného v této koncepci: z-sgov-pojem:je-ve-vztahu

a z-sgov-pojem:typ ;

z-sgov-pojem:specializuje z-sgov-pojem:prvek.

2 i pojem z-sgov-pojem:typ je instancí pojmu z-sgov-pojem:typ 3 typ z-sgov-pojem:specializuje specializuje typ z-sgov-pojem:vztah

46

Page 47: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Výsledkem této axiomatizace je OWL 2 DL ontologie, ve které existuje jediná definovaná OWL třída - typ a ostatní pojmy jsou jejími instancemi.

Úroveň objektů, událostí, vztahů a vlastností Na této úrovni jsou axiomatizovány klíčové vztahy, jejichž část je znázorněna v UML diagramu tříd v sekci Vizualizace klíčových částí základního modelu a Příloha č. 1. Základní slovník:

● ze všech typů vzniknou OWL třídy, např. z-sgov-pojem:prvek a owl:Class .

z-sgov-pojem:objekt a owl:Class .

z-sgov-pojem:vlastnost a owl:Class .

z-sgov-pojem:vztah a owl:Class .

z-sgov-pojem:událost a owl:Class .

z-sgov-pojem:časový-prvek a owl:Class .

● ze specializací typů vzniknou rdfs:subClassOf axiomy: z-sgov-pojem:je-metatypem rdfs:subClassOf z-sgov-pojem:vztah .

● z typu je instancí typu vzniknou instanční axiomy: ○ např. pro vazbu z-sgov-pojem:objekt z-sgov-pojem:je-instancí-typu

z-sgov-pojem:typ vznikne OWL axiom z-sgov-pojem:objekt a z-sgov-pojem:typ .

● z typu vztah a jeho specializací (např. je metatypem) vzniknou OWL třídy a OWL objektové vlastnosti z-sgov-pojem:je-ve-vztahu, např.

z-sgov-pojem:vztah a owl:Class ;

z-sgov-pojem:má-vztažený-prvek a owl:ObjectProperty

rdfs:domain z-sgov-pojem:vztah ;

rdfs:range z-sgov-pojem:proměnný-prvek ;

z-sgov-pojem:je-metatypem a owl:Class ;

rdfs:subClassOf z-sgov-pojem:vztah;

rdfs:subClassOf [

a owl:Restriction;

owl:onProperty [z-sgov-pojem:má-vztažený-prvek] ;

owl:minQualifiedCardinality 2

owl:onClass z-sgov-pojem:typ .

]

○ pro účely zjednodušení zápisu lze uvažovat o alternativní možnosti reprezentace vztahů přímo pomocí OWL objektových vlastností: z-sgov-pojem:je-metatypem a owl:ObjectProperty;

rdfs:domain z-sgov-pojem:typ;

rdfs:range z-sgov-pojem:typ.

Tato možnost výrazně zkracuje zápis daného vztahu, ovšem je ji možné využít pouze pro binární vztahy a ztrácí se tím možnost reprezentovat měnící se vztahy (např. manželství během své existence může změnit vlastnosti, např. znění předmanželské smlouva, manželství v rozvodovém řízení, atp.). Tato koncepce neuvádí korespondenci mezi oběma reprezentačními variantami, proto se tato zjednodušená reprezentace nepovažuje za normativní ve smyslu této koncepce.

47

Page 48: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

● z typu vlastnost a jeho specializací vzniknou OWL třídy s omezením na hodnoty vazby má vlastnost, reprezentované OWL objektovou vlastností má-vlastnost. Např.

z-sgov-pojem:jméno-člověka a owl:Class ;

rdfs:subClassOf [

a owl:Restriction;

owl:onProperty [owl:inverseOf

z-sgov-pojem:má-vlastnost] ;

owl:qualifiedCardinality 1 ;

owl:onClass z-sgov-pojem:člověk .

]

z-sgov-pojem:má-objektovou-vlastnost a owl:ObjectProperty

rdfs:domain z-sgov-pojem:proměnný-prvek ;

rdfs:range z-sgov-pojem:vlastnost .

○ pro účely zjednodušení zápisu lze uvažovat o alternativní možnosti reprezentace vlastností přímo pomocí OWL datových či objektových vlastností. Uvažujme např. typ vlastnosti jméno člověka objektu typu člověk, kterou lze reprezentovat pomocí OWL datové vlastnosti s nespecifikovaným oborem hodnot: z-sgov-pojem:jméno-člověka a owl:DatatypeProperty;

rdfs:domain z-sgov-pojem:člověk.

Tato možnost výrazně zkracuje zápis dané vlastnosti, ovšem ztrácí se tím možnost reprezentovat měnící se vlastnosti (např. člověk během své existence může změnit hodnotu svého jména). Tato koncepce neuvádí korespondenci mezi oběma reprezentačními variantami, proto se tato zjednodušená reprezentace nepovažuje za normativní ve smyslu této koncepce.

● z typů vazeb je-stavem, má časové určení, má prostorové určení, má účastníka, má počáteční stav, má koncový stav vzniknou OWL objektové vlastnosti s příslušnými doménami, obory hodnot a kardinalitami, např. z-sgov-pojem:je-stavem a owl:ObjectProperty;

rdfs:domain z-sgov-pojem:okamžitý-stav-proměnného-prvku;

rdfs:range z-sgov-pojem:proměnný-prvek.

z-sgov-pojem:okamžitý-stav-proměnného-prvku rdfs:subClassOf [

a owl:Restriction;

owl:onProperty z-sgov-pojem:je-stavem ;

owl:qualifiedCardinality 1 ;

owl:onClass z-sgov-pojem:proměnný-prvek

]

z-sgov-pojem:proměnný-prvek rdfs:subClassOf [

a owl:Restriction;

owl:onProperty [owl:inverseOf z-sgov-pojem:je-stavem] ;

owl:minQualifiedCardinality 1 ;

owl:onClass z-sgov-pojem:okamžitý-stav-proměnného-prvku

]

48

Page 49: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

OWL má pouze omezené prostředky pro reprezentaci tvrzení vyšších řádů (neboli pro reprezentaci typů typů). Využívá se syntaktického přepoužití identifikátoru pro různé typy OWL entit (tzv. punning definovaný ve specifikaci jazyka OWL), což zajistí rozhodnutelnost automatického dokazování nad OWL ontologií Např. konkrétní OWL třída, konkrétní OWL individuál i konkrétní OWL objektová vlastnost mohou být reprezentovány stejným identifikátorem, aniž by došlo ke ztrátě výpočetních vlastností výsledné ontologie. V našem případě punning hojně využíváme - např. z-sgov:objekt je v základním ontologickém modelu reprezentován jako OWL individuál (Úroveň typů) i jako OWL třída (Úroveň objektů, událostí, vztahů a vlastností). Podobně typ vztahu specializuje je reprezentován jako OWL třída a současně jako OWL objektová vlastnost (pro zkrácený zápis vztahu). Typy uvedené v základním ontologickém modelu jsou proměnnými prvky, jejich změny se však nepředpokládají. První verze základního slovníku definuje současně s typy (proměnnými prvky) i jejich první okamžité stavy platné pro aktuální verzi slovníku. Tyto okamžité stavy mají stejnou strukturu (vazby) jako typy samotné a nejsou v této kapitole ukázány.

4.6. Vyjádření sémantického slovníku pojmů veřejného sektoru

Vyjádření sémantického slovníku pojmů veřejného sektoru je stejné jako vyjádření základního sémantického slovníku pojmů a proto jej zde neuvádíme. Strojově čitelné verze vyjádření jsou k dispozici na:

● slovník ○ https://slovník.gov.cz/veřejný-sektor/slovník

● glosář ○ https://slovník.gov.cz/veřejný-sektor/glosář

● model ○ https://slovník.gov.cz/veřejný-sektor/model

4.7. Vyjádření sémantického slovníku pojmů právního předpisu

Pro vyjádření sémantického slovníku pojmů právního předpisu je třeba oproti obecným pravidlům zaznamenat odkaz na právní předpis, resp. jeho část.

4.7.1. Vyjádření glosáře pojmů právního předpisu Dokument glosáře pojmů daného právního předpisu má podobu danou obecnými pravidly a navíc je rozšířen o normativní odkaz na legislativní předpis následujícím způsobem: <Identifikátor glosáře>

dct:conformsTo <IRI předpisu> kde

49

Page 50: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

● <IRI předpisu> : IRI odkazovaného právního předpisu ○ Tvary IRI legislativních předpisů budou popsány v Konvencích propojených

otevřených dat. Zde jsou uváděny příklady v pracovní verzi tvarů IRI a budou upraveny po vydání Konvencí.

Např. glosář pojmů zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má následující vyjádření, které je rozšířením základního vyjádření uvedeného výše o normativní odkaz: l-sgov-sbírka-247-1995:glosář

a z-sgov-pojem:glosář, z-sgov-pojem:legislativní-struktura,

owl:Ontology, skos:ConceptScheme ;

rdfs:label "Glosář pojmů Zákona č. 247/1995 Sb. o volbách do Parlamentu České

republiky"@cs ;

dct:conformsTo <https://data.gov.cz/zdroj/legislativa/sbírka/247/1995> ;

owl:imports <http://slovnik.gov.cz/základní/glosář> . Pojmy definované v glosáři pojmů daného právního předpisu jsou vyjádřeny způsobem popsanými obecnými pravidly a navíc je vyjádření každého pojmu doplněno o normativní odkaz na část právního předpisu (nebo celý předpis) následujícím způsobem: <identifikátor pojmu> dct:conformsTo <IRI části předpisu> kde

● <IRI části předpisu> : IRI odkazované části právního předpisu (nebo celého předpisu)

○ Tvary IRI částí legislativních předpisů budou popsány v Konvencích propojených otevřených dat. V této koncepci jsou prozatím v příkladech uváděny předpokládané tvary IRI.

Např. pojem volební kraj z glosáře pojmů zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má tedy následující vyjádření, které je rozšířením základního vyjádření uvedeného výše o normativní odkaz: l-sgov-sbírka-247-1995-pojem:volební-kraj

a skos:Concept, z-sgov-pojem:typ-objektu ;

skos:prefLabel "volební kraj"@cs ;

dct:conformsTo

<https://data.gov.cz/zdroj/legislativa/sbírka/247/1995/paragraf/26> ;

skos:inScheme l-sgov-sbírka-247-1995:glosář .

4.7.2. Vyjádření ontologického modelu legislativy Dokument ontologického modelu daného právního předpisu má podobu danou obecnými pravidly a navíc je rozšířen o normativní odkaz na legislativní předpis následujícím způsobem: <IRI glosáře>

50

Page 51: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

dct:conformsTo <IRI předpisu> kde

● <IRI předpisu> : IRI odkazovaného právního předpisu Např. ontologický model zákona č. 247/1995 Sb. o volbách do Parlamentu České republiky má tedy následující vyjádření, které je rozšířením základního vyjádření uvedeného výše o normativní odkaz: l-sgov-sbírka-247-1995:model

a z-sgov:model, z-sgov:legislativní-struktura, owl:Ontology ;

rdfs:label "Ontologický model Zákona č. 247/1995 Sb. o volbách do Parlamentu České

republiky"@cs ;

dct:conformsTo <https://data.gov.cz/zdroj/legislativa/sbírka/247/1995> ;

owl:imports l-sgov-sbírka-247-1995:glosář,

z-sgov:model . Souvislosti mezi pojmy definované ontologickým modelem jsou vyjádřeny pomocí konstrukcí jazyka OWL. Některé typické druhy konstruktů, který jsou realizacemi konstruktů popsaných v sekci Vyjádření základního ontologického modelu, jsou tyto:

● zúžení významu pojmu: ○ <identifikátor typu 1> rdfs:subClassOf <identifikátor typu 2>.

Tento OWL axiom zavádí typ 1 jako speciální případ typu 2. Instance typu 1 pak sdílí vlastnosti a vztahy, jejichž typy jsou definovány pro typ 2.

■ Příklad: z-sgov:Člověk rdfs:subClassOf z-sgov:Agent . ● vytvoření jednoho prvku daného typu:

○ <identifikátor pojmu 1> a <identifikátor typu 2> . Tento OWL axiom zavádí pojem 1 jako instanci typu 2. Pojem 1 pak má vlastnosti, jejichž typy jsou definovány pro typ 2.

■ Příklad: l-sgov-sbírka-247-1995:volby a z-sgov:typ;

z-sgov-pojem:specializuje z-sgov-pojem:událost.

● definice vlastností instancí typu proměnného prvku ○ <identifikátor typu vlastnosti> rdfs:domain <identifikátor typu proměnného

prvku> . Tento OWL axiom přiřazuje typ vlastnosti k typu proměnného prvku, tj. popisuje typ proměnného prvku jako doménu typu vlastnosti. Instance typu proměnného prvku pak mají instance typu vlastnosti jako své vlastnosti.

■ Příklad: l-sgov-sbírka-247-1995-pojem:název-volebního-kraje

rdfs:domain l-sgov-sbírka-247-1995-pojem:volební-kraj .

● definice vztahů mezi instancemi typů proměnných prvků ○ <identifikátor typu vztahu> rdfs:domain <identifikátor typu proměnného

prvku 1> ; rdfs:range <identifikátor typu proměnného prvku 2> . Tyto dva OWL axiomy přiřazují typ vztahu k typům proměnných prvků, jejichž instance mohou být ve vztahu popsaném typem vztahu. Popisuje jeden typ proměnného prvku jako doménu typu vztahu a druhý typ proměnného prvku

51

Page 52: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

jako obor hodnot typu vztahu. Instance prvního typu proměnného prvku jsou pak ve vztahu daného typu s instancemi druhého typu proměnného prvku. Vztah je orientován ve směru od domény k oboru hodnot.

■ Příklad: l-sgov-sbírka-247-1995-pojem:je-podána-ve-volebním-kraji

rdfs:domain

l-sgov-sbírka-247-1995-pojem:kandidátní-listina-pro-volby-

do-poslanecké-sněmovny ;

rdfs:range

l-sgov-sbírka-247-1995-pojem:volební-kraj .

Doména i obor hodnot mohou být tvořeny i více typy proměnných prvků. V tom případě je doména (nebo obor hodnot) definovaná jako sjednocení typů proměnných prvků tvořících doménu (nebo obor hodnot)

■ Příklad: l-sgov-sbírka-247-1995-pojem:je-členem

rdfs:domain

L-sgov-sbírka-247-1995-pojem:člen-politické-strany-nebo-

hnutí ;

rdfs:range l-sgov-sbírka-247-1995-pojem:politická-strana,

l-sgov-sbírka-247-1995-pojem:politické-hnutí .

■ Příklad:

l-sgov-sbírka-247-1995-pojem:má-složení

rdfs:domain l-sgov-sbírka-247-1995-pojem:koalice .

rdfs:range l-sgov-sbírka-247-1995-pojem:politická-strana,

l-sgov-sbírka-247-1995-pojem:politické-hnutí .

4.8. Vyjádření agendového sémantického slovníku a sémantického slovníku datové sady

Pro tyto úrovně platí stejná pravidla jako pro legislativní slovník.

5. Vyjádření popisu významu datové sady pomocí sémantického slovníku pojmů

Tato kapitola popisuje, jakými způsoby je možné využít SGoV k popisu významu datové sady jako celku, nebo jejích jednotlivých částí.

5.1. Vyjádření popisu významu datové sady jako celku Popis významu datové sady jako celku je vyjádřen v DCAT-AP katalogizačním záznamu datové sady dle následujícího předpisu: <Identifikátor datové sady> a dcat:Dataset ;

dct:conformsTo <Identifikátor sémantického slovníku pojmů datové sady> ; dcat:theme <Identifikátor pojmu 1>, <Identifikátor pojmu 2>, … .

52

Page 53: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

kde

● <Identifikátor datové sady> je identifikátor datové sady tak, jak jej uvádí poskytovatel v DCAT-AP katalogizačním záznamu

● <Identifikátor sémantického slovníku pojmů datové sady> je identifikátor sémantického slovníku pojmů datové sady, který popisuje význam datové sady

● <Identifikátor pojmu 1>, <Identifikátor pojmu 2>, ... jsou identifikátory pojmů z glosáře pojmů ze sémantického slovníku pojmů datové sady, které popisují význam datové sady jako celku

Ostatní položky katalogizačního záznamu vyjádřeném v DCAT-AP nejsou v předpise výše uvedeny. Jejich použití zůstává nezměněno. Příkladem je datová sada Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017. <https://data.czso.cz/datová-sada/prskl/2017> a dcat:Dataset ;

dct:conformsTo <https://data.czso.cz/slovník/datový/prskl> ;

dcat:theme

l-sgov-247-1995-pojem:volební-kraj,

l-sgov-247-1995-pojem:kandidátní-listina-pro-volby-do-poslanecké-sněmovny,

l-sgov-247-1995-pojem:volby-do-poslanecké-sněmovny,

l-sgov-247-1995-pojem:registr-kandidujících-politických-stran-politických-

hnutí-a-koalic-ve-volbách-do-poslanecké-sněmovny,

l-sgov-247-1995-pojem:politická-strana,

l-sgov-247-1995-pojem:název-politické-strany

l-sgov-247-1995-pojem:politické-hnutí,

l-sgov-247-1995-pojem:název-politického-hnutí,

l-sgov-247-1995-pojem:koalice,

l-sgov-247-1995-pojem:název-koalice,

l-sgov-247-1995-pojem:má-složení,

l-sgov-247-1995-pojem:podání-kandidátní-listiny-pro-volby-do-poslanecké-sněmovny,

l-sgov-247-1995-pojem:český-statistický-úřad,

l-sgov-247-1995-pojem:rozhodnutí-o-registraci-kandidátní-listiny-pro-volby-do-poslanecké-sněmovny,

l-sgov-247-1995-pojem:rozhodnutí-o-odmítnutí-kandidátní-listiny-pro-volby-do-poslanecké-sněmovny

l-sgov-233-2000-pojem:vylosované-číslo-politické-strany,

l-sgov-233-2000-pojem:vylosované-číslo-politického-hnutí,

l-sgov-233-2000-pojem:vylosované-číslo-koalice,

l-sgov-233-2000-pojem:zkratka-názvu-politické-strany,

l-sgov-233-2000-pojem:zkratka-názvu-politického-hnutí,

l-sgov-233-2000-pojem:zkratka-názvu-koalice,

d-sgov-czso-prskl-pojem:interní-kód-politického-subjektu .

Předpokládá se, že sémantický slovník pojmů datové sady, jejich glosář pojmů a ontologický model jsou řádně publikovány jako otevřená data, tj. též katalogizovány v Národním katalogu otevřených dat.

53

Page 54: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

5.2. Vyjádření popisu významu prvků schématu distribuce datové sady

Popis významu prvků schématu distribuce datové sady je mapováním definic prvků na pojmy sémantického slovníku datové sady (na pojmy definované glosářem i na pojmy definované ontologickým modelem). Mapování je vyjádřeno jako RDF trojice, kde:

● subjekt je identifikátor mapovaného prvku schématu distribuce datové sady ● predikát je ze slovníků RDFS nebo OWL a vyjadřuje sémantiku (význam) mapování.

○ owl:equivalentClass, owl:equivalentProperty pro vyjádření významové ekvivalence, kdy význam prvku schématu je ekvivalentní významu pojmu ze sémantického slovníku pojmů datové sady

○ rdfs:subClassOf, rdfs:subPropertyOf pro vyjádření významové specializace, kdy význam prvku schématu je užší/speciálnější než význam pojmu ze sémantického slovníku pojmů datové sady

● objekt je identifikátor pojmu ze sémantického slovníku pojmů datové sady Podoba identifikátorů mapovaných prvků schématu distribuce datové sady závisí na použitém strojovém jazyku pro vyjádření schématu. V případě CSV distribuce a popisu jejího schématu pomocí jazyka CSVW (Metadata Vocabulary for Tabular Data, 2015) lze podobu identifikátorů definovat, jak ukazuje následující příklad definice schématu CSV distribuce datové sady Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017: {

"@context": [

"http://www.w3.org/ns/csvw",

{"@language": "cs",

"@base": "https://www.volby.cz/opendata/ps/psrkl.json#"}

],

"columns": [{

"@id": "KSTRANA",

"name": "KSTRANA"

}]

}

V příkladu je definován CSV sloupec s názvem KSTRANA. Zároveň má tento definovaný prvek určen identifikátor jako následující IRI: https://www.volby.cz/opendata/ps/psrkl.json#KSTRANA

Toto IRI je možné použit v RDF zápise mapování prvku KSTRANA na odpovídající pojem sémantického slovníku pojmů datové sady dle šablony popsané výše. Následující výpis ukazuje kompletní mapování prvků schématu CSV distribuce datové sady Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017:

54

Page 55: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

@prefix dscsvw: <https://www.volby.cz/opendata/ps/psrkl.json#>

dscsvw:KSTRANA

owl:equivalentProperty l-sgov-233-2000-pojem:vylosované-číslo-politického-subjektu .

dscsvw:VSTRANA

owl:equivalentProperty d-sgov-czso-prskl-pojem:interní-kód-politického-subjektu .

dscsvw:NAZEVCELK

rdfs:subPropertyOf l-sgov-247-1995-pojem:název-politického-subjektu .

dscsvw:NAZEV_STRK

rdfs:subPropertyOf l-sgov-233-2000-pojem:zkratka-názvu-politického-subjektu .

dscsvw:ZKRATKAK30

rdfs:subPropertyOf l-sgov-233-2000-pojem:zkratka-názvu-politického-subjektu .

dscsvw:ZKRATKAK8

rdfs:subPropertyOf l-sgov-233-2000-pojem:zkratka-názvu-politického-subjektu .

dscsvw:SLOZENI

owl:equivalentClass [

owl:unionOf

(l-sgov-247-1995-pojem:rozhodnutí-o-registraci-kandidátní-listiny-pro-volby-do-poslanecké-sněmovny

l-sgov-247-1995-pojem:rozhodnutí-o-odmítnutí-kandidátní-listiny-pro-volby-do-poslanecké-sněmovny)

] .

dscsvw:STAVREG

owl:equivalentProperty d-sgov-czso-prskl-pojem:má-stav .

Toto mapování musí být zveřejněno jako OWL dokument v síti WWW ke stažení a URL dokumentu musí být uvedeno v části katalogizačního záznamu popisované datové sady v NKOD v části katalogizující popisovanou distribuci jako hodnota vlastnosti dct:conformsTo. Příkladem je CSV distribuce datové sady Registr kandidátních listin pro volby do Poslanecké sněmovny Parlamentu ČR 2017: <https://data.czso.cz/distribuce-datové-sady/prskl/2017/csv> a dcat:Distribution ;

dct:conformsTo <https://www.volby.cz/opendata/ps2017/PS2017reg20171021_psrkl.json>,

<https://www.volby.cz/opendata/ps/psrkl-lifting.ttl> .

V uvedeném příkladě má distribuce dvě různé hodnoty vlastnosti dct:conformsTo. První je CSVW schéma. Druhé je mapování prvků definovaných v CSVW schématu na pojmy sémantického slovníku pojmů.

6. Správa SGoV Předchozí kapitoly ukázaly příklady návrhu sémantického slovníku pojmů, jeho strukturu a vzájemné návaznosti a význam jeho jednotlivých částí. Uvedené příklady byly sestaveny pro účely této koncepce, systematická tvorba a udržitelná správa slovníku však vyžaduje identifikaci klíčových postupů, které je třeba na úrovni orgánů veřejné moci zavést. Tato kapitola pouze identifikuje nutné postupy pro správu SGoV z technického hlediska, neklade si za cíl nabídnout procesní, ani organizační zajištění těchto postupů v rámci stávajících organizačních struktur orgánů veřejné moci.

55

Page 56: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

6.1. Správa globálních identifikátorů Celý SGoV je postaven na globálních identifikátorech. Technické aspekty správy těchto identifikátorů je stejná jako u ostatních datových sad publikovaných na stupni otevřenosti 4 či 5, a nejsou v této koncepci řešeny.

Globální identifikátory základního, legislativních a agendových slovníků Globální identifikátory slovníků, glosářů a ontologických modelů na základní, legislativní, agendové a datové úrovni jsou tvořeny automaticky z identifikátorů již spravovaných jinými autoritami, nevyžadují tak zavedení žádných nových procesů na jejich správu. Např.

https://slovnik.gov.cz/legislativní/sbírka/247/1995/glosář

je globální identifikátor glosáře legislativního, jehož forma (IRI) je dána druhem právního předpisu (zákon ze Sbírky zákonů ČR) a číslem (částka - 247/1995).

Globální identifikátory pojmů Globální identita jednotlivých pojmů je spravována OVM, který je správcem slovníku, ze kterého pojem pochází:

● Z-SGoV - CDO ● V-SGoV - CDO ● L-SGoV - CDO ● A-SGoV - OVM, který danou agendu ohlašuje ● D-SGoV- OVM, který datovou sadu vytváří

Správce slovníků zajišťuje unikátnost názvů pojmů v rámci jednoho slovníku. Identifikační názvy pojmů v rámci jednoho slovníku (a tedy i globální identifikátory v rámci všech SGoV) identifikují význam pojmu a jsou s ním svázány - jiný název pojmu označuje jiný význam pojmu.

6.2. Správa slovníků Tato sekce popisuje klíčové části životního cyklu slovníků a jejich pojmů.

6.2.1. Životní cyklus sémantického slovníku pojmů dané úrovně Sémantický slovník pojmů vzniká na každé úrovni jiným postupem:

● Z-SGoV - je vytvořen zavedením této koncepce do praxe, ● V-SGoV - je vytvořen zavedením této koncepce do praxe, ● L-SGoV - je vytvořen při vytvoření nového právního předpisu, např. při vydání

nového čísla částky do Sbírky zákonů ● A-SGoV - je vytvořen ohlášením nové agendy na MVČR ● D-SGoV - je vytvořen při požadavku na publikaci datové sady, pro kterou dosud

neexistuje D-SGoV, který by ji popisoval. Vzhledem k tomu, že se očekává častá průběžná aktualizace a rozvoj sémantického slovníku pojmů, bude pro jeho správu využita metodologie s jednoduchým a rychlým cyklem,

56

Page 57: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

ve srovnání s tradičními metodologiemi pro vývoj ontologií, viz. např. Methontology v Ontological Engineering, Gómez-Pérez, Asunción et al, Springer, 2004. Metodologie pro správu sémantického slovníku pojmů na každé úrovni zahrnuje tyto kroky:

1. vytvoření globálních identifikátorů slovníku, glosáře a ontologického modelu, viz sekce Správa globálních identifikátorů

2. opakovaně a. úprava slovníku, glosáře a ontologického modelu (v prvním průchodu se

jedná o vytvoření slovníku, glosáře a ontologického modelu) b. publikace okamžitého stavu slovníku, glosáře, ontologického modelu jako

tří otevřených datových sad. Tento bod bude implementován stejně jako u ostatních otevřených datových sad publikovaných na stupni otevřenosti 5*.

3. zánik slovníku. Slovník formálně zaniká vytvořením události typu zánik proměnného prvku, viz Příloha č. 1. Základní slovník, jejíž je slovník účastníkem. Vzhledem k tomu, že publikovaný slovník vytváří globální významy, na které se vážou významy publikovaných otevřených datových sad, zrušením globálních identifikátorů by tedy došlo ke ztrátě významových souvislostí v těchto datových sadách. Globální identifikace slovníku, glosáře, ontologického modelu a jeho pojmů se neruší. V jakých případech slovník zaniká, tato verze koncepce nespecifikuje.

6.2.2. Úprava slovníku Úprava slovníku se liší podle úrovně a je popsána v následujících kapitolách.

6.2.2.1. Úprava základního slovníku a slovníku veřejného sektoru Způsob upravování Z-SGoV a V-SGoVse liší od upravování ostatních slovníků. V případě Z-SGoV a V-SGoV se upravují glosář i model současně. Důvodem je to, že Z-SGoV a V-SGoV vznikají především shora-dolů, tedy integrací existujících ontologických pojmů a vazeb ze základních ontologií. Pojmy glosáře tak vznikají jako součást ontologického modelování a není užitečné pro základní slovník tyto fáze oddělovat. Úpravy Z-SGoV a V-SGoV by měly být řádově méně časté než úpravy ostatních slovníků. Zánik pojmů Z-SGoV a V-SGoV se neuvažuje a není pro tento případ v této koncepci řešen žádný postup. Vytváření nových pojmů lze uvažovat při rozšiřování Z-SGoV a V-SGoV o detailní modely mnoha ontologických aspektů, které byly s ohledem na srozumitelnost příkladu Z-SGoV a V-SGoV v této verzi koncepce zanedbány. Jedná se např. o

● vlastnosti typů proměnných prvků (rigidita, poskytování identity), ● mereologické vztahy (je částí, má část), ● modelování kvantitativních veličin, ● modelování úrovní metatypů.

Rozšiřování Z-SGoV a V-SGoV o tyto aspekty jde nad rámec koncepce v současné verzi a bude řešeno samostatně.

57

Page 58: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

6.2.2.2. Úprava legislativního, agendového a datového slovníku Úprava legislativního, agendového a datového slovníku probíhá v těchto krocích:

Úprava glosáře 1. Vytvoření pojmů - Vytvoření legislativního, agendového a datového glosáře je

aktivita, při které se analyzuje stávající znalost k dané oblasti (právní předpis, agenda, datová sada) a vytváří se odborné pojmosloví, které daná oblast využívá. Glosář tak vzniká zdola-nahoru. Pro analýzu lze využít podpůrné analytické techniky, které umožní tvořit glosář poloautomaticky, zejména techniky zpracování extrakce informací z nestrukturovaných či částečně strukturovaných dokumentů (např. právních předpisů). Lidský činitel je zde však nezastupitelný - odborník u každého takto automaticky nabídnutého pojmu potvrzuje jeho integritu - výstižnost názvu pojmu a normativní odkaz.

Odborné pojmy v dané oblasti jsou identifikovány odborníkem v dané oblasti a formalizovány v reprezentaci uvedené v kapitole Vyjádření sémantického slovníku pojmů jako otevřená data. Odborníky pro jednotlivé oblasti jsou

● právník pro legislativní glosář, ● odborník na procesy veřejné správy pro agendový glosář, ● kurátor datové sady na pro datový glosář

Při vytváření pojmů, které vyjadřují proměnné prvky se jejich tvůrce rozhoduje, zda vytváří nový proměnný prvek, nebo zda vytvoří pouze nový okamžitý stav existujícího proměnného prvku. Typickým příkladem jsou okamžité stavy typů pocházejících z různých znění jednoho zákona, který daný typ zavedl. Při vytvoření pojmu, který je proměnným prvkem, je současně vytvářen i pojem vyjadřující jeho první stav.

2. Zánik pojmu - pojem typu proměnný prvek zaniká analogicky jako v případě zániku slovníku, tedy vytvořením události typu zánik proměnného prvku, jejíž je pojem účastníkem. Pojem typu neměnný prvek nezaniká, jeho identita je neměnná. Globální identifikace pojmu typu proměnný prvek ani pojmu typu neměnný prvek se neruší.

3. Změna pojmu - pojem typu proměnný prvek mění svoje vlastnosti vytvářením událostí a nových pojmů identifikujících okamžitý (změněný) stav těchto pojmů. Veškeré změny těchto pojmů jsou vázány na událostí, které je způsobily (změna konkrétní vlastnosti s typem jméno kandidáta ve volbách do Poslanecké sněmovny z legislativního slovníku Zákona č. 247/1995 o volbách do Parlamentu České republiky je způsobena událostí typu změna jména z legislativního slovníku Zákona č. 301/2000 Sb. o matrikách, jménu a příjmení.

Publikací glosáře po úpravách (vytvoření/zánik/změna pojmu) vzniká nový okamžitý stav glosáře pojmů a rovněž nový okamžitý stav daného slovníku jako celku.

58

Page 59: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

Úprava ontologického modelu 1. Vytvoření vazby mezi pojmy - pojmy z glosáře se propojují vazbami ze základního

slovníku, ve formě uvedené v kapitole Vyjádření sémantického slovníku pojmů jako otevřená data. Úpravy ontologického modelu provádí ontologický inženýr ve spolupráci s odborníkem na danou doménu (viz předchozí odstavec ke glosáři pojmů).

2. Zánik vazby mezi pojmy - vazba zaniká odstraněním jejího vyjádření z

ontologického modelu.

Publikací ontologického modelu po úpravách (vytvoření/zánik vazby) vzniká nový okamžitý stav ontologického modelu pojmů a rovněž nový okamžitý stav daného slovníku jako celku. Dalším krokem úpravy glosáře a ontologického modelu zahrnuje validaci s využitím doménových odborníků i pomocí automatizovaných textů. Tato část bude řešena v další verzi této koncepce.

7. Technické prostředky pro správu a údržbu SGoV

Efektivní správa SGoV vyžaduje podporu softwarovými nástroji, které umožní spravovat glosáře pojmů (SKOS) a spravovat ontologické modely (UML, OWL). Tato kapitola poskytuje přehled současných systémů, které umožňují spravovat jednotlivé části SGoV. Tento seznam není úplný, poskytuje však obrázek o možnostech současných systémů.

7.1. Nástroje pro správu glosářů V oblasti open-source nástrojů existuje poměrně bohatá historie vývoje nástrojů pro správu SKOS slovníků. Příklady systémů zahrnují např. open-source nástroje pro tvorbu a publikaci slovníků - Vocol, či ThManager 2, HIVE 4, Skosmos, či komerční nástroj pro správu slovníků Multites 6. Následuje podrobnější přehled několika dalších nástrojů, se kterými mají autoři koncepce praktické zkušenosti při správě glosářů.

Tabulkové procesory MS Excel, LibreOffice Calc, Google Spreadsheet Tyto systémy představují dostupnou platformu pro správu glosářů ve formě jednoduchých tabulek, kde každý řádek odpovídá jednomu pojmu a sloupce jeho významotvorným atributům. Tyto systémy jsou vhodnou volbou pro počáteční naplnění a nastavení procesů souvisejících s vývojem glosáře v rámci dané organizace.

TemaTres 3 TemaTres 3 je open-source server pro správu slovníků, umožňující online kolaborativní tvorbu vícejazyčných SKOS slovníků a jejich publikaci. Poskytuje jednoduché uživatelské

59

Page 60: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

rozhraní pro správu a vyhledávání pojmů. Strojový přístup k odbornému pojmosloví je možné pomocí REST API.

VocBench 3 VocBench 3 je další open-source server pro kolaborativní správů vícejazyčných SKOS slovníků. Kromě slovníků samotných umožňuje vytvářet jednoduché ontologie pomocí omezeného OWL editoru. PoolParty Semantic Suite PoolParty Semantic Suite je rozsáhlý komerční balík zaměřený zejména na správu tezaurů a jejich tvorbu z textového korpusu. Podpora pro tvorbu OWL ontologií je omezená.

7.2. Nástroje pro správu ontologických modelů Pro tvorbu ontologických modelů založených na základních ontologiích neexistuje dostatečně expresivní jazyk a související nástroje. Pro UFO-A byl vytvořen jednoduchý jazyk založený na UML - jazyk OntoUML - který má i softwarovou podporu, např. v systémech OLED či Menthor. Tento jazyk bohužel neumožňuje modelovat události, typy a jiné ontologické konstrukty, které jsou klíčové pro tuto koncepci. Standardem pro reprezentaci ontologických modelů je zvolen formální logický jazyk OWL, který je W3C standardem a je podporován širokou škálou nástrojů - některé významnější uvádíme v následujících odstavcích.

Protégé De-facto standardem v této oblasti je open-source ontologický editor Protégé, který je vyvíjen na Stanford University a má k dispozici širokou škálu komunitou vyvíjených zásuvných modulů. Některé zásuvné moduly poskytují i různé grafové vizualizace. Práce s tímto systémem vyžaduje znalost syntaxe a sémantiky jazyka OWL, není proto určen pro použití neškolenými osobami.

Fluent Editor Komerční nástroj Fluent Editor nabízí vlastní jazyk s uživatelsky srozumitelnější syntaxí než jazyk OWL (s exportem do jazyka OWL) a uživatelské rozhraní vhodné pro tvorbu taxonomických struktur.

TopBraid Composer TopBraid Composer je další z komerčních nástrojů, který lze využít na správu OWL ontologií. Silnou stránkou tohoto nástroje jsou zejména datové transformace a validace dat.

60

Page 61: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

7.3. Příklad architektury pro správu sémantického slovníku pojmů

V této sekci nabídneme jednu z jednodušších architektur, které lze využít ke správě sémantického slovníku.Tato architektura předpokládá spolupráci dvou rolí - správce glosáře a znalostního architekta. Zodpovědností správce glosáře je udržovat glosář aktuální a konzistentní. Jedná se o odborníka na doménu glosáře. O změnách v glosáři je informován znalostní architekt, který je formalizuje do ontologického modelu a validuje jejich význam se správcem glosáře pomocí UML vizualizací. Takto navržené role pouze schematicky pojmenovávají klíčové činnosti, které se při správě sémantického slovníku pojmů vykonávají - podrobným organizačním a procesním rozborem se bude zabývat návazná dokumentace.

Na obrázku jsou vidět tři úrovně - úroveň slovníku, úroveň jazyka, úroveň technologie. Tečkované vztahy mezi dvěma úrovněmi pouze využití jazyků technologiemi a glosářem/modelem. Čárkované čáry označují kroky, které jsou v současných nástrojích pouze částečně automatizované.

61

Page 62: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

8. Reference 8.1. Handbook on using the Core Vocabularies, 2014 8.2. SKOS Simple Knowledge Organization System

Reference, W3C Recommendation, 2009 8.3. OWL 2 Web Ontology Language Document Overview

(Second Edition), W3C Recommendation, 2012 8.4. RDF Schema 1.1, W3C Recommendation, 2014 8.5. DCMI Metadata Terms, DCMI Recommendation, 2012 8.6. Linked Data Principles, 2009 8.7. Information principles for the UK public sector, 2011 8.8. GEA-NZ Reference Models and Taxonomies, 2017 8.9. Centrálny model údajov verejnej správy, 2017

8.10. Ontological foundations for structural conceptual models, 2005

8.11. Representing the UFO-B Foundational Ontology of Events in SROIQ, 2017

8.12. Extending the Foundations of Ontology-based Conceptual Modeling with a Multi-Level Theory, 2015

8.13. Agenda 1183, Volby do Parlamentu České republiky, verze 22.6.2017

8.14. DOLCE Ontology, 2006 8.15. BFO Ontology, 2017 8.16. Ontological Engineering, Gómez-Pérez, Asunción et al,

Springer, 2004. 8.17. Metadata Vocabulary for Tabular Data, W3C

Recommendation, 2015 8.18. § 3 odst. 11 zákona č. 106/1999 Sb. o svobodném

přístupu k informacím, 1999 8.19. Subjekty, objekty a obsah právních vztahů, 2015 8.20. Zákon č. 89/2012 Sb. Občanský zákoník, 2012

62

Page 63: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

9. Příloha č.1: Mapování ukázkové OWL reprezentace Z-OM a V-OM na ISA Core Vocabularies

Základní ontologický model a ontologický model veřejného sektoru je vytvořen na bázi českého odborného pojmosloví. Je kompatibilní s ontologiemi rodiny UFO, což zajistí širokou významovou kompatibilitu s existujícími slovníky založenými na stávajících základních ontologiích i stabilitu základního slovníku. Pro zajištění sémantické interoperability s existujícími slovníky pro e-government v této sekci představíme příklady mapování na slovníky ISA Core Vocabularies, které jsou vytvářeny na celoevropské úrovni pro unifikovaný popis základních pojmů veřejné správy a způsoby jejich tvorby. ISA Core Vocabularies jsou aktuálně tvořeny těmito slovníky:

● Core Business Vocabulary 1.0 , v RDF verzi nahrazená tzv. Registered Organization 4

Vocabulary 5

○ popisuje organizace registrované ve veřejném rejstříku (např. obchodní rejstřík)

● Core Location Vocabulary 1.0 6

○ popisuje místa a možnosti jejich vyjádření - jmény, adresami, geometriemi ● Core Person Vocabulary 1.0 7

○ popisuje osoby a základní údaje o nich - narození, úmrtí, občanství ● Core Organization Vocabulary 1.0 8

○ popisuje veřejné organizace - analogie orgánům veřejné moci v českém prostředí

● Core Public Service Vocabulary 2.1 Application Profile 9

○ popisuje veřejné služby, jejich strukturu, podmínky či náklady na jejich vykonávání, atp.

● Core Evidence and Core Criterion Vocabulary 1.0 10

○ popisuje obecné pojmy pro popis procesu rozhodování - kritérium (mechanismus hodnocení variant při rozhodování), odpovědi (hodnocení variant), důkaz (zdroj podporující odpověď).

ISA Core Vocabularies jsou poměrně malé - OWL reprezentace uvedených aktuálních verzí slovníků mají dohromady cca 100 pojmů rozdělených na OWL třídy, OWL objektové vlastnosti, OWL datové vlastnosti a OWL individuály. Úroveň obecnosti použitých pojmů je podobná jako Z-SGoV a V-SGoV, ovšem pojmy ISA Core Vocabularies nejsou systematicky budovány na pojmech základních ontologií - charakter pojmů není v slovnících specifikován

4 https://joinup.ec.europa.eu/release/core-business-vocabulary/100 5 https://www.w3.org/TR/vocab-regorg/ 6 https://joinup.ec.europa.eu/release/core-location-vocabulary/100 7 https://joinup.ec.europa.eu/release/core-person-vocabulary/100 8 https://joinup.ec.europa.eu/release/core-public-organisation-vocabulary-v100 9 https://joinup.ec.europa.eu/release/core-public-service-vocabulary-application-profile/21 10 https://joinup.ec.europa.eu/release/core-criterion-and-core-evidence-vocabulary-v100

63

Page 64: Koncepce sémantického slovníku pojmůsémantický... · 2020. 6. 3. · Motto S d í l í me -l i d a ta , s d í l e j me i j e j i c h v ý zn a m. 1. Úvod S é ma n ti c k

- např. u pojmu Person není specifikováno, zda je chápan ve smyslu proměnného (objektu) nebo neměnného prvku (jeho stavu). Popis slovníků neuvádíme, lze jej nalézt v Handbook on using the Core Vocabularies, 2014. V následujících sekcích uvedeme orientační mapování pojmů z příkladu Z-SGoV na pojmy ISA Core Vocabularies. Vzhledem k tomu, že ISA Core Vocabularies jsou dostupné v jazyce OWL, využijeme pro mapování jazyk OWL. Sémantika mapování je pouze intuitivní, neboť chybí podrobnější ontologická analýza pojmů z ISA Core Vocabularies. Smyslem uvedeného mapování není využít SGoV k definici významu pojmů z ISA Core Vocabularies, ale naopak umožnit sdílení SGoV kompatibilních dat pomocí ISA Core Vocabularies. Proto některým slovníkům z důvodů absence relevantních pojmů v SGoV mapování chybí. S rozvojem SGoV lze toto mapování dále rozvíjet a zpřesňovat. Mapování na Registered Organization Vocabulary 1.0 Bez mapování.

Mapování na Core Location Vocabulary 1.0 z-sgov-pojem:prostorový-objekt rdfs:subClassOf <http://purl.org/dc/terms/Location> .

z-sgov-pojem:má-prostorové-určení rdfs:subPropertyOf <http://www.w3.org/ns/locn#location> .

Mapování na Core Person Vocabulary 1.0 v-sgov-pojem:člověk rdfs:subClassOf <http://www.w3.org/ns/person#Person>

Mapování na Core Organization Vocabulary v-sgov-pojem:organizace rdfs:subClassOf <http://www.w3.org/ns/org#Organization> .

Core Public Service Vocabulary 2.1 Application Profile Bez mapování.

Core Evidence and Core Criterion Vocabulary 1.0 Bez mapování.

64