Rozdíly

Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.

Odkaz na výstup diff

Obě strany předchozí revize Předchozí verze
Následující verze
Předchozí verze
Následující verzeObě strany příští revize
nap:verejny_datovy_fond [2020/05/12 15:23] Tomáš Šedivecnap:verejny_datovy_fond [2021/04/30 10:46] – include změny Tomáš Šedivec
Řádek 2: Řádek 2:
  
 ===== Popis Veřejného datového fondu ===== ===== Popis Veřejného datového fondu =====
-{{page>nap:popisy:popis_verejny_datovy_fond}}+Veřejný datový fond (také jako "VDF") je princip vytváření a dotváření obrazu [[nap:propojeny_datovy_fond|propojeného datového fondu]] dle principů otevřených dat za účelem podpory sdílení údajů OVS při výkonu veřejné správy i mimo jejich rozsah práv a povinností zachycených v [[nap:rpp|RPP]] a mimo [[nap:propojeny_datovy_fond|PPDF]].
  
-===== Popis Veřejného datového fondu ===== +VDF zastřešuje a reprezentuje skutečné fyzické datové zdroje otevřených dat roztroušené ve webovém prostoru VS. Vlastní zastřešení a vymezení je realizováno nástroji určenými pro správu metadat otevřených dat, což nejen konkretizuje samotný pojem VDF, ale nabízí i prostředky pro další kategorizace v rámci celého datového fondu ČR. 
-{{page>nap:pravidla:pravidla_verejny_datovy_fond}}+ 
 +Význam a role VDF se projevuje ve dvou oblastech VS. 
 + 
 +První se týká interního režimu VS, kde je hlavním prostředkem sdílení veřejných údajů mezi veřejnoprávními subjekty navzájem a také rozšiřuje vzájemné sdílení informací o ty údaje, které v PPDF vůbec nejsou. Význam VDF v této oblasti nejlépe vystihuje znění dílčího cíle 5.10 z [[:ikcr|Informační koncepce ČR]]. 
 + 
 + 
 +//“Veřejný datový fond tvořený publikovanými veřejnými údaji veřejné správy je základní metodou pro sdílení veřejných informací mezi veřejnoprávními subjekty navzájem i pro sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou v ČR. Veřejný datový fond se od pouhé publikace automatizovaně čitelných Open Dat posune též k publikaci právně závazných, platných a pravidelně aktualizovaných datových sad s jasně definovanou zodpovědností OVS za takové sady.”// 
 + 
 +Druhou důležitou oblastí, ve které VDF sehrává významnou roli, je oblast směřování ČR k otevřenému vládnutí a postupnému zpřístupňování informací VS veřejnosti. VDF je tvořen publikovanými informacemi VS v podobě otevřených dat a tak se stává součástí všech veřejně přístupných otevřených dat v ČR. 
 + 
 + 
 +==== Datové zdroje VS ČR ==== 
 + 
 + 
 +Datový zdroj je způsob přístupu k datům. Data VS ČR jsou přístupná prostřednictvím datových zdrojů v následujících kategoriích: 
 +{{ :soubor:zdroje_vdf.png |}}  
 + 
 +PPDF - propojený datový fond je popsán [[nap:propojeny_datovy_fond|zde]]. 
 + 
 +OD - otevřená data - je tvořen všemi publikovanými daty VS ve formátu otevřených dat, která musí splňovat požadavky na otevřená data odpovídající definici uvedené v [[https://www.zakonyprolidi.cz/cs/1999-106#p3-11|§ 3 odst. 11 zákona č.106/1999 Sb.]] Součástí otevřených dat jsou také všechna otevřená data samospráv, otevřená data využívaná v konceptu SMART Cities a data publikovaná v rámci VDF. 
 + 
 +Pro data ve formátu otevřených dat platí, že jsou: 
 +  * Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF a v dalších formátech s otevřenou specifikací. 
 +  * Opatřená podmínkami užití neomezujícími jejich užití. 
 +  * Evidovaná v [[https://data.gov.cz/|Národním katalogu otevřených dat (NKOD)]] jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří. 
 +  * Opatřená úplnou, volně dostupnou a otevřenou dokumentací. 
 +  * Opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření, apod.) 
 +  * Jsou publikovány dle otevřených formálních norem ve smyslu [[https://www.zakonyprolidi.cz/cs/1999-106#p4-4b|§ 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím.]] 
 + 
 +VDF - veřejný datový fond - je podmnožinou otevřených dat. Je tvořen datovými zdroji, které veřejně zpřístupňují data dostupná v PPDF a datovými zdroji, která veřejně zpřístupňují data, jež [[nap:propojeny_datovy_fond|PPDF]] vůbec neobsahuje, ve formátu otevřených dat. Jedná se např. o data nutná pro správnou interpretaci dat z PPDF (např. číselníky) nebo o data obsažená v agendách, které nemají ze zákona povinnost publikovat svoje údaje jiným agendám, a tedy ani nejsou součástí [[nap:propojeny_datovy_fond|PPDF]]. VDF tedy slouží ke zpřístupnění dat [[nap:propojeny_datovy_fond|PPDF]] jednotlivým OVS v těch případech, kdy příslušná OVS nemají možnost tato data sdílet prostřednictvím [[nap:propojeny_datovy_fond|PPDF]] (nemají přidělena práva v RPP), nebo takových dat, které vůbec nejsou součástí [[nap:propojeny_datovy_fond|PPDF]] a v obou případech taková data ke své práci potřebují. Veškerá publikovaná data ve VDF musí být ve formátu otevřených dat a musí splňovat požadavky kladené na otevřená data dle [[https://www.zakonyprolidi.cz/cs/1999-106|zákona č.106/1999 Sb.]] a dále pak požadavkům právních předpisů na zpracování a ochranu osobních údajů. Nad rámec těchto pravidel musí poskytovatel u svých dat publikovaných ve VDF garantovat jejich aktuálnost, dostupnost a správnost tak, aby je ostatní OVS mohly využívat při své práci. 
 + 
 +Součástí VDF jsou rovněž data s řízeným přístupem. Jedná se o datové sady, které naplňují všechny stanovené podmínky pro otevřená data s výjimkou požadavku, aby jejich poskytovatel nijak neomezoval jejich následné využití. Příkladem takové praxe je podmínění poskytnutí dat předchozí registrací, aby mohl poskytovatel sledovat, jak je s daty nakládáno. Jedná se o takové případy, kdy úplnému otevření dat brání objektivní důvody vyplývající například z legislativy nebo věcně technického charakteru dané datové sady. 
 + 
 +Ačkoli data s řízeným přístupem nejsou otevřená data, hledí se na ně v kontextu VDF jako na otevřená data a musí tedy splňovat všechny požadované podmínky kladené na otevřená data včetně katalogizace v [[https://data.gov.cz/|NKOD]], s výjimkou upravených podmínek pro jejich užití. Pro úpravu platí, že v podmínkách užití dat musí být uvedena a zdůvodněna všechna stanovená omezení, musí být stanoveny podmínky pro získání souhlasu k užití a musí být uveden kontakt na publikující organizaci pro zažádání o přístup k publikovaným datovým sadám. 
 + 
 +Udělování fyzického přístupu k takovým datovým sadám a správu a registraci povolených uživatelů plně spadá na publikující organizace. 
 + 
 +==== Přístupy k datům VS ==== 
 + 
 +OVM (případně SPUÚ) při výkonu veřejné správy používají údaje vedené v [[nap:zakladni_registry|systému základních registrů]] a údaje vedené o jednotlivých entitách v jiných agendových systémech, pokud mají dle zákona povinnost publikovat svoje údaje jiným agendám. Tyto údaje tvoří [[nap:propojeny_datovy_fond|PPDF]] a jednotlivá OVM k nim mají přístup prostřednictvím [[nap:referencni_rozhrani|referenčního rozhraní veřejné správy]] na základě svých práv a povinností zachycených v [[nap:rpp|RPP]].  
 + 
 +OVM může pro svou práci vyžadovat i údaje nad rámec oprávnění definovaných v [[nap:rpp|RPP]],  případně může potřebovat údaje, které PPDF neobsahuje. V takových případech může přistupovat k veřejně dostupným údajům prostřednictvím VDF a k získání potřebných dat využije vhodnou publikovanou sadu otevřených dat prostřednictvím [[https://data.gov.cz/|NKOD]].  
 + 
 +Pokud taková sada neexistuje, požádá ohlašovatele odpovídající agendy o doplnění údajů v podobě otevřených dat do VDF. 
 + 
 +{{ :soubor:pristupy_3.jpg |}} 
 + 
 +Veřejnost má otevřený přístup ke všem otevřeným datům a tedy také k údajům ve VDF prostřednictvím [[https://data.gov.cz/|NKOD]] a Portálu otevřených dat (POD). 
 + 
 +==== Základní charakteristiky VDF ==== 
 + 
 +VDF obsahuje datové zdroje, které slouží jako doplňkový zdroj dat pro OVM v takových případech, kdy OVM nemají k použití takových dat přímo z [[nap:propojeny_datovy_fond|PPDF]] přidělena práva v [[nap:rpp|RPP]], nebo taková data [[nap:propojeny_datovy_fond|PPDF]] vůbec neobsahuje.  
 + 
 +V konečném důsledku se tímto způsobem rozšiřuje sdílení údajů VS nad rámec zajišťovaný [[nap:referencni_rozhrani|referenčním rozhraním]]  v [[nap:propojeny_datovy_fond|propojeném datovém fondu]] (viz. [[:ikcr|cíl 5.10 informační koncepce]]). Významným a hodnotným efektem VDF je také jeho zpřístupnění veřejnosti ve formátu otevřených dat v rámci možností a podmínek vymezených v zákonech u jednotlivých agend. 
 + 
 +Data ve VDF musí být poskytovány v podobě otevřených dat a musí tak splňovat všechny požadavky kladené na otevřená data dle [[https://www.zakonyprolidi.cz/cs/1999-106|zákona č.106/1999 Sb.]] VDF je základním prostředkem a metodou pro sdílení veřejných informací mezi veřejnoprávními subjekty navzájem a pro sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou. 
 + 
 +Pokud OVS využívá data z VDF, považuje je za správná a nemusí ověřovat jejich správnost. 
 + 
 +Poskytovatel dat do VDF tudíž musí: 
 +  * garantovat správnost publikovaných údajů, 
 +  * garantovat kvalitu publikovaných údajů, 
 +  * garantovat aktuálnost publikovaných údajů, 
 +  * garantovat pravidelnost aktualizace publikovaných údajů, 
 +  * zajišťovat automatickou [[nap:notifikace|notifikaci]] všech změn zaregistrovaným zájemcům s využitím funkcionality POD. 
 + 
 +==== Nástroje VDF ==== 
 + 
 +VDF vytvořený na základě principů otevřených dat vytváří virtuální distribuovaný datový prostor, ve kterém OVS sdílí s veřejností i mezi sebou navzájem veřejné údaje evidované v jimi spravovaných ISVS. Správa takového virtuálního prostředí a udržení kvality, konzistence a aktuálnosti publikovaných dat je založena na správě metadat publikovaných datových sad, popisu datových zdrojů a sémantickém mapování prvků struktur datových sad na sémantický slovník pojmů VS s pomocí k tomu určených nástrojů. 
 + 
 +Správa dat VDF bude v základu probíhat stejným způsobem jako jsou již spravována otevřená data VS s několika dalšími rozšířeními. Základem bude katalog dat NKOD, který bude upraven a doplněn tak, aby mohl rozlišovat jednotlivé kategorie dat, umožňoval registrace uživatelů a zajišťoval [[nap:notifikace|notifikace]] změn. 
 + 
 +Přehled všech nástrojů využitých při práci s daty VDF a otevřenými daty uvádí následující obrázek. 
 + 
 +{{ :soubor:nastroje_vdf.png |}} 
 + 
 +POD zastřešuje nástroje a funkční oblasti [[https://data.gov.cz/|NKOD]] nutné pro katalogizaci a správu všech kategorií dat v PPDF. 
 + 
 +Základní zajišťované funkce: 
 +  * katalogizace otevřených dat (VDF a OD), 
 +  * automatická [[nap:notifikace|notifikace]] změn v publikovaných datových sadách. 
 + 
 +Základní logické celky POD: 
 +  * NKOD - upravený a doplněný pro správu informací o jednotlivých kategoriích dat a jejich zařazení do VDF.  
 +    * NKOD je nástroj, ve kterém jednotlivé OVS katalogizují jimi zveřejňovaná otevřená data a jiné OVS a veřejnost v něm otevřená data vyhledává a získává k nim přístup. 
 +    * Existence NKOD a povinnost jednotlivých OVS v něm katalogizovat svá otevřená data je dána zákonem č. 106/1999 Sb., o svobodném přístupu k informacím, který zavádí definici otevřených dat a zakládá existenci NKOD. 
 +  * Katalog uživatelů otevřených dat (KUOD) - bude evidovat, jaké OVS využívají jaká otevřená data ve VDF. 
 +  * Katalog (registr) uživatelů dat s požadavkem [[nap:notifikace|notifikace]] změn v publikovaných datových sadách - seznam uživatelů s požadavky na zasílání [[nap:notifikace|notifikací]] o změnách pro konkrétní publikované datové sady. 
 +  * Notifikační HUB - nástroj zajišťující s pomocí KUOD s požadavkem notifikace automatickou distribuci notifikací změn v publikovaných sadách při ohlášení změny ze strany publikujícího OVS. Při registraci datové sady předává publikujícímu OVS URI pro zasílání informací o změnách. 
 +  * Registr požadovaných datových sad VDF - seznam požadavků na doplnění chybějících obrazů PPDF do VDF. 
 + 
 +**Sémantický slovník pojmů** - slovník pojmů veřejné správy, jako nástroj harmonizace sémantiky otevřených dat, bude vytvořen na bázi výčtů údajů vedených k agendám v RPP dle § 51 odst. 5 písm. g), h) a i) zákona č. 111/2009 Sb. o základních registrech a bude je postupně rozpracovávat do podoby opakovaně použitelných a sdílených informačních modelů (ontologií), které budou propojeny na údaje vedené k agendám a též propojovány se slovníky a ontologiemi vznikajícími z iniciativy EU (např. ISA Core Vocabularies). Logická datová schémata popisující jejich strojové (syntaktické) vyjádření na logické úrovni budou propojena na pojmy sémantického slovníku pojmů, čímž bude realizováno propojení sémantiky (významu) dat napříč jednotlivými datovými sadami a jejich zdroji. Sémantický slovník pojmů bude nedílnou součástí VDF a stane se základem popisu sémantiky publikovaných dat a jejich vzájemného propojení. 
 + 
 +**Nástroj pro správu sémantického slovníku pojmů (NSSSP)** – umožní správu sémantického slovníku pojmů všemi OVS a popisovat jejich data za účelem sémantické harmonizace. 
 + 
 +**Portál otevřených dat  (POD)** – vstupní brána do světa otevřených dat VS. Obsahuje NKOD, vzdělávací informace, publikační standardy, šablony, doporučené postupy, související dokumenty a informace o otevřených datech zveřejněných ve Standardech publikace a katalogizace otevřených dat 
 + 
 +**Lokální katalog otevřených dat - LKOD** - volitelně implementován pro potřeby katalogizace otevřených dat konkrétního poskytovatele dat. NKOD pravidelně automaticky přebírá informace o zveřejněných datových sadách z jednotlivých lokálních katalogů. 
 + 
 +**Katalog aplikací nad otevřenými daty** – seznam všech služeb (aplikací) využívajících publikované datové sady s možnostmi vyhledávání dle využívaných datových sad, nebo na základě životních situací konzumenta dat. 
 + 
 +==== Obsahové rozdělení datových zdrojů VDF ==== 
 + 
 +VDF je tvořen dvěma druhy datových zdrojů: 
 +  * datové zdroje obsahující veřejný obraz PPDF, 
 +  * datové zdroje rozšiřující obraz PPDF o data, která v PPDF nejsou. 
 + 
 +Veřejně přístupným obrazem datového zdroje chápeme data z tohoto zdroje transformovaná do strojově čitelné podoby, kterou lze zveřejnit. V případě, že lze datový zdroj zveřejnit celý v jeho původní podobě, je touto transformací identita. Tj. datový zdroj je v tomto případě sám sobě veřejně přístupným obrazem. U ostatních datových zdrojů transformace v maximální možné míře zachovává detaily původních dat a provádí tak typicky jen nezbytně nutnou anonymizaci. Ta většinou znamená buď projekci dat (tj. odstranění některých typů údajů z datové sady) nebo jejich statistickou agregaci. 
 + 
 +{{ :soubor:vycet_vdf.png |}} 
 + 
 +Pro datové zdroje vytvářející veřejně přístupný obraz PPDF by měla platit následující jednoduchá obecná pravidla. 
 +  * Pro každý datový zdroj v PPDF musí existovat nějaký obraz ve VDF a to: 
 +    * pro datové zdroje s legislativně stanoveným dálkovým přístupem budou předmětem publikace vždy primární data, 
 +    * u datových zdrojů bez legislativně stanoveného dálkového přístupu budou v případě, že tomu nebude nic bránit, publikována primární data, v opačném případě bude jejich publikace provedena formou statistik a agregací s co nejjemnější granularitou. 
 + 
 +==== Výčet datových zdrojů tvořící obsah VDF ==== 
 + 
 +  * Obrazy základních registrů - jako obraz registru budou publikovány statistiky z registru 
 +    * [[nap:ros|ROS]] 
 +    * [[nap:ruian|RÚIAN]] 
 +    * [[nap:rob|RPP]] 
 +    * [[nap:rob|ROB]] 
 +  * Obrazy veřejných rejstříků (veřejné rejstříky právnických a fyzických osob podle zákona č. 304/2013 Sb. (Zákon o veřejných rejstřících právnických a fyzických osob.). 
 +    * spolkový rejstřík, 
 +    * nadační rejstřík, 
 +    * rejstřík ústavů, 
 +    * rejstřík společenství vlastníků jednotek, 
 +    * obchodní rejstřík, 
 +    * rejstřík obecně prospěšných společností. 
 +  * Obrazy údajů evidovaných v RPP dle § 51 odst. 5 písm. h) zákona č. 111/2009 Sb. o základních registrech. 
 +  * Obrazy všech rejstříků, u kterých zákon definuje jejich dálkový přístup, pokud neexistují žádné právní překážky nebo významná rizika (v případě rejstříků bez stanoveného dálkového přístupu v zákonech - publikace agregací nebo statistik). 
 +  * Publikované (i lokální) číselníky, jejich sémantické provázání, případná konsolidace a uvedení kontextů zachycujících jejich použití. 
 +  * Publikované statistiky a jiné údaje využívané OVS, a které jsou  vhodné pro veřejné zpřístupnění. 
 + 
 + 
 +==== Zjednodušený koncept publikace dat do VDF ==== 
 + 
 +Cílem publikace dat VS do VDF je vytvoření harmonizovaného a konzistentního obrazu PPDF ve VDF, sémanticky provázaného i na odpovídající pojmy legislativy s pomocí Sémantického slovníku pojmů, včetně zachycených vzájemných souvislostí. Aby byla zajištěna konzistence VDF, a aby se z něj vytvořil rovnocenný obraz PPDF je proto nutné, aby publikované datové sady datových zdrojů v PPDF byly publikované i na úrovni propojených dat. Toho se dosáhne publikací konkrétních distribucí datových sad z PPDF se strojově čitelnou vazbou na sémantický slovník pojmů. 
 + 
 +  * Základem publikace do VDF je tedy sémantický slovník pojmů vytvořený na základě údajů v RPP, a který popisuje PPDF a tedy i budoucí obrazy ve VDF.  
 +  * Vlastní publikace bude realizovaná distribucemi datových sad s využitím takového formátu, který umožní zaznamenání souvislostí v datech a vazeb na sémantický slovník pojmů ve strojově čitelné podobě. 
 + 
 +Publikované obrazy datových zdrojů PPDF ve VDF vytvoří infrastrukturu pro všechna otevřená data VS, což prakticky znamená, že publikující organizace nebudou muset při publikaci nových datových sad publikovat data, která již vypublikovaná budou, ale pouze budou publikovat nové rozšiřující informace k jednotlivým entitám VDF. Do jejich povinností ale přibude povinnost doplnit vazby nově publikovaných údajů na již existující entity ve VDF. 
 + 
 +Publikovaná datová sada z datového zdroje PPDF musí k tomu, aby se stala součástí VDF: 
 +  * musí splňovat všechny podmínky kladené na otevřená data ve smyslu zákona č.  106/1999 Sb. o svobodném přístupu k informacím, 
 +  * musí být publikována dle předepsaných otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím 
 +  * musí mít doplněn kontext, který mapuje strukturální prvky datové sady na sémantický slovník pojmů. 
 + 
 +Dále platí následující pravidla: 
 +  * V případě duplicit u publikovaných datových sad ve VDF, nebo doplňování údajů různými publikujícími ke stejné publikované entitě, spadá povinnost doplnění vazeb na již publikované údaje vždy na toho publikujícího, který publikuje doplňující údaje. 
 +  * U každé datové sady publikované do VDF musí být uvedena informace o [[nap:notifikace|notifikačním]] mechanismu o změnách dle příslušné OFN uvedené na POD. 
 +  * K zajištění právní závaznosti publikovaných dat musí být garantována jejich kvalita, aktuálnost a bezodkladná aktualizace, prostřednictvím organizačního a procesního zajištění v organizaci poskytovatele dat. 
 +  
 +==== Správa dat VS ČR ==== 
 + 
 +Zapojení VDF do výkonu veřejné správy vyžaduje zajištěnou garanci kvality publikovaných datových sad, což znamená zajistit publikaci skutečně právně závazných, platných a pravidelně aktualizovaných datových sad s jasně definovanou zodpovědností OVS za takové sady. Je zřejmé, že takový stav bude obtížné dosáhnout stávajícími přístupy k publikaci otevřených dat ve VS, kdy publikace probíhá ne příliš koordinovaně, často nestandardními způsoby a s absencí používání doporučených standardů. 
 + 
 +K zajištění kvalitního veřejného datového fondu bude nutné přistoupit k plánovanému a přesně definovanému vytváření VDF a také ke změně stávajícího paradigmatu správy dat VS ČR - oddělit data VS od aplikací a posunout je do centra řízení informatiky v souladu s postavením dat v legislativě. Správa a řízení dat VS se zdá být v budoucnu nezbytná i ve světle proklamací, že data jsou to nejcennější co organizace, a tedy i veřejná správa a v konečném důsledku i veřejnost, mají. 
 + 
 +K zajištění kvality publikovaných datových sad, budou vydány: 
 +  * “Pravidla a postupy publikace dat do VDF”, 
 +  * “Pravidla a postupy publikace otevřených dat”,  
 +  * “Datová politika VS ČR”. 
 + 
 +Dále budou k zajištění snadného využití publikovaných datových sad soustavně rozvíjeny stávající a vytvářeny nové OFN (Otevřené formální formy), určující koncepční i technické vzory pro vlastní publikaci dat. OFN jsou a budou publikovány na Portálu otevřených dat a jsou dle zákona č.106/1999 Sb. pro publikující organizace závazné. 
 + 
 +==== Pohledy na veřejný datový fond ==== 
 + 
 +{{ :nap-dokument:vdf_-_byznys.png |}} 
 + 
 +{{ :nap-dokument:vdf_-_aplikace.png |}} 
 + 
 +===== Pravidla Veřejného datového fondu ===== 
 +VDF je tvořen otevřenými daty poskytovanými jednotlivými OVS za účelem sdílení s dalšími OVS a je podmnožinou všech otevřených dat VS. Je tedy nutné zajistit, aby všechny funkční celky architektury jednotlivých úřadů VS respektovaly a dodržovaly pravidla platná pro: 
 +  * otevřená data (legislativně podpořená zákonem č.106/1999 Sb.), 
 +  * data VDF - pravidla pro otevřená data navíc doplněná o další specifika odvozená od charakteristik VDF. 
 + 
 +==== Otevřená data ==== 
 + 
 +Otevřená data jsou: 
 +  * Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF (JSON-LD, Turtle, …) a další formáty s otevřenou specifikací. 
 +  * Opatřená podmínkami užití neomezujícími jejich užití. 
 +  * Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří. 
 +  * Opatřená úplnou dokumentací. 
 +  * Opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření, apod.). 
 +  * Jsou publikovány dle otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím. 
 +  
 +==== Využívání otevřených dat při výkonu veřejné správy ==== 
 + 
 +Nejsou stanovené žádné požadavky na způsoby použití publikovaných otevřených dat, data lze libovolně importovat do vhodných aplikací a informačních systémů. Publikovaná data jsou zpřístupněna prostřednictvím NKOD (POD) a lze je získat jako soubory s datovými sadami. K datům lze také přistupovat s využitím aplikací třetích stran, které příslušné data využívají. 
 + 
 +==== Publikace otevřených dat ==== 
 + 
 +=== Příprava ISVS pro export otevřených dat === 
 + 
 +Zásadní je zajištění přístupu k datům IS. Provozovaný IS tedy musí: 
 +  * umožňovat přístup k databázi nebo 
 +  * mít možnost stahovat volitelně strukturovaná data (tabulky) z reportingového modulu systému, nebo 
 +  * nabídnout API, ze kterého se dají pravidelně získávat kompletní data v podobě datových souborů. 
 + 
 +Vhodné otevřené formáty: 
 +  * tabulková data - CSV, XML, JSON, RDF (JSON-LD, Turtle, …), 
 +  * hierarchická data - XML, JSON, RDF (JSON-LD, Turtle, …), 
 +  * grafová data - RDF (JSON-LD, Turtle, …), 
 +  * geodata(prostorová data) - GeoJSON, ESRI Shapefile, OGC GML, OGC GeoPackage. 
 + 
 +Struktura dat musí být zdokumentována lidsky čitelným dokumentem, ale také strojově čitelným schématem. 
 +Doporučené jazyky pro definici schémat schémata: 
 +  * CSV - schéma CSV on the Web, 
 +  * XML - XML Schema, 
 +  * JSON - JSON schema, 
 +  * RDF - RDFS, OWL, SHACL 
 + 
 +Při dodržení výše uvedených bodů jsou získaná kompletní data z IS připravena k publikaci formou otevřených dat. 
 + 
 +=== Export dat nebo API v proprietárním formátu === 
 + 
 +Pokud se jedná o rozšíření existujícího IS, který neumožňuje export dat nebo nenabízí API ve strojově čitelném a otevřeném formátu a takovou úpravu nelze v IS provést, využije se stávající export či API, které již systém nabízí (např. do MS Excel), a tento výstup se dále zpracuje do otevřeného formátu pomocí dalších nástrojů tak, aby bylo dosaženo stavu jako v případě přímého exportu do otevřeného formátu. 
 + 
 +=== Závěrečná příprava dat k publikaci v podobě otevřených dat === 
 + 
 +Data získaná z IS jedním z popsaných způsobů je následně třeba publikovat jako otevřená data. To znamená minimálně: 
 +  - V případě API zajistit jeho vytěžení pro získání kompletních dat k publikaci (tj. případná přímá publikace API nenaplňuje podmínky otevřených dat) 
 +  - Zajistit pravidelnou aktualizaci získaných dat (dle charakteru dat to může být ve frekvenci např. denně, měsíčně nebo ročně) 
 +  - Publikovat získaná data na web ke stažení a následně publikovat každou jejich aktualizaci 
 +  - Opatřit je dokumentací, podmínkami užití a kontaktem na kurátora 
 +  - Katalogizovat je v Národním katalogu otevřených dat (NKOD) 
 + 
 +K tomu lze využít nástrojů pro přípravu, publikaci a katalogizaci otevřených dat, jako je třeba LinkedPipes ETL. 
 +Publikace otevřených dat by měla být zajištěna koncepčně na úrovni celé organizace. Kompletní postupy jsou k dispozici na POD, včetně vyžadovaných standardů. 
 + 
 +==== Data VDF ==== 
 + 
 +=== Otevřená data ve VDF === 
 + 
 +Ve VDF jsou poskytována otevřená data, která jsou určena mj. k využití jinými OVS při výkonu veřejné správy i mimo jejich rozsah práv a povinností zachycených v RPP. Nad rámec otevřených dat platí pro otevřená data ve VDF následující: 
 +  * Pokud OVS využívá data z VDF, považuje je za správná a nemusí ověřovat jejich správnost. 
 +  * Poskytovatel dat do VDF garantuje správnost, kvalitu, aktuálnost a pravidelnou aktualizaci údajů publikovaných ve VDF. 
 +  * Poskytovatel dat do VDF zajišťuje automatickou notifikaci všech změn v údajích publikovaných ve VDF zaregistrovaným zájemcům s využitím funkcionality Portálu otevřených dat. 
 + 
 +=== Využívání otevřených dat z VDF při výkonu veřejné správy === 
 + 
 +Při výkonu veřejné správy může OVS potřebovat údaje jiných OVS, kterým ale nemá přístup v rámci rozsahu stanoveného v RPP. Pokud se jedná o veřejné údaje, přistupuje k nim prostřednictvím VDF. Jsou-li data ve VDF dostupná, není žádný jiný způsob přístupu k datům a sdílení dat povolen. Typicky jsou data z VDF využívána následujícím způsobem: 
 + 
 +  * ruční vyhledání potřebných datových sad v NKOD a zjištění odkazů ke stažení dat, 
 +  * nastavení skriptů k pravidelnému importu nalezených datových sad do vlastního IS ze zjištěných odkazů, 
 +  * import datových sad do IS VS, 
 +  * registrace v Notifikačním hubu k pravidelnému a strojovému získávání aktualizací, 
 +  * nastavení skriptů k importu změn získaných z Notifikačního hubu do IS VS. 
 + 
 +=== Publikace otevřených dat do VDF === 
 + 
 +Pro publikaci otevřených dat do VDF platí stejná pravidla jako pro publikaci otevřených dat uvedená výše. Navíc musí být dodržená následující pravidla: 
 +  * Publikovaná data jsou popsána sémantickým slovníkem pojmů, který je vytvořen na základě údajů v RPP. Popis dat sémantickým slovníkem pojmů je vytvořen a publikován dle otevřené formální normy “Popis dat sémantickým slovníkem pojmů”. Sémantický slovník pojmů je tvořen a publikován dle otevřené formální normy “Sémantický slovník pojmů”. 
 +  * K identifikaci entit, o nichž jsou publikovány údaje ve VDF, jsou použita IRI dle otevřené formální normy “Propojená data”. 
 +  * V publikovaných datech se nepublikují duplicitní údaje s již publikovanými údaji ve VDF. V případě, že OVS publikuje údaje o entitě, o níž již publikuje ve VDF údaje jiný OVS, publikuje OVS pouze nové doplňující údaje k této entitě. V případě, že zavádí vlastní IRI k identifikaci entity než jiný OVS, propojí vlastní IRI s původním dle otevřené formální normy “Propojená data”. 
 +  * Souvislosti mezi entitami v datech stejného poskytovatele i různých poskytovatelů jsou reprezentovány dle otevřené formální normy “Propojená data”. Poskytovatel údajů ve VDF se snaží maximálně propojit entity, o nichž publikuje údaje, na entity, o nichž publikují údaje jiné OVS. 
 + 
 +=== Údaje povinně zveřejňované ve VDF === 
 +Ve VDF jsou jako otevřená data povinně zveřejňovány následující údaje: 
 + 
 +^Poskytovatel zveřejňující údaje ve VDF ^Zveřejňované údaje ^Způsob zveřejnění| 
 +|Český statistický úřad |Číselníky zavedené sdělením ve Sbírce zákonů |Dle OFN Číselníky| 
 +|Ohlašovatel agendy ve smyslu § 48 písm. f) zákona č. 111/2009 Sb. o základních registrech |Číselníky kódující údaje uvedené v registru práv a povinností dle § 51 odst. 5 písm. h) zákona č. 111/2009 Sb., o základních registrech. Ohlašovatel agendy číselník zveřejňuje ve VDF, pokud již číselník nezveřejňuje Český statistický úřad nebo jiný ohlašovatel.|Dle OFN Číselníky| 
 + 
 +==== Společná pravidla pro otevřená data i data VDF ==== 
 + 
 +=== Organizační a procesní zajištění publikace dat === 
 + 
 +Zapojení VDF do výkonu veřejné správy vyžaduje publikaci skutečně právně závazných, platných a pravidelně aktualizovaných datových sad s jasně definovanou zodpovědností OVS za takové sady. Publikující organizace musí pro splnění uvedených požadavků realizovat vhodná organizační opatření, přiřadit pracovníkům příslušné procesní role a implementovat činnosti publikačních procesů do pracovních náplní pracovníků. 
 +Jako minimum je vyžadováno přiřazení těchto klíčových procesních rolí: 
 + 
 +Koordinátor otevírání dat, do jehož kompetencí a povinností spadá: 
 +  * zajištění součinnosti a kontroly výstupů všech ostatních rolí, které se na otevírání dat podílejí, 
 +  * komunikace se všemi zapojenými pracovníky do publikace dat, 
 +  * externí komunikace s uživateli otevřených dat VS, 
 +  * komunikace a spolupráce s Národním koordinátorem otevřených dat, 
 +  * komunikace s Datovou kanceláří a s příslušným Chief data officer (CDO). 
 + 
 +Kurátor dat - klíčová role pro: 
 +  * zajištění kvality, správnosti, aktuálnosti a tím i právní závaznosti dat konkrétní agendy, 
 +  * publikaci datových sad v souladu s platnými právními předpisy ČR a Standardy publikace a katalogizace otevřených dat VS ČR. 
 + 
 +Kompletní doporučení, vhodné vzory interních dokumentů, všechny navržené procesní role a standardní publikační procesy jsou uvedeny na Portále otevřených dat. 
 + 
 +=== Ochrana osobních údajů === 
 + 
 +Pokud jsou předmětem evidence informačního systému osobní údaje ve smyslu zákona č. 110/2019 Sb., o zpracování osobních údajů a nařízení (EU) č. 2016/679, Obecné nařízení o ochraně osobních údajů (GDPR), neznamená to, že nelze ze systému publikovat otevřená data. V těchto případech platí následující doporučení. 
 +  - V případě, že se jedná o veřejnou evidenci či rejstřík a zvláštní právní předpis nařizuje zveřejnění informací, lze zveřejnit osobní údaje v podobě otevřených dat. 
 +  - Ochranu osobních údajů lze zajistit Anonymizací či Pseudonymizací. Z dat se odstraní osobní údaje a případně se nahradí bezvýznamovým umělým identifikátorem. Data bez osobních údajů se pak mohou zveřejnit v podobě otevřených dat. V závislosti na charakteru dat je ale nutné zkontrolovat, zda data ve své kombinaci neumožňují identifikaci konkrétní osoby i po odstranění zjevných osobních údajů. Může se jednat o kombinace typu město, věk a pohlaví a podobné. 
 +  - Data, která není možné nebo vhodné zveřejnit dle předchozího bodu, lze zveřejnit v agregované podobě. Tedy v podobě statistik. V případě zveřejnění statistik je ale žádoucí použít co nejjemnější granularitu dat a časové členění. 
 + 
 +=== Právní aspekty === 
 + 
 +Legislativní rámec otevřených dat v České republice tvoří jejich úprava obsažená v Zákoně č. 106/1999 Sb., o svobodném přístupu k informacím a v Nařízení vlády č. 425/2016 Sb., o seznamu informací zveřejňovaných jako otevřená data, které stanovuje vybraným orgánům veřejné správy povinnost zveřejňovat data z konkrétních jimi spravovaných informačních systémů ve formě otevřených dat. 
 +Podrobnější informace o strategických dokumentech, akčních plánech a souvisejících předpisech ČR i EU jsou k dispozici v aktualizované podobě na stránkách Portálu otevřených dat (POD).
  
 {{tag>"Otevřená data" "Open Data" "OD" "VDF" "Portál otevřených dat" "NKOD" "tematická oblast"}} {{tag>"Otevřená data" "Open Data" "OD" "VDF" "Portál otevřených dat" "NKOD" "tematická oblast"}}