- Česky (cs)
- English (en)
Otevřená data
Popis otevřených dat
Otevřená data jsou:
- Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF (JSON-LD, Turtle, …) a další formáty s otevřenou specifikací.
- Opatřená podmínkami užití neomezujícími jejich užití. Vhodné jsou například licence creative commons.
- Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří.
- Opatřená úplnou dokumentací.
- Opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření, apod.).
- Jsou publikovány dle otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím.
Využívání otevřených dat při výkonu veřejné správy
Nejsou stanovené žádné limitace možného použití publikovaných otevřených dat a lze je tedy využít pro libovolné agendové i neagendové činnosti. Publikovaná data jsou zpřístupněna prostřednictvím NKOD a lze je získat jako soubory s datovými sadami. K datům lze také přistupovat s využitím aplikací třetích stran, které příslušné data využívají. Při importu dat do aplikací a informačních systémů veřejné správy by však měl úřad data čerpat primárně z Propojeného datového fondu a Veřejného datového fondu přes referenční rozhraní.
Publikace otevřených dat
Příprava ISVS pro export otevřených dat
Zásadní je zajištění přístupu k datům IS. Provozovaný IS tedy musí:
- umožňovat přístup k databázi nebo
- mít možnost stahovat volitelně strukturovaná data (tabulky) z reportingového modulu systému, nebo
- nabídnout API, ze kterého se dají pravidelně získávat kompletní data v podobě datových souborů.
Vhodné otevřené formáty:
- tabulková data - CSV, XML, JSON, RDF (JSON-LD, Turtle, …),
- hierarchická data - XML, JSON, RDF (JSON-LD, Turtle, …),
- grafová data - RDF (JSON-LD, Turtle, …),
- geodata(prostorová data) - GeoJSON, ESRI Shapefile, OGC GML, OGC GeoPackage.
Struktura dat musí být zdokumentována lidsky čitelným dokumentem, ale také strojově čitelným schématem. Doporučené jazyky pro definici schémat schémata:
- CSV - schéma CSV on the Web,
- XML - XML Schema,
- JSON - JSON schema,
- RDF - RDFS, OWL, SHACL
Při dodržení výše uvedených bodů jsou získaná kompletní data z IS připravena k publikaci formou otevřených dat.
Export dat nebo API v proprietárním formátu
Pokud se jedná o rozšíření existujícího IS, který neumožňuje export dat nebo nenabízí API ve strojově čitelném a otevřeném formátu a takovou úpravu nelze v IS provést, využije se stávající export či API, které již systém nabízí (např. do MS Excel), a tento výstup se dále zpracuje do otevřeného formátu pomocí dalších nástrojů tak, aby bylo dosaženo stavu jako v případě přímého exportu do otevřeného formátu.
Závěrečná příprava dat k publikaci v podobě otevřených dat
Data získaná z IS jedním z popsaných způsobů je následně třeba publikovat jako otevřená data. To znamená minimálně:
- V případě API zajistit jeho vytěžení pro získání kompletních dat k publikaci (tj. případná přímá publikace API nenaplňuje podmínky otevřených dat)
- Zajistit pravidelnou aktualizaci získaných dat (dle charakteru dat to může být ve frekvenci např. denně, měsíčně nebo ročně)
- Publikovat získaná data na web ke stažení a následně publikovat každou jejich aktualizaci
- Opatřit je dokumentací, podmínkami užití a kontaktem na kurátora
- Katalogizovat je v Národním katalogu otevřených dat (NKOD)
K tomu lze využít nástrojů pro přípravu, publikaci a katalogizaci otevřených dat, jako je třeba LinkedPipes ETL. Publikace otevřených dat by měla být zajištěna koncepčně na úrovni celé organizace. Kompletní postupy jsou k dispozici na POD, včetně vyžadovaných standardů.
Pravidla pro otevřená data
Organizační a procesní zajištění publikace dat
Publikující organizace by měla realizovat vhodná organizační opatření, přiřadit pracovníkům příslušné procesní role a implementovat činnosti publikačních procesů do pracovních náplní pracovníků. Jako minimum je vyžadováno přiřazení těchto klíčových procesních rolí:
Koordinátor otevírání dat, do jehož kompetencí a povinností spadá:
- zajištění součinnosti a kontroly výstupů všech ostatních rolí, které se na otevírání dat podílejí,
- komunikace se všemi zapojenými pracovníky do publikace dat,
- externí komunikace s uživateli otevřených dat VS,
- komunikace a spolupráce s Národním koordinátorem otevřených dat,
- komunikace s Datovou kanceláří a s příslušným Chief data officer (CDO).
Kurátor dat - klíčová role pro:
- zajištění kvality, správnosti, aktuálnosti a tím i právní závaznosti dat konkrétní agendy,
- publikaci datových sad v souladu s platnými právními předpisy ČR a Standardy publikace a katalogizace otevřených dat VS ČR.
Kompletní doporučení, vhodné vzory interních dokumentů, všechny navržené procesní role a standardní publikační procesy jsou uvedeny na Portále otevřených dat a na portále pro poskytovatele.
Ochrana osobních údajů
Pokud jsou předmětem evidence informačního systému osobní údaje ve smyslu zákona č. 110/2019 Sb., o zpracování osobních údajů a nařízení (EU) č. 2016/679, Obecné nařízení o ochraně osobních údajů (GDPR), neznamená to, že nelze ze systému publikovat otevřená data. V těchto případech platí následující doporučení.
- V případě, že se jedná o veřejnou evidenci či rejstřík a zvláštní právní předpis nařizuje zveřejnění informací, lze zveřejnit osobní údaje v podobě otevřených dat.
- Ochranu osobních údajů lze zajistit Anonymizací či Pseudonymizací. Z dat se odstraní osobní údaje a případně se nahradí bezvýznamovým umělým identifikátorem. Data bez osobních údajů se pak mohou zveřejnit v podobě otevřených dat. V závislosti na charakteru dat je ale nutné zkontrolovat, zda data ve své kombinaci neumožňují identifikaci konkrétní osoby i po odstranění zjevných osobních údajů. Může se jednat o kombinace typu město, věk a pohlaví a podobné.
- Data, která není možné nebo vhodné zveřejnit dle předchozího bodu, lze zveřejnit v agregované podobě. Tedy v podobě statistik. V případě zveřejnění statistik je ale žádoucí použít co nejjemnější granularitu dat a časové členění.
Právní aspekty
Legislativní rámec otevřených dat v České republice tvoří jejich úprava obsažená v Zákoně č. 106/1999 Sb., o svobodném přístupu k informacím a v Nařízení vlády č. 425/2016 Sb., o seznamu informací zveřejňovaných jako otevřená data, které stanovuje vybraným orgánům veřejné správy povinnost zveřejňovat data z konkrétních jimi spravovaných informačních systémů ve formě otevřených dat. Podrobnější informace o strategických dokumentech, akčních plánech a souvisejících předpisech ČR i EU jsou k dispozici v aktualizované podobě na stránkách Portálu otevřených dat (POD).
Diskuze