Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revize Předchozí verze Následující verze | Předchozí verze | ||
verejny_datovy_fond [2019/05/15 14:19] – Tomáš Šedivec | nap:verejny_datovy_fond [2021/09/06 09:01] (aktuální) – odkazy otevrena data Tomáš Šedivec | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | {{objekt| | + | ====== Veřejný datový fond ====== |
- | Druh=Tématická oblast/ | + | |
- | Název=Veřejný datový fond| | + | |
- | Popis=Veřejný datový fond.| | + | |
- | Platípro=všechny OVM a OVS| | + | |
- | Spravuje=Tomáš Šedivec| | + | |
- | Gestor=Ministerstvo vnitra, Odbor hlavního architekta| | + | |
- | Platíkedni=30. září 2019}} | + | |
+ | ===== Popis veřejného datového fondu ===== | ||
- | Veřejným datovým fondem | + | Veřejný datový fond (VDF) je definován v [[https:// |
+ | // | ||
- | === Veřejné rejstříky (VDF-VR) | + | ==== Legislativní ukotvení veřejného datového fondu ==== |
- | Veřejnými rejstříky právnických | + | VDF není v legislativě jako pojem explicitně zmíněn. Legislativa pouze zavádí pojmy důležité v rámci VDF a pravidla evidence a sdílení údajů ve VDF. VDF je ukotven v [[https:// |
- | * spolkový rejstřík, | + | Základním pojmem je údaj vedený nebo vytvářený v rámci agendy. Podle § 51 odst. 6, písm. k) [[https:// |
- | * nadační rejstřík, | + | |
- | * rejstřík ústavů, | + | |
- | * rejstřík společenství vlastníků jednotek, | + | |
- | * obchodní rejstřík a | + | |
- | * rejstřík obecně prospěšných společností. | + | |
- | Do veřejného rejstříku se zapisují zákonem stanovené | + | Způsob poskytnutí |
- | Ministerstvo financí uveřejňuje způsobem umožňujícím dálkový | + | V případě údajů spravovaných v AIS se z principu jedná o informace vedené ve strukturované podobě ve vnitřních databázích informačních systémů, které jsou spravovány databázovými systémy. Databázový systém má rozhraní pro získání obsahu údajů, prostřednictvím kterého lze obsah údajů ve strukturované podobě získat. Jejich zveřejnění v otevřeném a strojově čitelném formátu je tedy technicky možné vždy. Zároveň je možné zveřejnit spolu s informací i metadata a při volbě formátu zveřejněné |
- | Údaje z Obchodního rejstříku společně s údaji z Registru | + | Dále je dle § 51 odst. 6, písm. k) [[https:// |
- | Veřejné rejstříky a vzdálený přístup k jejich údajům prostřednictvím ARES předcházely Základním registrům a musí být s nimi sladěny a integrálně nově zařazeny do celkové koncepce eGovernmentu. Koncepce rozvoje | + | Z pohledu [[https:// |
- | | + | {{ :nap-dokument: |
- | - Všechny rejstříky vedle toho, že jsou publikovány na internetu, musí být dostupné jako otevřená data. A to přímo, nebo prostřednictvím OD k ARES. | + | |
- | - Všechny rejstříky musí být pro potřeby agend OVS dostupné přes eGSB, a to buď sdruženě, prostřednictvím ARES, nebo přímo, pokud jejich veřejné údaje nejsou v ARES zahrnuty. | + | |
- | - ARES, jako klíčový veřejný rejstřík s velkým hospodářským dopadem, musí být být průběžně rozvíjen a inovován tak, aby odpovídal aktuálním potřebám občanské i podnikové veřejnosti ČR. | + | |
+ | Jak bylo zmíněno na začátku dokumentu, rozlišení údajů na veřejné a neveřejné provádíme z pohledu sdílení údajů. Ať už se jedná o údaje veřejné nebo neveřejné, | ||
- | === Otevřená data (VDF-OD) === | + | {{ :nap-dokument: |
- | Otevřenými daty se v rámci veřejného datového fondu se rozumí celek obsahující | + | Podle § 51 odst. 6, písm. k) [[https:// |
- | - Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF a další formáty s otevřenou specifikací | + | Pro zajištění přístupu k neveřejnému údaji je dle § 54 odst. 1, písm. d) [[https:// |
- | | + | |
- | - Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří | + | |
- | - Úplný obsah databáze nebo agregovaná statistika | + | |
- | - Opatřená dokumentací | + | |
- | - Připravena s cílem co nejsnazšího strojového zpracování programátory apod. | + | |
- | | + | |
- | - Jsou publikovány | + | |
- | Pokud vaše datová sada nesplňuje všechny uvedené podmínky, nejedná se o otevřená data české | + | Naproti tomu využívání |
- | Otevřenými daty zejména není: | + | {{ :nap-dokument: |
- | - odkaz na vyhledávací formulář určený pro koncové uživatele | + | ==== Principy |
- | - odkaz na novou stránku s dalšími informacemi | + | |
- | - odkaz na veřejné mapové rozhraní GIS | + | |
- | - odkaz na API umožňující přístup k jednotlivým záznamům či vyhledávání záznamů, nikoliv export kompletních dat | + | |
- | - datový soubor ve formátu PDF | + | |
- | - datový soubor | + | |
- | - datový soubor v pseudo-CSV formátu (např. jiný oddělovač než “,”) | + | |
- | Pro zajištění publikace otevřených dat z IS je třeba: | + | Obecným výchozím principem VDF je [[https:// |
- | - Zajistit možnost získávání kompletních dat z IS v podobě datových souborů | + | // |
- | - Zajistit publikaci datových souborů na webu organizace nebo v jejím lokálním katalogu | + | |
- | - Opatřit je lidsky čitelnou dokumentací a strojově čitelným schématem | + | |
- | - Opatřit je otevřenými podmínkami užití | + | |
- | - Zaregistrovat je v Národním katalogu otevřených dat (NKOD) | + | |
- | NKOD je nástroj, ve kterém jednotlivé orgány veřejné správy katalogizují jimi zveřejňovaná otevřená data a jiné orgány | + | VDF zpřístupňuje veřejné |
- | Existence NKOD a povinnost jednotlivých orgánů veřejné správy v něm katalogizovat svá otevřená data je dána zákonem | + | Pro vymezení navazujících pravidel VDF a navržení jeho celkové architektury slouží |
- | Nařízení vlády | + | * P1 (distribuovanost) - VDF zastřešuje a popisuje skutečné datové zdroje poskytující údaje prostřednictvím [[nap: |
+ | * P2 (garance) - pro OVM a SPUÚ čerpající údaje z VDF je garantována technická dostupnost a formální správnost (věcná správnost, úplnost, platnost a pravidelná aktualizace) těchto údajů. | ||
+ | * P3 (otevřená data) - údaje přístupné z VDF jsou zpřístupněny | ||
+ | * P4 (interoperabilita) - údaje jsou z VDF zpřístupněny v podobě, která zajišťuje schopnost různých programových vybavení vzájemně si poskytovat služby a efektivně spolupracovat. | ||
- | Pro naplnění závazků, které vyplývají ze strategických dokumentů, bude zveřejňování otevřených dat povinné pro všechny správce ISVS. Pro zamezení vytváření duplicitních informací ve veřejné správě, které mohou být zveřejňovány, | + | === Princip P1 – distribuovanost === |
- | Průběžná změna legislativního prostředí musí vést k postupnému rozšiřování povinností orgánů veřejné správy zveřejňovat informace reprezentované jako údaje evidované | + | VDF zastřešuje skutečné datové zdroje, které nemusí být centralizovány |
- | Je též nutné legislativně ukotvit povinnost orgánů veřejné správy využívat při výkonu svých agend otevřená data poskytovaná jinými orgány veřejné správy. To se týká především číselníků, kdy jsou stejné číselníky vytvářeny různými orgány veřejné správy. | + | * základní charakteristika datové sady (název, popis apod.), |
+ | * dokumentace datové sady, | ||
+ | * popis technického zpřístupnění datové sady. | ||
- | Různá kvalita otevřených dat komplikuje jejich opakovatelnou použitelnost. Je též téměř nemožné sdílet veřejné údaje mezi orgány veřejné správy jako otevřená data, neboť neexistují žádné garance dostupnosti. Pro zlepšení současného stavu se VDF stane virtuálním distribuovaným datovým prostorem, ve kterém orgány veřejné správy sdílí s veřejností i mezi sebou navzájem veřejné údaje evidované | + | Metadata o datových sadách jsou evidovány v podobě katalogizačních záznamů |
- | * //Národní katalog otevřených dat (NKOD)// | + | === Princip P2 – garance === |
- | * //Nástroj pro správu sémantického slovníku pojmů (NSSSP)// – umožní správu sémantického slovníku pojmů všemi orgány veřejné správy a popisovat jejich otevřená data za účelem sémantické harmonizace otevřených dat. | + | |
- | * //5* (pětihvězdičkový) veřejný datový fond (5VDF)// – bude podmnožinou otevřených dat, které jsou zveřejněny jako propojená otevřená data. Jeho součástí bude index datových entit, který pro každou datovou entitu reprezentovanou v 5VDF poskytuje základní údaje z 5VDF a odkazy na různé její reprezentace v otevřených datech jednotlivých orgánů veřejné správy v 5VDF. | + | |
- | Budou zajištěny kapacity pro vytvoření nových komponent | + | OVM garantuje zpřístupnění veškerých veřejných registrovaných údajů, jejichž je autoritativním zdrojem, prostřednictvím [[nap: |
- | Bude vytvořeno HW a SW prostředí pro provoz komponent VDF-OD. | + | Pro údaje |
- | HW a SW prostředí | + | * OVM může do VDF poskytovat pouze údaje, u kterých je autoritativním zdrojem. |
+ | * OVM poskytující údaje do VDF garantuje správnost, úplnost, platnost | ||
+ | * Infrastruktura | ||
+ | * Pokud OVM či SPUÚ čerpá údaje z VDF, považuje je za správné, úplné, platné a aktuální a nemusí tyto jejich vlastnosti ověřovat. | ||
+ | * Pokud OVM či SPUÚ využívá údaje dostupné ve VDF, přičemž je nezískal přímo z VDF, ale nějakým jiným způsobem, nemůže tyto údaje považovat za správné, úplné, platné ani aktuální. | ||
+ | * Při změně údajů dostupných ve VDF jsou notifikovány všechny OVM a SPUÚ, které údaje využívají. | ||
+ | === Princip P3 – otevřená data === | ||
- | === Možnosti přípravy IS pro otevřená data === | + | Údaje dostupné ve VDF jsou v totožné podobě také povinně publikovány jako [[nap: |
- | Zásadní je mít přístup k datům IS. Provozovaný IS tedy musí: | + | === Princip P4 – interoperabilita === |
- | - umožňovat | + | Dva softwarové systémy jsou interoperabilní, |
- | - mít možnost stahovat volitelně strukturovaná data (tabulky) z reportingového modulu systému nebo | + | |
- | - nabídnout API, ze kterého se dají pravidelně získávat kompletní data v podobě datových souborů | + | |
- | Export | + | * technickou – použití standardních webových technologií pro perzistentní (tj. trvalou) identifikaci údajů a jejich výměnu, |
+ | * syntaktickou – specifikace a dodržování konkrétních formátů | ||
+ | * sémantickou – způsob popisu a mapování datových položek, společné slovníky a jednotná klasifikace pojmů. | ||
- | IS má rozhraní pro pravidelný export dat nebo neomezené API, které organizace může vytěžit | + | Ve VDF je technická, syntaktická |
- | * Pro tabulková data je to CSV | + | ==== Začlenění veřejného datového fondu do výkonu veřejné správy ==== |
- | * Pro hierarchická data je to XML nebo JSON | + | |
- | * Pro grafová data je to RDF | + | |
- | * Pro geodata je to jeden z otevřených formátů pro geodata - GeoJSON, ESRI Shapefile, OGC GML, OGC GeoPackage. | + | |
- | Struktura dat je zdokumentována jednak lidsky čitelným dokumentem a jednak strojově čitelným schématem. | + | === Využití veřejného datového fondu pro doplnění datového kmene agendy === |
- | * Pro CSV je to schéma CSV on the Web | + | Základem pro výkon agendy |
- | * Pro XML je to XML Schema | + | |
- | * Pro JSON je to JSON schema | + | |
- | * Pokud je použit vlastní slovník pro RDF, je popsán pomocí RDFS nebo OWL | + | |
- | V takovém případě jsou získaná kompletní data z IS připravena k publikaci formou otevřených dat. | + | {{ : |
+ | === Přístup veřejnosti k údajům === | ||
- | === Export dat nebo API v proprietárním formátu === | + | K údajům veřejné správy má možnost přístupu ke čtení i veřejnost. |
- | Pokud se jedná o rozšíření existujícího IS, který neumožňuje export dat nebo nenabízí API ve strojově čitelném a otevřeném formátu a takovou úpravu nelze ve Vašem IS provést, využije se stávající export či API, které váš IS již umí (např. do MS Excel), a tento výstup se dále zpracuje do otevřeného | + | Přístup |
+ | Přístup veřejnosti k neveřejným údajům je realizován prostřednictvím řízeného přístupu. Pro tento přístup ale platí, že je možný pouze na základě definovaných oprávnění konkrétním subjektům práva. Pravidla řízeného přístupu však budou teprve popsána a zde se jim dále nevěnujeme. | ||
- | === Následná příprava dat k publikaci v podobě otevřených dat === | + | {{ : |
- | Data získaná z IS jedním z popsaných způsobů je následně třeba publikovat jako otevřená data. To znamená minimálně: | + | ==== Základní struktura veřejného datového fondu ==== |
- | - V případě API zajistit jeho vytěžení pro získání kompletních dat k publikaci (tj. případná přímá publikace API nenaplňuje podmínky otevřených dat) | + | Vnitřní architektura VDF je kromě samotných veřejných registrovaných údajů datového fondu VS ČR tvořena také dílčími nástroji. Dílčí nástroje jsou primárně určeny pro ukládání obsahu datových sad a práci s metadaty datových sad. Dále je tvořen souborem pravidel, postupů a doporučení, |
- | - Zajistit pravidelnou aktualizaci získaných dat (dle charakteru dat to může být ve frekvenci např. denně, měsíčně nebo ročně) | + | |
- | - Publikovat získaná data na web ke stažení | + | |
- | - Opatřit je dokumentací, podmínkami užití | + | |
- | - Katalogizovat | + | |
- | K tomu lze využít nástrojů pro přípravu, publikaci a katalogizaci otevřených dat, jako je třeba LinkedPipes ETL. | + | Přístup k údajům prostřednictvím VDF je technicky zajišťován |
- | Publikace otevřených dat by měla být zajištěna koncepčně na úrovni celé organizace. Kompletní postupy jsou k dispozici na Portálu otevřených dat, naleznete zde rovněž informace o školeních a workshopech, | + | * přístup k datovým souborům s obsahem datových sad ke stažení (povinně) |
+ | * přístup ke konkrétní položce datové sady prostřednictvím REST API (volitelně) | ||
+ | * dotazování nad obsahem datové sady prostřednictvím SPARQL API (volitelně) | ||
- | Pro příklad vhodného způsobu zveřejnění datové sady v lokálním katalogu se lze podívat | + | Přístup je zajištěn pomocí služeb [[nap: |
+ | * čtení publikovaného datového souboru s obsahem datové sady | ||
+ | * čtení publikované položky datové sady | ||
+ | * dotazování nad obsahem datové sady | ||
- | === Ochrana osobních údajů === | + | Tyto nové služby nemohou být z výše uvedených důvodů poskytovány prostřednictvím [[nap: |
- | Pokud jsou předmětem evidence informačního systému osobní údaje ve smyslu zákona č. 101/2000 Sb., o ochraně osobních údajů a nařízení (EU) č. 2016/679, Obecné nařízení | + | Do VDF publikují jednotlivé AIS i [[nap: |
- | - Pakliže se jedná o veřejnou evidenci či rejstřík a zvláštní právní předpis nařizuje zveřejnění informací, lze zveřejnit osobní údaje v podobě otevřených dat. | + | ISGOD je logickým zastřešením několika aplikačních komponent tvořících prostředí VDF. Komponenty jsou popsány |
- | - Anonymizace | + | |
- | - Agregace. Data, která není možné nebo vhodné zveřejnit dle předchozího bodu, lze zveřejnit v agregované podobě. Tedy v podobě statistik. V případě zveřejnění statistik je žádoucí použít co nejjemnější možné členění.Tedy například počet přijatých podání uvádět raději po měsících namísto jen po letech. | + | |
- | Více informací naleznete | + | === Úložiště datových sad === |
+ | |||
+ | Úložiště datových sad slouží k ukládání obsahu registrovaných veřejných údajů vedených v daném publikujícím ISVS v podobě distribucí datových sad. Pro každý publikující ISVS je vytvořeno úložiště, | ||
+ | |||
+ | * kontrolu souladu nahrávaného obsahu s otevřenými formálními normami | ||
+ | * transformaci obsahu do všech podob daných otevřenými formálními normami s pomocí transformačních skriptů definovaných otevřenými formálními normami | ||
+ | * zpřístupnění těchto podob jako distribuce datových sad, a to jako | ||
+ | * datové soubory ke stažení (povinně) | ||
+ | * API umožňující přistoupit ke každé jednotlivé položce datové sady (nepovinně) | ||
+ | * API umožňující dotazování nad obsahem uložených datových sad pomocí dotazovacího jazyka SPARQL (nepovinně) | ||
+ | * garantovanou dostupnost distribucí datových sad při přístupu prostřednictvím ISGOD | ||
+ | * požadovaná úroveň dostupnosti distribucí je stejná jako požadovaná úroveň dostupnosti ostatních služeb [[nap: | ||
+ | * negarantovanou dostupnost distribucí datových sad při přístupu prostřednictvím veřejného internetu | ||
+ | |||
+ | Úložiště datových sad daného publikujícího ISVS není novým ISVS, ale je součástí publikujícího ISVS. | ||
+ | |||
+ | Softwarový nástroj úložiště datových sad může správce ISVS vyvinout vlastní nebo může využít volně dostupný open-source nástroj nabízený a udržovaný MV ČR. | ||
+ | |||
+ | === Národní katalog otevřených dat === | ||
+ | |||
+ | V NKOD jsou evidovány katalogizační záznamy o všech datových sadách dostupných ve VDF. Za katalogizaci datových sad je zodpovědný publikující ISVS, který nahrává obsah do svého úložiště datových sad jako distribuce obsahu datové sady. Publikující ISVS poskytuje API dle [[https:// | ||
+ | |||
+ | Čtenáři údajů z VDF mohou v NKOD vyhledávat datové sady a získávat tak metadata popisující přístup k jejich distribucím prostřednictvím VDF. Metadata také popisují přístup k distribucím prostřednictvím otevřeného přístupu. | ||
+ | |||
+ | Správcem NKOD je MV ČR. | ||
+ | |||
+ | === Registr práv a povinností === | ||
+ | |||
+ | V [[nap: | ||
+ | |||
+ | Pro potřeby otevřeného přístupu i VDF je pro každý veřejných číselník evidováno IRI datové sady v NKOD, ve které je obsah číselníku přístupný. To samé platí pro veřejný údaj, pouze může být datových sad více. | ||
+ | |||
+ | Čtenáři údajů z VDF vyhledávají v [[nap: | ||
+ | |||
+ | V [[nap: | ||
+ | |||
+ | Správcem [[nap: | ||
+ | |||
+ | === Katalog uživatelů dat === | ||
+ | |||
+ | Katalog uživatelů dat eviduje, jaké datové sady z VDF čerpají konkrétní OVM a SPUÚ. Registraci čerpání datové sady provádí OVM či SPUÚ za účelem získávání notifikací | ||
+ | |||
+ | Registrace mj. obsahuje: | ||
+ | |||
+ | * IRI OVM či SPUÚ | ||
+ | * IRI datové sady | ||
+ | * požadovanou maximální frekvenci notifikací (ihned, hodinová, denní, týdenní, ...) | ||
+ | * požadovaný způsob | ||
+ | |||
+ | Správcem katalogu uživatelů dat je MV ČR. | ||
+ | |||
+ | === Notifikační hub === | ||
+ | |||
+ | Notifikační hub je nástroj zajišťující s pomocí katalogu uživatelů dat notifikační službu, která informuje subjekty registrované v katalogu uživatelů dat ke čtení datových sad z VDF o změnách v datových sadách. Jedná se o automatickou notifikaci o změnách zjištěných při ohlášení změny ze strany poskytujícího ISVS. | ||
+ | |||
+ | Notifikační hub je implementován na bázi mezinárodního standardu [[https:// | ||
+ | |||
+ | Správcem Notifikačního hubu je MV ČR. | ||
+ | |||
+ | === Směrovací služba === | ||
+ | |||
+ | Distribuce datové sady je v otevřených datech zpřístupněna jako datový soubor ke stažení nebo jako API, které umožňuje získat data každé jednotlivé položky datové sady (entity), o níž jsou v datové sadě reprezentovány údaje. Přístup k údajům je realizován s pomocí tzv. dereference identifikátoru položky. V otevřených datech jsou jako identifikátory použity tzv. IRI (Internationalized resource identifier, více viz [[https:// | ||
+ | |||
+ | IRI položky vyplývá z úložiště datových sad, na kterém je datová sada s položkou fyzicky uložena a z [[https:// | ||
+ | |||
+ | Pro veřejný údaj je nutné, aby správce ISVS, ze kterého se obsah údaje publikuje, zavedl identifikátory položek datové sady do směrovací služby a určil | ||
+ | |||
+ | Při změně úložiště datových sad nebo obecně při změně lokálních IRI je upraveno směrování ve směrovací službě. Tím je zajištěna perzistence IRI, která umožňuje trvalé a neměnné propojení údajů o stejné položce napříč různými datovými zdroji nezávisle na poskytovatelích těchto údajů. | ||
+ | |||
+ | Správcem směrovací a indexační služby je MV ČR. | ||
+ | |||
+ | ===== Pravidla veřejného datového fondu ===== | ||
+ | |||
+ | ==== Pravidla pro údaje zpřístupněné veřejným datovým fondem ==== | ||
+ | |||
+ | Ve VDF jsou zpřístupňovány veřejné registrované údaje spravované jednotlivými OVM. Pro údaje zpřístupněné prostřednictvím VDF platí: | ||
+ | |||
+ | * Údaje jsou zpřístupněny v datových sadách prostřednictvím [[nap: | ||
+ | * Datové sady jsou navíc publikovány prostřednictvím otevřeného přístupu (tj. jako otevřená data dle § 3 odst. 11 [[https:// | ||
+ | * Otevřený přístup i přístup prostřednictvím VDF jsou tedy dva přístupy ke stejnému obsahu v podobě otevřených dat. | ||
+ | * První je určen pro veřejnost, druhý je určen pro OVM a SPUÚ a je realizován prostřednictvím [[nap: | ||
+ | * Datové sady jsou popsány v podobě katalogizačních záznamů (metadat) v NKOD. | ||
+ | * Datové sady jsou fyzicky dostupné v podobě distribucí. Různé distribuce stejné datové sady zpřístupňují její obsah v různých formátech a prostřednictvím různých přístupových mechanismů. Proto je každá distribuce zaznamenána v katalogizačním záznamu datové sady v NKOD. VDF předpokládá tři následující způsoby zpřístupnění obsahu datové sady, z nichž první je povinný a zbylé dva jsou volitelné: | ||
+ | * v podobě datového souboru s kompletním obsahem datové sady ke stažení, | ||
+ | * v podobě API, které umožňuje přistupovat ke kompletním údajům o každé jednotlivé entitě či konceptu, o němž jsou v datové sadě reprezentovány údaje, prostřednictvím dereference identifikátoru entity či konceptu, který je stanoven poskytovatelem údajů v podobě IRI (Internationalized Resource Identifier, více viz [[https:// | ||
+ | * v podobě API, které umožňuje dotazování nad obsahem datové sady s pomocí dotazovacího jazyka SPARQL | ||
+ | * Informace o veřejnosti registrovaného údaje je zachycena v jeho evidenci v [[nap: | ||
+ | * Pro veřejný údaj obsahuje [[nap: | ||
+ | * Pro údaj kódovaný číselníkem obsahuje [[nap: | ||
+ | |||
+ | Vlastní mechanismus zpřístupnění údajů do VDF přibližuje dále uvedený obrázek na několika příkladech údajů „agendy 1“. Čísla v kroužcích na obrázku označují jednotlivé příklady. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | - V [[nap: | ||
+ | * Oba údaje jsou dostupné prostřednictvím stejné datové sady. | ||
+ | * V [[nap: | ||
+ | * Datová sada je publikovaná a dostupná v několika distribucích, | ||
+ | - V [[nap: | ||
+ | - Agenda 1 vytváří a udržuje číselník, | ||
+ | - V [[nap: | ||
+ | - U údaje D je v [[nap: | ||
+ | - V [[nap: | ||
+ | - Reprezentuje přístup k distribucím datových sad prostřednictvím VDF. | ||
+ | |||
+ | ==== Pravidla sdílení veřejných údajů prostřednictvím VDF ==== | ||
+ | |||
+ | === Pravidla publikace veřejných údajů do VDF === | ||
+ | |||
+ | Základní prvky architektury VDF z pohledu poskytovatele údajů zobrazuje následující obrázek. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Poskytovatelem údajů do VDF je správce ISVS, ve kterém jsou vedeny registrované veřejné údaje. Tento ISVS je vyznačen na levé straně obrázku jako //systém pro správu datového kmene//, kterým OVM spravuje svůj datový kmen. V praxi se samozřejmě může jednat o více ISVS, zde si pro jednoduchost zobrazujeme jen jeden systém. | ||
+ | |||
+ | Pro potřeby sdílení údajů ve VDF poskytovatel údajů vytvoří //systém pro zpřístupnění údajů prostřednictvím VDF//. Může se jednat o samostatný systém nebo to může být modul v rámci existujícího systému. Zajišťuje získávání obsahu veřejných údajů z datového kmene poskytovatele, | ||
+ | |||
+ | // | ||
+ | |||
+ | Poté, co jsou distribuce obsahu datových sad uloženy v úložišti a zpřístupněny, | ||
+ | |||
+ | Celý proces publikace údajů sdružených v jedné datové sadě do VDF je znázorněn na následujícím diagramu. Proces předpokládá, | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | V rámci procesu: | ||
+ | |||
+ | * Systém pro zpřístupnění údajů | ||
+ | * Připraví obsah datové sady v podobě datového souboru v jednom z formátů definovaných otevřenými formálními normami. | ||
+ | * Specifikaci otevřených formálních norem lze získat z repozitáře otevřených formálních norem. | ||
+ | * Pokud pro údaje neexistuje otevřená formální norma, musí ji správce systému pro zpřístupnění údajů s podporou MV ČR nejprve vytvořit. | ||
+ | * Zašle připravený obsah datové sady do úložiště datových sad. | ||
+ | * Úložiště datových sad | ||
+ | * Provede technickou kontrolu zaslaného obsahu | ||
+ | * Kontrola správného formátování (např. JSON nebo XML formátování) | ||
+ | * Kontrola validity datové struktury vůči datovým schématům definovaných otevřenými formálními normami (např. vůči JSON nebo XML schématům) | ||
+ | * V případě špatné syntaxe zašle zpět systému pro zpřístupnění údajů chybové hlášení a skončí. | ||
+ | * Vytvoří distribuce obsahu jeho transformací do všech podob definovaných otevřenými formálními normami s využití transformačních skriptů/ | ||
+ | * Zpřístupní vytvořené distribuce | ||
+ | * Zpřístupní je jako datové soubory dostupné ke stažení prostřednictvím ISGOD a z veřejného internetu. | ||
+ | * URL pro stažení datového souboru je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí veřejného internetu. | ||
+ | * Volitelně zpřístupní jednotlivé položky obsahu dle [[https:// | ||
+ | * Referenční IRI položky je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí veřejného internetu. | ||
+ | * Lokální IRI položky je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí veřejného internetu. | ||
+ | * Volitelně zpřístupní jejich obsah v podobě SPARQL endpointu prostřednictvím ISGOD a ve veřejném internetu. | ||
+ | * URL SPARQL endpointu je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí veřejného internetu. | ||
+ | * Zašle zpět systému pro zpřístupnění údajů potvrzení o úspěšném uložení. | ||
+ | * Jako součást potvrzení zasílá metadata o vytvořených distribucích v [[https:// | ||
+ | * Systém pro zpřístupnění údajů | ||
+ | * Vytvoří kompletní katalogizační záznam o datové sadě včetně metadat o distribucích vytvořených úložištěm datových sad a zpřístupní jej prostřednictvím API dle [[https:// | ||
+ | * Zašle notifikačnímu hubu informaci o změně obsahu datové sady. | ||
+ | * Úroveň detailu informace není v tomto místě řešena. | ||
+ | * Národní katalog otevřených dat | ||
+ | * Získá katalogizační záznam z API poskytnutého systémem pro zpřístupnění údajů a zaeviduje jej. | ||
+ | * Ohlašovatel agendy | ||
+ | * Ohlásí do [[nap: | ||
+ | * Notifikační hub | ||
+ | * Zaeviduje informaci o změně datové sady zaslanou úložištěm datových sad. | ||
+ | |||
+ | Systém pro zpřístupnění údajů prostřednictvím VDF souvisí s existujícím systémem pro zpřístupnění údajů prostřednictvím [[nap: | ||
+ | |||
+ | [[nap: | ||
+ | |||
+ | Protože ale kontexty pro [[nap: | ||
+ | |||
+ | === Čtení veřejných údajů z VDF === | ||
+ | |||
+ | Základní stavební kameny architektury VDF z pohledu čtenáře údajů zobrazuje následující obrázek. | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | Čtenářem údajů z VDF je správce ISVS, který čte veřejné údaje. Tento ISVS je v obecné úrovni vyznačen na levé straně obrázku jako //systém pro čtení údajů z VDF// (dále jen //systém pro čtení údajů// | ||
+ | |||
+ | Systém pro čtení údajů čte veřejné údaje z VDF jako otevřená data prostřednictvím ISGOD v podobě distribucí datových sad v různých formátech definovaných otevřenými formálními normami. Jsou umožněny 3 základní druhy přístupu prostřednictvím ISGOD: | ||
+ | |||
+ | -Přístup ke kompletnímu obsahu datové sady v podobě datových souborů voláním | ||
+ | -služeb ISGOD umožňujících přistoupit k metadatům o datové sadě a jejích distribucích na základě jejich referenčních IRI a k URL daného souboru a stáhnout jej. (povinné) | ||
+ | -Přístup k jednotlivým položkám datových sad voláním služeb ISGOD umožňujících přistoupit k datům o dané položce na základě jejího referenčního IRI. (volitelné) | ||
+ | -Dotazování nad položkami datových sad voláním dotazovacích služeb ISGOD. (volitelné) | ||
+ | |||
+ | Služby ISGOD jsou realizovány jako webové služby postavené na principech REST, které jsou poskytovány jednotlivými komponentami VDF znázorněnými v pravé části obrázku: | ||
+ | |||
+ | * REST služby NKOD umožňují číst metadata o datových sadách a jejich distribucích. | ||
+ | * REST služby úložiště datových sad umožňují číst obsah v nich uložených datových sad v podobě | ||
+ | * stahování datových souborů s obsahem uložených datových sad (povinné) | ||
+ | * přístupu k IRI jednotlivých položek obsahu uložených datových sad (volitelné) | ||
+ | * SPARQL dotazů nad obsahem uložených datových sad (volitelné) | ||
+ | |||
+ | ISGOD je pouhým logickým zastřešením výše uvedených služeb. | ||
+ | |||
+ | == Čtení obsahu datové sady v podobě datového souboru == | ||
+ | |||
+ | Čtení obsahu datové sady v podobě datového souboru typicky systém pro čtení údajů provádí za účelem aktualizace vlastní kopie údajů přebíraných z VDF. Aktualizaci typicky provádí v pravidelných intervalech nebo na základě notifikací o změnách zasílaných notifikačním hubem na základě registrace v katalogu uživatelů, | ||
+ | |||
+ | * Systém pro čtení údajů přistupuje k referenčnímu IRI datové sady. | ||
+ | * Směrovací služba přesměrovává referenční IRI datové sady na lokální IRI datové sady v NKOD. | ||
+ | * Systém pro čtení údajů přistupuje k lokálnímu IRI datové sady v NKOD. | ||
+ | * NKOD vrací metadata o datové sadě. | ||
+ | * Systém pro čtení údajů vybírá distribuci datové sady dle potřebného formátu a přistupuje k URL ke stažení obsahu distribuce. | ||
+ | * Úložiště datových sad zasílá systému pro čtení údajů obsah datového souboru na daném URL. | ||
+ | |||
+ | Následující obrázek postup znázorňuje v podobě sekvenčního UML diagramu na konkrétním příkladu přístupu k datové sadě “Služby veřejné správy”, která je publikována z [[nap: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | == Čtení položky datové sady == | ||
+ | |||
+ | Čtení položky datové sady typicky systém pro čtení údajů provádí za účelem zobrazení veřejných údajů o položce v uživatelském rozhraní nebo jiné práce s konkrétní položkou v okamžiku potřeby práce s údaji o položce, tj. v rámci svého run-time. Přístup k položce předpokládá, | ||
+ | |||
+ | * V předchozích krocích byl přečten z VDF údaj s referenčním IRI jako hodnotou. | ||
+ | * V předchozích krocích byl přečten z [[nap: | ||
+ | |||
+ | Přístup je pak realizován následujícím postupem: | ||
+ | |||
+ | * Systém pro čtení údajů přistupuje k referenčnímu IRI položky. | ||
+ | * Směrovací služba přesměrovává referenční IRI položky na lokální IRI položky v konkrétním úložišti datových sad, kde jsou údaje o položce uloženy. | ||
+ | * Systém pro čtení údajů přistupuje k lokálnímu IRI položky na daném úložišti datových sad. | ||
+ | * Úložiště datových sad vrací veřejné údaje o položce. | ||
+ | * Systém pro čtení údajů zobrazuje nebo jinak zpracovává získané údaje. | ||
+ | |||
+ | Následující obrázek postup znázorňuje v podobě sekvenčního UML diagramu na konkrétním příkladu přístupu k veřejným údajům o službě evidované v [[nap: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | ==== Pravidla sdílení veřejných číselníků prostřednictvím VDF ==== | ||
+ | |||
+ | Speciálním případem sdílení veřejných údajů prostřednictvím VDF je pak sdílení veřejných číselníků. Vychází z architektury sdílení veřejných údajů popsané v předchozí kapitole. Má však svá specifika, která jsou popsána zde. | ||
+ | |||
+ | === Pravidla publikace veřejných číselníků do VDF === | ||
+ | |||
+ | Architektura pro publikaci veřejných číselníků do VDF je vystavěna na bázi architektury pro publikaci veřejných údajů do VDF. Aby byl veřejný číselník publikován do VDF, musí být podle § 51 odst. 8 [[https:// | ||
+ | |||
+ | Všechny veřejné číselníky jsou tedy jako referenční údaje evidovány v [[nap: | ||
+ | |||
+ | K realizaci výše popsané architektury publikace veřejných číselníků do VDF a jako otevřená data je nutno zajistit následující rozšíření informačního systém AIS působnostní a [[nap: | ||
+ | |||
+ | - označování veřejnosti a neveřejnosti údaje | ||
+ | - včetně odkazů na legislativu v případě neveřejnosti údaje | ||
+ | - včetně IRI datových sad v NKOD, prostřednictvím kterých je veřejný údaj publikován | ||
+ | - evidenci veřejných číselníků | ||
+ | - pro každý veřejný číselník existuje 1..- verzí, které chápeme jako jednotlivé datové sady | ||
+ | - všechny datové sady reprezentující jednotlivé verze číselníku jsou seskupeny do zastřešující datové sady | ||
+ | - pro zastřešující datovou sadu a jednotlivé verze jsou evidována metadata [[https:// | ||
+ | - mimo vlastnosti [[https:// | ||
+ | - kterým je u číselníků vždy MV ČR, nikoliv poskytovatel číselníku | ||
+ | - pro zastřešující datovou sadu je navíc evidováno | ||
+ | - OVM, který zavádí veřejný číselník do [[nap: | ||
+ | - což není poskytovatel datové sady s číselníkem do VDF, kterým je v případě veřejných číselníků vždy MV ČR, viz předchozí bod | ||
+ | - pro verzi číselníku je navíc evidováno | ||
+ | - lokální proprietární identifikátor či kód číselníku | ||
+ | - potřebné pro konstrukci lokálních IRI číselníků a jejich položek | ||
+ | - může vyplnit poskytovatel číselníku nebo je vygenerováno automaticky, | ||
+ | - pro datové sady reprezentující jednotlivé verze číselníku jsou navíc evidovány následující vazby, které nejsou evidovány pro zastřešující datovou sadu: | ||
+ | - Je verzí (reference na zastřešující datovou sadu) | ||
+ | - Má předchozí verzi (reference na datovou sadu s předchozí verzí číselníku, | ||
+ | - zavedení nového veřejného číselníku poskytovatelem číselníku | ||
+ | - poskytovatel číselníku specifikuje metadata pro zastřešující datovou sadu číselníku | ||
+ | - lze převzít nebo jinak použít [[https:// | ||
+ | - poskytovatel číselníku specifikuje metadata pro datovou sadu s první verzí číselníku | ||
+ | - může zvolit možnost kopírovat hodnoty zadané pro zastředující datovou sadu | ||
+ | - poskytovatel číselníku předá obsah první verze číselníku ručně v uživatelském rozhraní nahráním připraveného souboru s obsahem první verze veřejného číselníku v podobě definované otevřenou formální normou | ||
+ | - předchozí tři body lze realizovat také automatizovaně načtením seznamu veřejných číselníků poskytovatele z URL, které zadá | ||
+ | - seznam musí být zpřístupněn dle [[https:// | ||
+ | - veřejné číselníky ale nemusí být pro účely předání zpřístupněny jejich správcem jako otevřená data. | ||
+ | - předaný obsah je zvalidován vůči otevřené formální normě pro číselníky | ||
+ | - obsah je uložen v podobě zkontrolovaného předaného datového souboru | ||
+ | - obsah veřejného číselníku pouze eviduje, ale nejsou nad ním stavěny žádné aplikační funkce | ||
+ | - zavedení nové verze již zavedeného veřejného číselníku poskytovatelem číselníku | ||
+ | - stejný postup jako při zavádění nového veřejného číselníku, | ||
+ | - původní verze zůstává evidována včetně její publikace do VDF a jako otevřená data | ||
+ | - funkcionality systému pro zpřístupnění údajů prostřednictvím VDF | ||
+ | - veřejné číselníky již jsou evidovány v podobě souborů s jejich jednotlivými verzemi v podobě definované otevřenými formálními normami, čili je nutno pouze zajistit jejich předání do úložiště veřejných číselníků a datových sad [[nap: | ||
+ | - další veřejné údaje evidované v [[nap: | ||
+ | - funkcionality úložiště veřejných číselníků a datových sad [[nap: | ||
+ | - bude vytvořeno ze stávajícího úložiště obsahu datových sad publikovaných z [[nap: | ||
+ | - jako doposud bude zpřístupňovat obsah [[nap: | ||
+ | - zajistí také publikaci distribucí datových sad s verzemi veřejných číselníků evidovaných v [[nap: | ||
+ | - jelikož se jedná pouze o komponentu v rámci AIS působnostní, | ||
+ | - je nutné zajistit dostupnost nejen z veřejného internetu jako doposud, ale také prostřednictvím ISGOD ([[nap: | ||
+ | - funkcionality lokálního katalogu otevřených dat pro katalogizaci datových sad publikovaných v úložišti veřejných číselníků a datových sad [[nap: | ||
+ | - zpřístupňuje do NKOD katalogizační záznam pro každou datovou sadu: | ||
+ | - datové sady zastřešující verze číselníků a datové sady s verzemi číselníků | ||
+ | - metadata o datových sadách jsou získány od poskytovatele | ||
+ | - metadata o distribucích jsou doplněny automatizovaně na základě vytvářených distribucí v úložišti | ||
+ | - datové sady s obsahem dalších veřejných údajů evidovaných v [[nap: | ||
+ | - metadata jsou fixně předvyplněna | ||
+ | - je registrován pod MV ČR | ||
+ | - označování údaje jako údaje kódovaného verzí veřejného číselníku | ||
+ | - včetně zaznamenávání IRI datové sady s touto verzí veřejného číselníku z NKOD | ||
+ | - Aby mohlo být IRI zaznamenáno, | ||
+ | - evidence veřejných údajů využívaných ohlášenou agendou | ||
+ | |||
+ | |||
+ | Kromě nových verzí veřejného číselníku existuje možnost, že je číselník kompletně nahrazen zcela novým číselníkem. V tom případě je skutečně zaveden jako zcela nový číselník bez vazby na původní číselník. Původní číselník ale zůstává evidován. | ||
+ | |||
+ | Číselníky kódující údaje evidované v [[nap: | ||
+ | |||
+ | === Pravidla čtení veřejných číselníků z VDF === | ||
+ | |||
+ | Čtení veřejných číselníků včetně jejich obsahu jako celku v podobě datových souborů ke stažení (VDF), přístupu k jednotlivým položkám datových sad s verzemi číselníků (VDF a otevřená data) a dotazování prostřednictvím SPARQL endpointu (otevřená data) probíhá v rámci [[# | ||
+ | |||
+ | ==== Technická pravidla pro aplikační komponenty veřejného datového fondu ==== | ||
+ | |||
+ | === Úložiště datových sad === | ||
+ | |||
+ | Úložiště datových sad je složeno ze 3 modulů: | ||
+ | |||
+ | * souborové úložiště distribucí datových sad | ||
+ | * ukládá distribuce v podobě datových souborů | ||
+ | * zpřístupňuje datové soubory distribucí prostřednictvím VDF a veřejného internetu | ||
+ | * každý datový soubor je dostupný na jednom URL, které je stejné pro VDF i veřejný internet | ||
+ | * nutno správně nastavit DNS pro KIVS/CMS a DNS pro veřejný internet | ||
+ | * modul pro validaci a transformaci distribucí dle příslušných otevřených formálních norem | ||
+ | * kontroluje správné formátování a validitu | ||
+ | * provádí transformace mezi jednotlivými formáty s využitím definic transformací v otevřených formálních normách | ||
+ | * ukládá výsledky transformací do souborového úložiště a v případě RDF distribucí také do triplestore | ||
+ | * bez definované otevřené formální normy pro daný typ dat není možné údaje prostřednictvím VDF zpřístupňovat | ||
+ | * příslušnou otevřenou formální normu nebo normy získává modul z repozitáře otevřených formálních norem | ||
+ | * triplestore pro ukládání RDF distribucí | ||
+ | * ukládá RDF distribuce datové sady dle otevřených formálních norem v triplestore (triplestore = databázový systém pro ukládání RDF dat v podobě trojic) | ||
+ | * zpřístupňuje SPARQL endpoint pro dotazování nad RDF reprezentací a HTTP dereferenci IRI položek prostřednictvím rozhraní pro čtení distribucí jako otevřená data | ||
+ | * lokální IRI položky je stejné pro VDF i veřejný internet, URL SPARQL endpointu stejné pro VDF i veřejný internet | ||
+ | * nutno správně nastavit DNS pro KIVS/CMS a DNS pro veřejný internet | ||
+ | |||
+ | === Směrovací služba pro veřejné číselníky a jejich položky === | ||
+ | |||
+ | Jak bylo popsáno výše veřejný číselník bude podle otevřené formální normy pro číselníky zpřístupněn jako datový soubor ke stažení a prostřednictvím dereference IRI jednotlivých položek. Je tedy nutno určit tvar referenčních a lokálních IRI položek veřejných číselníků a také samotných číselníků. Ta jsou určena dle [[https:// | ||
+ | |||
+ | * Referenční IRI číselníku: | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Referenční IRI verze číselníku k DDDD-MM-YY | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Lokální IRI číselníku: | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Lokální IRI verze číselníku: | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Referenční IRI položky číselníku: | ||
+ | |||
+ | < | ||
+ | |||
+ | * Lokální IRI položky číselníku: | ||
+ | |||
+ | < | ||
+ | |||
+ | Kde | ||
+ | |||
+ | * <ID číselníku v RPP> značí neměnné veřejné ID identifikující číselník v RPP | ||
+ | * < | ||
+ | * < | ||
+ | |||
+ | Pro potřeby sdílení veřejných číselníků je ve směrovací službě směrování výše uvedených referenčních IRI na lokální IRI přednastaveno a není potřeba, aby správce [[nap: | ||
+ | |||
+ | Dále je potřeba ve směrovací službě nastavit směrování na referenční IRI pro případy, kdy je znám pouze < | ||
+ | |||
+ | (<RPP identifikátor agendového údaje>, < | ||
+ | |||
+ | na referenční IRI | ||
+ | |||
+ | https: | ||
+ | |||
+ | ===== Příloha 1: Metodika poskytování a čerpání údajů prostřednictvím VDF ===== | ||
+ | |||
+ | - Postupy zpřístupňování údajů prostřednictvím VDF | ||
+ | * Určení údajů poskytovaných do VDF | ||
+ | * Návrh podoby datových sad a jejich distribucí | ||
+ | * Příprava informačního systému pro export dat | ||
+ | * Export údajů do distribucí datových sad | ||
+ | * Publikace distribucí datových sad | ||
+ | * Aktualizace údajů, archivace a notifikace | ||
+ | * Katalogizace datové sady | ||
+ | * Registrace lokálního katalogu | ||
+ | * Evidence odkazů na datové sady v [[nap: | ||
+ | - Postupy čerpání údajů prostřednictvím VDF | ||
+ | * Vyhledávání datových sad s údaji | ||
+ | * Import údajů z datových sad do informačního systému | ||
+ | * Příjem notifikací o změnách v datových sadách | ||
+ | |||
+ | Přístupy se liší nejen v tom, jaké údaje zpřístupňují a komu je zpřístupňují, | ||
+ | |||
+ | ===== Příloha 2: Srovnání vlastností jednotlivých způsobů přístupu ===== | ||
+ | |||
+ | | |**Přístup k PPDF** | ||
+ | |**úroveň garance kvality obsahu** | ||
+ | |**úroveň garance zpřístupněných údajů pro výkon agend veřejné správy**|vysoká dostupnost, | ||
+ | |**sjednocený popis zpřístupněných údajů** | ||
+ | |**centrální popis způsobu zpřístupnění údajů** | ||
+ | |**podoba definice datových formátů pro zpřístupnění** | ||
+ | |**systém pro správu oprávnění** | ||
+ | |**systém pro vedení evidence přístupu k údajům** | ||
+ | |**identifikace subjektů a objektů práva** | ||
+ | |||
+ | |||
+ | |||
+ | {{tag>" | ||
- | === Právní aspekty === | ||
- | Legislativní rámec otevřených dat v České republice tvoří jejich úprava obsažená v Zákoně č. 106/1999 Sb., o svobodném přístupu k informacím a v Nařízení vlády č. 425/2016 Sb., o seznamu informací zveřejňovaných jako otevřená data, které stanovuje vybraným orgánům veřejné správy povinnost zveřejňovat data z konkrétních jimi spravovaných informačních systémů ve formě otevřených dat. | ||
- | Více informací o strategických dokumentech, | ||