Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revize Předchozí verze Následující verze | Předchozí verze | ||
verejny_datovy_fond [2019/08/05 22:24] – /* Správa dat VS ČR */ dchocholaty | nap:verejny_datovy_fond [2021/09/06 09:01] (aktuální) – odkazy otevrena data Tomáš Šedivec | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
- | {{objekt| | + | ====== Veřejný datový fond ====== |
- | Druh=Funkční celek| | + | |
- | Název=Veřejný datový fond| | + | |
- | Popis=Veřejný datový fond.| | + | |
- | Platípro=všechny OVM a OVS| | + | |
- | Spravuje=Tomáš Šedivec| | + | |
- | Gestor=Ministerstvo vnitra, Odbor hlavního architekta| | + | |
- | Platíkedni=30. září 2019}} | + | |
- | Veřejným datovým fondem (také jako " | + | ===== Popis veřejného |
- | **//Nový text//** | + | Veřejný datový fond (VDF) je definován v [[https://archi.gov.cz/ikcr|Informační koncepci ČR (IKČR)]] jako [[https:// |
- | Veřejný datový fond je princip vytváření a dotváření obrazu propojeného datového fondu na bázi otevřených dat za účelem podpory | + | //“Veřejný datový fond tvořený publikovanými veřejnými údaji veřejné správy je základní metodou pro sdílení |
- | Veřejný datový fond je princip, tedy v podstatě abstrakce, která ale fakticky zastřešuje a reprezentuje skutečné fyzické datové zdroje otevřených dat roztroušené | + | ==== Legislativní ukotvení |
- | Veřejným datovým fondem (dále také jako VDF) se rozumí | + | VDF není v legislativě |
- | První se týká interního režimu VS, kde významným způsobem doplňuje sdílení | + | Základním pojmem je údaj vedený nebo vytvářený v rámci agendy. Podle § 51 odst. 6, písm. k) [[https:// |
- | //“Veřejný | + | Způsob poskytnutí údaje zveřejněním upravuje § 4b [[https://www.zakonyprolidi.cz/ |
- | Druhou důležitou oblastí, | + | V případě údajů spravovaných v AIS se z principu jedná o informace vedené |
+ | Dále je dle § 51 odst. 6, písm. k) [[https:// | ||
- | ==== Datové zdroje VS ČR. ==== | + | Z pohledu [[https:// |
+ | {{ : | ||
- | **Datový fond VS ČR** je tvořen všemi daty VS ČR a je obsažen v následujících kategoriích datových zdrojů: | + | Jak bylo zmíněno na začátku dokumentu, rozlišení údajů na veřejné |
- | [[soubor:datove_zdroje.jpg|center|400px]] | + | {{ :nap-dokument: |
- | **PPDF - propojený datový fond** - je tvořen veškerými autoritativními údaji a referenčními údaji podle zákona č.111/2009 Sb.o základních registrech, přičemž účelem propojeného datového fondu orgánů veřejné moci je maximalizovat užitek uživatele služby z možnosti sdílení uložených údajů v souladu s právy a povinnostmi zachycenými v registru RPP. | + | Podle § 51 odst. 6, písm. k) [[https://www.zakonyprolidi.cz/ |
- | **VDF - veřejný datový fond** - je tvořen zejména publikovanými “obrazy” dat obsaženými v PPDF ve formátu otevřených dat a slouží k zpřístupnění dat PPDF interním uživatelům VS v těch případech, kdy příslušná OVM nemají možnost tato data sdílet prostřednictvím PPDF (nemají přidělena práva v RPP) a přitom taková data potřebují ke své práci. Dále je VDF doplněn o data, která PPDF neobsahuje, jako jsou různé verze číselníků a jejich konsolidace. Veškeré publikované “obrazy” PPDF jako otevřená data jsou zpřístupněna také veřejnosti. VDF tedy v podstatě obsahuje publikovaný “obraz” PPDF ve formátu otevřených dat v rámci možností stanovených zákony o způsobu zveřejnění údajů umožňujícím dálkový přístup, doplněný o data, která v PPDF nejsou, ale jsou důležitá pro správnou interpretaci údajů, jako jsou např. číselníky. Veškerá publikovaná data ve VDF musí být ve formátu otevřených dat a musí splňovat požadavky kladené na otevřená data v duchu zákona č.106/1999 Sb. Výjimkou mohou být pouze takové případy, zcela úplnému otevření dat brání nějaká omezení (např. omezení na nekomerční využití, …). Tento typ dat je označen jako “data VDF s řízeným přístupem”, | + | Pro zajištění přístupu k neveřejnému údaji je dle § 54 odst. 1, písm. d) [[https:// |
- | **OD - otevřená data** - je tvořen všemi publikovanými daty VS ve formátu otevřených dat, která musí splňovat požadavky na otevřená data dle zákona č.106/1999 Sb. Součástí otevřených dat jsou také všechny lokální otevřená data samospráv a otevřená data využívaná v konceptu SMART Cities.. | + | Naproti tomu využívání veřejných údajů |
- | **ŘP - data s řízeným přístupem** - specifikum otevřených dat. Jedná se v podstatě o otevřená data, která splňují podmínky definované zákonem č.106/1999 Sb., avšak z nějakých důvodů je jejich použití limitováno, | + | {{ :nap-dokument: |
+ | ==== Principy veřejného datového fondu ==== | ||
- | ==== Přístupy k datovým zdrojům VS ČR. ==== | + | Obecným výchozím principem VDF je [[https:// |
+ | // | ||
- | [[soubor:pristupy.jpg|center|800px]] | + | VDF zpřístupňuje veřejné registrované údaje jednotlivým OVM a SPUÚ pro čtení bez omezení přístupu. Navíc jsou všechny údaje přístupné z VDF dostupné ve stejné podobě také prostřednictvím otevřeného přístupu, a to bez výjimky. V obou případech zpřístupnění, |
- | OVM (případně SPUÚ) při výkonu správních činností používá autoritativní | + | Pro vymezení navazujících pravidel VDF a navržení jeho celkové architektury slouží čtyři základní principy. |
- | Veřejnost má otevřený přístup k datům | + | * P1 (distribuovanost) - VDF zastřešuje a popisuje skutečné datové zdroje poskytující údaje |
+ | * P2 (garance) - pro OVM a SPUÚ čerpající údaje z VDF je garantována technická dostupnost | ||
+ | * P3 (otevřená data) - údaje přístupné z VDF jsou zpřístupněny jako [[nap: | ||
+ | * P4 (interoperabilita) - údaje | ||
+ | === Princip P1 – distribuovanost === | ||
- | ==== Datová struktura | + | VDF zastřešuje skutečné datové zdroje, které nemusí být centralizovány v jednom jediném úložišti. VDF spravuje a organizuje metadata o datových sadách, ve kterých jsou údaje z datových zdrojů zpřístupněny. Mezi tato metadata zejména patří: |
+ | * základní charakteristika datové sady (název, popis apod.), | ||
+ | * dokumentace datové sady, | ||
+ | * popis technického zpřístupnění datové sady. | ||
- | VDF obsahuje datové zdroje, které slouží jako doplňkový zdroj dat pro OVM v takových případech, | + | Metadata o datových sadách jsou evidovány |
- | VDF je tvořen zásadně pouze otevřenými daty a daty s řízeným přístupem, | + | === Princip P2 – garance === |
- | * Volně přístupná na webu jako datové soubory ke stažení | + | OVM garantuje zpřístupnění veškerých |
- | * Opatřená podmínkami užití neomezujícími | + | |
- | * Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy | + | |
- | * Opatřená úplnou dokumentací. | + | |
- | * Opatřená kontaktem na kurátora | + | |
- | * Publikovány dle otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím. | + | |
- | [[soubor:data.jpg|center|600px]] | + | Pro údaje ve VDF platí: |
- | **Otevřená data VDF** - jasně | + | |
+ | | ||
+ | * Infrastruktura VDF zajišťuje jejich dostupnost. | ||
+ | * Pokud OVM či SPUÚ čerpá údaje z VDF, považuje je za správné, úplné, platné | ||
+ | * Pokud OVM či SPUÚ využívá údaje dostupné ve VDF, přičemž je nezískal přímo z VDF, ale nějakým jiným způsobem, nemůže tyto údaje považovat za správné, úplné, platné ani aktuální. | ||
+ | * Při změně | ||
- | **Data VDF s řízeným přístupem** - platí vše co pro Otevřená data VDF, přibývá ale nová povinnost - registrace a případné vyžádání povolení pro práci s daty. | + | === Princip P3 – otevřená data === |
+ | Údaje dostupné ve VDF jsou v totožné podobě také povinně publikovány jako [[nap: | ||
- | ==== Nástroje VDF ==== | + | === Princip P4 – interoperabilita |
+ | Dva softwarové systémy jsou interoperabilní, | ||
- | VDF vytvořený na základě principů otevřených | + | * technickou – použití standardních webových technologií pro perzistentní (tj. trvalou) identifikaci údajů a jejich výměnu, |
+ | * syntaktickou – specifikace a dodržování konkrétních formátů dat, komunikačních protokolů | ||
+ | * sémantickou – způsob | ||
- | Správa dat VDF bude v základu probíhat stejným způsobem jako jsou již spravována otevřená data VS s několika dalšími rozšířeními. Základem bude katalog dat NKOD, který bude upraven a doplněn tak, aby mohl rozlišovat jednotlivé kategorie dat, umožňoval registrace uživatelů | + | Ve VDF je technická, syntaktická |
- | Přehled všech nástrojů využitých při práci s daty VDF a otevřenými daty uvádí následující obrázek. | + | ==== Začlenění veřejného datového fondu do výkonu veřejné správy ==== |
- | [[soubor: | + | === Využití veřejného datového fondu pro doplnění datového kmene agendy === |
- | **ČEDAK** - “Český | + | Základem pro výkon agendy je její datový |
- | Základní zajišťované funkce katalogem: | + | {{ :nap-dokument: |
- | * katalogizace otevřených dat (VDF-OD a OD), | + | === Přístup veřejnosti k údajům === |
- | * katalogizace dat s řízeným přístupem (VDF-ŘP a ŘP), | + | |
- | * katalogizace a správa číselníků, | + | |
- | * automatická notifikace změn v publikovaných datových sadách. | + | |
- | Základní logické celky katalogu: | + | K údajům veřejné správy má možnost přístupu ke čtení i veřejnost. |
- | * **NKOD** - upravený a doplněný pro správu informací o jednotlivých kategoriích dat a jejich zařazení do VDF. | + | Přístup |
- | * NKOD je nástroj, ve kterém jednotlivé orgány | + | |
- | * Existence NKOD a povinnost jednotlivých orgánů veřejné správy v něm katalogizovat svá otevřená data je dána zákonem č. 106/1999 Sb., o svobodném | + | |
- | * **Katalog dat s řízeným přístupem** - katalog se stejnou funkcionalitou jako NKOD, navíc by měl také obsahovat seznam předepsaných podmínek na použití jednotlivých publikovaných datových sad a odkazy na publikující organizaci. | + | |
- | * **Interní katalog uživatelů otevřených dat** (KUOD) - bude evidovat, jaké orgány | + | |
- | * **Katalog (registr) uživatelů dat s řízeným přístupem** - seznam uživatelů s přiděleným povolením využívat data s řízeným přístupem a seznam povolených datových sad. | + | |
- | * **Katalog (registr) | + | |
- | * **Notifikační HUB** - nástroj zajišťující s pomocí katalogu uživatelů dat s požadavkem notifikace automatickou distribuci notifikací změn v publikovaných sadách při ohlášení změny ze strany publikující organizace. Při registraci datové sady předává publikující organizaci URI pro zasílání informací o změnách. | + | |
- | * //Katalog číselníků// | + | |
- | * //Nástroj pro konsolidaci číselníků// | + | |
- | * // | + | |
- | **Sémantický slovník pojmů** - slovník pojmů | + | Přístup |
- | **Nástroj pro správu sémantického slovníku pojmů (NSSSP)** – umožní správu sémantického slovníku pojmů všemi orgány veřejné správy a popisovat jejich data za účelem sémantické harmonizace. | + | {{ : |
- | **Datový portál (DP)** – vstupní brána do světa otevřených dat VS. Obsahuje odkazy na NKOD, vzdělávací informace, publikační standardy, šablony, doporučené postupy, související dokumenty a informace o otevřených datech zveřejněných | + | ==== Základní struktura |
- | **Lokální katalog otevřených dat - LKOD** - volitelně implementován pro potřeby katalogizace otevřených dat konkrétního poskytovatele dat. NKOD pravidelně automaticky přebírá informace o zveřejněných | + | Vnitřní architektura VDF je kromě samotných veřejných registrovaných údajů datového fondu VS ČR tvořena také dílčími nástroji. Dílčí nástroje jsou primárně určeny pro ukládání obsahu datových sad a práci s metadaty datových sad. Dále je tvořen souborem pravidel, postupů a doporučení, |
- | **Katalog aplikací nad otevřenými daty** – seznam všech služeb (aplikací) využívajících publikované datové sady s možnostmi vyhledávání dle využívaných datových sad, nebo na základě životních situací konzumenta dat. | + | Přístup k údajům prostřednictvím VDF je technicky zajišťován jako |
+ | * přístup k datovým souborům s obsahem datových sad ke stažení (povinně) | ||
+ | * přístup ke konkrétní položce datové sady prostřednictvím REST API (volitelně) | ||
+ | * dotazování nad obsahem datové sady prostřednictvím SPARQL API (volitelně) | ||
- | ==== Obsahové rozdělení datových zdrojů VDF ==== | + | Přístup je zajištěn pomocí služeb [[nap: |
+ | * čtení publikovaného datového souboru s obsahem datové sady | ||
+ | * čtení publikované položky datové sady | ||
+ | * dotazování nad obsahem datové sady | ||
- | **VDF-OD (otevřená data)** jsou obsažena ve dvou skupinách datových zdrojů: | + | Tyto nové služby nemohou být z výše uvedených důvodů poskytovány prostřednictvím [[nap: |
- | * datové zdroje obsahující veřejně přístupný obraz propojeného datového fondu PPDF, | + | Do VDF publikují jednotlivé AIS i [[nap: |
- | * datové zdroje rozšiřující obraz PPDF o data, která | + | |
- | **VDF-ŘP (data s řízeným přístupem)** obsahují datové zdroje, jejichž využití vyžaduje splnění definovaných omezujících podmínek, zveřejněných publikujícím subjektem OVM. | + | ISGOD je logickým zastřešením několika aplikačních komponent tvořících prostředí VDF. Komponenty jsou popsány v následujících podkapitolách. |
- | [[soubor: | + | === Úložiště datových sad === |
- | **Datové zdroje vytvářející | + | Úložiště datových sad slouží k ukládání obsahu registrovaných |
- | Pro tuto oblast by měla platit následující jednoduchá obecná pravidla. | + | * kontrolu souladu nahrávaného obsahu s otevřenými formálními normami |
+ | * transformaci obsahu do všech podob daných otevřenými formálními normami s pomocí transformačních skriptů definovaných otevřenými formálními normami | ||
+ | * zpřístupnění těchto podob jako distribuce datových sad, a to jako | ||
+ | * datové soubory ke stažení (povinně) | ||
+ | * API umožňující přistoupit ke každé jednotlivé položce datové sady (nepovinně) | ||
+ | * API umožňující dotazování nad obsahem uložených datových sad pomocí dotazovacího jazyka SPARQL (nepovinně) | ||
+ | * garantovanou dostupnost distribucí datových sad při přístupu prostřednictvím ISGOD | ||
+ | * požadovaná úroveň dostupnosti distribucí je stejná jako požadovaná úroveň dostupnosti ostatních služeb [[nap: | ||
+ | * negarantovanou dostupnost distribucí datových sad při přístupu prostřednictvím veřejného internetu | ||
- | * Pro každý datový zdroj v PPDF musí existovat nějaký obraz ve VDF a to dle následujícího pravidla: | + | Úložiště datových |
- | * pro datové zdroje s legislativně stanoveným dálkovým přístupem budou předmětem publikace vždy primární data, | + | |
- | * u datových | + | |
- | * Pokud jakýkoliv zákon uvádí někde dálkový přístup k údajům, tak automaticky příslušný datový zdroj se stává | + | |
- | Výčet | + | Softwarový nástroj úložiště |
- | * Obrazy základních registrů | + | === Národní katalog otevřených dat === |
- | * ROS | + | |
- | * RÚIAN | + | |
- | * RPP | + | |
- | * ROB - jako obraz registru budou publikovány statistiky z registru. | + | |
- | * Obrazy veřejných rejstříků (veřejné rejstříky právnických a fyzických osob podle zákona č. 304/2013 Sb. o veřejných rejstřících právnických a fyzických osob.). | + | |
- | * spolkový rejstřík, | + | |
- | * nadační rejstřík, | + | |
- | * rejstřík ústavů, | + | |
- | * rejstřík společenství vlastníků jednotek, | + | |
- | * obchodní rejstřík, | + | |
- | * rejstřík obecně prospěšných společností. | + | |
- | * Obraz autoritativních údajů (data všech IS VS dle RPP). | + | |
- | * Obraz všech rejstříků, | + | |
- | * Rejstříky bez stanoveného dálkového přístupu v zákonech - publikace agregací nebo statistik. | + | |
- | **Rozšíření obrazu PPDF** | + | V NKOD jsou evidovány katalogizační záznamy o všech datových sadách dostupných ve VDF. Za katalogizaci datových sad je zodpovědný publikující ISVS, který nahrává obsah do svého úložiště datových sad jako distribuce obsahu datové sady. Publikující ISVS poskytuje API dle [[https:// |
- | * Publikace všech (i lokálních) číselníků, jejich sémantické provázání, | + | Čtenáři údajů z VDF mohou v NKOD vyhledávat datové sady a získávat tak metadata popisující |
- | **Data s řízeným přístupem** | + | Správcem NKOD je MV ČR. |
- | * Obraz všech rejstříků, | + | === Registr práv a povinností === |
- | * Publikované statistiky, nebo jiné datové sady, jejichž obecné využití je nežádoucí, | + | |
- | * Pro všechna data VS platí, že vždy je nejprve zvažováno zveřejnění v podobě otevřených dat, a pouze v případě existence objektivních a jasně zdůvodněných právních překážek či rizik je přistoupeno k publikaci dat s řízeným přístupem. Zdůvodnění řízeného přístupu a uvedení podmínek pro zpřístupnění dat je vždy povinnou součástí dokumentace dat. | + | |
+ | V [[nap: | ||
- | ==== Zjednodušený koncept publikace dat do VDF ==== | + | Pro potřeby otevřeného přístupu i VDF je pro každý veřejných číselník evidováno IRI datové sady v NKOD, ve které je obsah číselníku přístupný. To samé platí pro veřejný údaj, pouze může být datových sad více. |
+ | Čtenáři údajů z VDF vyhledávají v [[nap: | ||
- | Cílem publikace dat VS do VDF je vytvoření harmonizovaného a konzistentního obrazu PPDF ve VDF, sémanticky provázaného i na odpovídající pojmy legislativy s pomocí Sémantického slovníku pojmů, včetně zachycených vzájemných souvislostí. Aby byla zajištěna konzistence VDF, a aby se z něj vytvořil rovnocenný obraz PPDF, je proto nutné, aby publikované datové sady datových zdrojů v PPDF byly publikované na úrovni propojených dat. Toho se dosáhne publikací konkrétních distribucí datových sad z PPDF s provedenou vazbou na sémantický slovník pojmů s využitím formátu JSON-LD. Z tohoto důvodu musí platit pravidlo, že součástí VDF budou pouze ty distribuce datových sad, které budou ve formátu JSON-LD a budou mít namapovaný kontext na sémantický slovník pojmů. | + | V [[nap: |
- | * Základem publikace do VDF je tedy sémantický slovník pojmů vytvořený na základě údajů v RPP, a který popisuje PPDF a tedy i budoucí obrazy ve VDF. | + | Správcem [[nap:rpp|RPP]] je MV ČR. |
- | * Vlastní publikace bude realizovaná distribucemi datových sad s využitím formátu JSON-LD a s provedenou vazbou na sémantický slovník pojmů. | + | |
- | Publikované obrazy datových zdrojů PPDF ve VDF vytvoří infrastrukturu pro všechna otevřená data VS, což prakticky znamená, že publikující organizace nebudou muset při publikaci nových datových sad publikovat data, která již vypublikovaná budou, ale pouze budou publikovat nové rozšiřující informace k jednotlivým entitám VDF. Do jejich povinností ale přibude povinnost doplnit vazby nově publikovaných údajů na již existující entity ve VDF. | + | === Katalog uživatelů dat === |
- | **Pravidla publikace do VDF** | + | Katalog uživatelů dat eviduje, jaké datové sady z VDF čerpají konkrétní OVM a SPUÚ. Registraci čerpání datové sady provádí OVM či SPUÚ za účelem získávání notifikací o změnách v datové sadě. Registrace je předvyplněna z evidence čtení registrovaných veřejných údajů v [[nap: |
- | * Pro každý datový zdroj v PPDF musí existovat nějaký obraz ve VDF a to: | + | Registrace mj. obsahuje: |
- | * pro datové zdroje s legislativně stanoveným dálkovým přístupem budou předmětem publikace vždy primární data, | + | |
- | * u datových zdrojů bez legislativně stanoveného dálkového přístupu budou publikace provedeny ve formě statistik a agregací. | + | |
- | * Pokud konkrétní zákon uvádí někde dálkový přístup, tak automaticky příslušný datový zdroj se stává součástí VDF a musí být vytvořen obraz jeho primárních dat ve formátu otevřených dat. | + | |
- | * Publikovaná datová sada z datového zdroje PPDF musí k tomu, aby se stala součástí VDF: | + | |
- | * obsahovat alespoň jednu distribuci datové sady ve formátu JSON-LD, | + | |
- | * musí mít u této distribuce doplněný kontext, který bude mapovat strukturální prvky JSON souboru na sémantický slovník pojmů. | + | |
- | * V případě duplicit u publikovaných datových sad ve VDF, nebo doplňování údajů různými publikujícími ke stejné publikované entitě, spadá povinnost doplnění vazeb na již publikované autoritativní údaje vždy na toho publikujícího, | + | |
- | * U každé datové sady publikované do VDF musí být uvedena informace o notifikačním mechanismu o změnách dle příslušné OFN uvedené na POD. | + | |
- | * Publikované číselníky ve VDF musí být ve formátu JSON-LD s kontextem, stávající formáty CSV a XML mohou být použity při publikaci do otevřených dat mimo VDF. | + | |
- | * K zajištění garance kvality a právní závaznosti publikovaných dat musí publikující organizace: | + | |
- | * … | + | |
- | * …. | + | |
- | * …. | + | |
- | * K zajištění garance aktuálnosti publikovaných dat musí publikující organizace: | + | |
- | * … | + | |
- | * … | + | |
- | * ... | + | |
- | * K zajištění garance aktualizace publikovaných dat musí publikující organizace: | + | |
- | * … | + | |
- | * … | + | |
- | * ... | + | |
+ | * IRI OVM či SPUÚ | ||
+ | * IRI datové sady | ||
+ | * požadovanou maximální frekvenci notifikací (ihned, hodinová, denní, týdenní, ...) | ||
+ | * požadovaný způsob a technická specifikace notifikace (datová schránka, WebSub protokol) | ||
- | ==== Správa | + | Správcem katalogu uživatelů |
+ | === Notifikační hub === | ||
- | Zapojení VDF do výkonu veřejné správy vyžaduje | + | Notifikační hub je nástroj |
- | K zajištění kvalitního veřejného datového fondu bude nutné přistoupit k plánovanému vytváření VDF a také ke změně stávajícího paradigmatu - oddělit data VS od aplikací a posunout | + | Notifikační hub je implementován na bázi mezinárodního standardu [[https:// |
- | Musí vzniknout “Datová kancelář” s příslušným Chief data officer (CDO) organizačně postavená na úrovni OHA s následujícími pravomocemi a povinnostmi: | + | Správcem Notifikačního hubu je MV ČR. |
- | * spravovat a rozvíjet datový fond VS ČR, zejména PPDF a VDF, | + | === Směrovací služba === |
- | * udržovat a rozvíjet sémantický slovník pojmů VS, | + | |
- | * a mít právo kontroly dodržování rozvoje datového fondu VS ČR ze strany jednotlivých OVS. | + | |
- | **//Konec nového textu.//** | + | Distribuce datové sady je v otevřených datech zpřístupněna jako datový soubor ke stažení nebo jako API, které umožňuje získat data každé jednotlivé položky datové sady (entity), o níž jsou v datové sadě reprezentovány údaje. Přístup k údajům je realizován s pomocí tzv. dereference identifikátoru položky. V otevřených datech jsou jako identifikátory použity tzv. IRI (Internationalized resource identifier, více viz [[https://ofn.gov.cz/propojen%C3%A1-data/draft/# |
- | **//Začátek původního textu//** | + | IRI položky vyplývá z úložiště datových sad, na kterém je datová sada s položkou fyzicky uložena a z [[https://ofn.gov.cz/ |
+ | Pro veřejný údaj je nutné, aby správce ISVS, ze kterého se obsah údaje publikuje, zavedl identifikátory položek datové sady do směrovací služby a určil k nim tzv. referenční identifikátory na doméně gov.cz. Pro položku tak existují dva identifikátory. První je původní identifikátor položky určený správcem ISVS. Vyplývá z úložiště datových sad, ve kterém je obsah datové sady uložen. Jedná se o IRI v doméně úložiště, | ||
- | ==== Veřejné rejstříky (VDF-VR) ==== | + | Při změně úložiště datových sad nebo obecně při změně lokálních IRI je upraveno směrování ve směrovací službě. Tím je zajištěna perzistence IRI, která umožňuje trvalé a neměnné propojení údajů o stejné položce napříč různými datovými zdroji nezávisle na poskytovatelích těchto údajů. |
- | Veřejnými rejstříky právnických | + | Správcem směrovací |
- | * spolkový rejstřík, | + | ===== Pravidla veřejného datového fondu ===== |
- | * nadační rejstřík, | + | |
- | * rejstřík ústavů, | + | |
- | * rejstřík společenství vlastníků jednotek, | + | |
- | * obchodní rejstřík a | + | |
- | * rejstřík obecně prospěšných společností. | + | |
- | Do veřejného rejstříku se zapisují zákonem stanovené | + | ==== Pravidla pro údaje |
- | Ministerstvo financí uveřejňuje | + | Ve VDF jsou zpřístupňovány |
- | Údaje | + | * Údaje |
+ | * Datové sady jsou navíc publikovány prostřednictvím otevřeného přístupu | ||
+ | * Otevřený přístup i přístup prostřednictvím VDF jsou tedy dva přístupy ke stejnému obsahu v podobě otevřených dat. | ||
+ | * První je určen pro veřejnost, druhý je určen pro OVM a SPUÚ a je realizován prostřednictvím [[nap: | ||
+ | * Datové sady jsou popsány v podobě katalogizačních záznamů | ||
+ | * Datové sady jsou fyzicky dostupné v podobě distribucí. Různé distribuce stejné datové sady zpřístupňují její obsah v různých formátech a prostřednictvím | ||
+ | * v podobě datového souboru s kompletním obsahem datové sady ke stažení, | ||
+ | * v podobě API, které umožňuje přistupovat ke kompletním údajům | ||
+ | * v podobě API, které umožňuje dotazování nad obsahem datové sady s pomocí dotazovacího jazyka SPARQL | ||
+ | * Informace o veřejnosti registrovaného údaje je zachycena v jeho evidenci v [[nap: | ||
+ | * Pro veřejný údaj obsahuje [[nap: | ||
+ | * Pro údaj kódovaný číselníkem obsahuje [[nap: | ||
- | Veřejné rejstříky a vzdálený přístup k jejich | + | Vlastní mechanismus zpřístupnění |
- | | + | {{ :nap-dokument: |
- | - Všechny rejstříky vedle toho, že jsou publikovány na internetu, musí být dostupné jako otevřená data. A to přímo, nebo prostřednictvím OD k ARES. | + | |
- | - Všechny rejstříky musí být pro potřeby agend OVS dostupné přes [[e_gsb]], a to buď sdruženě, prostřednictvím ARES, nebo přímo, pokud jejich veřejné údaje nejsou v ARES zahrnuty. | + | |
- | - ARES, jako klíčový veřejný rejstřík s velkým hospodářským dopadem, musí být být průběžně rozvíjen a inovován tak, aby odpovídal aktuálním potřebám občanské i podnikové veřejnosti ČR. | + | |
+ | - V [[nap: | ||
+ | * Oba údaje jsou dostupné prostřednictvím stejné datové sady. | ||
+ | * V [[nap: | ||
+ | * Datová sada je publikovaná a dostupná v několika distribucích, | ||
+ | - V [[nap: | ||
+ | - Agenda 1 vytváří a udržuje číselník, | ||
+ | - V [[nap: | ||
+ | - U údaje D je v [[nap: | ||
+ | - V [[nap: | ||
+ | - Reprezentuje přístup k distribucím datových sad prostřednictvím VDF. | ||
- | ==== Otevřená data (VDF-OD) ==== | + | ==== Pravidla sdílení veřejných údajů prostřednictvím |
- | Otevřenými daty se v rámci | + | === Pravidla publikace |
- | - Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF a další formáty s otevřenou specifikací | + | Základní prvky architektury VDF z pohledu poskytovatele údajů zobrazuje následující obrázek. |
- | - Opatřená podmínkami užití neomezujícími jejich užití, viz návod na stanovení podmínek užití | + | |
- | - Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří | + | |
- | - Úplný obsah databáze nebo agregovaná statistika | + | |
- | - Opatřená dokumentací | + | |
- | - Připravena s cílem co nejsnazšího strojového zpracování programátory apod. | + | |
- | - Opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření, | + | |
- | - Jsou publikovány dle otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím. | + | |
- | Pokud vaše datová sada nesplňuje všechny uvedené podmínky, nejedná se o otevřená data české veřejné správy podle zákona č. 106/1999 Sb., o svobodném přístupu k informacím, | + | {{ : |
- | Otevřenými daty zejména není: | + | Poskytovatelem údajů do VDF je správce ISVS, ve kterém jsou vedeny registrované veřejné údaje. Tento ISVS je vyznačen na levé straně obrázku jako //systém pro správu datového kmene//, kterým OVM spravuje svůj datový kmen. V praxi se samozřejmě může jednat o více ISVS, zde si pro jednoduchost zobrazujeme jen jeden systém. |
- | - odkaz na vyhledávací formulář určený pro koncové uživatele | + | Pro potřeby sdílení údajů |
- | - odkaz na novou stránku s dalšími informacemi | + | |
- | - odkaz na veřejné mapové rozhraní GIS | + | |
- | - odkaz na API umožňující přístup k jednotlivým záznamům či vyhledávání záznamů, nikoliv export kompletních dat | + | |
- | - datový soubor ve formátu PDF | + | |
- | - datový soubor ve formátu XLS formátovaný pro tisk nebo obsahující výpočty | + | |
- | - datový soubor | + | |
- | Pro zajištění | + | //Úložiště datových sad// zajišťuje kontrolu technické správnosti zaslaných dávek vůči otevřeným formálním normám a zpřístupnění distribucí obsahu ve všech formátech definovaných |
- | - Zajistit možnost získávání kompletních dat z IS v podobě datových souborů ve strojově čitelném | + | Poté, co jsou distribuce obsahu datových sad uloženy v úložišti |
- | - Zajistit publikaci datových souborů na webu organizace nebo v jejím lokálním katalogu otevřených dat | + | |
- | - Opatřit je lidsky čitelnou dokumentací a strojově čitelným schématem | + | |
- | | + | |
- | | + | |
- | NKOD je nástroj, ve kterém jednotlivé orgány veřejné správy katalogizují jimi zveřejňovaná otevřená data a jiné orgány veřejné správy a veřejnost | + | Celý proces publikace údajů sdružených v jedné datové sadě do VDF je znázorněn na následujícím diagramu. Proces předpokládá, že příslušná agenda již byla ohlášena |
- | Existence NKOD a povinnost jednotlivých orgánů veřejné správy v něm katalogizovat svá otevřená data je dána zákonem č. 106/1999 Sb., o svobodném přístupu k informacím, | + | {{ : |
- | Nařízení vlády č. 425/2016 Sb. o seznamu informací zveřejňovaných jako otevřená data stanovuje, jaké informace mají být zveřejňovány orgány veřejné správy jako otevřená data povinně. | + | V rámci procesu: |
- | Pro naplnění závazků, které vyplývají ze strategických dokumentů, bude zveřejňování | + | * Systém pro zpřístupnění údajů |
+ | * Připraví obsah datové sady v podobě datového souboru v jednom z formátů definovaných otevřenými formálními normami. | ||
+ | * Specifikaci | ||
+ | * Pokud pro údaje neexistuje otevřená formální norma, musí ji správce systému pro zpřístupnění údajů s podporou MV ČR nejprve vytvořit. | ||
+ | * Zašle připravený obsah datové sady do úložiště datových sad. | ||
+ | * Úložiště datových sad | ||
+ | * Provede technickou kontrolu zaslaného obsahu | ||
+ | * Kontrola správného formátování (např. JSON nebo XML formátování) | ||
+ | * Kontrola validity datové struktury | ||
+ | * V případě | ||
+ | * Vytvoří distribuce obsahu jeho transformací do všech podob definovaných otevřenými formálními normami s využití transformačních skriptů/ | ||
+ | * Zpřístupní vytvořené distribuce | ||
+ | * Zpřístupní je jako datové soubory dostupné ke stažení prostřednictvím ISGOD a z veřejného internetu. | ||
+ | * URL pro stažení datového souboru je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí veřejného internetu. | ||
+ | * Volitelně zpřístupní jednotlivé položky obsahu dle [[https:// | ||
+ | * Referenční IRI položky je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí | ||
+ | * Lokální IRI položky | ||
+ | * Volitelně zpřístupní jejich obsah v podobě SPARQL endpointu prostřednictvím ISGOD a ve veřejném internetu. | ||
+ | * URL SPARQL endpointu je stejné pro přístup prostřednictvím ISGOD a veřejného internetu, k čemuž je nutné správně nastavit DNS v prostředí KIVS/CMS a DNS v prostředí veřejného internetu. | ||
+ | * Zašle zpět systému pro zpřístupnění údajů potvrzení o úspěšném uložení. | ||
+ | * Jako součást potvrzení zasílá metadata o vytvořených distribucích v [[https:// | ||
+ | * Systém pro zpřístupnění údajů | ||
+ | * Vytvoří kompletní katalogizační záznam o datové sadě včetně metadat o distribucích vytvořených úložištěm datových sad a zpřístupní jej prostřednictvím API dle [[https:// | ||
+ | * Zašle notifikačnímu hubu informaci o změně obsahu datové sady. | ||
+ | * Úroveň detailu informace není v tomto místě řešena. | ||
+ | * Národní katalog otevřených dat | ||
+ | * Získá katalogizační záznam z API poskytnutého systémem pro zpřístupnění údajů a zaeviduje jej. | ||
+ | * Ohlašovatel agendy | ||
+ | * Ohlásí do [[nap: | ||
+ | * Notifikační hub | ||
+ | * Zaeviduje informaci o změně datové sady zaslanou úložištěm datových sad. | ||
- | Průběžná změna legislativního | + | Systém pro zpřístupnění údajů prostřednictvím VDF souvisí s existujícím systémem pro zpřístupnění údajů |
- | Je též nutné legislativně ukotvit povinnost orgánů veřejné správy využívat při výkonu svých agend otevřená data poskytovaná jinými orgány veřejné správy. To se týká především číselníků, kdy jsou stejné číselníky vytvářeny různými orgány veřejné správy. | + | [[nap: |
- | Různá kvalita otevřených dat komplikuje jejich opakovatelnou použitelnost. Je též téměř nemožné sdílet veřejné údaje mezi orgány veřejné správy jako otevřená data, neboť neexistují žádné garance dostupnosti. Pro zlepšení současného stavu se VDF stane virtuálním distribuovaným datovým prostorem, ve kterém orgány | + | Protože ale kontexty pro [[nap: |
- | * //Národní katalog | + | === Čtení veřejných údajů z VDF === |
- | * //Nástroj pro správu sémantického slovníku pojmů (NSSSP)// – umožní správu sémantického slovníku pojmů všemi orgány | + | |
- | | + | Základní stavební kameny architektury VDF z pohledu čtenáře údajů zobrazuje následující obrázek. |
+ | |||
+ | {{ : | ||
+ | |||
+ | Čtenářem údajů z VDF je správce ISVS, který čte veřejné údaje. Tento ISVS je v obecné úrovni vyznačen na levé straně obrázku jako //systém pro čtení údajů z VDF// (dále jen //systém pro čtení údajů// | ||
+ | |||
+ | Systém pro čtení údajů čte veřejné údaje z VDF jako otevřená data prostřednictvím ISGOD v podobě distribucí datových sad v různých formátech definovaných otevřenými formálními normami. Jsou umožněny 3 základní druhy přístupu prostřednictvím ISGOD: | ||
+ | |||
+ | -Přístup ke kompletnímu obsahu datové sady v podobě datových souborů voláním | ||
+ | -služeb ISGOD umožňujících přistoupit k metadatům o datové sadě a jejích distribucích na základě jejich referenčních IRI a k URL daného souboru a stáhnout jej. (povinné) | ||
+ | -Přístup k jednotlivým položkám datových sad voláním služeb ISGOD umožňujících přistoupit k datům o dané položce na základě jejího referenčního IRI. (volitelné) | ||
+ | -Dotazování nad položkami datových sad voláním dotazovacích služeb ISGOD. (volitelné) | ||
+ | |||
+ | Služby ISGOD jsou realizovány jako webové služby postavené na principech REST, které jsou poskytovány jednotlivými komponentami VDF znázorněnými v pravé části obrázku: | ||
+ | |||
+ | * REST služby NKOD umožňují číst metadata o datových sadách a jejich distribucích. | ||
+ | * REST služby úložiště datových sad umožňují číst obsah v nich uložených datových sad v podobě | ||
+ | * stahování datových souborů s obsahem uložených datových sad (povinné) | ||
+ | * přístupu k IRI jednotlivých položek obsahu uložených datových sad (volitelné) | ||
+ | * SPARQL dotazů nad obsahem uložených datových sad (volitelné) | ||
+ | |||
+ | ISGOD je pouhým logickým zastřešením výše uvedených služeb. | ||
+ | |||
+ | == Čtení obsahu datové sady v podobě datového souboru == | ||
+ | |||
+ | Čtení obsahu datové sady v podobě datového souboru typicky systém pro čtení údajů provádí za účelem aktualizace vlastní kopie údajů přebíraných z VDF. Aktualizaci typicky provádí v pravidelných intervalech nebo na základě notifikací o změnách zasílaných notifikačním hubem na základě registrace v katalogu | ||
+ | |||
+ | * Systém pro čtení údajů přistupuje k referenčnímu IRI datové sady. | ||
+ | * Směrovací služba přesměrovává referenční IRI datové sady na lokální IRI datové sady v NKOD. | ||
+ | * Systém pro čtení údajů přistupuje k lokálnímu IRI datové sady v NKOD. | ||
+ | * NKOD vrací metadata o datové sadě. | ||
+ | * Systém pro čtení údajů vybírá distribuci datové sady dle potřebného formátu a přistupuje k URL ke stažení obsahu distribuce. | ||
+ | * Úložiště datových sad zasílá systému pro čtení údajů obsah datového souboru na daném URL. | ||
+ | |||
+ | Následující obrázek postup znázorňuje v podobě sekvenčního UML diagramu na konkrétním příkladu přístupu k datové sadě “Služby veřejné správy”, která je publikována z [[nap:rpp|RPP]]. | ||
+ | |||
+ | {{ :nap-dokument: | ||
+ | |||
+ | == Čtení položky datové sady == | ||
+ | |||
+ | Čtení položky datové sady typicky systém pro čtení údajů provádí za účelem zobrazení veřejných údajů o položce v uživatelském rozhraní nebo jiné práce s konkrétní položkou v okamžiku potřeby práce s údaji o položce, tj. v rámci svého run-time. Přístup k položce předpokládá, | ||
+ | |||
+ | * V předchozích krocích byl přečten z VDF údaj s referenčním IRI jako hodnotou. | ||
+ | * V předchozích krocích byl přečten z [[nap: | ||
+ | |||
+ | Přístup je pak realizován následujícím postupem: | ||
+ | |||
+ | * Systém pro čtení údajů přistupuje k referenčnímu IRI položky. | ||
+ | * Směrovací služba přesměrovává referenční IRI položky na lokální IRI položky v konkrétním úložišti datových sad, kde jsou údaje o položce uloženy. | ||
+ | * Systém pro čtení údajů přistupuje k lokálnímu IRI položky na daném úložišti datových sad. | ||
+ | * Úložiště datových sad vrací veřejné údaje o položce. | ||
+ | * Systém pro čtení údajů zobrazuje nebo jinak zpracovává získané údaje. | ||
+ | |||
+ | Následující obrázek postup znázorňuje v podobě sekvenčního UML diagramu na konkrétním příkladu přístupu k veřejným údajům o službě evidované v [[nap: | ||
+ | |||
+ | {{ : | ||
+ | |||
+ | ==== Pravidla sdílení veřejných číselníků prostřednictvím VDF ==== | ||
+ | |||
+ | Speciálním případem sdílení veřejných údajů prostřednictvím VDF je pak sdílení veřejných číselníků. Vychází z architektury sdílení veřejných údajů popsané v předchozí kapitole. Má však svá specifika, která jsou popsána zde. | ||
+ | |||
+ | === Pravidla publikace veřejných číselníků do VDF === | ||
+ | |||
+ | Architektura pro publikaci veřejných číselníků do VDF je vystavěna na bázi architektury pro publikaci veřejných údajů do VDF. Aby byl veřejný číselník publikován do VDF, musí být podle § 51 odst. 8 [[https://www.zakonyprolidi.cz/ | ||
+ | |||
+ | Všechny veřejné číselníky jsou tedy jako referenční údaje evidovány v [[nap: | ||
+ | |||
+ | K realizaci výše popsané architektury publikace veřejných číselníků do VDF a jako otevřená data je nutno zajistit následující rozšíření informačního systém AIS působnostní a [[nap: | ||
+ | |||
+ | - označování veřejnosti a neveřejnosti údaje | ||
+ | - včetně odkazů na legislativu v případě neveřejnosti údaje | ||
+ | - včetně IRI datových sad v NKOD, prostřednictvím kterých je veřejný údaj publikován | ||
+ | - evidenci veřejných číselníků | ||
+ | - pro každý veřejný číselník existuje 1..- verzí, které chápeme jako jednotlivé datové sady | ||
+ | - všechny datové sady reprezentující jednotlivé verze číselníku jsou seskupeny do zastřešující datové sady | ||
+ | - pro zastřešující datovou sadu a jednotlivé verze jsou evidována metadata [[https:// | ||
+ | - mimo vlastnosti [[https://ofn.gov.cz/ | ||
+ | - kterým je u číselníků vždy MV ČR, nikoliv poskytovatel číselníku | ||
+ | - pro zastřešující datovou sadu je navíc evidováno | ||
+ | - OVM, který zavádí veřejný číselník do [[nap: | ||
+ | - což není poskytovatel datové sady s číselníkem do VDF, kterým je v případě veřejných | ||
+ | - pro verzi číselníku je navíc evidováno | ||
+ | - lokální proprietární identifikátor či kód číselníku | ||
+ | - potřebné pro konstrukci lokálních IRI číselníků a jejich položek | ||
+ | - může vyplnit poskytovatel číselníku nebo je vygenerováno automaticky, | ||
+ | - pro datové sady reprezentující jednotlivé verze číselníku jsou navíc evidovány následující vazby, které nejsou evidovány pro zastřešující datovou sadu: | ||
+ | - Je verzí (reference na zastřešující datovou sadu) | ||
+ | - Má předchozí verzi (reference na datovou sadu s předchozí verzí číselníku, | ||
+ | - zavedení nového veřejného číselníku poskytovatelem číselníku | ||
+ | - poskytovatel číselníku specifikuje metadata pro zastřešující datovou sadu číselníku | ||
+ | - lze převzít nebo jinak použít [[https://data.gov.cz/ | ||
+ | - poskytovatel číselníku specifikuje metadata pro datovou sadu s první verzí číselníku | ||
+ | - může zvolit možnost kopírovat hodnoty zadané pro zastředující datovou sadu | ||
+ | - poskytovatel číselníku předá obsah první verze číselníku ručně v uživatelském rozhraní nahráním připraveného souboru s obsahem první verze veřejného číselníku v podobě definované | ||
+ | - předchozí tři body lze realizovat také automatizovaně načtením seznamu veřejných číselníků poskytovatele z URL, které | ||
+ | - seznam musí být zpřístupněn dle [[https:// | ||
+ | - veřejné číselníky ale nemusí být pro účely předání zpřístupněny jejich správcem | ||
+ | - předaný obsah je zvalidován vůči otevřené formální normě pro číselníky | ||
+ | - obsah je uložen v podobě zkontrolovaného předaného datového souboru | ||
+ | - obsah veřejného číselníku pouze eviduje, ale nejsou nad ním stavěny žádné aplikační funkce | ||
+ | - zavedení nové verze již zavedeného veřejného číselníku poskytovatelem číselníku | ||
+ | - stejný postup jako při zavádění nového veřejného číselníku, | ||
+ | - původní verze zůstává evidována včetně její publikace do VDF a jako otevřená data | ||
+ | - funkcionality systému pro zpřístupnění údajů prostřednictvím VDF | ||
+ | - veřejné číselníky již jsou evidovány v podobě souborů s jejich jednotlivými verzemi v podobě definované otevřenými formálními normami, čili je nutno pouze zajistit jejich předání do úložiště veřejných číselníků a datových sad [[nap: | ||
+ | - další veřejné údaje evidované v [[nap: | ||
+ | - funkcionality úložiště veřejných číselníků a datových sad [[nap: | ||
+ | - bude vytvořeno ze stávajícího úložiště obsahu | ||
+ | - jako doposud bude zpřístupňovat obsah [[nap: | ||
+ | - zajistí také publikaci distribucí datových sad s verzemi veřejných číselníků evidovaných v [[nap: | ||
+ | - jelikož se jedná pouze o komponentu v rámci AIS působnostní, | ||
+ | - je nutné zajistit dostupnost nejen z veřejného internetu jako doposud, ale také prostřednictvím ISGOD ([[nap: | ||
+ | - funkcionality lokálního katalogu otevřených dat pro katalogizaci datových sad publikovaných v úložišti veřejných číselníků a datových sad [[nap: | ||
+ | - zpřístupňuje do NKOD katalogizační záznam | ||
+ | - datové sady zastřešující verze číselníků a datové sady s verzemi číselníků | ||
+ | - metadata o datových sadách jsou získány od poskytovatele | ||
+ | - metadata o distribucích jsou doplněny automatizovaně na základě vytvářených distribucí | ||
+ | - datové sady s obsahem dalších veřejných údajů evidovaných v [[nap: | ||
+ | - metadata jsou fixně předvyplněna | ||
+ | - je registrován pod MV ČR | ||
+ | - označování | ||
+ | - včetně zaznamenávání IRI datové sady s touto verzí veřejného číselníku | ||
+ | - Aby mohlo být IRI zaznamenáno, | ||
+ | - evidence veřejných údajů využívaných ohlášenou agendou | ||
+ | |||
+ | |||
+ | Kromě nových verzí veřejného číselníku existuje možnost, že je číselník kompletně nahrazen zcela novým číselníkem. V tom případě je skutečně zaveden jako zcela nový číselník bez vazby na původní číselník. Původní číselník ale zůstává evidován. | ||
+ | |||
+ | Číselníky kódující údaje evidované | ||
+ | |||
+ | === Pravidla čtení veřejných číselníků z VDF === | ||
+ | |||
+ | Čtení veřejných číselníků včetně jejich obsahu jako celku v podobě datových souborů ke stažení (VDF), přístupu k jednotlivým položkám datových sad s verzemi číselníků (VDF a otevřená data) a dotazování prostřednictvím SPARQL endpointu (otevřená data) probíhá v rámci [[# | ||
+ | |||
+ | ==== Technická pravidla pro aplikační komponenty veřejného datového fondu ==== | ||
+ | |||
+ | === Úložiště datových sad === | ||
+ | |||
+ | Úložiště datových sad je složeno ze 3 modulů: | ||
+ | |||
+ | * souborové úložiště distribucí datových sad | ||
+ | * ukládá distribuce v podobě datových souborů | ||
+ | * zpřístupňuje datové soubory distribucí prostřednictvím VDF a veřejného internetu | ||
+ | * každý datový soubor je dostupný na jednom URL, které je stejné pro VDF i veřejný internet | ||
+ | * nutno správně nastavit DNS pro KIVS/CMS a DNS pro veřejný internet | ||
+ | * modul pro validaci a transformaci distribucí dle příslušných | ||
+ | * kontroluje správné formátování a validitu | ||
+ | * provádí transformace mezi jednotlivými formáty s využitím definic transformací v otevřených formálních normách | ||
+ | * ukládá výsledky transformací do souborového úložiště a v případě RDF distribucí také do triplestore | ||
+ | * bez definované otevřené formální normy pro daný typ dat není možné údaje prostřednictvím VDF zpřístupňovat | ||
+ | * příslušnou otevřenou formální normu nebo normy získává modul z repozitáře otevřených formálních norem | ||
+ | * triplestore pro ukládání RDF distribucí | ||
+ | * ukládá RDF distribuce datové sady dle otevřených formálních norem v triplestore (triplestore = databázový systém pro ukládání RDF dat v podobě trojic) | ||
+ | * zpřístupňuje SPARQL endpoint pro dotazování nad RDF reprezentací a HTTP dereferenci IRI položek prostřednictvím rozhraní pro čtení distribucí jako otevřená data | ||
+ | * lokální IRI položky je stejné pro VDF i veřejný internet, URL SPARQL endpointu stejné pro VDF i veřejný internet | ||
+ | * nutno správně nastavit DNS pro KIVS/CMS a DNS pro veřejný internet | ||
+ | |||
+ | === Směrovací služba pro veřejné číselníky a jejich položky === | ||
+ | |||
+ | Jak bylo popsáno výše veřejný číselník bude podle otevřené formální normy pro číselníky zpřístupněn jako datový soubor ke stažení a prostřednictvím dereference IRI jednotlivých | ||
+ | |||
+ | * Referenční IRI číselníku: | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Referenční IRI verze číselníku k DDDD-MM-YY | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Lokální IRI číselníku: | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Lokální IRI verze číselníku: | ||
+ | |||
+ | https: | ||
+ | |||
+ | * Referenční IRI položky číselníku: | ||
+ | |||
+ | < | ||
+ | |||
+ | * Lokální IRI položky číselníku: | ||
+ | |||
+ | < | ||
+ | |||
+ | Kde | ||
+ | |||
+ | * <ID číselníku v RPP> značí neměnné veřejné ID identifikující číselník v RPP | ||
+ | * < | ||
+ | * < | ||
+ | |||
+ | Pro potřeby sdílení veřejných číselníků je ve směrovací službě směrování výše uvedených referenčních IRI na lokální IRI přednastaveno a není potřeba, aby správce [[nap: | ||
+ | |||
+ | Dále je potřeba ve směrovací službě nastavit směrování na referenční IRI pro případy, kdy je znám pouze < | ||
+ | |||
+ | (<RPP identifikátor agendového údaje>, < | ||
+ | |||
+ | na referenční IRI | ||
+ | |||
+ | https: | ||
+ | |||
+ | ===== Příloha 1: Metodika poskytování a čerpání údajů prostřednictvím VDF ===== | ||
+ | |||
+ | - Postupy zpřístupňování údajů prostřednictvím VDF | ||
+ | * Určení údajů poskytovaných do VDF | ||
+ | * Návrh podoby datových sad a jejich distribucí | ||
+ | * Příprava informačního systému pro export dat | ||
+ | * Export údajů do distribucí datových sad | ||
+ | * Publikace distribucí datových sad | ||
+ | * Aktualizace údajů, archivace a notifikace | ||
+ | * Katalogizace datové sady | ||
+ | * Registrace lokálního katalogu | ||
+ | * Evidence odkazů na datové sady v [[nap: | ||
+ | - Postupy čerpání údajů prostřednictvím VDF | ||
+ | * Vyhledávání datových sad s údaji | ||
+ | * Import údajů z datových sad do informačního systému | ||
+ | * Příjem notifikací o změnách v datových sadách | ||
+ | |||
+ | Přístupy se liší nejen v tom, jaké údaje zpřístupňují a komu je zpřístupňují, | ||
+ | |||
+ | ===== Příloha 2: Srovnání vlastností jednotlivých způsobů přístupu ===== | ||
+ | |||
+ | | |**Přístup k PPDF** | ||
+ | |**úroveň garance kvality obsahu** | ||
+ | |**úroveň garance zpřístupněných údajů pro výkon agend veřejné správy**|vysoká dostupnost, | ||
+ | |**sjednocený popis zpřístupněných údajů** | ||
+ | |**centrální popis způsobu zpřístupnění údajů** | ||
+ | |**podoba definice datových formátů pro zpřístupnění** | ||
+ | |**systém pro správu oprávnění** | ||
+ | |**systém pro vedení evidence přístupu k údajům** | ||
+ | |**identifikace subjektů a objektů práva** | ||
+ | |||
+ | |||
+ | |||
+ | {{tag>" | ||
- | Budou zajištěny kapacity pro vytvoření nových komponent VDF-OD. Softwarové nástroje pro realizaci VDF budou vytvořeny jako open-source s maximálním využitím existujících open-source komponent. | ||
- | Bude vytvořeno HW a SW prostředí pro provoz komponent VDF-OD. Pro potřeby orgánů veřejné správy, které budou zveřejňovat otevřená data v SVDF bude vybudováno sdílené úložiště SVDF, které umožní zajistit a garantovat dostupnost pro ostatní orgány veřejné správy. | ||
- | HW a SW prostředí pro VDF-OD bude zajištěno v NDC nebo eGovernment Cloudu. Správcem vytvořených prostředí bude Ministerstvo vnitra. | ||
- | **//Konec původního textu//** | ||