Překlady této stránky:

Toto je starší verze dokumentu!


<title>Veřejný datový fond</title>

<note important>Konkrétní implementační kroky a způsoby zapracování do informační koncepce OVS jsou popsány v kapitole Pravidla pro funkční celky architektury jednotlivých úřadů</note>

Veřejný datový fond (také jako "VDF") je princip vytváření a dotváření obrazu propojeného datového fondu dle principů otevřených dat za účelem podpory sdílení údajů OVS při výkonu veřejné správy i mimo jejich rozsah práv a povinností zachycených v RPP a mimo PPDF.

VDF zastřešuje a reprezentuje skutečné fyzické datové zdroje otevřených dat roztroušené ve webovém prostoru VS. Vlastní zastřešení a vymezení je realizováno nástroji určenými pro správu metadat otevřených dat, což nejen konkretizuje samotný pojem VDF, ale nabízí i prostředky pro další kategorizace v rámci celého datového fondu ČR.

Význam a role VDF se projevuje ve dvou oblastech VS.

První se týká interního režimu VS, kde je hlavním prostředkem sdílení veřejných údajů mezi veřejnoprávními subjekty navzájem a také rozšiřuje vzájemné sdílení informací o ty údaje, které v PPDF vůbec nejsou. Význam VDF v této oblasti nejlépe vystihuje znění dílčího cíle 5.10 z Informační koncepce ČR.

“Veřejný datový fond tvořený publikovanými veřejnými údaji veřejné správy je základní metodou pro sdílení veřejných informací mezi veřejnoprávními subjekty navzájem i pro sdílení veřejných údajů mezi veřejnoprávní a soukromoprávní sférou v ČR. Veřejný datový fond se od pouhé publikace automatizovaně čitelných Open Dat posune též k publikaci právně závazných, platných a pravidelně aktualizovaných datových sad s jasně definovanou zodpovědností OVS za takové sady.”

Druhou důležitou oblastí, ve které VDF sehrává významnou roli, je oblast směřování ČR k otevřenému vládnutí a postupnému zpřístupňování informací VS veřejnosti. VDF je tvořen publikovanými informacemi VS v podobě otevřených dat a tak se stává součástí všech veřejně přístupných otevřených dat v ČR.

Datový fond VS ČR je tvořen všemi daty VS ČR a je obsažen v následujících kategoriích datových zdrojů:

center|400px

PPDF - propojený datový fond - je tvořen veškerými autoritativními údaji a referenčními údaji podle zákona č.111/2009 Sb.o základních registrech, přičemž účelem propojeného datového fondu orgánů veřejné moci je maximalizovat užitek uživatele služby z možnosti sdílení uložených údajů v souladu s právy a povinnostmi zachycenými v registru RPP.  Autoritativní údaj je údaj vedený v informačním systému veřejné správy ohlášený ohlašovatelem agendy do registru práv a povinností. Propojený datový fond je primárním zdrojem platných a právně závazných neveřejných údajů pro subjekty práva i pro všechny orgány veřejné moci při výkonu jejich působnosti.

VDF - veřejný datový fond - je tvořen zejména publikovanými “obrazy” dat obsaženými v PPDF ve formátu otevřených dat a slouží k zpřístupnění dat PPDF interním uživatelům VS v těch případech, kdy příslušná OVM nemají možnost tato data sdílet prostřednictvím PPDF (nemají přidělena práva v RPP) a přitom taková data potřebují ke své práci. Dále je VDF doplněn o data, která PPDF neobsahuje, jako jsou různé verze číselníků a jejich konsolidace. Veškeré publikované “obrazy” PPDF jako otevřená data jsou zpřístupněna také veřejnosti. VDF tedy v podstatě obsahuje publikovaný “obraz” PPDF ve formátu otevřených dat v rámci možností stanovených zákony o způsobu zveřejnění údajů umožňujícím dálkový přístup, doplněný o data, která v PPDF nejsou, ale jsou důležitá pro správnou interpretaci údajů, jako jsou např. číselníky. Veškerá publikovaná data ve VDF musí být ve formátu otevřených dat a musí splňovat požadavky kladené na otevřená data v duchu zákona č.106/1999 Sb. Výjimkou mohou být pouze takové případy, zcela úplnému otevření dat brání nějaká omezení (např. omezení na nekomerční využití, …). Tento typ dat je označen jako “data VDF s řízeným přístupem”, pro která platí stejné podmínky jako pro otevřená data, pouze je nutná registrace s případným povolením publikující organizace. VDF slouží jako doplňkový zdroj dat pro OVM v případě, že v RPP nemají přidělena práva k těmto údajům (viz. cíl 5.10 informační koncepce) a také jako výchozí zdroj dat ve formátu otevřených dat určených veřejnosti.

OD - otevřená data - je tvořen všemi publikovanými daty VS ve formátu otevřených dat, která musí splňovat požadavky na otevřená data dle zákona č.106/1999 Sb. Součástí otevřených dat jsou také všechny lokální otevřená data samospráv a otevřená data využívaná v konceptu SMART Cities..

ŘP - data s řízeným přístupem - specifikum otevřených dat. Jedná se v podstatě o otevřená data, která splňují podmínky definované zákonem č.106/1999 Sb., avšak z nějakých důvodů je jejich použití limitováno, nebo je nelze poskytovat anonymně komukoliv a tak se může vyžadovat případná registrace, nebo povolení publikující organizace. U takových dat by byla problematická i katalogizace v NKOD dle zákona č.106/199 Sb. a také z tohoto důvodu odlišení na specifikum. Tento typ dat se může vyskytovat ve VDF i mimo VDF.

center|800px

OVM (případně SPUÚ) při výkonu správních činností používá autoritativní a referenční údaje prostřednictvím ISZR a eGSB obsažené přímo v PPDF na základě svých práv a povinností zachycených v RPP. V případě, že se dostane do situace, že k výkonu bude potřebovat údaje, na které nemá dle RPP právo, využije k získání potřebných dat vhodnou publikovanou sadu otevřených dat s požadovanými údaji z VDF prostřednictvím NKOD, pokud taková datová sada existuje. Pokud ještě neexistuje, získá potřebná data jinými komunikačními prostředky a současně prostřednictvím správy VDF požádá správce odpovídající agendy o doplnění údajů ve formátu otevřených dat do VDF.

Veřejnost má otevřený přístup k datům prostřednictvím NKOD, mezi data zpřístupněná veřejnosti patří VDF a také všechna otevřená data mimo VDF. K údajům uloženým v PPDF se veřejnost může dostat pouze zprostředkovaně s využitím OVM, SPUÚ nebo Portálu občana. Přístup je ale omezen na údaje jednotlivých občanů, kdy každý občan má právo na získání všech dat vedených o něm v IS VS jako o subjektu práva v " otevřené podobě", tj. ve strojově čitelném otevřeném formátu a pro něj k neomezenému užití.

VDF obsahuje datové zdroje, které slouží jako doplňkový zdroj dat pro OVM v takových případech, kdy OVM nemají k použití takových dat přímo z PPDF přidělena práva v RPP.  V konečném důsledku se také tímto způsobem rozšiřuje sdílení údajů vedených v propojeném datovém fondu nad rámec zajišťovaný ISZR a eGSB (viz. cíl 5.10 informační koncepce). Významným a hodnotným efektem VDF je také jeho zpřístupnění veřejnosti ve formátu otevřených dat v rámci možností a podmínek vymezených v zákonech u jednotlivých agend.

VDF je tvořen zásadně pouze otevřenými daty a daty s řízeným přístupem, které jsou současně i součástí Otevřených dat VS, a pro která tedy platí principy otevřených dat. Ve skutečnosti to znamená, že otevřená data musí být:

  • Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF a další formáty s otevřenou specifikací.
  • Opatřená podmínkami užití neomezujícími jejich užití.
  • Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří.
  • Opatřená úplnou dokumentací.
  • Opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření, apod.)
  • Publikovány dle otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím.

center|600px

Otevřená data VDF - jasně a přesně definovaná zákonem č.106/1999 Sb. a jedná se o otevřená data splňující všechny požadované vlastnosti na ně kladené a také garance kvality, aktuálnosti, pravidelnosti aktualizace a zajištění požadavků na automatické notifikace všech změn zaregistrovaným zájemcům. Kontrola plnění všech požadavků, včetně zajištění automatické notifikace, bude probíhat v rámci katalogů a správy VDF.

Data VDF s řízeným přístupem - platí vše co pro Otevřená data VDF, přibývá ale nová povinnost - registrace a případné vyžádání povolení pro práci s daty.

VDF vytvořený na základě principů otevřených dat vytváří virtuální distribuovaný datový prostor, ve kterém orgány veřejné správy sdílí s veřejností i mezi sebou navzájem veřejné údaje evidované v jimi spravovaných ISVS. Správa takového virtuálního prostředí a udržení kvality, konzistence a aktuálnosti publikovaných dat vyžaduje zcela odlišný přístup, než je tomu u klasického managementu dat. Správa je založena na správě metadat publikovaných datových sad, popisu datových zdrojů a sémantickém mapování prvků struktur datových sad na sémantický slovník pojmů VS s.pomocí k tomu určených nástrojů.

Správa dat VDF bude v základu probíhat stejným způsobem jako jsou již spravována otevřená data VS  s několika dalšími rozšířeními. Základem bude katalog dat NKOD, který bude upraven a doplněn tak, aby mohl rozlišovat jednotlivé kategorie dat, umožňoval registrace uživatelů a zajišťoval notifikace změn.Takto upravený a rozšířený NKOD získá nový rozměr i název “ČEDAK” a bude sloužit nejen pro VDF, ale také pro všechna otevřená data VS. Podmnožina funkcí katalogu ČEDAK nutná k zachování souladu se zákonem č. 106/1999 Sb. zůstane stále označována názvem NKOD.

Přehled všech nástrojů využitých při práci s daty VDF a otevřenými daty uvádí následující obrázek.

center|800px

ČEDAK - “Český datový katalog” zastřešuje nástroje a funkční oblasti NKOD nutné pro katalogizaci a správu všech kategorií dat. PPDF není předmětem správy katalogu ČEDAK, neboť má vlastní správu prostřednictvím ISZR a eGSB.

Základní zajišťované funkce katalogem:

  • katalogizace otevřených dat (VDF-OD a OD),
  • katalogizace dat s řízeným přístupem (VDF-ŘP a ŘP),
  • katalogizace a správa číselníků,
  • automatická notifikace změn v publikovaných datových sadách.

Základní logické celky katalogu:

  • NKOD - upravený a doplněný pro správu informací o jednotlivých kategoriích dat a jejich zařazení do VDF.
    • NKOD je nástroj, ve kterém jednotlivé orgány veřejné správy katalogizují jimi zveřejňovaná otevřená data a jiné orgány veřejné správy a veřejnost v něm otevřená data vyhledává a získává k nim přístup.
    • Existence NKOD a povinnost jednotlivých orgánů veřejné správy v něm katalogizovat svá otevřená data je dána zákonem č. 106/1999 Sb., o svobodném přístupu k informacím, který zavádí definici otevřených dat a národního katalogu otevřených dat NKOD.
  • Katalog dat s řízeným přístupem - katalog se stejnou funkcionalitou jako NKOD, navíc by měl také obsahovat seznam předepsaných podmínek na použití jednotlivých publikovaných datových sad a odkazy na publikující organizaci.
  • Interní katalog uživatelů otevřených dat (KUOD) - bude evidovat, jaké orgány veřejné správy využívají jaká otevřená data ve VDF.
  • Katalog (registr) uživatelů dat s řízeným přístupem - seznam uživatelů s přiděleným povolením využívat data s řízeným přístupem a seznam povolených datových sad.
  • Katalog (registr) uživatelů dat s požadavkem na zasílání notifikací o změnách v publikovaných datových sadách - seznam uživatelů s požadavky na zasílání notifikací o změnách pro konkrétní publikované datové sady,.
  • Notifikační HUB - nástroj zajišťující s pomocí katalogu uživatelů dat s požadavkem notifikace automatickou distribuci notifikací změn v publikovaných sadách při ohlášení změny ze strany publikující organizace. Při registraci datové sady předává publikující organizaci URI pro zasílání informací o změnách.
  • Katalog číselníků
  • Nástroj pro konsolidaci číselníků
  • Registrace chybějících sad v VDF-OD (chybějící obrazy PPDF)

Sémantický slovník pojmů - slovník pojmů veřejné správy, jako nástroj harmonizace sémantiky otevřených dat, bude vytvořen na bázi výčtů údajů vedených k agendám v Registru práv a povinností dle § 51 odst. 5 písm. g), h) a i) zákona č. 111/2009 Sb. o základních registrech a bude je postupně rozpracovávat do podoby opakovaně použitelných a sdílených informačních modelů (ontologií), které budou propojeny na údaje vedené k agendám a též propojovány se slovníky a ontologiemi vznikajícími z iniciativy EU (např. ISA Core Vocabularies). Logická schémata otevřených dat popisujících jejich strojové (syntaktické) vyjádření na logické úrovni budou propojena na pojmy sémantického slovníku pojmů, čímž bude realizováno propojení sémantiky (významu) dat napříč jednotlivými ISVS. Sémantický slovník pojmů bude nedílnou součástí VDF a stane se základem popisu sémantiky publikovaných dat a jejich vzájemného propojení.

Nástroj pro správu sémantického slovníku pojmů (NSSSP) – umožní správu sémantického slovníku pojmů všemi orgány veřejné správy a popisovat jejich data za účelem sémantické harmonizace.

Datový portál  (DP) – vstupní brána do světa otevřených dat VS. Obsahuje odkazy na NKOD, vzdělávací informace, publikační standardy, šablony, doporučené postupy, související dokumenty a informace o otevřených datech zveřejněných ve Standardech publikace a katalogizace otevřených dat

Lokální katalog otevřených dat - LKOD - volitelně implementován pro potřeby katalogizace otevřených dat konkrétního poskytovatele dat. NKOD pravidelně automaticky přebírá informace o zveřejněných datových sadách z jednotlivých lokálních katalogů.

Katalog aplikací nad otevřenými daty – seznam všech služeb (aplikací) využívajících publikované datové sady s možnostmi vyhledávání dle využívaných datových sad, nebo na základě životních situací konzumenta dat.

VDF-OD (otevřená data) jsou obsažena ve dvou skupinách datových zdrojů:

  • datové zdroje obsahující veřejně přístupný obraz propojeného datového fondu PPDF,
  • datové zdroje rozšiřující obraz PPDF o data, která v PPDF nejsou.

VDF-ŘP (data s řízeným přístupem) obsahují datové zdroje, jejichž využití vyžaduje splnění definovaných omezujících podmínek, zveřejněných publikujícím subjektem OVM.

center|600px

Datové zdroje vytvářející veřejně přístupný obraz PPDF.

Pro tuto oblast platí následující jednoduchá obecná pravidla.

  • Pro každý datový zdroj v PPDF musí existovat nějaký obraz ve VDF a to dle následujícího pravidla:
    • pro datové zdroje s legislativně stanoveným dálkovým přístupem budou předmětem publikace vždy primární data,
    • u datových zdrojů bez legislativně stanoveného dálkového přístupu budou v případě, že tomu nebude nic bránit, publikovány primární data, v opačném případě budou publikace provedeny ve formě statistik a agregací.
  • Pokud jakýkoliv zákon uvádí někde dálkový přístup k údajům, tak automaticky příslušný datový zdroj se stává součástí VDF a musí být vytvořen obraz jeho primárních dat ve formátu otevřených dat.

Výčet datových zdrojů tvořících obsah veřejně přístupného obrazu PPDF.

  • Obrazy základních registrů
    • ROS
    • RÚIAN
    • RPP
    • ROB - jako obraz registru budou publikovány statistiky z registru.
  • Obrazy veřejných rejstříků (veřejné rejstříky právnických a fyzických osob podle zákona č. 304/2013 Sb. o veřejných rejstřících právnických a fyzických osob.).
    • spolkový rejstřík,
    • nadační rejstřík,
    • rejstřík ústavů,
    • rejstřík společenství vlastníků jednotek,
    • obchodní rejstřík,
    • rejstřík obecně prospěšných společností.
  • Obraz autoritativních údajů (data všech IS VS dle RPP).
  • Obraz všech rejstříků, u kterých zákon definuje jejich dálkový přístup, pokud neexistují žádné právní překážky nebo významná rizika.
  • Rejstříky bez stanoveného dálkového přístupu v zákonech - publikace agregací nebo statistik.

Rozšíření obrazu PPDF

  • Publikace všech (i lokálních) číselníků, jejich sémantické provázání, případná konsolidace a uvedení kontextů zachycujících jejich použití.

Data s řízeným přístupem

  • Obraz všech rejstříků, u kterých zákon definuje jejich dálkový přístup, ale existují právní překážky nebo významná rizika bránící jejich veřejnému zpřístupnění.
  • Publikované statistiky, nebo jiné datové sady, jejichž obecné využití je nežádoucí, nebo je lze zpřístupnit pouze omezenému okruhu uživatelů, případně existují jiná omezení (např. zákaz komerčního využití, …).
  • Pro všechna data VS platí, že vždy je nejprve zvažováno zveřejnění v podobě otevřených dat, a pouze v případě existence objektivních a jasně zdůvodněných právních překážek či rizik je přistoupeno k publikaci dat s řízeným přístupem. Zdůvodnění řízeného přístupu a uvedení podmínek pro zpřístupnění dat je vždy povinnou součástí dokumentace dat.

Cílem publikace dat VS do VDF je vytvoření harmonizovaného a konzistentního obrazu PPDF ve VDF, sémanticky provázaného i na odpovídající pojmy legislativy s pomocí Sémantického slovníku pojmů, včetně zachycených vzájemných souvislostí. Aby byla zajištěna konzistence VDF, a aby se z něj vytvořil rovnocenný obraz PPDF, je proto nutné, aby publikované datové sady datových zdrojů v PPDF byly publikované na úrovni propojených dat. Toho se dosáhne publikací konkrétních distribucí datových sad z PPDF s provedenou vazbou na sémantický slovník pojmů s využitím formátu JSON-LD. Z tohoto důvodu musí platit pravidlo, že součástí VDF budou pouze ty distribuce datových sad, které budou ve formátu JSON-LD a budou mít namapovaný kontext na sémantický slovník pojmů.

  • Základem publikace do VDF je tedy sémantický slovník pojmů vytvořený na základě údajů v RPP, a který popisuje PPDF a tedy i budoucí obrazy ve VDF.
  • Vlastní publikace bude realizovaná distribucemi datových sad s využitím formátu JSON-LD a s provedenou vazbou na sémantický slovník pojmů.

Publikované obrazy datových zdrojů PPDF ve VDF vytvoří infrastrukturu pro všechna otevřená data VS, což prakticky znamená, že publikující organizace nebudou muset při publikaci nových datových sad publikovat data, která již vypublikovaná budou, ale pouze budou publikovat nové rozšiřující informace k jednotlivým entitám VDF. Do jejich povinností ale přibude povinnost doplnit vazby nově publikovaných údajů na již existující entity ve VDF.

Pravidla publikace do VDF

  • Pro každý datový zdroj v PPDF musí existovat nějaký obraz ve VDF a to:
    • pro datové zdroje s legislativně stanoveným dálkovým přístupem budou předmětem publikace vždy primární data,
    • u datových zdrojů bez legislativně stanoveného dálkového přístupu budou publikace provedeny ve formě statistik a agregací.
  • Pokud konkrétní zákon uvádí někde dálkový přístup, tak automaticky příslušný datový zdroj se stává součástí VDF a musí být vytvořen obraz jeho primárních dat ve formátu otevřených dat.
  • Publikovaná datová sada z datového zdroje PPDF musí k tomu, aby se stala součástí VDF:
    • obsahovat alespoň jednu distribuci datové sady ve formátu JSON-LD,
    • musí mít u této distribuce doplněný kontext, který bude mapovat strukturální prvky JSON souboru na sémantický slovník pojmů,
    • musí být publikována dle předepsaných otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím.
  • V případě duplicit u publikovaných datových sad ve VDF, nebo doplňování údajů různými publikujícími ke stejné publikované entitě, spadá povinnost doplnění vazeb na již publikované autoritativní údaje vždy na toho publikujícího, který publikuje neautoritativní údaj.
  • U každé datové sady publikované do VDF musí být uvedena informace o notifikačním mechanismu o změnách dle příslušné OFN uvedené na POD.
  • Publikované číselníky ve VDF musí být ve formátu JSON-LD s kontextem, stávající formáty CSV a XML mohou být použity při publikaci do otevřených dat mimo VDF.
  • K zajištění garance kvality a právní závaznosti publikovaných dat musí publikující organizace:
    • ….
    • ….
  • K zajištění garance aktuálnosti publikovaných dat musí publikující organizace:
  • K zajištění garance aktualizace publikovaných dat musí publikující organizace:

Zapojení VDF do výkonu veřejné správy vyžaduje zajištěnou garanci kvality publikovaných datových sad, což znamená zajistit publikaci skutečně právně závazných, platných a pravidelně aktualizovaných datových sad s jasně definovanou zodpovědností OVS za takové sady. Je zřejmé, že takový stav bude obtížné dosáhnout stávajícími přístupy k publikaci otevřených dat ve VS, kdy publikace probíhá ne příliš koordinovaně, často nestandardními způsoby a s absencí používání doporučených standardů.

K zajištění kvalitního veřejného datového fondu bude nutné přistoupit k plánovanému vytváření VDF a také ke změně stávajícího paradigmatu - oddělit data VS od aplikací a posunout je do centra řízení informatiky v souladu s postavením dat v legislativě. Správa a řízení dat VS se zdá být v budoucnu nezbytná i ve světle proklamací, že data jsou to nejcennější co organizace, a tedy i veřejná správa a v konečném důsledku i veřejnost, mají.

Musí vzniknout “Datová kancelář” s příslušným Chief data officer (CDO) organizačně postavená na úrovni OHA s následujícími pravomocemi a povinnostmi:

  • spravovat a rozvíjet datový fond VS ČR, zejména PPDF a VDF,
  • udržovat a rozvíjet sémantický slovník pojmů VS,
  • a mít právo kontroly dodržování rozvoje datového fondu VS ČR ze strany jednotlivých OVS.

Konec nového textu.

Začátek původního textu

Veřejnými rejstříky právnických a fyzických osob podle zákona č. 304/2013 Sb., Zákon o veřejných rejstřících právnických a fyzických osob (také jako „veřejný rejstřík“), se rozumí:

  • spolkový rejstřík,
  • nadační rejstřík,
  • rejstřík ústavů,
  • rejstřík společenství vlastníků jednotek,
  • obchodní rejstřík a
  • rejstřík obecně prospěšných společností.

Do veřejného rejstříku se zapisují zákonem stanovené údaje o právnických a fyzických osobách (také jako "zapsaná osoba"). Veřejný rejstřík je informačním systémem veřejné správy. Veřejný rejstřík je veden v elektronické podobě. Veřejný rejstřík vede soud (také jako "rejstříkový soud").

Ministerstvo financí uveřejňuje způsobem umožňujícím dálkový přístup informace o osobách zapsaných v České republice a údaje o tom, ve kterém veřejném rejstříku jsou tyto osoby zapsány. Ministerstvo financí umožňuje získat o údajích vedených ve veřejných rejstřících elektronický opis.

Údaje z Obchodního rejstříku společně s údaji z Registru živnostenského podnikání (také jako "RŽ"P) a Registru ekonomických subjektů (také jako "RES"), Registru plátců spotřební daně (také jako "SD") a dalších zdrojů publikuje Ministerstvo financí prostřednictvím Administrativního registru ekonomických subjektů (také jako "ARES"). ARES je IS, který zpřístupňuje veřejné údaje o ekonomických subjektech z informačních systémů (zdrojů) veřejné správy. Obsahuje údaje ze základních (majoritních) zdrojů, které jsou formou odkazů doplněny údaji z dalších zdrojů. Při zpracování se používají též kontrolní zdroje.

Veřejné rejstříky a vzdálený přístup k jejich údajům prostřednictvím ARES předcházely Základním registrům a musí být s nimi sladěny a integrálně nově zařazeny do celkové koncepce eGovernmentu. Koncepce rozvoje veřejných rejstříků a jejich IS musí tedy naplňovat přinejmenším následující požadavky:

  1. Všechny rejstříky musí obsahovat ztotožněné údaje FO a PO, pokud je bylo proti čemu ztotožnit (u rezidentů).
  2. Všechny rejstříky vedle toho, že jsou publikovány na internetu, musí být dostupné jako otevřená data. A to přímo, nebo prostřednictvím OD k ARES.
  3. Všechny rejstříky musí být pro potřeby agend OVS dostupné přes e_gsb, a to buď sdruženě, prostřednictvím ARES, nebo přímo, pokud jejich veřejné údaje nejsou v ARES zahrnuty.
  4. ARES, jako klíčový veřejný rejstřík s velkým hospodářským dopadem, musí být být průběžně rozvíjen a inovován tak, aby odpovídal aktuálním potřebám občanské i podnikové veřejnosti ČR.

Otevřenými daty se v rámci veřejného datového fondu se rozumí celek obsahující údaje zveřejňované orgány veřejné správy jako otevřená data v NKOD. Otevřená data jsou:

  1. Volně přístupná na webu jako datové soubory ke stažení ve strojově čitelném a otevřeném formátu - CSV, XML, JSON, RDF a další formáty s otevřenou specifikací
  2. Opatřená podmínkami užití neomezujícími jejich užití, viz návod na stanovení podmínek užití
  3. Evidovaná v Národním katalogu otevřených dat (NKOD) jako datové sady opatřené přímými odkazy na datové soubory, které je tvoří
  4. Úplný obsah databáze nebo agregovaná statistika
  5. Opatřená dokumentací
  6. Připravena s cílem co nejsnazšího strojového zpracování programátory apod.
  7. Opatřená kontaktem na kurátora pro zpětnou vazbu (chyby, žádost o rozšíření, apod.)
  8. Jsou publikovány dle otevřených formálních norem ve smyslu § 4b odst. 1 zákona č. 106/1999 Sb. o svobodném přístupu k informacím.

Pokud vaše datová sada nesplňuje všechny uvedené podmínky, nejedná se o otevřená data české veřejné správy podle zákona č. 106/1999 Sb., o svobodném přístupu k informacím, který definuje otevřená data ve svém § 3 odst. 11.

Otevřenými daty zejména není:

  1. odkaz na vyhledávací formulář určený pro koncové uživatele
  2. odkaz na novou stránku s dalšími informacemi
  3. odkaz na veřejné mapové rozhraní GIS
  4. odkaz na API umožňující přístup k jednotlivým záznamům či vyhledávání záznamů, nikoliv export kompletních dat
  5. datový soubor ve formátu PDF
  6. datový soubor ve formátu XLS formátovaný pro tisk nebo obsahující výpočty
  7. datový soubor v pseudo-CSV formátu (např. jiný oddělovač než “,”)

Pro zajištění publikace otevřených dat z IS je třeba:

  1. Zajistit možnost získávání kompletních dat z IS v podobě datových souborů ve strojově čitelném a otevřeném formátu
  2. Zajistit publikaci datových souborů na webu organizace nebo v jejím lokálním katalogu otevřených dat
  3. Opatřit je lidsky čitelnou dokumentací a strojově čitelným schématem
  4. Opatřit je otevřenými podmínkami užití
  5. Zaregistrovat je v Národním katalogu otevřených dat

NKOD je nástroj, ve kterém jednotlivé orgány veřejné správy katalogizují jimi zveřejňovaná otevřená data a jiné orgány veřejné správy a veřejnost v něm otevřená data vyhledávají a získávají k nim přístup.

Existence NKOD a povinnost jednotlivých orgánů veřejné správy v něm katalogizovat svá otevřená data je dána zákonem č. 106/1999 Sb., o svobodném přístupu k informacím, který zavádí definici otevřených dat, NKOD a zmocňuje vládu vydat nařízení o seznamech, evidencích či registrech, jejichž veřejný obsah je povinně zveřejňován jako otevřená data, § 5 odst. 7 tohoto zákona pak zmocňuje orgány veřejné správy zveřejňovat i další informace jako otevřená data.

Nařízení vlády č. 425/2016 Sb. o seznamu informací zveřejňovaných jako otevřená data stanovuje, jaké informace mají být zveřejňovány orgány veřejné správy jako otevřená data povinně.

Pro naplnění závazků, které vyplývají ze strategických dokumentů, bude zveřejňování otevřených dat povinné pro všechny správce ISVS. Pro zamezení vytváření duplicitních informací ve veřejné správě, které mohou být zveřejňovány, bude zavedena povinnost orgánů veřejné správy je sdílet jako otevřená data.

Průběžná změna legislativního prostředí musí vést k postupnému rozšiřování povinností orgánů veřejné správy zveřejňovat informace reprezentované jako údaje evidované v ISVS, jejichž zveřejnění je možné, nebo jejich anonymizovanou podobu, souhrn či statistiku jako otevřená data s cílem dosáhnout plošné povinnosti. Je nutné výslovně zanést možnost zveřejňovat informace jako otevřená data do zvláštních předpisů upravujících zveřejňování údajů, v jejichž případě se postup podle zákona o svobodném přístupu k informacím nepoužije, např. do zákona o právu na informace o životním prostředí.

Je též nutné legislativně ukotvit povinnost orgánů veřejné správy využívat při výkonu svých agend otevřená data poskytovaná jinými orgány veřejné správy. To se týká především číselníků, kdy jsou stejné číselníky vytvářeny různými orgány veřejné správy.

Různá kvalita otevřených dat komplikuje jejich opakovatelnou použitelnost. Je též téměř nemožné sdílet veřejné údaje mezi orgány veřejné správy jako otevřená data, neboť neexistují žádné garance dostupnosti. Pro zlepšení současného stavu se VDF stane virtuálním distribuovaným datovým prostorem, ve kterém orgány veřejné správy sdílí s veřejností i mezi sebou navzájem veřejné údaje evidované v jimi spravovaných ISVS v podobě kvalitních otevřených dat. VDF-OD bude mít následující součásti:

  • Národní katalog otevřených dat – bude zvýšena jeho uživatelská přívětivost i na bázi sémantického slovníku pojmů. Bude podporovat standard DCAT-AP[1].
  • Nástroj pro správu sémantického slovníku pojmů (NSSSP) – umožní správu sémantického slovníku pojmů všemi orgány veřejné správy a popisovat jejich otevřená data za účelem sémantické harmonizace otevřených dat.
  • 5* (pětihvězdičkový) veřejný datový fond (5VDF) – bude podmnožinou otevřených dat, které jsou zveřejněny jako propojená otevřená data. Jeho součástí bude index datových entit, který pro každou datovou entitu reprezentovanou v 5VDF poskytuje základní údaje z 5VDF a odkazy na různé její reprezentace v otevřených datech jednotlivých orgánů veřejné správy v 5VDF.

Budou zajištěny kapacity pro vytvoření nových komponent VDF-OD. Softwarové nástroje pro realizaci VDF budou vytvořeny jako open-source s maximálním využitím existujících open-source komponent.

Bude vytvořeno HW a SW prostředí pro provoz komponent VDF-OD. Pro potřeby orgánů veřejné správy, které budou zveřejňovat otevřená data v SVDF bude vybudováno sdílené úložiště SVDF, které umožní zajistit a garantovat dostupnost pro ostatní orgány veřejné správy.

HW a SW prostředí pro VDF-OD bude zajištěno v NDC nebo eGovernment Cloudu. Správcem vytvořených prostředí bude Ministerstvo vnitra.

Konec původního textu

, 2023/02/21 16:51
Dobrý den,
přikládám dotaz ke scénáři plnění VDF údaji z autoritativního zdroje, který mi z popisu není jasný. Pokud je zdrojem datového kmene některý ze Základních registrů a konkrétní referenční údaj je ze zákona veřejný, jakým správným způsobem má zmiňovaný "Systém pro správu datového kmene" (v zodpovědnosti poskytovatele údajů do VDF = Správce ZR) správně komunikovat se Základním registrem při tvorbě datové sady? Může "Systém pro správu datového kmene" při tvorbě datové sady komunikovat se ZR napřímo a dávkově?

S pozdravem Radek Pohan
, 2023/02/22 16:00
Dobrý den,

publikovat údaje by měli pouze jejich původci. V případě základních registrů u nich žádné údaje nevznikají, všechny jsou převzaté od editorů základních registrů. Datové sady veřejných dat ZR by tedy měly publikovat původci, např. ISEO, CIS, ISKN apod.
Se základními registry se nedá komunikovat jinak, než přes systém ISZR, který je součástí referenčního rozhraní.

S pozdravem,
Tomáš Šedivec
, 2022/12/21 12:46, 2022/12/21 13:20
Dobrý den, volně dostupný open-source nástroj nabízený MVČR se prozatím nepovedlo realizovat. Děkujeme za pochopení.
, 2022/12/05 11:01
dotaz:
Zhruba na straně 8 je uvedeno: "Softwarový nástroj úložiště datových sad může správce ISVS vyvinout vlastní nebo může využít volně dostupný open-source nástroj nabízený a udržovaný MV ČR".
O jakém nástroji se tam zmiňujete?
Děkuji za odpověď.
, 2022/12/21 12:49, 2022/12/21 13:21
Dobrý den, volně dostupný open-source nástroj nabízený MVČR se prozatím nepovedlo realizovat. Děkujeme za pochopení
Vložte svůj komentář: