Відкриті дані: що це таке, де їх шукати і як використовувати?

29 Вересня 2020 13:26

Які шанси у школяра з вашого міста — учня конкретної школи — заразитись коронавірусною хворобою? Який результат мав «Опозиційний блок» у вашому окрузі на парламентських виборах 2014 року? Як співвідноситься смертність від онкозахворювань із кількістю автомобілів на душу населення? Відповіді на ці й багато інших важливих питань можна отримати за допомогою відкритих даних. Пояснюємо, що це таке, де їх шукати і як можна використати.

Що таке відкриті дані?

Це публічна інформація у форматі, придатному для автоматизованої обробки електронними засобами, інакше кажучи, у форматі, який може опрацювати програмне забезпечення без участі людини.

Найлегше їх знайти на Єдиному державному порталі відкритих даних. На порталі є понад 33 тисячі наборів даних, які посортовано за розпорядниками, групами, тематиками тощо.

Хто адмініструє цей портал?

Міністерство цифрової трансформації України . До серпня 2019 року цим займалось Державне агентство з питань електронного урядування. Наповнюють портал самі розпорядники інформації. Міністерство також проводить у партнерстві з міжнародними організаціями конкурс Open Data Challenge для проєктів, які використовують і створюють відкриті дані.

Хто визначає, яким даним бути відкритими, а яким ні?

Вся інформація апріорі має бути відкритою, якщо немає причин її обмежити до неї доступ.

2015 року Кабінет Міністрів, виконуючи закон «Про доступ до публічної інформації», затвердив Положення про набори даних, які підлягають оприлюдненню у формі відкритих даних. У ньому є довгий перелік даних, які обов’язково повинні публікуватись і періодично оновлюватись, сортований за розпорядниками. Цей перелік не є вичерпним.

Наприклад, ініціатива OpenUp добивається у судах відкриття даних, які не є в переліку. Свою діяльність активісти аргументують тим, що у постанові вказано, що у форматі відкритих даних мають оприлюднюватися ті дані, які можуть дати антикорупційний, економічний ефект чи мають суспільний інтерес.

Міністерство цифрової трансформації доповнює цей перелік. В ідеалі вся публічна інформація, доступ до якої не обмежений, мала би бути (і колись стане) доступною в мережі у так званому машиночитному форматі.

Чим машиночитні дані кращі за папірці?

Набори даних можна аналізувати, зіставляти з іншими, візуалізувати й поширювати у зручному форматі. Як правило, цим займаються журналісти, аналітичні організації, громадські проєкти (наприклад, Clarity Project,YouControl і Сіті-бот Назар), а також стартапи, бізнес, створюючи сервіси, до прикладу, для відслідковування руху громадського транспорту, бізнес-партнерів. З відкритими даними може створювати цікаві штуки кожен. Вам може допомогти Державний портал відкритих даних .

Також через відкриті дані можна відслідковувати корупцію, особливо коли йдеться про корупцію в державних масштабах.

Справа OpenUp vs ДАБІ

Державна архітекурно-будівельна інспекція (ДАБІ) відмовила запитувачці Надії Бабинській (Вірній) надати на запит відомості, передбачені Порядком ведення єдиного реєстру документів, що дають право на виконання підготовчих та будівельних робіт і засвідчують прийняття в експлуатацію закінчених будоб’єктів.

Запитувачці було відмовлено нібито «з технічних причин», та поінформовано про можливість ознайомитися з даними на офіційному сайті.

«Проте інформація на сайті не є у форматі відкритих даних (не піддається автоматичній обробці), а головне – в такому вигляді неможливо відслідкувати зміни, які вносилися в реєстр. А зміни в такому реєстрі — це важливе питання контролю і моніторингу, адже реєстр — це про будівництво, про компанії-забудовників. Тобто цінність цих даних надважлива, з огляду на проблемні будівництва в містах України», – розповіла запитувачка.

Дані були оприлюднені у форматі відкритих даних лише в грудні 2019 року – у розпал судових баталій.

Причому міністр цифрової трансформації Михайло Федоров зауважив, що там «поганий стан даних, явні сліди багаторазового переписування даних, приховування даних...» .

Відкриті дані справді можна використовувати без спеціальної освіти і навичок?

Тут існує кілька рівнів складності, але є набори, з якими цілком можуть дати собі раду прості користувачі. 15 років тому письменники брати Капранови, зіставивши кількість голосів за Віктора Януковича і кількість бібліотек на душу населення, відкрили свій «закон» . Це було задовго до ухвалення закону «Про доступ до публічної інформації». Уявіть, що вони могли би відкрити зараз, маючи під рукою портал відкритих даних! :)

А серйозно?

Для роботи з великими, об’ємними даними потрібно мати навички програмування. Окрім того дані важливо правильно інтерпретувати. З відкритих даних можна дізнатися найпопулярніші марки автомобілів у різних регіонах, але не відповідь на запитання «чому?» Щоб зіставляти масиви даних, шукаючи закономірності, варто мати базові знання з математики. Або хоча б проконсультуватися з експертом, перш ніж робити висновки.