Відкриті дані під час війни: питання, що потребує відповіді

Відкриті дані під час війни: питання, що потребує відповіді

Photo: ua.depositphotos.com / ADragan
26 Вересня 2022
FacebookTwitterTelegram
4823

На початку повномасштабної війни уряд закрив реєстри та доступ до відкритих даних. Це негативно вплинуло на бізнеси, побудовані на відкритих даних, та знизило прозорість державних органів. Поступово, за кілька місяців, доступи почали відновлювати, проте до повноцінної відкритості ще далеко. Як знайти баланс між захистом даних про фізичних та юридичних осіб, прозорістю влади (що є необхідним елементом громадського контролю над нею) та потребами бізнесу? Розбираємося у цій статті.   

Україна, яка щороку досягала значного прогресу в забезпеченні прозорості урядування та підкорювала рейтинги Open Data Maturity Report, Open Data Barometer та Global Data Barometer, різко змінила політику відкритості в протилежний бік. У перші тижні повномасштабної війни більшість наборів даних була закрита. Таке рішення піддали критиці відомі компанії та ініціативи, такі як YouControl, Liga:Zakon,Open Up, Антикорупційний штаб та інші. Чи можливо знайти компроміс та які питання потрібно вирішити для цього?

Історія питання

24 лютого було відключено Національний портал відкритих даних. 24-25 лютого за допомогою особистих зв’язків представники державних структур просили проекти, які використовують відкриті дані (наприклад, сервіс пошуку декларацій чиновників, Ring, ukr.vote), приховати ту чи іншу інформацію. Низка проектів самостійно прибрали з публічного доступу частину персональних даних зі своїх продуктів. 

З початку березня найбільш цінні ресурси (наприклад, Реєстр виборців), що вимагають захисту, вимикали з мережі та фізично вивозили сервери. Влада працювала в режимі «гасіння пожеж», оскільки досі була відсутня політика роботи з даними.

У середині березня вийшла постанова КМУ, яка дозволила обмежувати роботу систем, що публікують дані. У середині квітня найгучнішою подією у цій сфері став наказ Мін’юсту про припинення публікації інформації у форматі відкритих даних.

Держава закрила все, що вважала за потрібне закрити, пояснивши, що довго думати про те, що закривати, а що ні, не було часу. Згодом у публічну площину повернулися судові рішення, статистичні дані, фінанси та деякі інші набори у форматі відкритих даних. На початку серпня відновив свою роботу Національний портал відкритих даних, проте сьогодні більшість даних на ньому – це історичні архіви, які не оновлюються.

Чому відкриті дані важливі?

  1. Відкриті дані – це політичне явище та один з інструментів впливу на політику. Класичне «Knowledge is the Power» Френсіса Бекона тут працює на всі 100%. 
  2. Якість відкритих даних – це показник якості управління. Якщо дані не використовуються, то про їхню якість ніхто не дбає.
  3. Відкриті дані додають прозорість діяльності владних інститутів, і тому важливі для суспільного контролю над ними. Водночас їх публікація може нести ризики для публікатора, який прагне зберегти статус кво.

Поточна ситуація

Стосунки між інститутами влади та спільнотою відкритих даних завжди були дещо напруженими. Проте сьогодні діалог фактично припинився.

Розпорядники даних не зацікавлені у їхньому відкритті з кількох причин. По-перше, вони можуть зекономити ресурси, які раніше витрачалися на підготовку та публікацію даних. По-друге, закриття даних виводить низку питань з-під публічного контролю. Нарешті, якщо відкриті дані будуть використані ворогом, відповідальність лежатиме саме на чиновниках, які схвалили відкриття того чи іншого набору даних.

В умовно мирний час спільнота відкритих даних працювала у судах та з Уповноваженим з прав людини, проводила публічні кампанії та громадські дискусії з представниками різних держорганів. Аргументи про понад 7 мільйонів користувачів сервісів на основі відкритих даних, прогнозовані мільярди ВВП та міжнародні рейтинги, в яких Україна посідала перші місця за прозорістю, як правило, були достатніми для відкриття даних. 

При цьому навіть до повномасштабного вторгнення були люди, які неоднозначно ставилися до публікації даних. Наприклад, у 2018 році ІТ-спільнота обурювалася, коли з’явилася мапа з усіма домашніми адресами ФОПів, що працюють у цій сфері.

Зараз контекст змінився. Достатньо буде кількох повідомлень про те, що «приліт» ракети відбувся на об’єкт, який фігурував у відкритих даних, або що на окупованій території окупанти приходили насамперед до людей із певного публічного реєстру, щоб суспільна думка схилилася на користь закриття даних.

Схоже, для судів безпека також переважає прозорість. Так, нещодавно Велика Палата ВСУ скасувала позитивне рішення, яке стосувалося відкритості даних за замовчуванням. Можливо, якби це рішення ухвалювалося за інших обставин, його зміст був би іншим. 

Позиція громадськості

Спільнота відкритих даних, зокрема громадські організації, які займаються розробкою політики у цій сфері, наводить декілька аргументів проти вищезгаданого рішення Мін’юсту про закриття даних:

(1) Відкриті дані до 23 лютого і так з високою ймовірністю були зібрані Російською Федерацією. Відключення порталу відкритих даних у цьому плані нічого не вирішує. 

Це хороший аргумент, якщо вважати, що сьогодні проти однієї системи воює інша система. Насправді, проти безладу веде боротьбу інший безлад. Тому повернення всіх даних у публічну площину дозволить величезній кількості випадкових людей використовувати інформацію для суспільно шкідливих цілей.

(2) Відкриті дані вилучили із публікації незаконно

Це справедливе твердження. Влада не подбала ані про внесення змін до законодавства, ані про належне документальне забезпечення вилучення наборів з публічного доступу. І зрозуміло, що не проводився передбачений законом «Про доступ до публічної інформації» «трискладовий тест» для визначення потенційної шкоди від публікації даних.

(3) Відсутність відкритих даних шкодить економіці.

Сервіси втрачають від 25% та більше користувачів. Проте причина цього – не лише перехід сервісів у режим архівів, а й те, що у користувачів у зв’язку з активною фазою війни з’явилися зовсім інші цілі та пріоритети. Враховуючи значне скорочення економічної активності, показник у 25% втрат користувачів не виглядає надто великим. Водночас деякі сервіси на основі відкритих даних взагалі припинили роботу. Однією з останніх втрат став сервіс Monitor.Estate.

Певні сервіси ще працюють. Наприклад, «Суд на долоні» отримував нових підписників, проте кожного попереджали, що система працює в режимі архіву і сервіс готовий повернути гроші, якщо дані не задовольняють користувачів. Наразі ніхто не скористався цією опцією.

Зближення позицій

Спільнота відкритих даних об’єднує гравців зі спільними принципами, але різними інтересами. Так, розробники продуктів на основі відкритих даних більше зацікавлені у створенні якісних продуктів та отриманні прибутку, тоді як громадські організації намагалися врахувати інтереси споживачів. Після 23 лютого комунікація всередині спільноти значно зменшилася. Проте сьогодні дискусії відновлюються. Зокрема, напрацьовуються підходи до того, як не допустити остаточного згортання відкритих даних і навіть як їх розвивати. Мінцифри мало б увійти до цього процесу та координувати його, щоб отримати виважене рішення, яке врахує різнопланові інтереси.

Мінцифри робить кроки до відновлення публікації даних. Щоб розподілити відповідальність, міністерство звернулося до громадських організацій, які мають добру репутацію, із проханням провести оцінку ризиків від публікації даних та запропонувати варіанти реалізації політик. 

Судова адміністрація повернула у публічний доступ не лише рішення (хоча й не всі), а й перелік стану судових справ, який містить персональні дані громадян України. Мін’юст також продовжив надавати дані без обмежень та у повному обсязі через свій API. За повідомленнями від представників спільноти відкритих даних, користувачами таких платних сервісів були й російські компанії. Тож це рішення, вочевидь, потрібно переглянути.

Також цікаво, що низка держструктур (наприклад, уже згадана Державна судова адміністрація) використала воєнний час, щоб створити прикладні інтерфейси програмування (API) для комерціалізації даних.

Що робити сьогодні

Перш за все – налагодити комунікацію між зацікавленими сторонами – державою, бізнесом, громадськими організаціями, щоб ухвалення рішень в царині відкритих даних відбувалося з урахуванням інтересів різних гравців. Ось кілька рекомендацій для знаходження оптимальних рішень у взаємодії спільноти користувачів відкритих даних та їхніх розпорядників.

(1) Відкриті дані вимагають зусиль та відповідальності розпорядника

Теоретично, чиновники мають проводити трискладовий тест, тобто визначати, чи служить приховування інформації громадським інтересам, чи може публікація завдати шкоди, і чи перевищує суспільний інтерес шкоду від публікації. Проте на практиці виникає багато питань – зокрема, як забезпечити відповідну кваліфікацію та доброчесність тих, хто проводитиме цей тест?

Більше того, на порталі відкритих даних були опубліковані десятки тисяч наборів. Оцінювати окремо кожен із них – дорого. Теоретично, можна було б розбити їх на класи за Постановою КМУ №835 та робити узагальнену оцінку такого класу. Але набори даних не публікуються за єдиним стандартом. Хтось опублікує лише «залишки» даних, а хтось – «зайві» поля даних зі службовою чи чутливою інформацією.

Тому, як на мене, зараз найкращий час працювати над пріоритизацією наборів. Спочатку варто публікувати на Національному порталі відкритих даних лише мета-інформацію про кожний набір даних. Має бути опублікований вичерпний перелік полів, кількість записів, невелика вибірка даних або кілька згенерованих фейкових рядків, які дозволяли б зрозуміти, як виглядає набір. Після цього можна займатися відкриттям даних на запит спільноти (наприклад, якщо набирається певна кількість голосів «за», органи влади проводять аналіз набору даних, після чого відкривають його або аргументовано пояснюють відмову від його відкриття). 

Цей процес має бути максимально публічним. Тоді можна буде налагодити пряму та постійну комунікацію з користувачами даних та спільну роботу. Якщо ж відкриті дані призводять до проблемних ситуацій, кожному користувачеві даних можна буде подати сигнал про те, що той чи інший продукт необхідно змінити для безпеки. 

Можливо, такий принцип «даних на запит» замість «відкритість за замовчуванням» варто зберігати лише до закінчення воєнного стану.

(2) Має бути зрозуміла політика щодо приховування даних

Для більшості користувачів відкритих даних пріоритетом є повнота і точність наданої інформації. Зрештою, від цього залежить особиста репутація користувача та репутація продукту на основі відкритих даних. Сьогодні із запитом на приховування тих чи інших даних до користувача можуть звернутися державні органи або суб’єкт персональних даних (наприклад, з окупованої території). В такому разі рішення про приховування даних ухвалюватимуть розробники продуктів. Так для проекту «Суд на долоні» було прийнято рішення, що певні дані можуть бути приховані, але при цьому буде впроваджуватися політика, яку використовує Google під час вилучення окремих посилань з пошукової видачі. Тобто в системі має залишатися інформація про те, що той чи інший контент був прихований, частина мета-інформації про контент або статистика про прихований контент. Можуть бути й інші підходи, але проблема набуватиме актуальності – тому потрібно працювати над її вирішенням.

(3) Розвиток військових відкритих даних

Сьогодні держава володіє (або теоретично могла б мати) дуже цікаві масиви даних.

Наприклад, можна було б повністю опублікувати статистику тривог і «прильотів». Інформація про тривалість тривоги, про час і напрям ракетних ударів могла б бути корисною для зіставлення даних із різними інформаційними проектами на кшталт «Білоруський гаюн», для оцінки часу, за який необхідно ховатися в бомбосховищі, аналізу ризиків залежно від локації. 

Дані щодо динаміки ворожих втрат чи біженців також можна було б широко використовувати – наприклад, для розробки державної політики. 

Інший приклад – це інформація про ворожих солдатів, яку публікує ГУР МО. Ці дані публікуються в форматах, які геть не зручно аналізувати. А ці дані могли б бути корисними для сервісів з деанонімізації ворожих солдатів. Потрапляння інформації про людину до публічної площини знижує бажання залучатися до злочинної діяльності.

Ще один приклад – публікації пропагандистських каналів у телеграмах. Коли СБУ публікує рисунок із переліком назв таких каналів, де немає ID сторінок, а на саму картинку ще й накладено «водяний знак», загалом незрозуміло, з якою метою її було опубліковано. Тож із військовими даними залишаються ті самі проблеми, що й раніше з відкритими.

Якби держава увімкнула доступ до російських ресурсів, можна було б працювати з відкритими даними РФ. Цілком можливо, що хакатони із застосуванням даних противника дали би поштовх розвитку галузі. Військовий час часто є джерелом несподіваних інновацій.

(4) Міжнародна робота

Мене щиро дивує, що Мінцифри не проводить жодних активностей з міжнародною спільнотою. Адже Україна у 2015-2022 роках найбільш динамічно розвивалася в галузі відкритих даних, ми послідовно імплементували усі принципи Хартії відкритих даних, і зараз опинилися в абсолютно унікальній ситуації (війна 2014-2022 років та війна 2022 року – це дуже різні війни). Думаю, як для України, так і для світової спільноти було б корисно обговорити виклики, які постали в галузі відкритих даних, із Тімом Бернсом Лі, Руфусом Поллоком та іншими яскравими представниками спільноти.

Проблеми, що постають у сфері відкритих даних у зв’язку з війною, прикладні аспекти використання даних мають виходити на метарівень, де тепер багато нових цікавих питань.

Замість висновку

Ситуація з відкритими даними зараз сама є відкритою. Україні варто не втратити свої досягнення у сфері відкритості. Робота для військових успіхів, фінансової стабільності, соціальних гарантій вразливим категоріям українців – це робота на перемогу сьогодні. Робота з відкритими даними – це один із аспектів перемоги завтра. Післявоєнний час поставить нові завдання, роботу над якими варто починати вже зараз.

Коментар Олексія Грибановського, старшого дата аналітика Центру вдосконалення закупівель Київської школи економіки:

«З одного боку, через війну реєстри справді варто було закрити для публічного доступу. З іншого боку, деякі державні органи скористалися закриттям реєстрів, щоб почати надавати доступ до даних на комерційній основі. При цьому таким чином дані можуть отримати й особи, пов’язані з Росією. Тож ключова проблема в тому, що розпорядники даних не надали чіткої інформації про те, хто саме та на яких умовах може отримати дані. Мінцифри разом із зацікавленою громадськістю має напрацювати відповідні критерії та процедури доступу до даних».

Автори
  • Кирило Захаров, автор проекту «Суд на долоні», розробленого на основі відкритих даних

Застереження

Автори не є співробітниками, не консультують, не володіють акціями та не отримують фінансування від жодної компанії чи організації, яка б мала користь від цієї статті, а також жодним чином з ними не пов’язаний