Навіщо відкриті дані аналітичним центрам

Доки одна частина громадянського суспільства активно закликає до публікації відкритих даних, інша частина – не знає, що це таке та як воно працює.

До останніх часто можна віднести аналітичні центри, які готують дослідження про результати імплементації інституційних реформ: конституційної, судової, органів правопорядку, адмінреформи тощо.

Тож давайте разом розбиратися, чи потрібні відкриті дані (open data) аналітикам реформ.

Нова стара ідея про державу у смартфоні
Закон України «Про доступ до публічної інформації» у 2011 році визначив поняття відкритих даних та умови їх використання (стаття 101).

Пункт 1 статті 101 Закону: Публічна інформація у формі відкритих даних – це публічна інформація у форматі, що дозволяє її автоматизоване оброблення електронними засобами, вільний та безоплатний доступ до неї, а також її подальше використання.

Пункт 2 статті 101Закону: Публічна інформація у формі відкритих даних є дозволеною для її подальшого вільного використання та поширення.

У 2015 році Державне агентство з питань електронного урядування презентувало єдиний портал відкритих даних data.gov.ua. А вже у 2016 році Україна приєдналася до «Хартії відкритих даних» – тобто взяла на себе зобов’язання робити урядові дані відкритими за замовчуванням.

Те, що відкриті дані перейшли з категорії «що це взагалі таке» до «must have» – значною мірою заслуга громадськості. Адже про open data багато розповідають Громадянська мережа ОПОРА, Тексти.org.ua, 1991 Open Data Incubator та інші. Постійні запити на якісні набори даних надходять від активістів, журналістів, розробників електронних сервісів.

Чому? Тому що втілення мрії про електронне врядування без доступу до відкритих даних – на практиці малоймовірне. І про це говорять вже не перший рік.

Що таке відкриті дані та де їх узяти?
Відкриті дані — це масиви публічної інформації, яку органи влади публікують у вільному доступі в інтернеті. Наприклад, дані про витрати бюджету, роботу чиновників, законодавчі акти чи дозвільну документацію.

У червні цього року чинності набули зміни до Постанови КМУ № 835 «Про затвердження Положення про набори даних, які підлягають оприлюдненню в формі відкритих даних». Як результат – перелік наборів, які підлягають оприлюдненню, розширився з 616 до 887, щороку має відбуватися оцінка роботи розпорядників даних, запроваджена премодерація, що посилює контроль за якістю даних.

Постанови, які стосуються оприлюднення відкритих даних, готує Державне агентство з питань електронного урядування. Ця структура також опікується Єдиним порталом відкритих даних.

Приклади сервісів, які працюють на основі наборів даних
Сервіс Rada4you допомагає перевірити, як насправді голосують депутати та фракції Верховної Ради.
Проект «Відкрита школа» – єдиний сервіс із детальною інформацією про школи, яких в Україні близько 17000.
Офіс ефективного регулювання в Україні використовує відкриті дані для допомоги підприємцям під час відкриття бізнесу, задля дотримання нормативних вимог, а також для попередження про перевірки державними органами.
Додатки на основі відкритих даних (інформація з Порталу відкритих даних):
Нові Кодекси України містить 4 мільйонів судових рішень другої та вищих інстанцій, структуровані за статтями.
PravoSud допомагає перевірити особу щодо історії судових справ, виконавчих проваджень, наявність провадження у справі про банкрутство, а також поставити таку особу на моніторинг щодо появи нових даних в державних реєстрах.
ZakonOnline – це юридична база даних, що дозволяє знайти необхідний нормативний акт, судове рішення або правову позицію.
Суд на долоні містить судові рішення з Єдиного державного реєстру судових рішень та інформацію з інших 8 пов’язаних державних реєстрів. Додаткова послуга – аналіз та прогнозування судових рішень на основі наявних документів.
Судові засідання та реєстр допомагає дізнаватися про судові засідання в судах України та отримувати судові документи з реєстру судових рішень.
Закупівлі 2.0 показує закупівлі певного держоргану чи міської ради, коли, кому й що продавало підприємство, починаючи з 2008 року.
А що ж у регіонах?
На сайті Міністерства цифрової трансформації України читаємо:

«Наразі дев’ять українських міст приєдналися до Міжнародної хартії відкритих даних – Львів, Вінниця, Дніпро, Дрогобич та Чернівці – у 2017 році, Івано-Франківськ, Кропивницький, Тернопіль та Хмельницький – у 2019 році.»

Щойно міста відкривають дані – одразу на їхній основі починають з’являтися корисні сервіси для громади. Наприклад, #Дніпро розумне місто (мапа Дніпра з даними за 27 темами) або Муніципальний чат-бот LvivCityHelper для швидкого доступу до публічної інформації міста 24/7 прямо через Фейсбук-менеджер.

Навіщо набори даних аналітикам реформ?
Щоб показати, наскільки впливова може бути аналітика даних, слід пригадати одну історію.

Її звали Флоренс Найтінгейл, їй було 38 і вона хотіла реорганізувати військово-медичну службу. Флоренс аналізувала смертність у військах та встановила, що у більшості випадків солдати гинули через причини, яким насправді можна було запобігти (наприклад, через антисанітарію). Її звіт був опублікований у 1858 році та містив графіки та діаграми.

Іноді цю історію наводять як приклад початків соціальної статистики, іноді – як приклад журналістики даних. А про Флоренс Найтінгейл пам’ятають як про засновницю сучасної сестринської справи та соціальну реформаторку.

В Україні 21 століття аналіз відкритих даних впливає на три основні фактори:

Доказова база. Відкриті дані дозволяють уникнути популізму при підготовці аналітики, тому що вказують на конкретні факти, а не їхню заанґажовану інтерпретацію. Наприклад, коли йдеться про витрачання державних коштів, впровадження державних політик та стратегій.
Прогнозування. Аналіз масиву даних з урахуванням контексту дає можливість передбачити результат перебігу тих чи інших процесів. Наприклад, точна інформація про те, як голосують конкретні депутати Верховної Ради за ті чи інші законопроекти певної реформи – це аргумент, який знадобиться для політичного аналізу.
Зростання довіри до аналітичних продуктів. Цей аспект прямо пов’язаний з методологією досліджень та з доказовою базою. Адже достовірність інформації, що ґрунтується на відкритих даних, за бажання може перевірити кожен.
«Масивні датасети дають можливості для проведення експериментів в масштабах, що до цього були немислимими в різного роду дослідженнях. У час, коли зароджувався біхевіоральний напрям в політології в 1930-их роках, а надто в 1950-60-их роках, коли він став популярним, спостерігалися подібні тенденції: з’явилася можливість обробляти небачені в той час об’єми інформації. Тоді йшлося насамперед про соціологічні вимірювання, сьогодні ж мова йде про Big Data, набори даних з мільйонами показників. В Україну популярність біхевіоралізму в політології прийшла в 90-их роках, і саме різницю в часі – близько 40 років – можна умовно окреслити як відставання в українській політології від американської. На разі ж, володіючи інструментами й навичками роботи з великими масивами даних, Україна може долучатися до світової науки і робити те ж саме, що робить увесь світ у той самий час», – пояснював важливість даних Денис Великожон, випускник політології в Острозькій академії та учасник магістерської програми «Східно-Європейські студії» в Варшавському університеті, під час дискусії «Відкриті дані для науки та аналітики».

Що потрібно аналітичним центрам, щоб використовувати відкриті дані?
Відкриті дані можна використовувати, коли людина їх розуміє, а комп’ютер може їх обробити (тобто якщо розпорядник даних опублікував їх відповідно до вимог).

Тепер розглянемо роботу аналітика з даними крок за кроком.

Для початку слід зрозуміти, що таке відкриті дані та якими вони мають бути. Для цього у вільному доступі є курс про основи роботи з відкритими даними від Державного агентства з питань електронного урядування. Його можна пройти менше ніж за годину за посиланням.
Наступним кроком має бути чітке розуміння: а які саме набори даних можуть бути цікаві у досліджуваній темі? Цю інформацію можна знайти у Постанові КМУ №835 від 10.2015 р.
Для того, щоб працювати з конкретним набором даних, знадобиться або хороше знання Excel, або спеціально навчена людина, яка зможе не лише за вказівкою аналітика знайти відповідну інформацію, а й візуалізувати її графічно (підготувати інфографіку або створити відповідні діаграми). Зрозуміти, як це працює, допоможе 45-хвилинне відео від Григорія Сорочана з Громадянської мережі ОПОРА «Робота з відкритими даними Верховної Ради України в Excel».
Останній етап – а саме візуалізація даних для аналітики – дотична до галузі журналістики даних. Такий тип матеріалів активно розвивається в Україні, адже великі та яскраві візуалізації – це не лише можливість побачити тенденції у різних сферах життя, а й цікавий інформаційний продукт, що вабить читача-користувача. Тим паче, що сучасні технології дозволяють як створювати креативні статичні інфографіки, так і генерувати, до прикладу, інтерактивні карти.

Чи потрібні відкриті дані регіональним аналітикам?
Що робити, наприклад, регіональному аналітику чи аналітикині Громадської мережі публічного права та адміністрації? Особливо, якщо він не досліджує законопроекти Верховної Ради?

Перш ніж поринати у світ відкритих даних – важливо зрозуміти, які дані вже зараз доступні та можуть знадобитися як інформація для дослідження. Це повертає до Постанови КМУ №835 від 10.2015 р., де можна подивитися приклади даних, які відкриває держава.
Якщо місто ще не відкриває потрібні експерту дані (або не відкриває дані взагалі) – можна долучитися до адвокації цієї ідеї на місцевому рівні. Наприклад, до проекту Дані міст.
Наостанок
Використовувати відкриті дані в роботі аналітичного центру чи ні – персональне рішення експерта. Усе залежить від сфери дослідження, його особливостей, предмету та об’єкту аналізу. Проте відкриті дані – це джерело інформації. Як писав дослідник Big Data Сет Стівенс-Давідовіц у книзі «Усі брешуть, але інтернет знає твої думки»: «Найкращий спосіб отримати правильну відповідь на питання – це об’єднати всі доступні дані».

Ксенія Дітчук,
керівник проекту Центру політико-правових реформ

Джерело: https://www.prostir.ua/?blogs=navischo-vidkryti-dani-analitychnym-tsentram