Готовы ли журналисты Кыргызстана к открытым данным?

Готовы ли журналисты Кыргызстана к открытым данным?

Школа Данных

Проценты. Именно эта простейшая математическая операция часто дает новостной повод в журналистике данных.


Один день.  1 августа Федеральная Налоговая Служба Российской Федерации опубликовала статистику бухгалтерской и налоговой отчетности в формате открытых данных. 2 августа издание РБК выпустило расследование: в 15% российских компаний, данные о которых раскрыла ФНС, нет ни одного сотрудника, в 50% фирм работают по 1–2 человека. РБК также обнаружил две малоизвестные компании, в которых работают свыше 600 тыс. человек. Что тут особенного и почему это важно для Кыргызстана?


Работа в таблицах. Самое важное - на момент публикации набора в РБК была команда, которая не боится файла в 2, 5 миллиона строк, умеет работать с данными и знает, где и как искать в них истории. Максимальные и минимальные значения, общие тренды, проценты и средние значения - вот где надо начинать копать.


Проверка. Оказалось, что в компании, где было зарегистрировано по полмиллиона человек, на самом деле никого не числится. Редакция выяснила это, позвонив за комментарием гендиректору фирмы. «Организация деятельности не ведет. В статистике ошибка», сообщил он, и РБК обратился обратно в ФНС с вопросом о корректности данных. Умение не слепо доверять, а перепроверять данные - это необходимый навык для современного журналиста и любого специалиста, который работает с фактами.


Интерпретация данных - это поиск объяснений. Причина редко бывает единственной, и надо уметь видеть проблему с нескольких сторон. С одной стороны, “в любой отрасли есть множество малых компаний, чей вклад ничтожен”. А с другой, “работодатели не принимают сотрудников в штат, потому что хотят сэкономить на выплатах”, объясняют эксперты. Получается, на каждом таком сотруднике экономят примерно 170 000 рублей в год. За счет его пенсии, конечно. Так данные позволяют увидеть проблемы, о которых мы, может, и догадываемся, но не знаем наверняка.


Впереди предстоит еще два этапа раскрытия данных - 1 октября ФНС опубликует информацию о суммах доходов и расходов по данным бухгалтерской отчетности, а также сумме уплаченных налогов, сборов и страховых взносов, а 1 декабря будут обнародованы данные о суммах недоимки и задолженности по пеням и штрафам организаций. И в РБК эти данные уже ждут.


В Кыргызстане тоже готовят к запуску портал открытых данных, где пилотные ведомства будут размещать информацию о стране. А готовы ли мы к этим данным? Сможем ли мы их проанализировать, отличить ошибки от аномалий, и найти в наборе истории?