3. Создание единого хранилища первичных статистических данных (включая агрегированные и первичные данные) и совершенствование распространения данных

3. Создание единого хранилища первичных
статистических данных (включая агрегированные и первичные
данные) и совершенствование распространения данных

Разрозненный сбор статистических данных федерального и ведомственного сегментов всеми субъектами статического учета привел к созданию и эксплуатации десятков государственных информационных систем и сотен ведомственных хранилищ данных.

По результатам опроса, проведенного Федеральной службой государственной статистики в рамках плана мероприятий, в котором приняли участие 16 из 62 федеральных органов исполнительной власти, являющихся субъектами официального статистического учета, была получена информация о том, что федеральные органы исполнительной власти, участвовавшие в опросе, являются операторами 45 государственных информационных систем, в составе которых насчитывается 617 баз данных.

При этом хранилища данных субъектов статистического учета, в свою очередь, также представлены на разных уровнях - федеральном и региональном. На федеральном уровне информация представлена в агрегированном виде, а на региональном - в виде первичных статистических данных или отсутствует, а статистические данные представлены в виде набора бумажных или электронных таблиц или форм федерального статистического наблюдения.

Таким образом, данные федерального уровня представлены в различных структурах и форматах в зависимости от субъекта официального статического учета.

При этом различие в методиках сбора и обработки (агрегирования) данных не позволяет обеспечить взаимосвязь статистических данных разных ведомств. В связи с отсутствием согласованности методик сбора и расчета статистических показателей возникают случаи, когда у разных субъектов статистического учета по идентичным показателям формируется противоречивая официальная статистическая оценка одних и тех же экономических понятий и объектов. В связи с тем, что первичные данные не хранятся на региональном уровне, их нельзя использовать повторно.

Кроме того, для эксплуатации и развития информационных систем, поддерживающих процессы хранения и агрегирования статистических данных, необходимы существенные затраты всех субъектов статистического учета и бюджета Российской Федерации.

Создание платформы направлено в том числе на обеспечение возможности повторного использования первичных статистических данных для расчета и построения аналитических отчетов, анализа "больших" данных, обеспечения доступа всех заинтересованных лиц к деперсонифицированным микроданным, создания предпосылок к переходу на потоковый сбор первичных статистических данных.

Существующая в настоящее время в федеральных органах исполнительной власти система сбора и хранения первичных статистических данных, а также организационное, методологическое и правовое обеспечение не позволяют в полной мере обеспечить достижение указанных целей и задач.

В период с 2013 по 2017 год Федеральной службой государственной статистики была создана и введена в промышленную эксплуатацию Система многомерного анализа данных на основе единого хранилища данных, которая решила задачу разрозненности хранилищ данных, функционировавших на тот момент в рамках информационно-вычислительной системы Федеральной службы государственной статистики. Были объединены, сопоставлены и сведены к единой нормативно-справочной информации все статистические данные федерального уровня, накопленные в информационно-вычислительной системе Федеральной службы государственной статистики.

С учетом положительного опыта создания и эксплуатации Системы многомерного анализа данных на основе единого хранилища данных в рамках создания платформы необходимо:

создать единое хранилище первичных статистических данных;

осуществить систематизацию и нормализацию накопленных в ведомственных системах агрегированных статистических данных;

создать инструменты аналитической работы с первичными данными, разрозненными данными и данными различных источников, в том числе с созданием для выполнения указанных работ государственно-частного партнерства;

создать в целях государственного управления инструменты доступа к ведомственным данным на базе единого хранилища первичных статистических данных платформы, обеспечить межведомственное взаимодействие;

обеспечить взаимодействие с международными организациями, в том числе с применением SDMX, XBRL;

предоставить доступ к деперсонифицированным микро- и макроданным с привлечением центра компетенций и с созданием государственно-частного партнерства;

обеспечить методологическую и нормативную правовую основы работы с деперсонифицированными микро- и макроданными, включая возможность тестового доступа к данным;

создать инструменты доступа к деперсонифицированным микро- и макроданным.

Поступившие от субъектов статистического учета через "Единое окно" для представления отчетности в электронном виде первичные статистические данные должны размещаться в едином хранилище первичных статистических данных платформы.

Доступ субъектов официального статистического учета и федеральных органов исполнительной власти к единому хранилищу первичных статистических данных платформы должен осуществляться с использованием единого унифицированного механизма, в качестве которого возможно рассматривать, например, единую систему межведомственного электронного взаимодействия.

Для реализации доступа субъектов официального статистического учета и федеральных органов исполнительной власти к единому хранилищу первичных статистических данных платформы с использованием единой системы межведомственного электронного взаимодействия необходимо:

организовать разработку и последующее рассмотрение Правительственной комиссией по цифровому развитию, использованию информационных технологий для улучшения качества жизни и условий ведения предпринимательской деятельности технологических карт межведомственного взаимодействия, определяющих перечень первичных статистических данных, подлежащих передаче из единого хранилища первичных статистических данных платформы в соответствующие государственные информационные системы;

организовать разработку электронного сервиса единой системы межведомственного электронного взаимодействия, реализующего информационный обмен по соответствующим технологическим картам межведомственного взаимодействия.

При выполнении работ по созданию единого хранилища первичных статистических данных платформы и совершенствованию распространения данных должны быть учтены мероприятия, проводимые в рамках создания и внедрения единой системы нормативной справочной информации и национальной системы управления данными.

В качестве одного из перспективных способов доступа пользователей к ресурсам платформы можно рассматривать единый портал государственных и муниципальных услуг с использованием сервиса, реализующего запрос на получение сводных (агрегированных) данных с учетом требований к конфиденциальности первичных статистических данных.

Вне зависимости от способа доступа платформа должна обеспечивать возможность предоставления статистических данных в привычном для пользователей виде (сборники, публикации, отчеты и др.). Помимо привычных представлений в платформе должен быть представлен гибкий инструментарий по формированию внутренних и внешних витрин данных, обеспечивающий доступ к статистической информации разного уровня различным группам пользователей в зависимости от ролевой модели, а также доступ к данным посредством программных интерфейсов технологического взаимодействия (API).

Целесообразным также представляется выполнение центром компетенций функций по приему запросов и формированию аналитических отчетов и витрин данных на основе деперсонифицированных микро- и макроданных.

Также необходимо отметить, что на 2020 год запланировано проведение Всероссийской переписи населения, в рамках которой предусмотрен сбор данных для формирования основы всей статистики о населении.

В настоящее время существует несколько государственных информационных источников о населении: Всероссийская перепись населения и единый федеральный информационный ресурс, содержащий сведения о населении Российской Федерации, создаваемый Федеральной налоговой службой.

Вместе с тем единый федеральный информационный ресурс, содержащий сведения о населении Российской Федерации, создаваемый на основе данных государственных и муниципальных информационных систем (единые государственные ресурсы органов записи актов гражданского состояния, Министерства внутренних дел Российской Федерации, Пенсионного фонда Российской Федерации, Федеральной налоговой службы и др.), оперирует прежде всего данными, полученными по месту регистрации, а также специфическими данными, имеющими отношение к определенному министерству, собирающему такие данные.

В связи с этим в рамках создания и развития платформы должна быть решена задача интеграции баз данных платформы и Всероссийской переписи населения 2020 года, единого федерального информационного ресурса, содержащего сведения о населении Российской Федерации, которая позволит обеспечить привязку собранных данных непосредственно к месту проживания лиц. Для этого необходимо разработать механизмы сопоставления и интеграции данных, имеющихся в указанных источниках.

Интеграция позволит расширить перечень информации о лице, осуществив привязку его деятельности к геолокации, дополнив описанием семейной ячейки, домохозяйства и жилого фонда, в котором проживает такое лицо. Это даст возможность использовать статистические данные для адресного выделения ресурсов или принимать более качественные управленческие решения. При этом актуализацию данных в платформе необходимо проводить после каждой переписи населения и микропереписи (раз в 5 лет).