2.2.1. Выполнение требований законодательства Российской Федерации в области открытых данных

2.2.1. Выполнение требований законодательства
Российской Федерации в области открытых данных

В открытом доступе в сети Интернет в формате открытых данных могут быть опубликованы все данные, собираемые, хранимые и обрабатываемые ведомством в рамках своих полномочий, за исключением:

персональных данных,

данных, которые являются государственной тайной,

данных, доступ к которым ограничен законодательством Российской Федерации.

Первоочередной и обязательной публикации подлежат: данные в соответствии с требованиями Закона N 8-ФЗ и Постановления N 953, данные, необходимость публикации которых закреплена отдельным решением Правительственной комиссии по координации деятельности открытого правительства (далее - Правительственная комиссия).

Рекомендуется публиковать данные с максимальной глубиной детализации, без агрегации (заведомого укрупнения содержания данных, приводящего к потере важной информации из предметной области, описанной данными). Также рекомендуется публиковать данные с максимальной исторической хронологией. Например, публиковать можно различные версии одного набора данных, различающиеся по времени опубликования, по составу и названию структурных элементов данных (например, различные версии хранения и описания адреса места жительства, или внесение исправлений в данные в новой версии, или появление дополнительных атрибутов, описывающих сущности в наборе данных). Агрегированные данные и данные без исторической хронологии имеют низкую ценность и не будут востребованы конечными потребителями.

Публикация данных в сети Интернет в формате открытых данных

Публикацию наборов данных в формате открытых данных следует производить в соответствии с "Методическими рекомендациями о публикации открытых данных государственными органами и органами местного самоуправления и техническими требованиями к публикации открытых данных" от 2013 г., разработанными Минэкономразвития России и доступными на сайте www.ar.gov.ru в подразделе "Открытые данные" раздела "Информационная открытость".

В частности, детализируется публикация наборов данных на следующие этапы:

1. Подготовка раздела открытых данных на официальном сайте территориального органа.

2. Подготовка паспорта и самого набора данных.

3. Публикация паспорта набора данных и сам набор данных.

4. Подготовка и публикация реестра всех открытых данных.

Подготовка раздела открытых данных на сайте ведомства делается единовременно. Подготовка и публикация паспорта и реестра наборов данных делается каждый раз при публикации нового набора данных, а подготовка и публикация самого набора данных делается регулярно, в соответствии с периодичностью обновления самих данных.

Подготовка паспорта и самого набора данных

Паспорт набора данных - визитная карточка набора данных, содержащая исчерпывающую информацию о наборе данных, необходимую для разработчиков. Паспорт каждого набора данных территориального органа должен включать детальные сведения о происхождении и свойствах набора данных (т.н. метаданные).

Сам набор данных необходимо предварительно перевести либо в csv- (для простых линейных таблиц), либо в xml-формат (для более сложных иерархических таблиц). Перевод линейных таблиц в csv-формат может быть организован стандартными средствами Microsoft Excel и не потребует значительных усилий. Если данные публикуются в xml-формате, необходимо также опубликовать и схему этих данных в xsd-формате. Если исходные данные находятся в форматах PDF или это скан-копии документов, необходимо первоначально перевести их в машиночитаемый вид (распознать их с помощью специального программного обеспечения). Наборы, которые превышают по объему 10 Мб, лучше публиковать в сжатом формате ZIP (в заархивированном виде).

Подготовка и публикация реестра открытых данных
территориального органа

Реестр наборов данных необходим для того, чтобы была возможность централизованно получать информацию обо всех наборах данных, опубликованных ведомством, а также для автоматизированного мониторинга результатов открытия данных.

Реестр ведется по всем наборам данных территориального органа и должен содержать название набора данных и ссылку на страницу набора данных

Реестр готовится в формате CSV и публикуется на главной странице раздела открытых данных в формате, удобном, прежде всего, визуально, для чтения человеком (например, HTML) и машиночитаемом формате (например, CSV).