2.2.1. Выполнение требований законодательства Российской Федерации в области открытых данных

2.2.1. Выполнение требований законодательства
Российской Федерации в области открытых данных

В открытом доступе в сети Интернет в формате открытых данных могут быть опубликованы все данные, собираемые, хранимые и обрабатываемые ТОФК в рамках своих полномочий, за исключением:

персональных данных;

данных, которые являются государственной тайной;

данных, доступ к которым ограничен законодательством Российской Федерации.

Первоочередной и обязательной публикации подлежат:

Рекомендуется публиковать данные с максимальной глубиной детализации, без агрегации (заведомого укрупнения содержания данных, приводящего к потере важной информации из предметной области, описанной данными). Также рекомендуется публиковать данные с максимальной исторической хронологией. Например, публиковать можно различные версии одного набора данных, различающиеся по времени опубликования, по составу и названию структурных элементов данных (например, различные версии хранения и описания адреса места жительства, или внесение исправлений в данные в новой версии, или появление дополнительных атрибутов, описывающих сущности в наборе данных). Агрегированные данные и данные без исторической хронологии имеют низкую ценность и не будут востребованы конечными потребителями.

Публикация данных в сети Интернет в формате открытых данных

Публикацию наборов данных в формате открытых данных следует производить в соответствии с "Методическими рекомендациями о публикации открытых данных государственными органами и органами местного самоуправления и техническими требованиями к публикации открытых данных" от 2013 г., разработанными Минэкономразвития России и доступными на сайте www.ar.gov.ru в подразделе "Открытые данные" раздела "Информационная открытость" <1>.

--------------------------------

<1> На 12:00, 05.06.2013, скачать данные методические рекомендации можно по ссылке: http://ar.gov.ru/inform_otkritost_05_otkritii_dannie/index.html.

В частности, детализируется публикация наборов данных на следующие этапы:

1. Подготовка раздела открытых данных на официальном сайте ТОФК.

2. Подготовка паспорта и самого набора данных.

3. Публикация паспорта набора данных и сам набор данных.

4. Подготовка и публикация реестра всех открытых данных.

Подготовка раздела открытых данных на сайте ТОФК делается единовременно. Подготовка и публикация паспорта и реестра наборов данных делается каждый раз при публикации нового набора данных, а подготовка и публикация самого набора данных делается регулярно, в соответствии с периодичностью обновления самих данных.

Подготовка паспорта и самого набора данных

Паспорт набора данных - визитная карточка набора данных, содержащая исчерпывающую информацию о наборе данных, необходимую для разработчиков. Паспорт каждого набора данных ТОФК должен включать детальные сведения о происхождении и свойствах набора данных (т.н. метаданные).

Сам набор данных необходимо предварительно перевести либо в csv- (для простых линейных таблиц), либо в xml-формат (для более сложных иерархических таблиц). Перевод линейных таблиц в csv-формат может быть организован стандартными средствами Microsoft Excel и не потребует значительных усилий. Если данные публикуются в xml-формате, необходимо также опубликовать и схему этих данных в xsd-формате. Если исходные данные находятся в форматах PDF или это скан-копии документов, необходимо первоначально перевести их в машиночитаемый вид (распознать их с помощью специального программного обеспечения). Наборы, которые превышают по объему 10 Мб, лучше публиковать в сжатом формате ZIP (в заархивированном виде).

Подготовка и публикация реестра открытых данных ТОФК

Реестр наборов данных необходим для того, чтобы была возможность централизованно получать информацию обо всех наборах данных, опубликованных ТОФК, а также для автоматизированного мониторинга результатов открытия данных.

Реестр ведется по всем наборам данных ТОФК и должен содержать название набора данных и ссылку на страницу набора данных.

Реестр готовится в формате CSV и публикуется на главной странице раздела открытых данных в формате, удобном, прежде всего, визуально, для чтения человеком (например, HTML) и машиночитаемом формате (например, CSV).