8.1.2. Машиночитаемое представление открытых данных

8.1.2. Машиночитаемое представление открытых данных

Машиночитаемое представление открытых данных должно быть реализовано посредством представления данных через API или в одном из перечисленных форматов:

1 CSV;

2 XML;

3 JSON;

4 любой из открытых форматов, реализующих модель RDF.

Название и адрес размещения машиночитаемого представления открытых данных должно соответствовать одному из следующих шаблонов:

- <адрес официального сайта>/opendata/<код организации>-<наименование набора>.расширение файла - в случае публикации через раздел открытых данных на официальном сайте;

- opendata.<адрес официального сайта>/<код организации>-<наименование набора>.расширение файла - в случае публикации через портал открытых данных государственного органа.

Общие требования к публикации машиночитаемого представления
набора открытых данных

а. открытые данные должны публиковаться в форматах CSV, XML, JSON, RDF или с применением API (в случае наборов открытых данных со специфическими особенностями). В формате CSV рекомендуется публиковать данные, имеющие плоскую табличную форму, при этом в содержании записи не допускается использование символа перевода строки. Сложные иерархические данные рекомендуется публиковать в форматах XML, JSON. Для облегчения последующего процесса связывания наборов данных рекомендуется публиковать в одном из открытых форматов, реализующих модель RDF. Подробная схема представления связей между метаданными, открытыми данными и онтологиями представлена в Приложении 1;

б. в случае если размер набора имеет значительный объем данных (более 30 Мбайт), рекомендуется архивировать его с помощью алгоритма архивирования, имеющего спецификацию в виде открытого стандарта (см. п. 8.1.4);

в. для представления наборов открытых данных, содержащих сведения из различных предметных областей, должны использоваться существующие форматы разметки типовых данных (schema.org, YMapsML, XAL и т.п.), имеющие опубликованную спецификацию;

г. необходимо избегать смены формата представления открытых данных, так как это может затруднить процесс автоматической обработки. В случае смены формата необходимо заранее уведомлять потребителей и фиксировать суть изменений (например, путем установки соответствующего значения параметра "Содержание последнего изменения" в "Изменение структуры данных" набора открытых данных);

д. атрибуты каждого набора открытых данных должны иметь краткое англоязычное представление (в виде англоязычных имен или краткого текста транслитерации);

е. машиночитаемое представление набора открытых данных (в соответствующем формате или через API) должно обеспечивать возможность автоматической идентификации и обработки информационными системами составных элементов набора (записей, сущностей и т.д.) и атрибутов этих элементов; не допускается представление данных в неструктурированной форме, затрудняющей автоматическую обработку (например, недопустимо представление набора данных в виде бинарных данных, включенных в файл офисного документа).

Полные требования и примеры к машиночитаемому представлению открытых данных представлены в Приложениях 7 - 10.