Часть критериев классификации включено в качестве метаинформации к паспорту набора данных:
- формат данных;
- объем данных;
- способ публикации;
- способ хранения;
- периодичность обновления и актуальности данных.
Критерий предметной области выделяет специфические особенности публикации открытых данных по специализированным тематикам.
Тематики наборов предполагают использование различных справочников и стандартов для связывания наборов открытых данных между собой. Для связывания наборов открытых данных возможно использование международных общепринятых стандартов, систем и справочников, таких как: ISO 8601 (международный стандарт, описывающий формат даты и времени), EPSG: 4326 (система координат геоданных). При использовании общепринятых стандартов, систем и справочников обязательным требованием является указание данных онтологий в структуре набора открытых данных (например, для формата xsd структуры - Дата первой публикации набора данных в формате ISO 8601.). При использовании собственных справочников (например, ОКАТО или другой специализированный справочник) необходимо указывать ссылку на справочник или на онтологию справочника в структуре набора открытых данных. Используемые общепринятые стандарты, системы и справочники не должны иметь никаких ограничений в использовании.
В том случае, если в рамках перечисленных тематик используются различные и/или закрытые справочники и стандарты, необходимо согласование и утверждение единых открытых спецификаций в рамках тематики. Процедура выработки технических спецификаций осуществляется посредством Совета по открытым данным.
В соответствии с перечнем наиболее важных сегментов открытых данных, выделенных в Хартии открытых данных, классификация наборов может проводиться по следующим тематикам:
Категория данных
| Примеры массивов данных
| Компании
| Компании/реестр предприятий
| Преступность и правосудие
| Статистика преступности, безопасность
| Наблюдение за планетой
| Метеорологические данные/сведения о погоде, сельском хозяйстве, лесоводстве, рыбной ловле и охоте
| Образование
| Список школ; результативность работы школ, цифровые навыки
| Энергетика и окружающая среда
| Уровни загрязнения, энергопотребление
| Финансовые и контрактные вопросы
| Заключенные сделки, подписанные контракты, поданные заявки на участие в тендере, будущие тендеры, местный бюджет, национальный бюджет (планируемый и расходуемый)
| Геопространственные данные
| Топография, почтовые индексы, национальные карты, местные карты
| Международное развитие
| Предоставление помощи, продовольственная безопасность, добывающая промышленность, землепользование
| Подотчетность правительственного аппарата и демократия
| Контактная информация для связи с правительством, результаты выборов, нормативно-законодательные акты и уставы, заработные платы (ставки заработной платы), знаки признательности/подарки
| Здравоохранение
| Данные о назначаемых препаратах, данные о результатах
| Наука и исследования
| Данные о геномах, исследовательская и образовательная деятельность, результаты экспериментов
| Статистика
| Национальная статистика, перепись, инфраструктура, уровень благосостояния, профессиональные навыки
| Социальная мобильность и благосостояние
| Жилищное обеспечение, медицинское страхование и пособие по безработице
| Транспорт и инфраструктура
| Расписание общественного транспорта, точки доступа к широкополосным каналам
|
11. Приложение 3. Рекомендуемые инструменты визуализации
Наименование инструмента
| Гиперссылка
| Описание/характеристики
| Google Chart Tools
| http://code.google.com/apis/chart/
| Javascript API от Google для простого создания таблиц визуализации для постоянно изменяющихся данных.
| GeoCommons
| http://geocommons.com
| Инструментарий визуализации для совместного использования геоданных.
| JavaScript InfoVis Toolkit
| http://thejit.org
| Javascript-инструментарий для создания и поддержки визуализации различного рода графиков.
| Google Public Data Explorer
| http://www.google.com/publicdata/home
| Каталог общего набора данных и инструмент для публикации и визуализации больших наборов данных.
| Maps Marker WP-Plugin
| http://www.mapsmarker.com
| Wordpress-плагин для отображения карты с аннотацией достопримечательностей в блоге Wordpress.
| DataMaps.eu - map your data
| http://www.datamaps.eu/
| Инструмент для создания привлекательных карт визуализации, которые могут быть созданы в браузере через официальный сайт без знания программирования.
| Ushahidi
| http://www.ushahidi.com
| Открытое программное обеспечение для сбора, визуализации и интерактивного отображения на основе определения местоположения данных в реальном времени (например, от чрезвычайных ситуаций, политических выборов и т.д.).
| Eclipse BIRT
| http://www.eclipse.org/birt/phoenix/
| Система отчетности eclipse (http://www.eclipse.org) для создания визуально привлекательных отчетов больших объемов данных.
| Chartle.net
| http://www.chartle.net
| Бесплатное интерактивное онлайн-приложение по созданию графиков. Интуитивно понятный интерфейс, специальных навыков не требует, однако и набор возможностей ограниченный. Применяется, когда нужен быстрый результат: круглые и столбчатые диаграммы, линейные графики, динамические схемы, географическая карта двух видов. Итоговая визуализация интерактивна, и ее код легко встраивается в html-страницу.
| Hohli
| http://charts.hohli.com/#cht=p3&chs=320x240&chd=s:&chf=bg,s,FFFFFF|c,s,FFFFFF&max=100&agent=hohli.com
| Онлайн-инструмент для визуализации данных с помощью стандартного набора диаграмм. (Нет возможности создавать карты.)
| IBM Many Eyes
| http://www-958.ibm.com/software/data/cognos/manyeyes/
| Популярный онлайн-инструмент для визуализации данных. Бесплатный. Есть возможность совместной работы над проектами.
| TagCrowd
| http://www.tagcrowd.com
| Онлайн-приложение для анализа и визуализации частотности употребления слов в тексте. Бесплатное.
| Wordle
| http://www.wordle.net
| Онлайн-приложение для анализа и визуализации частотности употребления слов в тексте. Бесплатное.
| Dundas
| http://www.dundas.com
| Программное обеспечение для создания интерактивных визуализаций. Может обрабатывать большие массивы данных. Создает визуализации, в числе прочего, в виде панелей из нескольких компонентов, что позволяет одновременно представить несколько измерений. Работает онлайн, коммерческое, платное. Предлагают 45-дневный бесплатный испытательный срок.
| Leximancer
| https://www.leximancer.com
| Профессиональная программа для анализа текста и визуализации результатов этого анализа. Коммерческая, платная, кроссплатформенная.
| SMILE Widgets
| http://www.simile-widgets.org
| Собрание разнообразных виджетов и их кодов. Коды открыты, их можно адаптировать под свои нужды, но для этого требуются соответствующие навыки. Среди прочего есть инструменты, позволяющие обрабатывать большие массивы данных и конструировать карты, тайм-лайны, интерактивные таблицы и многое другое. Инструмент Exibit позволяет создавать целые интерактивные веб-страницы с возможностью поиска и самостоятельного исследования представленной базы данных.
| GeoCommons
| http://geocommons.com
| Бесплатный (и свободный) веб-инструмент по созданию карт на основе данных.
| Gephi
| http://gephi.org
| Программное обеспечение для визуализации графов. Используется как один из инструментов анализа соцсетей. Бесплатное, открытый код, кроссплатформенное.
| Graphviz
| http://www.graphviz.org
| Программа для визуализации графов. Открытый код, кроссплатформенная, бесплатная.
| NewRadial
| http://sourceforge.net/projects/newradial/
| Комплекс инструментов для визуального представления нечисловых данных (в том числе изображений).
|
12. Приложение 4. Требования к семантическому представлению реестра и паспорта набора открытых данных Данные семантические требования рекомендуются для способа публикации в разделе открытых данных официального сайта государственного органа и органа местного самоуправления. Общие сведения
Настоящие требования к представлению наборов открытых данных базируются на следующих стандартах:
- RDF (Resource Description Framework) - разработанная консорциумом Всемирной паутины (World Wide Web Consortium - W3C) абстрактная модель для представления данных, в особенности - метаданных, пригодных для машинной обработки;
- RDFa (Resource Description Framework in attributes) - модель для представления данных в формате RDF через атрибуты программных сред HTML, XHTML и XML;
- Microdata - один из способов семантической разметки веб-страниц сведениями о разнообразных сущностях, используя стандартные элементы языка HTML (или XHTML);
- W3C Recommendation: RDFa Core 1.1 - Рекомендация от W3C по использованию RDFa;
- RFC2413 - Общепризнанный интернет-стандарт "Encoding Dublin Core Metadata in HTML";
- ГОСТ Р 7.0.10-2010 - Российский стандарт "Набор элементов метаданных "Дублинское ядро";
- W3C Recommendation: XML Schema Part 2: Datatypes - Рекомендация от W3C по использованию типов данных.
Для представления наборов открытых данных используются следующие словари:
- schema.org - http://schema.org/;
- dc (Dublin Core) - "http://purl.org/dc/terms/" - для предоставления свойств объекта (используется редакция "Qualified Dublin Core", так как содержит расширенный реестр свойств);
- foaf (Friend of a Friend) - "http://xmlns.com/foaf/0.1/" - для предоставления класса объекта. Требования
Каждая страница реестра наборов отрытых данных должна содержать объект, к которому предъявляются следующие обязательные требования:
1) объект должен быть элементом текущей страницы набора.
2) объект должен иметь класс "Collection" онтологии "dc" или "CreativeWork" онтологии schema.org.
Соблюдение этих требований однозначно сопоставляет данный объект с текущей страницей реестра открытых данных и определяет данный объект, как машиночитаемый формат реестра открытых данных.
Объект реестра открытых данных содержит следующие значения:
Свойство
| Онтологическое значение (schema.org)
| Онтологическое значение (dc)
| Формат значения
| Набор открытых данных
| -
| hasPart
| xsd:anyURI
| Предыдущая страница
| -
| prev
| xsd:anyURI
| Следующая страница
| -
| next
| xsd:anyURI
|
Свойство "Набор открытых данных" объекта реестра открытых данных повторяется ровно столько раз, сколько существует публикуемых наборов открытых данных.
Свойства "Предыдущая страница" и "Следующая страница" объекта реестра открытых данных указываются обязательно, если данные значения существуют.
Каждая страница набора открытых данных должна содержать объект, к которому предъявляются следующие обязательные требования:
1) объект должен быть субъектом текущей страницы набора.
2) объект должен иметь класс "Document" онтологии "foaf" или "CreativeWork" онтологии schema.org.
Соблюдение этих требований однозначно сопоставляет данный объект с текущей страницей набора открытых данных и определяет данный объект, как машиночитаемый формат текущего набора открытых данных.
Паспорт набора открытых данных в соответствии с текущей версией Методических рекомендаций содержит следующие значения:
Свойство
| Онтологическое значение (schema.org)
| Онтологическое значение (dc)
| Формат значения
| Идентификационный номер (код) набора данных
| -
| identifier
| xsd:string
| Наименование набора данных
| name
| title
| xsd:string
| Описание набора данных
| description
| description
| xsd:string
| Владелец набора данных
| creator
| creator
| xsd:string
| Ответственное лицо
| publisher
| publisher
| foaf: Person
schema: Person
| Дата первой публикации набора данных
| dateCreated
| created
| xsd:dateTime
| Дата последнего внесения изменений
| dateModified
| modified
| xsd:dateTime
| Ключевые слова, соответствующие содержанию набора данных
| keywords
| subject
| xsd:string
| Список всех версий наборов открытых данных
| url
| source
| dc:Collection
schema:DataCatalog
|
Свойство "Ответственное лицо" набора открытых данных ссылается на объект ответственного лица набора данных. К объекту ответственного лица набора данных предъявляются следующие обязательные требования:
1) объект должен иметь класс "Person" онтологии "foaf" или "Person" онтологии schema.org.
Объект ответственного лица набора данных содержит следующие значения:
Свойство
| Онтологическое значение (schema.org)
| Онтологическое значение (foaf)
| Формат значения
| Полное имя ответственного лица
| givenName
familyName
| name
| xsd:string
| Телефон ответственного лица
| telephone
| phone
| xsd:string
| Электронный адрес ответственного лица
| email
| mbox
| xsd:string
|
Свойство "Список всех версий наборов открытых данных" набора открытых данных ссылается на объект коллекции всех версий наборов данных. К объекту коллекции всех версий наборов данных предъявляются следующие обязательные требования:
1) объект должен иметь класс "Collection" онтологии "dc" или DataCatalog онтологии schema.org.
Объект коллекции всех версий наборов данных содержит следующие значения:
Свойство
| Онтологическое значение (schema.org)
| Онтологическое значение (dc)
| Формат значения
| Версия набора данных
| dataset
| hasPart
| dc:Document schema:Dataset
|
Свойство "Версия набора данных" объекта коллекции всех версий наборов данных повторяется ровно столько раз, сколько существует публикуемых версий текущего набора открытых данных.
Свойство "Версия набора данных" объекта коллекции всех версий наборов данных ссылается на объект набора данных. К объекту набора данных предъявляются следующие обязательные требования:
1) объект должен иметь класс "Document" онтологии "foaf" или "Dataset" онтологии schema.org.
Объект набора данных содержит следующие значения:
Свойство
| Онтологическое значение (schema.org)
| Онтологическое значение (dc)
| Формат значения
| Гиперссылка (URL) на набор данных
| "source" из словаря "dc"
| source
| xsd:anyURI
| Дата актуальности
| temporal
| valid
| xsd:DateTime
| Место применимости набора
| spatial
| spatial -
| dc:string
schema:Place
| Дата создания набора данных
| dateCreated
| created
| xsd:dateTime
| Содержание последнего изменения
| -
| provenance
| xsd:string
| Структура набора данных
| -
| conformsTo
| dc:Document
schema:Dataset
|
Свойство "Структура набора данных" объекта набора данных ссылается на объект структуры набора данных. К объекту структуры набора данных предъявляются следующие обязательные требования:
1) объект должен иметь класс "Document" онтологии "foaf" или Dataset онтологии schema.org.
Объект структуры набора данных содержит следующие значения:
Свойство
| Онтологическое значение (schema.org)
| Онтологическое значение (dc)
| Формат значения
| Гиперссылка (URL) на структуру набора данных
| url
| source
| xsd:anyURI
| Дата создания структуры набора данных
| DateCreated
| created
| xsd:dateTime
|
13. Приложение 5. Исходный пример материала для публикации в виде открытых данных ИСХОДНЫЕ ДАННЫЕ (ПРЕДСТАВЛЕНЫ В XLSX) ИНФОРМАЦИЯ, НЕОБХОДИМАЯ ДЛЯ РАЗМЕЩЕНИЯ В ВИДЕ НАБОРА ОТКРЫТЫХ ДАННЫХ
Название
| Округ
| Район
| Адрес
| Телефон
| ГБУК г. Москвы "Выставочный зал "Солянка ВПА"
| Центральный административный округ
| Басманный район
| улица Солянка, дом 1/2, строение 2
| (495) 621-55-72;
(495) 621-59-61
| ГБУК г. Москвы "Выставочный зал "Творчество"
| Центральный административный округ
| Таганский район
| Таганская улица, дом 31/22
| (495) 678-55-78
| ГБУК г. Москвы "Московский выставочный зал "Галерея А3"
| Центральный административный округ
| район Арбат
| Староконюшенный переулок, дом 39
| (495) 697-14-56
| ГБУК г. Москвы "ГВЗ "Ковчег"
| Северный административный округ
| Тимирязевский район
| улица Немчинова, дом 12
| (499) 977-00-44;
(499) 977-00-88
| ГБУК г. Москвы "ГВЗ "Галерея на Песчаной"
| Северный административный округ
| район Сокол
| Новопесчаная улица, дом 23/7
| (499) 943-51-31
| ГБУК г. Москвы "ГВЗ "Ростокино"
| Северо-Восточный административный округ
| район Ростокино
| Ростокинская улица, дом 1
| (499) 187-10-45
| ГБУК г. Москвы "ГВЗ "Галерея L"
| Северо-Восточный административный округ
| район Марьина Роща
| Октябрьская улица, дом 26
| (495) 689-24-91
| ГБУК г. Москвы "ГВЗ "Галерея "Измайлово"
| Восточный административный округ
| район Измайлово
| Измайловский проезд, дом 4
| (499) 166-44-96
| ГБУК г. Москвы "Выставочный зал "Богородское"
| Восточный административный округ
| район Богородское
| Открытое шоссе, дом 5, корпус 6
| (499) 168-30-15
| ГБУК г. Москвы "ГВЗ истории войны в Афганистане"
| Восточный административный округ
| район Перово
| 1-я Владимирская улица, дом 12, корпус 1
| (495) 306-43-30
| ГБУК г. Москвы "ГВЗ "АРТ-Измайлово"
| Восточный административный округ
| район Измайлово
| Измайловский бульвар, дом 30
| (499) 367-45-81
| ГБУК г. Москвы "Выставочный зал "Арт-холл Юго-восток"
| Юго-Восточный административный округ
| район Выхино-Жулебино
| Ташкентская улица, дом 9
| (495) 377-21-00;
(499) 356-21-10
| ГБУК г. Москвы "ГВЗ "Пересветов переулок"
| Южный административный округ
| Даниловский район
| Пересветов переулок, дом 4, корпус 1
| (495) 675-22-28
| ГБУК г. Москвы "ГВЗ-музей "Наследие"
| Южный административный округ
| район Бирюлево Восточное
| Лебедянская улица, дом 24, корпус 2
| (495) 329-60-39
| ГБУК г. Москвы "Выставочный зал "На Каширке"
| Южный административный округ
| район Нагатино-Садовники
| улица Академика Миллионщикова, дом 35, корпус 5
| (499) 612-95-17;
(499) 612-11-61
| ГБУК г. Москвы "ГВЗ "Варшавка"
| Южный административный округ
| Нагорный район
| Варшавское шоссе, дом 75, корпус 1
| (499) 723-10-75
| ГБУК г. Москвы "ГВЗ "Замоскворечье"
| Южный административный округ
| Даниловский район
| улица Серпуховской Вал, дом 24, корпус 2
| (495) 954-30-09
| ГБУК г. Москвы "ГВЗ "Галерея Беляево"
| Юго-Западный административный округ
| район Коньково
| Профсоюзная улица, дом 100
| (495) 335-83-22
| ГБУК г. Москвы "ГВЗ "Галерея Нагорная"
| Юго-Западный административный округ
| район Котловка
| улица Ремизова, дом 10
| (499) 127-47-02
| ГБУК г. Москвы "Выставочный зал "Солнцево"
| Западный административный округ
| район Солнцево
| улица Богданова, дом 44
| (495) 435-66-24;
(495) 439-51-80
| ГБУК г. Москвы "Выставочный зал "Феникс"
| Западный административный округ
| Можайский район
| Сколковское шоссе, дом 32, корпус 2
| (495) 417-42-28;
(495) 446-40-87;
(495) 446-29-64
| ГБУК г. Москвы "Выставочный зал "Галерея XXI век"
| Западный административный округ
| район Фили-Давыдково
| Рублевское шоссе, дом 9
| (495) 445-16-50
| ГБУК г. Москвы "Выставочный зал "Тушино"
| Северо-Западный административный округ
| район Южное Тушино
| бульвар Яна Райниса, дом 19, корпус 1
| (495) 492-23-00
| ГБУК г. Москвы "Выставочный зал "Ходынка"
| Северо-Западный административный округ
| район Щукино
| улица Ирины Левченко, дом 2
| (499) 943-69-41
| ГБУК г. Москвы "Выставочный зал "Зеленоград"
| Зеленоградский административный округ
| район Крюково
| город Зеленоград, корпус 1410
| (499) 717-16-02
|
14. Приложение 6. Визуальное представление паспорта набора открытых данных
N
| Название поля паспорта
| Значение поля паспорта
| 1
| Идентификационный номер
| 7712345678-showrooms
| 2
| Наименование набора данных
| Список выставочных залов
| 3
| Описание набора данных
| Список выставочных залов с указанием контактных данных по округам и районам.
| 4
| Владелец набора данных
| Министерство культуры
| 5
| Ответственное лицо
| Иванов Иван Иванович
| 6
| Телефон ответственного лица
| 74951234567
| 7
| Адрес электронной почты ответственного лица
| ivanov@example.com
| 8
| Гиперссылка (URL) на набор
| data-2013-06-01T00-00-structure-2013-04-01T00-00.xml
| 9
| Формат данных
| XML <1>
| 10
| Описание структуры набора данных
| structure-2013-04-01T00-00.xsd
| 11
| Дата первой публикации набора данных
| 01.04.2013
| 12
| Дата последнего внесения изменений
| 01.06.2013
| 13
| Содержание последнего изменения
| Изменение данных
| 14
| Дата актуальности набора данных
| 01.07.2013
| 15
| Ключевые слова, соответствующие содержанию набора данных
| Выставка, зал, выставочный зал, культура
| 16
| Гиперссылки (URL) на версии набора данных
|
| 17
| Гиперссылки (URL) на версии структуры набора данных
|
|
--------------------------------
<1> http://www.w3.org/TR/xml11/. 15. Приложение 7. Требование к представлению реестра наборов открытых данных Реестр наборов открытых данных (CSV) Требования к публикации реестра наборов открытых данных в машиночитаемом формате CSV
1) Требования к расположению:
a. Машиночитаемый формат реестра открытых данных представлен отдельным файлом в формате CSV.
b. Файл имеет название "list.csv".
c. Файл расположен непосредственно в разделе открытых данных. Например, ваш сайт расположен по адресу "http://example.com/". Тогда, учитывая требование к названию файла и возможные адреса раздела открытых данных, файл реестра открытых данных должен быть доступен по одному из двух адресов:
i. http://example.com/opendata/list.csv
ii. http://opendata.example.com/list.csv
2) Требования к формату:
a. Соответствие файла стандарту RFC - "Common Format and MIME Type for Comma-Separated Values (CSV) Files" (http://tools.ietf.org/html/rfc4180).
b. Дополнительные требования к CSV:
i. Разделителем полей является знак "," (запятая).
ii. Ограничителем строк является знак " (универсальная двойная кавычка).
iii. Разделителем целой и дробной части чисел является знак "." (точка).
c. Кодировка файла - "UTF-8".
3) Требование к структуре данных:
a. По горизонтали перечислены атрибуты полей реестра наборов открытых данных, по вертикали перечислены поля реестра наборов открытых данных.
b. Наличие следующих обязательных атрибутов поля реестра наборов открытых данных:
i. Атрибут поля "Наименование поля реестра наборов открытых данных":
1. Должен быть установлен следующий обязательный заголовок атрибута: "property".
2. Значением атрибута является наименование поля реестра набора открытых данных.
ii. Атрибут поля "Заголовок поля реестра наборов открытых данных":
1. Должен быть установлен следующий обязательный заголовок атрибута: "title".
2. Значением атрибута является заголовок поля реестра наборов открытых данных.
iii. Атрибут поля "Значение поля реестра наборов открытых данных":
1. Должен быть установлен следующий обязательный заголовок атрибута: "value".
2. Значением атрибута является значение поля реестра наборов открытых данных.
iv. Атрибут поля "Формат поля реестра наборов открытых данных":
1. Должен быть установлен следующий обязательный заголовок атрибута: "format".
2. Значением атрибута является формат значения поля реестра наборов открытых данных.
c. Наличие следующих обязательных полей реестра наборов открытых данных:
i. Поле паспорта "Версия методических рекомендаций":
1. Должно быть установлено следующее обязательное наименование поля: "standardversion".
2. Должен быть установлен следующий обязательный заголовок поля: "Версия методических рекомендаций".
3. Значением поля является ссылка на версию методических рекомендаций, которой соответствует публикация этого реестра наборов открытых данных.
4. Атрибут "Формат поля реестра наборов открытых данных" неприменим для этого поля, поэтому значением формата поля является пустая строка.
ii. Поле паспорта "Набор открытых данных" (данное поле повторяется столько раз, сколько опубликовано наборов открытых данных):
1. Должно быть установлено следующее обязательное наименование поля: "1>1> |