Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура»


НазваниеЛекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура»
страница4/4
ТипЛекция
1   2   3   4

Ирина Радченко: Можете посмотреть в хабе данные, интересующие вас, и потом мы сможем их использовать в лекциях по дата-журналистике. Возможно, имеет смысл с этого ракурса подойти к использованию дата-хаба.

Иван Бегтин: После того как мы сделали вводную по нашему веб-хабу, притом что он, конечно, прекрасен, и мы себя любим и, конечно, хвалим и говорим “приходите к нам и используйте наши данные, которые мы там собрали”, я вам хотел бы сказать, что работая с хабом, который предоставляем мы, вы получаете возможность работать на самом деле с любым CKAN-развернутым ресурсом, который у вас есть. Таков и главный мировой хаб, который поддерживается как раз Open Knowledge Foundation - Datahub.io. Это огромный архив, просто огромное количество данных, и там все то, что я описал: все те же операции с API, с регистрацией, с доступом, с публикацией. И все это делается со следующими целями. Первое — привлекать внимание разработчиков, публикуя данные на одной центральной точке, чтобы мы могли это использовать, а второе, если вы являетесь разработчиком самостоятельно, то найти то, что вас интересует, и то, что вы можете использовать в практических целях.

Более сложные уровни работы с порталами включают в себя сразу загрузку данных структурированно, то есть вы получаете данные непосредственно из базы данных. Не просто файлами выкачивать, а уже получать данные оттуда, с геоданными и многим, многим другим. Мой сеанс агитации за CKAN закончился. Как говорится, мне не стыдно агитировать, потому что это открытый код. Вы можете забыть про наш дата-хаб, обидиться на меня, так сказать невзлюбить за что-то и взглянуть самостоятельно и сказать, что мы самая главная планета открытых данных. Я скажу: Ура, ура, я не один.

Теперь давайте приступим к вопросам и ответам, какое-то время еще есть у нас.

Ирина Радченко: У меня появилась идея. Вы могли бы зайти в блог «Школы открытых данных» и написать свои предложения по тем массивам данных, которые стоит использовать, в том числе, для визуализации в наших последующих лекциях. У нас есть готовые задания, но если вы предложите свой интересный вариант, я думаю, это будет интересно и разумно. В этом случае мы вместе будем конструировать работу с данными. Так что такой вариант тоже возможен. Я думаю, это самое интересное.

Иван Бегтин: Да, я думаю, то, что на следующих лекциях (они будут и теоретические, и практические) мы будем переходить к конкретным вопросам. Если у вас будут какие-то вопросы сейчас, то я отвечу сейчас. Если есть вопросы, на которые я не могу ответить сейчас, я думаю, что мы с вами договоримся, и я отвечу вам на следующей лекции.

Ирина Радченко: Или в интернете.

Вопрос из зала: Расскажите, пожалуйста, подробнее про связанные данные, на каком основании производится это связывание?

Иван Бегтин: Связанные данные — это сложная тема. Она в принципе сложная, она очень интересная. Я бы сказал так, связанные данные - это сейчас область скорее научного проектирования, и они происходят из научной среды. Вот Ирина, она как раз человек, который в большей степени занимался Linked Data, чем я, честно говоря. Я разрабатывал свою онтологию, но это скорее игры. Реально онтологию делают ученые, занимающиеся биологией, медициной, исследованием различных прав собственности даже и так далее, поэтому я не отвечу на этот вопрос быстро.

Об этом мы постараемся позвать Зорена Ауэра либо кого-то из его коллег, и они уже расскажут об этом подробнее. Я думаю, что на одной из следующих лекциях скорей Ирина посвятит этому чуть-чуть больше времени.

Ирина Радченко: В ходе нашей дата-экспедиции мы столкнулись с тем, что за рубежом есть много различных каталогов данных и поэтому, если будет возможность и желание организовать свой собственный российский портал открытых данных, это только приветствуется! Это будет замечательно.

Вопрос из зала: Возможно ли движком CKANа заменять базы данных, например при создании сайта?

Иван Бегтин: Внутри у CKANа, конечно, и SQL, и какие-то еще другие варианты типа SQLDB, которые просто неудобно использовать в промышленном развертывании. Я бы сказал так, у нас есть несколько вариантов развертывания CKANа, у нас был вариант развертывания CKANа с нуля, к  которому мы в итоге пришли, это проще, чем оперировать, и более сложный вариант, когда мы делали давно еще портальчик, в котором было сверху специальное приложение на Django, а внизу CKAN, и он работал через API. Такие варианты тоже есть. Ну, кому что нравится. Если вы делаете сайт государственный, скорей всего вам придется делать над CKANом надстройку, потому что CKAN грубоват, он не дает достаточной гибкости. Он неудобен в плане, чтобы его легко менять, поэтому обычно он поставляется разработчиками в компьютере, хотя по-разному. Вот правительство Южной Австралии просто развернуло CKAN и забыло про все, а правительство Канады сделало CKAN, а над ним повесило Drupal и сказало: вот мы будем обращаться к нему. То есть это вопрос технический, и мы можем рассказать об этом подробнее на одной из лекции. Еще вопросы?

Вопрос из зала: Я правильно полагаю, что в лекциях предполагается два потока - для программистов и для журналистов?

Иван Бегтин: Мы вначале думали о том, чтобы их разделить, но мы столкнулись с тем, что почти все записавшиеся к нам на курс сказали, что хотят и то, и то, поэтому я думаю, что мы будем здесь варьировать через один или каким-то другим образом. На самом деле то, что касается журналистов, касается и программистов, а то, что касается программистов, касается журналистов, потому что журналисты разговаривают с программистом понятным языком, а программистам надо уметь немножко визуализировать информацию и знать не только о том, что внутри, но и то, что должно быть на выходе.

Вопрос из зала: Я заранее поигрался с CKANом и, насколько я понял, CKAN не импортирует данные, загружаемые в него, в базу данных.

Иван Бегтин: Это не совсем так. Есть несколько способов. Во-первых, API CKANа позволяет загружать файлы. Если там версия последняя, оно не очень стабильно, но там есть разные варианты. Есть специальная Data Storage, это просто вообще-то в саму базу данных сохраняет, но там не всегда удобно, с большими данными тяжело. Есть возможность просто загрузить туда файлы, и он будет хранить в своем хранилище, но мы поступаем иначе, если честно. У нас просто есть аккаунт на облаке, и мы загружаем туда файлы. Один раз просто на облако, а потом там специальными скриптами, ну, там в облаке есть перманентные ссылки, и мы просто указываем в CKANе любые массивы - в Git, в Github. Если у нас гигабайт файлов, их неудобно грузить в Скан, ну просто ресурсоемко. Мы их выгружаем отдельно и подключаем отдельно.

Вопрос из зала: Правильно ли я понимаю, что API CKAN работает с файлом целиком, то есть нет возможности обратиться к строке?

Иван Бегтин: Есть, называется API datastorer. Вот API datastorer не очень пока стабильный и, в принципе, надо сказать, когда мы говорим про CKAN, что CKAN не самый совершенный по работе с открытыми данными. Он открытый, он самый динамично развивающийся и более простой в плане экономии бюджетных средств, своих денег, даже можно сказать бесплатный, то есть если администрация города Вологды захочет себе сделать портал открытых данных, вот так вот, развернули Скан и запустили там. Вопрос только его сертификации. Но есть более совершенные инструменты. Есть Socrata, есть FreeBase, они очень крутые, и мы потом отдельно расскажем о них. Это не совсем открытые данные, но это в принципе работа с данными. Но они все коммерческие, они все закрытые, они все находятся в американских облаках, их невозможно использовать в наших госорганах, ну, то есть там есть куча ограничений.

Да, домашнее задание мы пришлем, но на самом деле вам не нужно ждать его в письменном виде, оно всё равно то, которое я описываю. Домашнее задание очень простое: если вы не умеете программировать, найдите интересный массив данных, найдите массив данных и попробуйте его опубликовать на платформе CKAN. Я даже не переживаю, если вы сделаете не на портале нашего Хаба, вы можете зайти на Datahub.io, то есть глобально и опубликовать там, если хотите сделать на английском языке. Если на русском, то можно опубликовать его на Hubofdata, и мы все эти тестовые поубираем.

Если вы умеете программировать, то сделайте любой скрипт. Открыто, с авторизацией - просто проверьте, как это сделать. Но любая альтернативна, если вы все-таки это хотите сделать, попробуйте развернуть CKAN как раз таки самостоятельно. Так что у нас домашнее задание разделяется на два типа: для разработчиков, то есть тех, кто готов покопаться внутри, и для тех, кто хочет немножко поизучать, как это работает. Еще вопросы?

Тогда всем огромное спасибо, что все-таки добрались к нам в эту ужасную, холодную, дождливую погоду. Я очень рад был вас видеть и очень надеюсь увидеть всех вас на следующем занятии.
1   2   3   4

Похожие:

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconЛекция №17 77 Синдром воспаления 77 Лекция №18 80 Синдром воспаления...
Хирургический метод лечения имеет большое значение в клинической медицине. Одну четверть заболеваний составляют хирургические болезни....

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconЛекция религии современных неписьменных народов: человек и его мир...
Редактор Т. Липкина Художник Л. Чинёное Корректор Г. Казакова Компьютерная верстка М. Егоровой

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» icon2. Лекция: "Общие критерии", часть Основные идеи 8
Лекция: Обзор наиболее важных стандартов и спецификаций в области информационной безопасности 3

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconЛекция №5 Налогообложение общественных организаций инвалидов (часть...
Жением. В связи с этим, пятая лекция будет посвящена также вопросам налогового законодательства: налог на прибыль, налог на имущество,...

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconЛекция 10. Международное сотрудничество в ОРД лекция 11. Проблемы...
Спецкурс «Актуальные вопросы оперативно-розыскной деятельности» как открытая учебная дисциплина представляет устоявшуюся систему...

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconDate: 16. 01. 2016 Subject
Что вы видите? Да, правильно. Это письмо. А вы знаете как будет на английском слово письмо?

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconЕсть множество книг, которые учат тому, что нужно делать специалисту...
Как это делать. Эта книга как раз о том, как соединить маркетинговую теорию с реальной жизнью коммерческого предприятия и добиться...

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconВ саморегулируемой организации некоммерческое партнёрство «тюменское...
Некоммерческое партнёрство «Тюменское партнёрство кадастровых инженеров» (далее–Партнёрство), устанавливает требования к членам Партнёрства,...

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconСтатья 13. Пункт 2
Это небольшая инструкция для тех, у кого подобное случается. Заранее скажу, что не стоит хамить и кричать на сотрудников полиции,...

Лекция №1 Открытые данные: введение Часть 1 Иван Бегтин я вначале скажу краткое вступительное слово о том, кто мы, что мы, как это началось, и о чем будет сегодняшняя лекция. Мы, то есть некоммерческое партнерство «Информационная культура» iconНекоммерческое Партнерство «Гильдия строителей Республики Марий Эл»
Целью контроля является выявление и предупреждение нарушений требований, установленных в отношении юридических лиц и индивидуальных...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск