Методическое и информационно-аналитическое обеспечение


НазваниеМетодическое и информационно-аналитическое обеспечение
страница9/51
ТипОтчет
filling-form.ru > Туризм > Отчет
1   ...   5   6   7   8   9   10   11   12   ...   51

6. Экспертные опросы и библиометрический анализ

6.1 Техническая реализация системы библиометрии



Одной из важнейших задач в научной области является поиск и оценка информации, способствующей выявлению перспективных направлений развития научных исследований в национальной и интернациональной науке. Решение этой задачи - необходимая составляющая науки при достижении результатов мирового уровня, создания научно-технических заделов, обеспечения конкурентных позиций отечественных исследований на перспективных направлениях развития. Форсайт-исследования, в основе которых лежит постоянный мониторинг экспертами передовых прорывных исследований, играют важнейшую роль в задаче определения приоритетных направлений в научных областях знаний. Проведение таких исследований, требующих поиска и анализа больших объемов информации, связано со значительными трудозатратами экспертов, поскольку подавляющую часть этой работы им приходится осуществлять вручную. Разрабатываемая поисковая система предназначена для частичной автоматизации работ во время проведения форсайт-исследований, связанных с задачами поиска и обработки данных для структурированного представления данных по имеющимся публикациям.

Структурированное отображение информации, представленной в публикациях, способно сэкономить время при поиске информации, а также дать представление о состоянии дел в области, в которой происходит поиск и планируется исследование. Это позволяет быстро найти нужные публикации, проследить тенденции и тематические изменения в заданной области, оценить популярность различных направлений исследований, вовремя заметить новые направления развития в области. Традиционные поисковые механизмы, используемые в системах Google или Yаndex и возвращающие результат запроса в форме ранжированного списка документов, проводить такой анализ не позволяют.

В основу предлагаемого решения заложены иные механизмы обработки данных и представления результатов запроса пользователю. Он заключается в кластеризации полученных результатов запроса с аннотированием кластеров и отдельных документов и построении графа связи понятий. Результаты поиска по научным публикациям разбиты и упорядочены по годам, кластеры для каждого года упорядочены по размеру. Таким образом, анализируя по годам динамику развития публикационной активности, становится возможным оценить основные тенденции изменения тематики в области запроса, извлечь основные темы, наиболее популярные в каждом году, а также за весь запрашиваемый период. Для наиболее популярных тем, найденных для запроса, выводится динамика их популярности за указанный период и отображается графическая взаимосвязь между понятиями в области запроса, а также в сопряжённых областях. Система обеспечивает фасетный (с возможностью поиска по разным информационным полям) поиск. Для короткого описания каждого документа, найденного в результате поиска, используются ключевые фразы, что позволяет сразу оценить основные содержательные понятия документа. Дополнительно выводится и собирается статистика по числу публикаций национальных авторов по отношению к зарубежным, по числу совместных публикаций отечественных и зарубежных учёных.

Указанное выше представление результатов запроса позволяет быстро проанализировать данные и выявить основные тенденции и тренды в области, увидеть взаимосвязь понятий, а также определить перспективные направления исследований для решения заданной проблемы, опираясь на современное состояние дел в области и существующие тенденции. Представленный прототип по набору функционала является уникальным и в настоящее время в системах академического поиска не представлен. Особенностью системы является специализация всех частей комплексного решения для решения задач академического поиска в области информационно-компьютерных технологий. Для этого производится специализированная разработка и настройка поискового робота и всех модулей блока обработки информации.

Основные, наиболее известные в мировом сообществе академические поисковые системы: Scirus (http://www.scirus.com), Microsoft Academic search (http://academic.research.microsoft.com), Google scholar (http://scholar.google.com), CiteSeerX (http://citeseer.ist.psu.edu/index), Medline Plus (http://www.nlm.nih.gov/medlineplus), Pub Med (http://www.ncbi.nlm.nih.gov/pubmed), представляют результаты поиска ранжированными списками (списки могут быть ранжированы по цитируемости найденных работ, по году их публикации и по другим параметрам). В некоторых системах добавлен перечень понятий в области запроса, позволяющий сузить область поиска. В указанных системах используются фасетный поиск, дополнительные фильтры (по годам, числу цитирований, по направлениям, по организациям и т. д.). Некоторые системы представляют информацию о рейтинге институтов, динамику цитирования автора по годам, динамику цитирования конкретной работы по годам, граф со-авторства. Можно посмотреть ранжированный по цитируемости список основных авторов или список самых цитируемых работ по запросу. Несмотря на такой набор различных опций, вопрос визуального и структурированного представления информации и автоматического построения понятийных структур научных областей всё ещё остаётся открытым. Представление найденного результата в виде списков релевантных документов не всегда удобно, особенно с учетом того, что такие списки часто состоят из многих тысяч документов. В данном случае важно представить структуру предметной области с характерными для нее понятиями и связями между понятиями, показать, какие направления являются ключевыми. В разрабатываемой системе делается акцент на решение указанной задачи. Основное отличие разрабатываемой системы от уже существующих - это заточенность под форсайт-исследования. Основной упор делается на структурирование и наглядную визуализацию данных, собранных в результате запроса.

В ходе разработки предлагаемой системы были изучены научные работы в области визуального представления результатов поиска [5-9]. Акцент во многих из них делается на кластеризацию результатов запроса, а в ряде работ на использовании ключевых фраз для представления результатов поиска. Проблема извлечения ключевых фраз для аннотирования документов и использования аннотаций в прикладных задачах получила широкое развитие как самостоятельное направление в англоязычных публикациях [10-15]. К сожалению, прототипы систем, использующих кластеризацию результатов запросов, заявленные в рассмотренных научных трудах, сейчас не доступны. Попытка найти функционирующие прототипы, описанные в работах, не удалась. Такое положение иллюстрирует необходимость запуска и поддержки реально работающей системы, способной предоставить функционал, представленный в исследованиях и научных работах. Указанная система академического поиска включает в себя как использование ключевых фраз, так и кластеризацию. Внедрение такой системы позволяет представить новый подход к академическому поиску и может стать основой развития инновационной технологии в области поиска и представления информации.

Основной функционал системы включает в себя несколько способов представления результатов поиска пользователю: в виде ранжированного списка и в виде кластеров. Система также представляет граф взаимосвязи понятий в области запроса и динамику развития основных ключевых понятий в ней. Для начала работы с системой необходимо ввести поисковый запрос в виде отдельного слова, группы слов или словосочетания. Для поиска по словосочетанию его необходимо взять в кавычки. После нажатия на кнопку «поиск» появится результат поиска, представленный в виде ранжированного списка. Если кликнуть по найденному документу, то откроется окошко с аннотацией. В этом окошке можно кликнуть по названию статьи, в этом случае произойдёт переход на страницу со статьей в электронной библиотеке. Можно кликнуть по небольшой иконке, расположенной после статьи и авторов. Клик по иконке, находящейся после автора/названия приведёт к переходу на Google Scholar, где можно получить индекс Хирша автора (если он зарегистрирован в Google Scholar) или данные по цитированию статьи. В системе доступен функционал в виде выбора публикаций, которые должны быть представлены в результатах поиска: работы, авторами которых являются только российские учёные; работы в соавторстве с российскими учёными; работы без участия российских учёных; работы, для которых точная аффилиация в системе не была определена; все работы. В системе допускается поиск с дополнительными ограничениями.

После того, как получен результат запроса (вкладка «Поиск» — основная страница поиска), доступен переход на одну из вкладок (рисунок 20), где будет отражён результат обработки первых 1500 результатов.




Рисунок 20 - Вкладки для просмотра результатов поиска
Вкладка «Кластеры». Интерфейс вкладки представлен на рисунках 21 и 22. Доступен просмотр результатов отдельно за каждый год и за все года, что позволяет увидеть, как меняются основные темы по годам. На странице доступен поиск с ограничениями. На странице также представлен структурированный вариант результата запроса в виде групп тематически близких друг другу документов, группы аннотированы наборами ключевых понятий. Если размер группы больше 10 документов, доступно разбиение данной группы на подгруппы, для этого нужно кликнуть на «дополнительную кластеризацию». Темы кластеров, показывают основную тему кластера. Точная тема кластера может быть не определена. В правой части страницы приводится список основных, наиболее употребительных тем (для каждого года свой список), если кликнуть по одной из таких тем, то будет осуществлён поиск по данной теме.




Рисунок 21 - Интерфейс вкладки «Кластеры»
Рисунок 22 - Кластеры и аннотации на вкладке «Кластеры»

Вкладка «Граф». На вкладке (рисунки 23-24) отображается граф взаимосвязи основных понятий в области запроса пользователя. Граф можно приближать и отдалять, для чего используется колёсико мыши; если выделить мышкой вершину, то её можно двигать. Доступен просмотр связей основных понятий, представленных в каждый конкретный год. Для выбора года нужно кликнуть по надписи соответствующего года. Если поставить галочку в графе «Отображать полный граф», то будут отображены все вершины со связями за весь период. В этом случае можно делать переходы между годами и смотреть, как изменяется популярность каждой из тем во времени. Размер вершины пропорционален числу документов по теме. Ободок вершины показывает тенденцию к увеличению (красный) или спаду (зелёный) числа публикаций по теме по сравнению со средним за предыдущие два года. Можно поставить галочку в графе «Отображать только значащие связи», тогда будут показаны только наиболее значимые связи.
Рисунок 23 - Граф на вкладке «Граф», показаны вершины и связи за 2008 год






Рисунок 24 - Граф на вкладке «Граф», показаны вершины и связи за 2008 год,включена опция «отображать только значимые связи»

Вкладка «Диаграммы». На данной вкладке (рисунок 25) отражается информация по двадцати наиболее популярным понятиям. Для каждого понятия выводится по 2 графика. Первый график (зелёный) показывает отношение числа публикаций с данным понятием по отношению к общему числу публикаций за этот год, если навести курсором мыши на столбик, то будет показано, сколько из работ с данным понятием за указанный год имеет аффилиацию, российскую/зарубежную. Второй график (красный) показывает, сколько раз были процитированы работы, содержащие указанное понятие и опубликованные в конкретный год.



Рисунок 25 - Пример графиков на вкладке «Диаграммы»
Таким образом, разработанный инструмент представляет собой рабочую систему, доступную в открытом доступе в сети Интернет. Она включает в себя реализацию современных методов обработки информации и предоставления результатов запроса пользователю: кластеризация результатов запросов, представление графа понятий и связей между понятиями в области, извлечение ключевых тем в каждый конкретный год и за весь анализируемый период, извлечение ключевых понятий для документов и сопровождение документов аннотациями.

Система объединяет в себя три тренда, существующие в области информационного поиска: кластеризация и структурирование результатов запросов пользователя, визуализация данных, представленных в результатах поиска, извлечение мета-данных для индексирования и представления документов, на основе обработки ключевых понятий.

Структурированная форма представления результатов поиска, список основных тем, представленных в документах и графическое отображение структуры взаимосвязи тем и тематических понятий в области, позволяют:

  • быстро находить нужный блок публикаций, отсеивая не интересующие целыми группами, для чего используются кластеры и аннотации кластеров;

  • выделять основные тренды, в виде наиболее популярных в публикациях понятий;

  • проводить оценку изменения по годам популярности основных в области тем;

  • быстро и наглядно представлять структуру связей понятий, а также динамику изменения данной структуры;

  • быстро и наглядно представлять связи заданной темы с понятиями смежных областей;

  • быстро оценивать по графу положение заданной темы в контексте других тем, которые необходимо учитывать при работе в области, что способствует развитие системного подхода к анализу предметной области.

Реализация функционала, обеспечивающего обозначенные выше возможности в системах поддержки проведения форсайт-исследований, позволяет упростить решение задачи оценки состояния дел в предметной области; делает возможным визуализировать структуру области; автоматически представлять тренды и динамику по направлению, заданному в запросе.
1   ...   5   6   7   8   9   10   11   12   ...   51

Похожие:

Методическое и информационно-аналитическое обеспечение iconИнформационное, аналитическое и методическое обеспечение
Это связано с тем, что процедуры, организационное, аналитическое и методическое обеспечение которых осуществляет отдел, являются...

Методическое и информационно-аналитическое обеспечение iconВыпускная квалификационная работа информационно-аналитическое обеспечение...
Информационно-аналитическое обеспечение управления персоналом в компаниях розничной торговли

Методическое и информационно-аналитическое обеспечение iconВыпускная квалификационная работа информационно-аналитическое обеспечение...
Информационно-аналитическое обеспечение управления персоналом в компаниях розничной торговли

Методическое и информационно-аналитическое обеспечение iconКазань
Информационно-методическое обеспечение по вопросам создания малых инновационных предприятий в Казанском федеральном университете

Методическое и информационно-аналитическое обеспечение iconУчебно-методическое обеспечение Информационно-техническое оснащение
Сведения о реализации образовательных программ, заявленных для государственной аккредитации

Методическое и информационно-аналитическое обеспечение iconОтчет о работе «методическое обеспечение»
Аналитическая информационная система обеспечения открытости деятельности федеральных органов исполнительной власти, размещенная в...

Методическое и информационно-аналитическое обеспечение iconЖурнал "Право и безопасность" Номер 2 (35), Июль 2010 Современная...
Федотова М. Ф., Шойко И. С., Информационно-аналитическое управление Аппарата Московской городской Думы

Методическое и информационно-аналитическое обеспечение iconЮридический факультет утверждаю
Структуру и содержание дисциплины основы делопроизводства, образовательные технологии, а так же учебно-методическое обеспечение самостоятельной...

Методическое и информационно-аналитическое обеспечение iconМетодическое пособие Ростов-на-Дону
Работа с традиционными и электронными каталогами Информационно-библиотечного центра Института управления, бизнеса и права: методическое...

Методическое и информационно-аналитическое обеспечение icon1. 1 Общие сведения о процедуре запроса предложений 6
На ежеквартальный анализ развития vas на 6 зарубежных рынках (великобритания, германия, чехия, Ю. Корея, польша и индия), и информационно-аналитическое...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск