Международная ассоциация строительных вузов


НазваниеМеждународная ассоциация строительных вузов
страница104/115
ТипДокументы
filling-form.ru > Туризм > Документы
1   ...   100   101   102   103   104   105   106   107   ...   115

ОРГАНИЗАЦИЯ ПОИСКОВОЙ ДЕЯТЕЛЬНОСТИ В ДИНАМИЧЕСКИ РАЗВИВАЮЩИХСЯ ПРЕДМЕТНЫХ ОБЛАСТЯХ




Ворошилов Виталий Витальевич, С.А. Пиявский


Самарский государственный архитектурно-строительный университет
г. Самара

Рассматривается новый подход к вопросу поиска, систематизации и использования фактографической информации в информационном пространстве. Данный подход предлагается как альтернатива существующим разработкам в области представления и систематизации знаний, в частности информационно-поисковым системам. Описывается технология накопления, обработки, систематизации и выдачи информации. Описываются математические модели оптимальной систематизации фактографической информации.

Фактографическая информация, систематизация данных, оптимизация, нелинейная оптимизация, информационный поиск.

Постановка проблемы фактографического поиска. В условиях информационного общества основным источником информации для специалиста в сфере науки, техники и экономики является информация из интернета, при этом все большую роль играет фактографическая информация. Понятие фактографической информации в настоящее время находится в стадии становления и допускает различные близкие интерпретации. К примеру, в [1] дается следующее определение фактографической информации: «К фактографическим данным относятся сведения, извлеченные из документов, как первичных, так и вторичных и получаемые непосредственно из источников их возникновения». В [2] под фактографической информацией называется информация об объектах в тексте на естественном языке, которые однозначно соотносятся с объектами, существующими в действительности. В зарубежных словарях дается более широкое понятие фактографической информации, например в словаре «Macmillan» [3] под фактографической информацией понимается информация, основанная на фактах или содержащая только факты, а не теории или мнения.

Под фактографической информацией будем понимать информацию, представленную в виде числа (с указанием размерности) с набором терминов, поясняющих объект, характеризуемый этим числом. Такое понимание имеет важное практическое значение, позволяет достаточно просто решить самостоятельную сложную задачу выделения самого факта наличия фактографической информации в тексте на естественном языке. Кроме того, разработанные нами алгоритмы не используют существенно числовой характер фактографической информации и поэтому могут быть использованы и в рамках других интерпретаций.

Между тем специальные средства для поиска такой информации лишь разрабатываются (например,wolfram [4]) и тем более не включены в учебный процесс в вузах.

В настоящей работе авторы поставили перед собой задачу разработать специальный инструментарий для поиска и систематизации фактографической информации.

Технология фактографического поиска на основе формирования атомарной базы данных. В основе фактографической информации лежат количественные данные описания фактов, сгруппированных по определенным системообразующим признакам. Таким образом, элементом, единицей фактографической информации является «атом», состоящий из набора числового значения, размерности и набора лексем. Лексема представляет собой словоформу (термин, понятие) используемое из семантического тезауруса.

Таким образом, в основе автоматизированного фактографического поиска должна лежать специальным образом организованная база данных фактографической информации (АтБД), представляющая собой совокупность атомов фактографической информации [5]. Система управления такой АтБД должна обеспечивать пополнение БД с выявлением тавтологической и противоречивой информации, а также выдачу, по определенному запросу пользователя, релевантной фактографической информации как в не систематизированном виде (набор атомов упорядочениях по релевантности), так и систематизированной (в виде наиболее плотно заполненных двумерных таблиц). Использование такой формы фактографического поиска требует специального обучения студентов, а это обучение может проходить достаточно эффективно лишь с использованием специальной информационной системы, позволяющей контролировать работу студентов, как на аудиторных занятиях, так и во внеучебное время.

На основе вышеизложенной структуры данных была реализована атомарная база знаний. Имеются три канала пополнения АтБД. Первый из них - пополнение службой сопровождения БД, оно включает в себя формирование и пополнение базовых наборов лексем характеризующие различные предметные области, т.е. прямое пополнение тезауруса системы базовым набором лексем характеризующие предметную область.

Второй канал пополнения - это автоматизированный поиск фактографической информации, ее индексирование и ввод в АтБД, который состоит из двух основных этапов. На первом этапе проводится отбор информационных ресурсов из интернета (документов, файлов, веб-страниц) по прямым ссылкам, указанным методологической службой сопровождения, составленных на основе поисковой деятельности пользователей системы, а также отбор с использованием известных поисковых систем и сервисов, по поисковым запросам, составленным методологической службой сопровождения и состоящих из набора лексем описывающих предметную область. На втором этапе проводится анализ информационного ресурса полученного в результате поиска, а затем выделение атомов фактографической информации их индексирование и сохранение в АтБД.

Третий канал - это пополнение АтБД в процессе ее использования: пользователями в процессе своей профессиональной поисковой деятельности, студентами по различным дисциплинам в процессе учебной поисковой деятельности, а также студентами при обучении фактографическому поиску на основе АтБД. Пополнение происходит на основе формирования запросов к методологической службе сопровождения о расширении базы поиска в виде указания: поисковых запросов, предметной области, прямых ссылок на документы или веб-страницы. А также в виде указания набора атомов фактографической информации, с указанием источника и дополнительной метаинформацией, составленных студентами в процессе обучения фактографическому поиску на основе АтБД.

На рисунке 1 показана схема использования атомарной базы знаний для поиска фактографической информации.


Рис.1 Использование атомарной базы знаний для поиска фактографической информации
Вначале пользователю необходимо авторизоваться в системе. Затем указать поисковый запрос в виде набора лексем из тезауруса системы или в виде строки, при этом строка поискового запроса автоматически преобразуется в набор лексем из тезауруса системы. При указании поискового запроса существует возможность указать запрос один из сохраненных, ранее используемых пользователем. Далее следует задать лимитные параметры выдачи фактографической информации из АтБД, такие как:

- максимальное значение количества атомов в выдаваемом результате;

- минимальное значение количества атомов в выдаваемом результате;

- максимальное значение количества лексем при поиске информации в АтБД;

- минимальное значение количества лексем при поиске информации в АтБД.

После указания параметров выдачи проводится поиск в АтБД и в результате представляется фактографическая информация в виде набора максимально заполненных двумерных таблиц. Эти таблицы содержат наиболее плотно-заполненные кластеры информации (под кластером информации понимается набор атомов). Для количественной оценки степени заполненности кластера введем понятие его информативности. Под информативностью лексемы относительно кластера будем понимать отношение числа атомов, в описании которых содержится данная лексема к общему числу атомов кластере. Информативностью кластера будем называть среднюю информативность относительного данного кластера всех лексем входящих в описание хотя бы одного из атомов этого кластера. Кластер будем называть замкнутым, если входящие в его атомы лексемы не входят в описание других атомов, т.е. не входящих в кластер.

Затем пользователем имеет возможность провести анализ информации в таблицах на предмет их наполненности. Выявив недостающую информацию, по пустотам в таблицах, рекомендуется провести ее поиск с использованием известных поисковых средств и сервисов и добавить найденную новую информации в АтБД для его пополнения.

3. Математическая модель формирования кластера наибольшей информативности. Введем следующие обозначения:

N – число атомов в БД; M – число лексем в БД;

Uj – признак включения лексемы в описание кластера;

Vi – признак включения атома в кластер.

Li – нецелочисленная, неотрицательная переменная.

Тогда:

– удельная информативность исходной таблицы.

– число атомов в кластере;

– число лексем в описании кластера;

– удельная информативность кластера на один атом.

Задача: найти кластер максимальной удельной информативности на один атом при заданной длине его описаний m.

Это задача сводится к задаче линейной оптимизации со следующими целевой функцией и ограничениями:



Условия, что если лексема не выбрана, ее не должно быть ни в одном атоме кластера:

,

Лимитные условия на размер получаемого кластера:

, , , .
БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Фактографический поиск, Википедия свободная энциклопедия, 2012 г. - [Электронный ресурс] - Режим доступа: http://ru.wikipedia.org/ (дата обращения: 07.03.2012).

2. Извлечение фактографической информации, 2012 г. - [Электронный ресурс] - Режим доступа: http://lksystems.ru/factography.aspx (дата обращения: 03.04.2012).

3. Фактографическая информация, словарь Macmillan, 2012 г. - [Электронный ресурс] - Режим доступа: http://www.macmillandictionary.com/ (дата обращения: 12.03.2012).

4. Поисковая система WolframAlpha, 2012 г. - [Электронный ресурс] - Режим доступа: http://www.wolframalpha.com/ (дата обращения: 14.03.2012).

5. Gallagher S. Using The Knowledge Management Maturity Model (KM3) As An Evaluation Tool, 2010 г. - [Электронный ресурс] - Режим доступа: http://bprc.warwick.ac.uk/km028.pdf (дата обращения: 29.03.2010).

6. Математическое моделирование управляемого развития научных способностей / С.А. Пиявский // Известия Академии наук, серия "Теория и системы управления". - 2000. - №3. - С.100-106.

7. Исследовательская деятельность студентов в инновационном вузе: учебник / С.А. Пиявский // Самара: СГАСУ, 2011. 198 с.

8. Гаврилова Т.А. Онтологический подход к управлению знаниями при разработке корпоративных информационных систем // Новости искусственного интеллекта. – 2003. – № 2. – С. 24-30.


1   ...   100   101   102   103   104   105   106   107   ...   115

Похожие:

Международная ассоциация строительных вузов iconПравила проведения состязаний и испытаний по гонкам на собачьих упряжках...
Настоящие Правила разработаны на основе Правил wsa (Международная ассоциация гонок ездовых собак)

Международная ассоциация строительных вузов iconX (L) международная научно-практическая конференция "модель развития современной науки"
Участники конференции: студенты, курсанты и слушатели вузов старших курсов, выпускники вузов, аспиранты, адъюнкты, соискатели и молодые...

Международная ассоциация строительных вузов iconГенеральному директору нп «Международная ассоциация туризма»

Международная ассоциация строительных вузов iconТретье лицо: Ассоциация «Саморегулируемая организация «Межрегиональное...

Международная ассоциация строительных вузов iconПредседатели Оргкомитета
Российская академия наук, Министерство природных ресурсов и экологии Российской Федерации, Федеральное агентство по недропользованию...

Международная ассоциация строительных вузов iconПравила проведения состязаний и испытаний гонок на собачьих упряжках в системе ркф
Настоящие Правила разработаны на основе Правил wsa (Международная ассоциация гонок ездовых собак) и ifss (Международной федерации...

Международная ассоциация строительных вузов iconРегламен т
Настоящий регламент вводится с целью обеспечения производственной дисциплины, техники безопасности при работе техники на строительных...

Международная ассоциация строительных вузов iconТема: Составление ведомости потребности в строительных материалах, конструкциях и изделиях
Задание. Составить ведомость потребности в материально-технических ресурсах, используя нормативы расхода строительных материалов...

Международная ассоциация строительных вузов iconУчебник для вузов Рекомендовано Учебно-методическим объединением...
Дудникова Э. В. — профессор кафедры детских болезней по ростовского государствен­ного медицинского университета, доктор медицинских...

Международная ассоциация строительных вузов iconИздательский центр «гравис» ii-я Международная научная конференция...
К участию в Конференции приглашаются ученые, преподаватели, аспиранты, докторанты, студенты вузов и ссузов, ведущие научные исследования...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск