Сборник трудов


НазваниеСборник трудов
страница3/27
ТипДоклад
filling-form.ru > бланк доверенности > Доклад
1   2   3   4   5   6   7   8   9   ...   27

ДОКЛАД №2. ИНТЕГРАЦИЯ РЕСУРСОВ И СЕРВИСОВ НА ОСНОВЕ РАСПРЕДЕЛЕННОЙ ЭЛЕКТРОННОЙ ПОЛНОТЕКСТОВОЙ БИБЛИОТЕКИ


всероссийская молодежная конференция

Докладчик: С.Х. Ляпин, компания «Константа»‏, г. Архангельск
Соавтор: А.В. Куковякин, Архангельский областной краеведческий музей‏

1. Об интеграции на основе распределенных библиотечно-информационных систем.

Новый подход к интеграции информационных ресурсов и поисково-презентационных сервисов может быть реализован на основе создания и развития сети распределенных электронных библиотек с полнотекстовым поиском – именно этот сервис является наиболее важным (по сравнению с поиском по каталогу) для пользователя, как наиболее информативный и соответствующий его конечным интересам. Но именно для полнотекстового поиска отсутствуют общепринятые международные стандарты и протоколы взаимодействия информационных систем в составе распределенной информационной среды.

2. О распределенном полнотекстовом поиске (определение понятия и постановка задачи для целей доклада).

‘Распределенным полнотекстовым поиском’, или ‘полнотекстовым поиском в распределенной электронной библиотеке’ мы будем называть осуществление поисковых запросов по множеству полнотекстовых ресурсов, расположенных на пространственно разделенных (в том числе удаленных) библиотечных серверах, находящихся в ведении различных организаций. Эти запросы должны осуществляться в глобальной среде Интернет (клиент-серверная архитектура); при этом у пользователя (клиента) предполагается только наличие стандартного браузера и стандартного прикладного ПО для работы с файловыми ресурсами: текстового редактора (например, MS Word), архиватора (например, 7z) и т.п.

Такого рода запрос осуществляется с любого пользовательского рабочего места, имеющего доступ к одному из библиотечных серверов, связанных между собой специализированным техническим протоколом, позволяющим: 1) осуществить полнотекстовый запрос одновременно ко всему множеству серверов, организационно включенных в распределенную среду и 2) отобразить результаты этого запроса в среде стандартного браузера, находящегося на пользовательском компьютере.

В общем случае на библиотечных серверах, входящих в распределенную информационную среду, могут функционировать различные библиотечные информационные системы, обладающие различными возможностями полнотекстового поиска и представлением его результатов.

В нашем, более простом, случае мы предполагаем на библиотечных серверах одну и ту же информационную систему – а именно ИС T-Libra для создания многофункциональных электронных полнотекстовых библиотек (разработка ООО «Константа», см. http://www.softconst.ru). Об архитектуре и функциональных возможностях ИС T-Libra мы неоднократно рассказывали на крупных конференциях и семинарах в 2003-2011 годах (EVA-Moscow, АДИТ, Научный сервис в сети Интернет, Интернет и современное общество, Электронный век культуры, видеоконференции ЭЛБИ, Электронные ресурсы библиотек, музеев, архивов). Имеется возможность практически познакомиться с сервисами продвинутого полнотекстового поиска по адресу http://demo.tlibra.ru.

В январе-марте 2011 года была осуществлена существенная модернизация ИС TLibra: разработан модуль распределенного полнотекстового поиска, и 5 апреля 2011 года на заседании научно-практической конференции «Музейные библиотеки в современном обществе» (Музеи Кремля) группой докладчиков от нескольких организаций впервые была осуществлена экспериментальная презентация проекта «Как пройти в распределенную библиотеку?». В ней приняли участие 2 организации из Архангельска (ООО «Константа», Центр повышения квалификации специалистов культуры) и 3 организации из Москвы (Музеи Кремля, Государственный исторический музей, Библиотека А.Ф.Лосева). Эта презентация была осуществлена затем (8 апреля) в режиме видеоконференции ЭЛБИ (http://www.aselibrary.ru/conference/conference43/conference432039; ее легко найти также по запросу «распределенная межмузейная библиотека» в Яндексе), а также на одном из заседаний международной конференции АДИТ-2011 в Минске в мае 2011 года.

3. Электронная библиотека в распределенной среде: организационные вопросы.

Электронная библиотека в распределенной среде позволяет найти оптимальное решение двух важных и взаимосвязанных вопросов: 1) ускоренное создание современных цифровых ресурсов и 2) рост количества пользователей поисковыми сервисами по доступу к этим ресурсам. То и другое возможно за счет координации деятельности в рамках сотрудничества между организациями, развивающими деятельность в этом направлении.

При этом ресурсы создаются каждой из организаций самостоятельно – и остаются в их ведении, размещаются и пополняются на их собственных библиотечных серверах; пользователь ресурсами любой из организаций получает автоматически доступ ко всей совокупности ресурсов участников распределенной среды; кроме того, тем самым каждая организация существенно увеличивает количество своих пользователей.

Эти идеи реализуются в настоящее время в двух специализированных партнерских проектах: "Консорциум музейных библиотек" и "Nordeana: Северная электронная библиотека".

Первый из них, заявленный на конференции в Музеях Кремля в апреле 2011 года и поддержанный музейным сообществом на конференции АДИТ-2011, ориентирован на музейное сообщество России и стран СНГ. Консорциум не является юридическим лицом и действует на основе Положения, он является открытым для вступления в него новых участников.

Второй консорциум (Nordeana) является региональным, и включает различные организации Архангельской области: как государственные и муниципальные, так и частные (коммерческие и некоммерческие).

Техническим оператором обоих консорциумов является ООО «Константа» (Архангельск).

4. Демонстрация поисковых запросов в распределенной информационной среде на основе модернизированной ИС T-Libra.

В докладе демонстрируются возможности полнотекстового поиска в распределенной среде, создаваемой инициаторами Консорциума музейных библиотек. Эти возможности предоставляются модулем распределенного поиска ИС T-Libra, и кратко описаны и иллюстрируются ниже.

p1

Рис.1. Фрагмент экранной формы для распределенного тематического запроса.

Сформирован пользовательский запрос [+Собор +Василия +Блаженного] (все термины сделаны обязательными, путем указания знаков «+» слева от каждого из терминов).

Кроме кнопок [Выполнить запрос] и [Собрать тему], характерных и для обычной (нераспределенной, локальной) версии T-Libra, в этой форме имеется дополнительно 3 активных элемента: подключение блока распределенного запроса (поставлена «галочка» слева от слова ‘распределенно’); поле для указания тайм-аута запроса (в секундах), по умолчанию стоит «10»; кнопка [Библиотеки], нажатие на которую открывает список библиотек, участвующих в распределенной поисковой среде, и состояние их серверов относительно состоявшейся транзакции.

p2

Рис. 2. Активизирована кнопка [Библиотеки] (см. рис. 1).

На рис. 2 показана таблица, включающая список библиотек, участвующих в распределенном полнотекстовом поиске. Она содержит столбцы с кратким и полным названием организаций, с кратким описанием ресурсов и/или назначения библиотеки, – эти поля заполняются автоматически электронными библиотеками организаций, участвующих в распределенном поиске, – а также состояние каждого библиотечного сервера в текущей транзакции распределенного запроса.

В нашем случае видно, что за указанное время тайм-аута (10 секунд, см. рис.1) участвующие в поисковой сессии библиотеки: ООО «Константа», Архангельск), Музеи Московского Кремля (Москва), Государственного исторического музея (ГИМ, Москва) успешно подключены.

p3

Рис. 3. Фрагмент экранной формы с результатами распределенного полнотекстового запроса [+Собор +Василия +Блаженного], и с их группировкой по документам.

Показано, что всего найдено 24 релевантных документа, содержащих 71 абзац с поисковыми терминами.

Результаты запроса сгруппированы по документам, ранжированным по количеству содержащихся в них релевантных абзацев.

Имеется также возможность сгруппировать и ранжировать результаты непосредственно по релевантным абзацам (поставив «птичку» в активном элементе «список абзацев»).

Результаты выводятся постранично (по 10 результатов на каждой экранной странице).

В итоговой таблице указаны организации, откуда пришел результат запроса, название документа (фрагмент электронной карточки), указано количество релевантных абзацев в каждом из документов.

Название документа является активным, и ‘кликом’ мышки позволяет раскрыть список релевантных абзацев, содержащихся в нем.

p4

Рис. 4. Фрагмент экранной формы с полным (раскрытым) релевантным абзацем результата тематического запроса [+Собор +Василия +Блаженного].

Представлен в полном (раскрытом) виде один из найденных абзацев результата тематического запроса в распределенной среде. Поисковые термины выделены темно-синим цветом букв и синим фоном. Поиск ведется с учетом дореволюционной орфографии (поисковые термины могут вводиться пользователем как в современной орфографии, так и в дореволюционной – для этого в правой части каждого поискового поля T-Libra имеется соответствующая кнопка, активизирующая виртуальную клавиатуру). Показаны также относящиеся к тексту абзаца сноски (как постраничные, так и концевые).

В верхней части экранной формы представлена часть электронной карточки документа, содержащего найденный абзац.

Данная форма содержит опции, позволяющие произвести оценку найденного абзаца с точки зрения текущих интересов пользователя: поставив ему условную «оценку» (от 1 до 5; по умолчанию стоит 3), а также написав произвольный комментарий в соответствующем поле. Оценка сохраняется с помощью нажатия кнопки [Сохранить оценку]. Нажав кнопку [Параметры запроса], можно увидеть эти параметры во всплывающем окне.

В левой верхней части раскрытого абзаца помещен специальный значок, указывающий на то, что имеется возможность получить графическую страницу документа, содержащую данный абзац - см. рис. 5 (графические страницы загружаются в ИС T-Libra при импорте полнотекстового ресурса). Заметим, что мы имеем здесь дополнение функционала электронной полнотекстовой библиотеки функциями архивной информационной системы.

p5

Рис. 5. Фрагмент экранной страницы в графическом формате, содержащей найденный абзац; (на скриншоте видно его начало, см. выше рис.4: «Покровский собор, на котором сначала была черепичная крыша…»).

С помощью активных кнопок [Предыдущая] и [Следующая], расположенных в верхней части экранной страницы, можно листать графические страницы документа относительно текущей – это может быть полезно в том случае, когда на текущей странице оказывается только начало или конец найденного абзаца. Сравнение найденного абзаца с соответствующей графической страницей позволяет, кроме того, проверить текст абзаца на предмет наличия ошибок распознавания и вычитки.

Такого рода связь результатов полнотекстового поиска с графическими имиджами страниц особенно важна для работы с архивными документами и книжными памятниками.

5. «Собрать тему». В реализованной на сегодня версии распределенного поиска соответствующий модуль позволяет, кроме осуществления собственно тематических запросов (нескольких разновидностей), организовать также пользовательскую оценку найденных абзацев (с точки зрения его текущих тематических интересов), а затем в автоматическом режиме собрать тематический файл в распределенной среде с отобранными абзацами – с указаниями на документ и библиотеку, в которой этот документ находится – и сохранить этот файл в виде html-страницы; ее затем можно распечатать или записать на переносимый носитель информации стандартными средствами браузера.

6. Заключение. Создание распределенных электронных библиотек с возможностями продвинутых сервисов по работе с полнотекстовой (а в дальнейшем – и с мультимодальной) информацией, организацию партнерских проектов и развитие сотрудничества в этом направлении мы считаем одним из основных способов существенного продвижения на пути ускоренного развития современной качественной цифровой среды и соответствующих библиотечно-информационных сервисов, в целом развития современной информационной культуры общества.

1   2   3   4   5   6   7   8   9   ...   27

Похожие:

Сборник трудов icon· · Межвузовский сборник научных трудов Выпуск седьмой
Язык. Речь. Речевая деятельность: Межвузовский сборник научных трудов. Выпуск седьмой. – Нижний Новгород: Нижегородский государственный...

Сборник трудов iconСборник научных трудов студентов и молодых ученых
Наука и молодежь: сборник научных трудов студентов и молодых ученых. Вып / Редколлегия: Роговая В. Г., Горин Н. И. – Курган: Курганский...

Сборник трудов iconСборник научных трудов студентов и молодых ученых
Наука и молодежь: сборник научных трудов студентов и молодых ученых. Вып / Редколлегия: Роговая В. Г., Горин Н. И. – Курган: Курганский...

Сборник трудов iconРоссийская Академия Наук Дагестанский Научный Центр Сборник научных...
Сборник научных трудов по термодинамическим циклам Ибадуллаева // Под редакцией И. К. Камилова и М. М. Фатахова. – Махачкала: днц...

Сборник трудов iconН. Г. Чернышевского Педагогический институт музыка и молодежь: теоретические...
Музыка и молодежь: теоретические и практические аспекты: сборник научных статей. Саратов: ООО «Издательский Центр «Наука», 2011....

Сборник трудов iconРоссии Общество офтальмологов России Инновационные технологии в офтальмологической...
Министерство здравоохранения Астраханской области гбоу впо «Астраханская государственная медицинская академия»

Сборник трудов iconXiii международная заочная научно-практическая конференция перспективы...
По итогам конференции будет опубликован сборник научных трудов. Сборнику присваивается международный индекс isbn, удк, ббк. Материалы...

Сборник трудов iconДругие виды изданий в список трудов не включаются и не учитываются
Список составляется по разделам в хронологической последовательности публикации учебных изданий и научных трудов, используемых в...

Сборник трудов iconУченые записки Выпуск 3
Ученые записки. Выпуск Сборник научных трудов Западно-Сибирского филиала Российской академии правосудия (г. Томск). Изд-во: цнти,...

Сборник трудов iconУченые записки Выпуск 2
Ученые записки. Выпуск Сборник научных трудов Западно-Сибирского филиала Российской академии правосудия (г. Томск). Изд-во: цнти,...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск