Скачать 1.69 Mb.
|
ИНДИКАТОРНЫЙ СЛОВАРЬ Индикаторный словарь представляет собой список расположенных в алфавитном порядке отдельных дескрипторов, включенных в дескрипторный словарь. Например, дескриптор камера взрывная в индикаторном словаре расчленен на две самостоятельные части: камера и взрывной, каждая из которых имеет свое кодовое обозначение. В восьмеричной системе счисления в данном случае кодовые обозначения соответственно будут 02373 и 00511. В связи с тем, что в словаре, кроме дескрипторов, записаны их кодовые значения, индикаторный словарь получил название кодового указателя. В том случае, если одна и та же поясняющая характеристика варе она указывается только один раз. Например, из дескрипторов каретка буровая и скважина буровая в кодовый указатель взяты три составные части: каретка, скважина и поясняющая характеристика буровой. Компоненты с кодами в словаре оформлены списком. Ниже приведен образец кодового указателя: Вруб 00740 Врубовый 00742 Врубо-навалочный 00743 Врубо-погрузочный 00744 При составлении индикаторного словаря соблюдались следующие правила словесного оформления. Имена существительные (дескрипторы) в кодовом указателе записаны в форме именительного падежа единственного числа. В некоторых случаях имена существительные ставятся в форме множественного числа. Например, аппараты (как предмет) в отличие от аппарата (административного), чаши бегунные (употребительная форма этого термина). Имена прилагательные (поясняющие характеристики) стоят в форме именительного падежа единственного числа мужского рода. Если среди слов, используемых в словаре, встречаются омонимы (т.е. два слова, одинаковых по произношению и написанию, но различных по значению), то значение этих слов поясняется соответствующими пометками, причем кодовые значения у них совершенно различные между собой. Например, рабочий (сущ.), рабочий (прил.), простой (сущ.), простой (прил.). В связи с тем, что при индексировании могут встретиться трудности в кодировании синонимов, ниже рассмотрены способы кодирования всех трех случаев структурных разновидностей синонимов.
Терминологические сочетания, синонимичные друг другу, в индикаторном словаре имеют одинаковые индексы, в то время как их составные компоненты имеют другие индексы. Например, индекс синонимичных дескрипторов «оклад дверной» и «крепь штрековая» будет 02246, а индексы составных компонентов соответственно будут 04163, 01414, 03011, 10426. Такие терминологические сочетания в кодовом указателе снабжаются знаком дефис (-), например: Крепь 03011 - штанговая 01510 - штрековая 11227 Для облегчения процесса индексирования в индикаторном словаре помещены все связанные и вышестоящие термины, относящиеся к основному дескриптору, например: Костер 02753 в. крепь 03011 В том случае, если связанные и вышестоящие дескрипторы относятся к дескриптору, выраженному словосочетанием, то у основного дескриптора поставлен знак «+», что означает необходимость просмотра индикатором всей дескрипторной ассоциации в дескрипторном словаре с целью установления имеющихся связанных и вышестоящих терминов. Особый случай представляет кодирование относительных синонимов. Термин, обладающий более широким объемом содержания, принято разбивать на два термина меньшего объема содержания, один из которых синонимичен другому термину, а второй не является его синонимом. Например, термин «газ горючий» разбивается на два термина: 1. Термин «газ горючий», синонимичный термин «горючее газообразное», получающий общее с ним кодовое обозначение (00450). 2. Термин «газ горючий», не синонимичный термину «горючее газообразное» и имеющий отличительный от него код (01506). ПОСТРОЕНИЕ ДЕСКРИПТОРНОГО СЛОВАРЯ Построение дескрипторного словаря проводилось методом отбора характеристик, которыми могут быть описаны информационные объекты с последующим переводом отобранных характеристик - слов и словосочетаний - в дескрипторы. В связи с тем, что информационно-поисковая система должна обслуживать коллекцию документов (она систематически пополняется), охватывающую все отрасли знания по горному делу, для отбора характеристик документов была выбрана их представительная коллекция. Эта коллекция документов, по возможности, была представлена равновеликим количеством документов по всем разделам горного дела, в том числе системам разработки, креплению горных выработок, вентиляций, водоотливу и т.д. Характеристики выписывались не только из документов представительной коллекции, но и из ряда других документов, например, терминологических словарей, энциклопедий, а также из общих и отраслевых таблиц Универсальной десятичной классификации (УДК). Методы выявления характеристик из документов осуществлялись по общим существующим правилам разработки ИПС дескрипторного типа. В результате обработки почти 10 тыс. документов по горному делу, входивших в представительную коллекцию, было получено свыше 80-ти процентов всех характеристик. Соотношение выявленных характеристик из различных видов документов, представленных в коллекции, показано в таблице:
В результате анализа выбранных характеристик и их частого повторения в документах можно сделать вывод: чем количественно больше коллекция документов и разнообразней ее документы по видам, тем полнее может быть произведен отбор необходимых характеристик для включения их в словник. После отбора характеристик для ИПС была выявлена частота их повторения в экспериментальном информационном массиве. В результате установлено, что в 1000 документов характеристики по их частотному повторению могут быть разбиты на 4 группы, а именно: с повторением: До 12 раз 30 % До 24 раз 31% До 40 раз 20% Свыше 41 раза 19%
Было замечено, что в горнотехнической литературе отдельные характеристики вступают между собой во взаимность и образуют устойчивые словосочетания. Например, лента конвейерная, реагент флотационный, очистной забой, горная выработка и т.п. При анализе характеристик по их принадлежности к частям речи значительное преимущество по частотности повторений принадлежит именам существительным. После перевода характеристик в дескрипторы было проведено "пробное индексирование, целью которого являлась проверка полноты характеристик в дескрипторном словаре, выявление характеристик, относящихся по своему терминологическому значению к горному делу и выработка правил ограничений вносимых в словник характеристик, относящихся по своей терминологической значимости к другим отраслям знаний. Методика проверки заключаюсь в подсчете количества характеристик, недостающих в словаре на каждую сотню обработанных документов, а также принадлежность этих характеристик к частям речи. Недостающие характеристики после обработки каждой сотни документов вносились в отдельную картотеку -словарь. Пробное индексирование показало, что если количество недостающих характеристик, относящихся к горному делу, снижается в первых сотнях документов скачкообразно, то. начиная с десятой сотни, снижение идет постепенно. Если на 20-й сотне обработанных документов недостающих характеристик было 5, то на 25-30-й сотнях документов их не хватает только 3-2; эти характеристики относятся к характеристикам, выраженным именем прилагательным. Число характеристик, относящихся к другим отраслям знаний, для отдельных сотен документов различно, и заметно снижение их числа с увеличением объема обработанных документов. Учитывая, что информационно-поисковая система эксплуатируется в условиях, когда общим для всех документов является их принадлежность к горному делу, для характеристик, относящихся к другим отраслям знаний, были наложены искусственные ограничения при включении их в словарь. ИССЛЕДОВАНИЕ РОЛИ ПРЕДЛОГОВ И СОЮЗОВ ДЛЯ ПОВЫШЕНИЯ КАЧЕСТВА ИНДЕКСИРОВАНИЯ Предлоги и союзы как форма связи 2-х понятий играют существенную роль при индексировании документов дескрипторами. Связи эти могут иметь различный качественный характер: • связи целевого назначения; • причинно-следственные связи; • видо-родовые связи; • атрибутивные; пространственно-позиционные; • пространственно-направленные; • пространственно-исходные;
Одни и те же предлоги или союзы могут иметь различный характер в зависимости от их дистрибуции (или контекста). Возможные связи предлогов и союзов представлены в следующей таблице: Виды значений служебных слов
|
«Медицинская документация фельдшерско-акушерских пунктов» [Текст] : /сост.: Т. В. Дружинина, Н. Л. Дочкина, Н. Н. Осокина [и др.]... | Коллегией Администрации Кемеровской области, реализуемой в рамках Государственной программы «Экономическое развитие и инновационная... | ||
Региональная федерация – Федерация футбола член рфс, осуществляющая деятельность на территории области | На моем столе лежит старая тетрадь из далеких времен школьного детства начала 70-х годов прошлого столетия | ||
Ориентировочно! Выезд группы из Краснодара в Волгоград поездом №354 сообщением «Адлер Пермь» | Направляю Вам для учета в работе перечень федеральных нормативных правовых актов, касающихся вопросов градостроительной и сопутствующей... | ||
Эта книга и посвящается юности – нелегкой юности поколения, к которому я имею честь принадлежать | Марш-бросок «Никто, только мы!» посвящается 70-летию Победы в Великой Отечественной войне 1941-1945 годов | ||
Посвящается миллионам предпринимателей во всем мире, которые в меру своих сил и возможностей делают жизнь лучше | Литературный конкурс «Души прекрасные порывы» проводится среди педагогических работников и обучающихся 1-11-х классов образовательных... |
Поиск Главная страница   Заполнение бланков   Бланки   Договоры   Документы    |