Скачать 1.69 Mb.
|
ЭЛЕКТРОННАЯ СИСТЕМА ПОИСКА ИНФОРМАЦИИ АСПИ-00010 Рис.8. Общий вид системы АСПИ-00010 Автоматическая система поиска информации АСПИ-00010 (рис.8) относится к классу специализированных информационных машин, предназначенных для работы в условиях регионального центра информации, в задачу которого входит индивидуальное дифференцированное обслуживание потребителей информации не только по текущим поступлениям, но и в том случае, когда нужно осуществить ретроспективный поиск информации. Система включает в себя: блок исключения «избыточной» информации и вводное устройство ВУ-700-2. Структурная схема системы Упрощенная блок-схема показана на рис. 9. Она состоит из вводного устройства - наборного пульта на 10 слов, арифметического устройства, производящего сравнение информации и подсчет количества совпавших слов, памяти, выполненный на тригерном регистре устройства управления, распределяющего управляющие импульсы во времени, и устройства выброса отобранных по программе поиска перфокарт. Рис.9. Блок-схема системы АСПИ-00010 Работа на установке На пульте набора устройства ввода переключателями «КВП» набирается исходная информация (поисковая программа) и «устанавливается» общее количество дескрипторов, введенных в систему, а также указывается количество дескрипторов, по которым будет осуществляться поиск. Тумблерами «Приоритет» устанавливаются «главные» дескрипторы. Во входное устройство ВУ-700-2 закладывается информационный рабочий массив перфокарт. Вводное устройство со скоростью 700 карт в минуту производит подачу перфокарт к считывающему блоку. Информация, записанная позиционно на перфокарте, в полях второй зоны, поступает в виде подпоров в электронный блок, где производится ее сравнение с информацией, записанной на наборном пульте устройства ввода информации. При совпадении перфокарта, несущая соответствующую информацию, выбрасывается в приемный карман емкостью в 300 перфокарт. Электронная система поиска информации разработана коллективами Кузбасского ЦБТИ и научно-исследовательской лабораторией Алтайского политехнического института. НОВАЯ ТЕХНОЛОГИЯ ПОДГОТОВКИ РАБОЧИХ ИНФОРМАЦИОННЫХ МАССИВОВ НА ПЕРФОКАРТАХ Подготовка перфокарты для механизированного поиска информации состоит из следующих этапов:
Выбор оптимальной длины слова (дескриптора) для ввода в память ЭЦВМ При разработке системы автоматизированного кодирования документов с использованием ЭЦВМ необходимо решить вопрос о выборе оптимальной длинны слова (дескриптора). При обработке информации на ЭЦВМ в память машины будет введен дескрипторный словарь. Дескрипторный словарь обрабатывается один раз, записывается на магнитную ленту или магнитный барабан, где может храниться неопределенно долго. Вопрос о вводе дескрипторного словаря в ЭЦВМ может быть решен двумя способами:
При обработке информации с переменной длиной слова требуется сложная программа для определения конца слова, память машины загружается ненужной информацией. В рассматриваемой системе принята определенная длина слова. Такой порядок ввода словаря в ЭЦВМ позволяет составить наиболее рациональную программу обработки информации, исключив из нее логическую обработку данных, позволив наиболее рационально и полно использовать быстродействие машины и ее запоминающее устройство. Принятая длина слова (14 букв) и шестизначный цифр отвечает всем требованиям как ЭВМ, так и требованиям информационного поиска. Способ записи информации позволил вводить большее количество информации в память ЭВМ. 1-1. В дескрипторном словаре в индикаторной части дескрипторы проставляются в строгом алфавитном порядке, в единственном числе именительном падеже. 1-2. Дескрипторы в словаре объединяются в 18 групп по алфавитной принадлежности: группы (А, Б, В), (Г, Д, Е, Ж, 3, И), (К, Л, М), (Н, О, Р) (П) (С, Т), (У, Ф, X, Ц, Ч, Ш, Щ, Ы, Э, Ю, Я). С целью лучшего использования быстродействия машины время обработки документа почти полностью зависит от количества обращений к магнитной ленте. Такая разбивка преследовала уменьшение количества зон на ленте. Этим самым уменьшилось количество обращений к ленте. 1-3. В связи с экономией памяти ЭЦВМ М-20, термины дескрипторного словаря не должны содержать более 14 букв, включая «дефис» (в сложных словах). 1-4. Все дескрипторы должны иметь шестизначный шифр, вместо пятизначного, принятого ранее в дескрипторном словаре. 1-5. Сложные слова, объединенные знаком «дефис», трансформируются в следующие словообразования: а) те из них, которые отвечают на вопрос какой? который? записываются в словаре вместе. Например, водо-масляный - водомасляный, вращательно-подающий - вращательноподающий; б) сложные слова, отвечающие на вопрос кто? что?, когда первое из них определяет второе, то они трансформируются в простые термины, например, термоэлектро-анемометр- термо-электрический + анемометр, и записываются в словаре в алфавитном порядке; в) сложные слова, теряющие первоначальный смысл при отчуждении их друг от друга, пишутся в словаре через знак «дефис», например, капсюль-детонатор, крепь-оболочка, экспресс-метод, Гейгера-Мюллера, Дарен-Вейсбаха (законы, коэффициенты, названные именами ученых); г) собственные составные имена различных типов: личные, географические, названия учреждений и т.п., отвечающие на вопрос какой? записываются через знак «дефис», например, Канско-Ачинский, Львовско-Волынский и др. 1-6. Согласно пункту 1-1 дескрипторы в словаре должны стоять в именительном падеже единственного числа, однако сложные и простые слова, которые в большинстве случаев употребляются во множественном числе, так и записываются, например, соли-Коагуляторы, Гамма-Лучи, аппаратура и др. 1-7. Сложные слова типа «Г-образный», «Т-образный» записываются по правилам грамматики. 1-8. Полные названия государств, типов машин записываются сокращенно, например: Германская Демократическая Республика -ГДР, проходческий комбайн Гуменика - ПКГ. 1-9. Личные имена со словами коэффициент, формула, критерий, число и т.д. записываются в словаре отдельно в из алфавитном порядке в именительном падеже единственного числа, например, коэффициент Пуассона - коэффициент + Пуассон, критерий Рейнольдса - критерий + Рейнольдс, формула Дарси-Вейсбаха - формула + Дарси-Вейсбах и др. 1-10. Полным синонимам в словаре дается один и тот же шифр, например, аккумуляция - 000050 и накопление - 000050. 1-11. Относительным синонимам и омонимам в словаре даются различные шифры, например, величина - 11321, размер - 00452. 1-12. Термины, выраженные сочетанием слов и синонимичные другим терминам, в словаре пишутся отдельно, в алфавитном порядке, например, скафандр тепловой, аппарат газотеплозащитный (синоним) или озокерит (синоним), воск горный записываются скафандр, тепловой, воск, горный, аппарат, газотеплозащитный. Подготовка дескрипторного словаря на перфоленте 2-1. Словарь должен быть закодирован на пятидорожной перфоленте во втором международном коде М-2. 2-2. Словарь кодируется на рулонном телеграфном аппарате, имеющем перфорационную приставку (трансмиттер). 2-3. Каждая группа дескрипторов словаря кодируется на отдельной перфоленте. 2-4. Группы дескрипторов на перфоленте кодируются без разрывов на одном куске перфоленты по правилам, указанным в пунктах 2-5, 2-6, 2-7. 2-5. Начало перфоленты: а) Каретка аппарата устанавливается в исходное положение; б) Набирается регистр «РУС» на длине 20 см; в) Набираются дескрипторы и их шифры в последовательности, указанной на примере: Абразивность -000010 Абразивный -000011 и т.д. г) В конце каждого слова необходимо ставить признак конца слова (один телеграфный пробел); д) Перед каждым шифром (числом) дескриптора набирается цифровой регистр; е) Каждое слово (дескриптор) должно начинаться с регистра (да же если в нем нет необходимости). 2-6. Конец ленты: а) После последнего шифра (числа) группы дескрипторов набираются три мягких знака (признак конца ввода), причем три мягких знака набираются по тем же правилам, что и дескриптора (регистр соответствующей буквы в начале и телеграфный пробел в конце); б) После признака «Конец ввода» набирается «РУС» на длине 20 см. 2-7. Ошибка в наборе исправляется с помощью трансмиттера, получением копии перфоленты до дескриптора, закодированного с ошибкой. После исправления ошибочного закодированного дескриптора набор последующих дескрипторов производится в установленном порядке. 2-8 Пропуск внутри слова, большое количество пробелов между слонами, отсутствие цифрового регистра перед шифром считается ошибкой. Подготовка перфоленты для кодирования информационного документа (подготовка задач) 3-1. Исходные данные задачи набираются, как и словарь, в соответствии с пунктами 2-5, 2-6: а) шифры дескрипторов на перфоленте не набираются; б) дескриптор от дескриптора отделяется одним телеграфным пробелом; 3-2. Задача от задачи отделяется двумя буквами «щ» (конец информации), 2 буквы «щ» набираются как слово. 3-3. Количество задач на одном куске перфоленты не ограничивается. Для удобства ввода задач рекомендуется ограничиваться 100 задачами на одном куске перфоленты. 3-4. При наборе задач на перфоленте должны также соблюдаться правила пунктов 1-1, 1-12. 3-5. В конце всей информации необходимо набирать три буквы «ы» как слово. 3-6. После 3 букв «ы» набирать 3 мягких знака как слово. Выбор типа ЭЦВМ и разработка программы Для обработки информации по автоматическому индексированию в системе АСПИ необходима вычислительная машина, имеющая ввод с перфоленты в международном телеграфном коде М-2 и возможность вывода информации на перфокарты с двоичной записью шифра. Кроме того одним из важных факторов является вопрос надежной работы ЭЦВМ. Для обработки информации в системе АСПИ принята ЭЦВМ М-220. Эта машина удовлетворяет поставленным требованиям ввода, вывода и надежности хранения информации. Машина надежна в эксплуатации, быстродействие достаточно для выполнения логических операций при решении поставленной задачи. Способом программирования в системе М-20 можно осуществить вывод информации на перфокарты с двоичной записью шифров. Информация в ЭЦВМ может храниться как на магнитной ленте, так и на магнитных барабанах. Предпочтительно информацию хранить на магнитных барабанах. Фотосчитывающее устройство позволяет вводить информацию со скоростью 600-800 строк в секунду. Вывод на перфокарты осуществляется со скоростью 60 карт/мин. Эффективность внедрения системы автоматизированного кодирования документов Внедрение в системе АСПИ автоматизированного кодирования документов даст возможность сделать качественный скачок в деле автоматизации процессов поиска и подготовки информации за счет применения современного, достаточно быстродействующего оборудования. Этот факт имеет важное значение, и не учитывать эффект этих мероприятий было бы ошибкой. В настоящее время инженер-специалист читает документ, выписывает характеристики и производит кодирование. Основные затраты времени идут на заполнение карт характеристик и индексирование. При автоматизированном индексировании специалист только подчеркивает дескрипторы (термины), а кодирование информационных карт отпадает полностью. При кодировании на ЭЦВМ М-20 скорость обработки документов может практически ограничиваться только скоростью работы выходного перфоратора. ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ ИПС Для расчетов экономической эффективности ИПС принято: 1. Годовое поступление вторичной информации (рефератов) 30 000 названий 2.Количество информационных запросов в месяц 1880 3. Ежемесячный объем поступления вторичной информации (рефератов) 2500 названий 4. Среднее количество вторичной информации (рефератов), подлежащей просмотру для одного запроса 2 500 названий Особые условия: а) Информационные запросы на год - постоянные; б) Выдача информации по текущим поступлениям - ежемесячно. Подготовка информационного массива к поиску Расчет затрат на индексирование (раскрытие содержания) на годовой объем поступления документов в систему. В расчете приняты следующие операции:
Тогда годовой объем работ составит: 30 000 х 20 - 600 000, где 30 000 - годовое количество рефератов, подлежащих индексированию, 20 - среднее количество характеристик на один реферат. Общие затраты рабочего времени при норме 400 характеристик в день будут равны: 60 000 : 400 = 1 500 рабочих дней. Общая сумма расходов на индексирование при дневной тарифной ставке индексатора 4 руб. 80 коп. (из расчета месячной ставки старшего инженера 120) составит: 1 500 х 4 руб. 80 коп. = 7 200 руб. Затраты рабочего времени на «запись» (перфорация) характеристик на перфокарты в двоичном коде с помощью перфоратора П80-2 будут равны: 600 000 : 4 000 = 300 рабочим дням. Общая сумма расходов на «запись» характеристик будет равна -300 х 3 руб. 20 коп. = 960 руб. (из расчета 30 руб. месячной ставки оператора). Кроме основных операций по подготовки вторичной информации к поиску, существует предварительная подготовка информационного массива к поиску, заключающая в себе операции по расстановке перфокарт по системе УДК в пределах 8-20 знака дробности. Общие расходы рабочего времени на отсортировку 30 000 информационного массива в рабочие подмассивы с помощью сортировки С80-5 и составит 30 000 : 5 000 = 6 рабочих дней. Сумма же расходов составит 6 х 3,2 = 19 руб. 20 коп. (3 руб. 20 коп. - дневная тарифная ставка оператора). ИТОГО: расходы по подготовке 30 000 информационного массива к поиску составят: 7 200 + 960 + 19 = 8 179 руб. Затраты по подготовке этого информационного массива к поиску, например, с помощью УДК (индексирование осуществляется централизованно и в расчет не принимается) составит только 411 руб. (учтены расходы, связанные с предварительной подготовкой информационного массива к поиску, расстановка по УДК). Как видно из расчетов, информационные поисковые системы дескрипторного типа требуют дополнительной обработки документов. Поиск информации - исходя из общих условий информационного обеспечения потребителей, информационно-поисковая система (информационный язык, средство реализации) обслуживает (осуществляется поиск) 1 830 тем по горному делу с постоянными поисковыми программами по каждой теме. В течение года в поисковую систему потребителем информации могут вноситься дополнения и изменения. Средства реализации информационно-поисковой системы должны обеспечивать обязательный просмотр всех текущих поступлений по теме общим объемом 2 500 учетных единиц. В результате общий объем информационного массива для 1 830 задач составит: 1 830 х 2 500 = 4 575 000 перфокарт. Ручной обычный поиск информации - при норме просмотра 1000 документов (рефератов) в день общие затраты рабочего времени при старом (обычном) ручном поиске составят 4 575 рабочих дней или 2,5 рабочих дня на одну информационную задачу (тему). При этом средняя стоимость поиска по одной информационной задаче составит по зарплате при дневной тарифной ставки инженера-информатора 4,8 руб. -12 руб. Общие месячные расходы на поиск информации по 1 830 задачам будут равны 1830x12 = 21 960 руб. (в расчет не принято индексирование задач по УДК). Механизированный поиск - механизированный поиск информации предусматривает составление поисковой программы (аналогично переводу информационного запроса на язык УДК), т.е. перевод информационной задачи - запроса с естественного языка на язык информационно-поисковой системы, т.е. выполнение операций аналогичных тем, которые присущие этапу подготовки информационного массива к поиску. Каждой информационной задаче - запросу записывается в среднем 10 характеристик в рабочий день. Общий расход времени на одну задачу-запрос составит 11 минут. На подготовку и ввод массива в автоматическую систему затрачивается 5 минут. Таким образом, для решения одной задачи-запроса расход рабочего времени составит при механизированном поиске 16 минут, а стоимость поиска информации составит 18 копеек. Месячные расходы на поиск информации по 1 830 задачам-запросам составят 320 рублей. При этом надо учесть то, что основу рабочего времени составляет перевод запросов на язык информационно-поисковой системы, и эти программы составляются на год 1 раз. Общий годовой экономический эффект от эксплуатации системы на 21 960 задач составит 249 566 рублей. При централизованной подготовке информационного массива к поиску для ряда региональных центров информации экономический эффект будет значительно выше, а дело планового дифференцированного информационного обслуживания станет на прочную совместную базу машинной техники. Приложение 1 |
«Медицинская документация фельдшерско-акушерских пунктов» [Текст] : /сост.: Т. В. Дружинина, Н. Л. Дочкина, Н. Н. Осокина [и др.]... | Коллегией Администрации Кемеровской области, реализуемой в рамках Государственной программы «Экономическое развитие и инновационная... | ||
Региональная федерация – Федерация футбола член рфс, осуществляющая деятельность на территории области | На моем столе лежит старая тетрадь из далеких времен школьного детства начала 70-х годов прошлого столетия | ||
Ориентировочно! Выезд группы из Краснодара в Волгоград поездом №354 сообщением «Адлер Пермь» | Направляю Вам для учета в работе перечень федеральных нормативных правовых актов, касающихся вопросов градостроительной и сопутствующей... | ||
Эта книга и посвящается юности – нелегкой юности поколения, к которому я имею честь принадлежать | Марш-бросок «Никто, только мы!» посвящается 70-летию Победы в Великой Отечественной войне 1941-1945 годов | ||
Посвящается миллионам предпринимателей во всем мире, которые в меру своих сил и возможностей делают жизнь лучше | Литературный конкурс «Души прекрасные порывы» проводится среди педагогических работников и обучающихся 1-11-х классов образовательных... |
Поиск Главная страница   Заполнение бланков   Бланки   Договоры   Документы    |