В юридической деятельности


НазваниеВ юридической деятельности
страница23/29
ТипРеферат
1   ...   19   20   21   22   23   24   25   26   ...   29
Преимущества цифровой передачи видеоданных

Кроме очевидных преимуществ формата, сам способ формирования цифрового изображения также несет в себе существенные преимущества. Цифровой сигнал не ослабляется при передаче на расстояние, как аналоговый сигнал. Поэтому если он принимается вообще, то принимается без искажений. Цифровой сигнал не подвержен помехам, характерным для работы нецифрового оборудования, таким как тени, «туман» или «снег». Передается же цифровой сигнал в компрессированном виде, что намного сужает требуемую полосу пропускания канала. В цифровом телевидении применяется схема компрессии MPEG-2 – та же, что и на DVD.

Любая компрессия – это компромисс. Самое высокое качество у некомпрессированного цифрового видео, но для этого необходимо передавать невероятное количество данных. Такую пропускную способность можно обеспечить только в локальной сети. Чтобы передавать цифровой сигнал по существующим каналам, изображение с разрешением примерно вчетверо выше по сравнению с обычным нецифровым компрессируется в соотношении 77:1.

«Чудо компрессии» позволяет не только передавать в эфир превосходное изображение. Благодаря запасу полосы пропускания, появляется возможность передавать цифровое аудио 7.1, то есть настоящий окутывающий звук (surround sound).

Важнейшим компонентом HDTV служит совсем крошечная деталь – скромный пиксель. В аналоговом телевидении элементы изображения, из которых состоит красная, зеленая и синяя компоненты, представляют собой вертикальные прямоугольники. В HDTV они квадратные, как на компьютерных мониторах, и более, чем в четверо меньше пикселов аналогового ТВ, так что мелкие детали получаются намного четче, что позволяет разглядеть каждую пору на коже кинозвезды.

2. Информационные кросс - технологии

К данному классу отнесены технологии пользователя, ориентированные на следующие (или аналогичные) виды преобразования информации:

• распознавания символов;

• звук-текст;

• текст-звук;

• автоматический перевод.

Оптическое распознавание символов (OCR)

Когда страница текста отсканирована в ПК, она представлена в виде состоящего из пикселей растрового изображения. Такой формат не воспринимается компьютером как текст, а как изображение текста и текстовые редакторы не способны к обработке подобных изображений. Чтобы превратить группы пикселей в доступные для редактирования символы и слова, изображение должно пройти сложный процесс, известный как оптическое распознавание символов (optical character recognition – OCR).

В то время как переход от символьной информации к графической (растровой) достаточно элементарен и без труда осуществляется, например при выводе текста на экран или печать, обратный переход (от печатного текста к текстовому файлу в машинном коде) весьма затруднителен. Именно в связи с этим для ввода информации в ЭВМ исстари использовались перфоленты, перфокарты и др. промежуточные носители, а не исходные «бумажные» документы, что было бы гораздо удобнее. «В защиту» перфокарт скажем здесь, что наиболее «продвинутые» устройства перфорации делали надпечатку на карте для проверки ее содержания.

Первые шаги в области оптического распознавания символов были предприняты в конце 50-х гг. XX в. Принципы распознавания, заложенные в то время, используются в большинстве систем OCR: сравнить изображение с имеющимися эталонами и выбрать наиболее подходящий.

В середине 70-х гг. была предложена технология для ввода информации в ЭВМ, заключающаяся в следующем:

  • исходный документ печатается на бланке с помощью пишущей машинки, оборудованной стилизованным шрифтом (каждый символ комбинируется из ограниченного числа вертикальных, горизонтальных, наклонных черточек, подобно тому, как это делаем мы и сейчас, нанося на почтовый конверт цифры индекса);

  • полученный «машинный документ» считывается оптоэлектрическим устройством (собственно OCR), которое кодирует каждый символ и определяет его позицию на листе;

  • информация переносится в память ЭВМ, образуя электронный образ документа или документ во внутреннем представлении.

Очевидно, что по сравнению с перфолентами (перфокартами) OCR-документ лучше хотя бы тем, что он без особого труда может быть прочитан и проверен человеком и, вообще, представляет собой «твердую копию» соответствующего введенного документа. Было разработано несколько модификаций подобных шрифтов, разной степени «удобочитаемости» (OCR A (рис 1), OCR В (рис 2) и пр.).

ocr

Рис. 1. OCR – A

ocrb-fontchip

Рис. 2. OCR – B

Очевидно также, что считывающее устройство представляет собой сканер, хотя и специализированный (считывание стилизованных символов), но интеллектуальный (распознавание их).

OCR – технология в данном виде просуществовала недолго и в настоящее время приобрела следующий вид:

  • считывание исходного документа осуществляется универсальным сканером, осуществляющим создание растрового образа и запись его в оперативную память и/или в файл;

  • функции распознавания полностью возлагаются на программные продукты, которые, естественно, получили название OCR-software.

Исследования в этом направлении начались в конце 1950–х гг., и с тех пор технологии непрерывно совершенствовались. В 1970-х гг. и в начале 1980-х гг. программное обеспечение оптического распознавания символов все еще обладало очень ограниченными возможностями и могло работать только с некоторыми типами и размерами шрифтов. В настоящее время программное обеспечение оптического распознавания символов намного более интеллектуально и может распознать фактически все шрифты, даже при невысоком качестве изображения документа.

Основные методы оптического распознавания

Один из самых ранних методов оптического распознавания символов базировался на сопоставлении матриц или сравнении с образцом букв. Большинство шрифтов имеют формат Times, Courier или Helvetica и размер от 10 до 14 пунктов (точек). Программы оптического распознавания символов, которые используют метод сопоставления с образцом, имеют точечные рисунки для каждого символа каждого размера и шрифта. Сравнивая базу данных точечных рисунков с рисунками отсканированных символов, программа пытается их распознавать. Эта ранняя система успешно работала только с непропорциональными шрифтами (подобно Courier), где символы в тексте хорошо отделены друг от друга. Сложные документы с различными шрифтами оказываются уже вне возможностей таких программ.



Рис. 3. Разные подходы к распознаванию

Выделение признаков было следующим шагом в развитии оптического распознавания символов. При этом распознавание символов основывается на идентификации их универсальных особенностей, чтобы сделать распознавание символов независимым от шрифтов. Если бы все символы могли быть идентифицированы, используя правила, по которым элементы букв (например, окружности и линии) присоединяются друг к другу, то индивидуальные символы могли быть описаны независимо от их шрифта. Например: символ «а» может быть представлен как состоящий из окружности в центре снизу, прямой линии справа и дуги окружности сверху в центре (рис. 3). Если отсканированный символ имеет эти особенности, он может быть правильно идентифицирован как символ «а» программой оптического распознавания.

Выделение признаков было шагом вперед сравнительно с соответствием матриц, но практические результаты оказались весьма чувствительными к качеству печати. Дополнительные пометки на странице или пятна на бумаге существенно снижали точность обработки. Устранение такого «шума» само по себе стало целой областью исследований, пытающейся определить, какие биты печати не являются частью индивидуальных символов. Если шум идентифицирован, достоверные символьные фрагменты могут тогда быть объединены в наиболее вероятные формы символа.

Некоторые программы сначала используют сопоставление с образцом и/или метод выделения признаков для того, чтобы распознать столько символов, сколько возможно, а затем уточняют результат, используя грамматическую проверку правильности написания для восстановления нераспознанных символов. Например, если программа оптического распознавания символов неспособна распознать символ «е» в слове «th~ir», программа проверки грамматики может решить, что отсутствующий символ – «е».

Современные технологии оптического распознавания намного совершеннее, чем более ранние методы. Вместо того чтобы только идентифицировать индивидуальные символы, современные методы способны идентифицировать целые слова. Эту технологию, предложенную Caere, называют прогнозирующим оптическим распознаванием слов (Predictive Optical Word Recognition – POWR).

Используя более высокие уровни контекстного анализа, метод POWR способен устранить проблемы, вызванные шумом. Компьютер анализирует тысячи или миллионы различных способов, которыми точки изображения могут быть собраны в символы слова. Каждой возможной интерпретации приписывается некоторая вероятность, после чего используются нейронные сети и прогнозирующие методы моделирования, заимствованные от исследований в области искусственного интеллекта. Они предполагают использование «экспертов» – алгоритмов, разработанных специалистами в различных областях распознавания символов. Один «эксперт» может знать многое о начертаниях шрифта, другой – о словарной информации, третий – об ухудшении качества от «зашумленности» и пр. На каждой стадии исследования привлекается новый набор «экспертов» с учетом близости их «областей знаний» к специфической ситуации и статистики успеха в подобных ситуациях.

Окончательный итог – то, что система POWR способна идентифицировать слова способом, который близко напоминает человеческое визуальное распознавание. Практически, методика значительно улучшает точность распознавания слов во всех типах документа. Все возможные интерпретации слова оцениваются, комбинируя все источники доказательства, от информации пикселя нижнего уровня до контекстных особенностей высокого уровня, в результате чего выбирается самая вероятная интерпретация.

Технологии Finereader

Хотя системы оптического распознавания символов существовали в течение долгого времени, их выгоды только сейчас начали по достоинству оценивать. Первые разработки были чрезвычайно дорогостоящими (в терминах программного обеспечения и оборудования), неточны и трудны для использования. За несколько последних лет системы оптического распознавания полностью преобразились. Современное программное обеспечение распознавания символов очень удобно в использовании, обладает высокой точностью и находится на пути к распространению на все виды рабочих сред в массовом масштабе.

Типичным представителем данного семейства программ является ABBYY FineReader, технологический процесс которого включает следующие шаги (рис. 4):

  • сканирование исходного документа (страницы);

  • разметку областей (ручную или автоматическую), требующих различные виды обработки (страницы разворота книги, таблицы, рисунки, колонки текста и пр.);

  • распознавание – создание и вывод на экран текстового файла (с вставленными рисунками и таблицами, если это необходимо);

  • контроль правильности (ручной, автоматический, полуавтоматический);

  • вывод информации в выходной файл в заданном формате (.DOC или .RTF для Word, .XSL для Excel и пр.).

Данные, полученные на каждом этапе (изображение, текстовый файл), сохраняются под «общей вывеской» пакета (страницы с номером), что позволяет в любой момент вернуться и повторить разметку, распознавание и пр.
Если нет необходимости сохранять цветовую информацию оригинала документа (например, для последующей обработки системами оптического распознавания символов), изображение лучше всего сканировать в режиме grayscale (полутоновое изображение). При этом файл будет занимать одну треть объема сравнительно со сканированием в цвете RGB. Можно использовать также режим штриховой графики (line art), однако при этом часто теряются подробности, существенные для точности последующего процесса распознавания символов.

Рассмотрим основные принципы функционирования программного продукта.

Системы распознавания речи

Теоретически машинное распознавание речи, т. е. ее автоматическое представление в виде текста, является крайней степенью сжатия речевого сигнала.

Процесс распознавания речи (STT – speech-to-text) в последние годы сделал гигантский скачок вперед. В наибольшей мере его стимулирует отнюдь не желание разработчиков создать пользовательские суперудобства, а существование специфических областей компьютеризации, где голосовые команды являются более приемлемым или даже единственно возможным решением. К ним относятся телефонный доступ к автоматическим справочным системам, управление удаленным компьютером или мобильным портативным устройством, осуществляемое во время движения.

Принципы распознавания речи

Системы распознавания речи обычно состоят из двух компонент, которые могут быть выделены в блоки или в подпрограммы – акустической и лингвистической. Лингвистическая часть может включать в себя фонетическую, фонологическую, морфологическую, синтаксическую и семантическую модели языка. Акустическая модель отвечает за представление речевого сигнала. Лингвистическая модель интерпретирует информацию, получаемую от акустической модели, и отвечает за представление результата распознавания потребителю.

Акустическая модель

Существуют два подхода к построению акустической модели: изобретательский и бионический. Оба подхода имеют свои достоинства и недостатки. Первый базируется на результатах поиска механизма функционирования акустической модели. При втором подходе разработчик пытается понять и смоделировать работу естественных систем.

Лингвистическая модель

Лингвистический блок подразделяется на следующие слои (уровни); фонетический, фонологический, морфологический, лексический, синтаксический, семантический. Все уровни содержат априорную информацию о структуре естественного языка, а, как известно, любая априорная информация об интересующем предмете увеличивает шансы принятия верного решения. Поскольку естественный язык несет весьма сильно структурированную информацию, для каждого естественного языка может потребоваться своя уникальная лингвистическая модель (отсюда трудности русификации сложных систем распознавания речи зарубежной разработки).

В соответствии с данной моделью на первом (фонетическом) уровне производится преобразование входного (для лингвистического блока) представления речи в последовательность фонем, как наименьших единиц языка. Считается, что в реальном речевом сигнале можно обнаружить лишь аллофоны – варианты фонем, зависящие от звукового окружения.

На следующем (фонологическом) уровне накладываются ограничения на комбинаторику фонем (аллофонов) – не все сочетания фонем (аллофонов) встречаются, а те, что встречаются, имеют различную вероятность появления, зависящую еще и от окружения. Для описания этой ситуации используется математический аппарат цепей Маркова.

Далее, на морфологическом уровне оперируют со слогоподобными единицами речи более высокого уровня, чем фонема. Иногда они называются морфемами. Они накладывают ограничение уже на структуру слова, подчиняясь закономерностям моделируемого естественного языка.

Лексический уровень охватывает слова и словоформы того или иного естественного языка, т. е. словарь языка, также внося важную априорную информацию о том, какие слова возможны для данного естественного языка. Семантика устанавливает соотношения между объектами действительности и словами, их обозначающими. Она является высшим уровнем языка. При помощи семантических отношений интеллект человека производит как бы сжатие речевого сообщения в систему образов, понятий, представляющих суть речевого сообщения.

Российская компания «ИстраСофт» известна пакетом для обучения английскому языку с визуальным контролем произношения «Профессор Хиггинс». Развивая «Хиггинса», сотрудники «ИстраСофт» совершили технологический прорыв, значение которого трудно переоценить: они научились членить слова на элементарные сегменты, соответствующие звукам речи, независимо от диктора и от языка (Существующие системы распознавания Речи не производят сегментации, наименьшей единицей для них является слово.) Демонстрация новой технологии выглядит пока не очень эффектно: это всего-навсего упаковка и распаковка звуковых файлов с записью речи - правда, с высокими коэффициентами сжатия. Если файл был сжат сильно, то после распаковки в нем появляются отчетливо слышные границы между сегментами; использованию программы по прямому назначению они, конечно, мешают, но специалисту позволяют убедиться в правильности членения.

В соответствии с этим решение задачи речевых технологий можно представить в виде схемы рис. 5.

База фонем соответствующего языка

Программа распознавания и преобразования фонем

Текстовый файл или команда

Программа перевода текста в фонемное описание


Файл описания фонем в сжатой форме формата SPF

Программа перевода речевого сигнала в фонемное описание


Программа

синтеза речи из файла описания фонем

Текст

Речь

Канал связи

Речь

В основе алгоритма лежит выделение фонем из потока слитной речи в режиме реального времени, их кодирование и последующее восстановление, однако у разработчиков нет единого мнения о том, что считать фонемой при машинной обработке речи. Способ, предложенный фирмой «ИстраСофт», допускает сжатие речи в 200 раз, причем при сжатии менее чем в 40 раз качество сигнала практически не падает.
Чтобы создать основанную на новой технологии систему распознавания, необходимо «привязать» сегментацию к конкретному языку с помощью двух словарей – «звукового», сопоставляющего реальным звукам речи определенные фонемы, т. е. смыслоразличительные единицы (на слух мы, как правило, воспринимаем именно фонемы родного языка, не замечая различий между их вариантами, обусловленными, например, позицией), и «фонетико–орфографического», который будет переводить фонемную запись в письменную. Принципиально ничего сложного здесь нет: это вполне рутинная, умеренно трудоемкая техническая задача.

Интеллектуальная обработка речи на уровне фонем перспективна не только как способ сжатия, но и как шаг на пути к созданию нового поколения систем распознавания речи.

Engine – «машины» синтеза и распознавания речи

«Машина» (в просторечии – «движок») – это пакет программных средств, выполняющих строго определенную задачу и поставляющий интерфейс для использования его возможностей В настоящее время существует целый ряд машин синтеза и Опознавания речи, которые разработаны для использования совместно с MS Speech API.

smARTspeak CS – настраиваемая независимая от языка «машина» распознавания речи для набора цифр, указания имен и речевой навигации, т. е. для приложений, используемых в сотовых телефонах и беспроводных устройствах. Созданный для использования в указанных устройствах, smARTspeak CS удовлетворяет потребностям как пользователей, так и разработчиков: иммунитет к фоновому шуму, малые требования к процессору и памяти, совместимость с MS SAPI 5.0, оптимизация для средств быстрой разработки приложений и для интеграции в сертифицированные устройства.

Conversay предоставляет решение для речевого взаимодействия с информацией, поставляемой через сеть, включая Internet в случае, когда другие интерфейсы слишком сложны или отсутствуют. Conversay разрабатывает речевую технологию, которая позволяет пользователям взаимодействовать через мобильные устройства привычным для себя способом.

Lernout&Hauspie. Система компании L&H позволяет настраивать чтение аббревиатур и слов (ударения). Продукт, активно продвигаемый Microsoft.

Digalo. Голосовой «движок» для русского языка Digalo – продукт французской фирмы Elan Informatique. Digalo различает буквы «Е» и «Е» и виртуозно владеет русской ненормативной лексикой. В основном ошибки в ударениях приходятся на некоторые фамилии и имена, малоупотребительные слова и термины, замечено не всегда корректное озвучивание чисел и очень акцентированное произнесение слов «нет» и «не». Разработчики обещают в дальнейшем сделать возможной корректировку произнесения отдельных слов и слогов.

Аctor 5. Новый «движок» фирмы Loquendo «Actor 5» предназначен для использования в областях голосовых технологий и сервиса. Синтезирует речь на итальянском, испанском, английском, немецком, мексиканском, бразильском и американском иском диалекте (русского, к сожалению, нет).

PC Voice Club. Движок синтеза речи Клуба голосовых технологий при Научном Парке МГУ. При его создании использована базовая технология синтеза речи, разработанная на филологическом факультете МГУ. Синтезатор характеризуется высоким качеством синтеза речи, что позволяет прослушивать тексты без их специальной подготовки. Позволяет синтезировать речь на английском и русском языках. Кроме того, имеет около десятка голосовых типажей (робот, эльф, мышь и пр.) Имеются возможности редактирования голосов. Помимо стандартных функций синтеза речи имеется дополнительная функция встраивания в текст управляющих символов, которые позволяют устанавливать паузы, изменять тембр, тон и длительность звучания. К примеру, можно, отредактировав текст, заставить синтезатор петь.

3. Геоинформационные технологии

Геоинформационные технологии можно определить как совокупность программно-технологических средств получения новых видов информации об окружающем мире. Геоинформационные технологии предназначены для повышения эффективности: процессов управления, хранения и представления информации, обработки и поддержки принятия решений. По сфере использования ГИС не имеют себе равных. Они применяются в транспорте, навигации, геологии, географии, военном деле, топографии, экономике и т.д. Переход к автоматизированным методам создания карт с помощью ГИС имеет ряд преимуществ:

  • повышение точности картографической информации;

  • сокращение трудозатрат на изготовление продукции;

  • увеличение производительности труда за счет автоматизации от дельных операций или исключения их.

Методологической основой процессов обработки информации в ГИС является цифровое моделирование местности, объединяющее процессы сбора первичной информации, ее моделирования и обновления, обработки и формирования документов.

За счет применения современных технических средств осуществляется автоматизация полевых и камеральных работ.

Использование ГИС происходит на разных уровнях. Это обусловлено многообразием геоинформационных технологий.

Выделяют следующие территориальные уровни использования ГИС в России:

  • глобальный уровень – Россия на глобальном и евразийском фоне, масштаб 1: 4 500 000 – 1: 100 000 000;

  • всероссийский уровень – вся территория страны, включая прибрежные акватории и приграничные районы, масштаб 1: 2 500 000–1: 20 000 000;

  • региональный уровень – крупные природные и экономические регионы, субъекты Федерации, масштаб 1: 500 000 – 1: 4 000 000;

  • локальный уровень – области, районы, национальные парки, ареал кризисных ситуаций, масштаб 1: 50 000 – 1 000 000;

  • муниципальный уровень – города, городские районы, пригородные зоны, масштаб 1: 50 000 и крупнее.

К основным компонентам ГИС относят: техническое, программное, информационное обеспечение. Требования к компонентам ГИС определяются, в первую очередь, пользователем, перед которым стоит конкретная задача (учет природных ресурсов, либо управление инфраструктурой города), которая должна быть решена для определенной территории, отличающейся природными условиями и степенью ее освоения.

Техническое обеспечение – это комплекс аппаратных средств, применяемых при функционировании ГИС: рабочая станция или персональный компьютер (ПК), устройства ввода–вывода информации, устройства обработки и хранения данных, средства телекоммуникации.

Рабочая станция или ПК являются ядром любой информационной системы и предназначены для управления работой ГИС и выполнения процессов обработки данных, основанных на вычислительных или логических операциях. Современные ГИС способны оперативно обрабатывать огромные массивы информации и визуализировать результаты.

Ввод данных реализуется с помощью разных технических средств и методов: непосредственно с клавиатуры, с помощью дигитайзера или сканера, через внешние компьютерные системы. Пространственные данные могут быть получены электронными геодезическими приборами, непосредственно с помощью дигитайзера и сканера, либо по результатам обработки снимков на аналитических фотограмметрических приборах или цифровых фотограмметрических станциях.

Устройства для обработки и хранения данных сконцентрированы в системном блоке, включающем в себя центральный процессор, оперативную память, внешние запоминающие устройства и пользовательский интерфейс.

Устройства вывода данных должны обеспечивать наглядное представление результатов, прежде всего на мониторе, а также в виде графических оригиналов, получаемых на принтере или плоттере (графопостроителе), кроме того, обязательна реализация экспорта данных во внешние системы.

Программное обеспечение – совокупность программных средств, реализующих функциональные возможностей ГИС, и программных документов, необходимых при их эксплуатации.

Структурно программное обеспечение ГИС включает базовые и прикладные программные средства.

Базовые программные средства включают: операционные системы (ОС), программные среды, сетевое программное обеспечение и системы управления базами данных. Операционные системы предназначены для управления ресурсами ЭВМ и процессами, использующими эти ресурсы. На настоящее время основные ОС: Windows и Unix.

Любая ГИС работает с данными двух типов данных – пространственными и атрибутивными. Для их ведения программное обеспечение должно включить систему управления базами тех и других данных (СУБД), а также модули управления средствами ввода и вывода данных, систему визуализации данных и модули для выполнения пространственного анализа.

Прикладные программные средства предназначены для решения специализированных задач в конкретной предметной области и реализуются в виде отдельных приложений и утилит.

Информационное обеспечение – совокупность массивов информации, систем кодирования и классификации информации. Информационное обеспечение составляют реализованные решения по видам, объемам, размещению и формам организации информации, включая поиск и оценку источников данных, набор методов ввода данных, проектирование баз данных, их ведение и метасопровождение. Особенность хранения пространственных данных в ГИС – их разделение на слои. Многослойная организация электронной карты, при наличии гибкого механизма управления слоями, позволяет объединить и отобразить гораздо большее количество информации, чем на обычной карте. Данные о пространственном положении (географические данные) и связанные с ними табличные могут подготавливаться самим пользователем либо приобретаться. Для такого обмена данными важна инфраструктура пространственных данных.

Инфраструктура пространственных данных определяется нормативно–правовыми документами, механизмами организации и интеграции пространственных данных, а также их доступность разным пользователям. Инфраструктура пространственных данных включает три необходимых компонента: базовую пространственную информацию, стандартизацию пространственных данных, базы метаданных и механизм обмена данными.

Геоинформационные системы и ГИС–технологии объединяют компьютерную картографию и системы управления базами данных. Концепция технологии ГИС состоит в создании многослойной электронной карты, опорный слой которой описывает географию территории, а каждый из остальных слоев – один из аспектов состояния территории. Тем самым ГИС–технологии определяют специфическую область работы с информацией.

Технология ГИС применима везде, где необходимо учитывать, обрабатывать и демонстрировать территориально распределенную информацию. Пользователями ГИС–технологии могут быть как организации, чья деятельность целиком базируется на земле владельцы нефтегазовых предприятий, экологические службы, жилищно–коммунальное хозяйство, так и многочисленные коммерческие предприятия – банки, страховые, торговые и строительные фирмы, чья успешная работа во многом зависит от правильного и своевременного учета территориального фактора.

В основе любой ГИС лежит информация о каком-либо участке земной поверхности: континенте, стране, городе, улице.

БД организуется в виде набора слоев информации. Основной шрифт содержит географически привязанную карту местности (топооснова). На него накладываются другие слои, несущие информацию об объектах, находящихся на данной территории: коммуникации, в том числе линии электропередач, нефте- и газопроводы, водопроводы, промышленные объекты, земельные участки, почвы, коммунальное хозяйство, землепользование и др.

В процессе создания и наложения слоев друг на друга между ними устанавливаются необходимые связи, что позволяет выполнять пространственные операции с объектами посредством моделирования и интеллектуальной обработки данных.

Как правило, информация представляется графически в векторном виде, что позволяет уменьшить объем хранимой информации и упростить операции по визуализации. С графической информацией связана текстовая, табличная, расчетная информация, координатная привязка к карте местности, видеоизображения, аудиокомментарии, БД с описанием объектов и их характеристик.

Многие ГИС включают аналитические функции, которые позволяют моделировать процессы, основываясь на картографической информации.

Программное ядро ГИС можно условно разделить на две подсистемы: СУБД и управление графическим выводом изображения. В качестве СУБД используют SQL–серверы.

4. Использование видео и аудио технологий в профессиональной деятельности

Windows Movie Maker - это полезная и проверенная временем программа для видеомонтажа. Для пользователей ранних версий Windows она знакома, поскольку была встроена в операционную систему.. Приложение рассчитано на новичков и представляет собой интуитивно понятный редактор для домашнего применения.
Программа для обработки видео позволяет получать его с различных источников, обрабатывать, пользуясь различными переходами и эффектами, создавать заголовки, титры, вырезать и склеить фрагменты.

Рабочая область программы состоит из области содержимого, монтажного стола и окошка предварительного просмотра. Для быстрого доступа к часто используемым командам программа оснащена панелью задач. Недостатком программы можно считать сравнительно небольшой арсенал инструментов для работы с видео и его сохранение практически в одном выходном формате – wmv. В данном случае всегда можно воспользоваться софтом для конвертации.

VirtualDub – уникальная программа для монтажа видео. Приложение работает на всей линейке ОС Windows и позиционируется как бесплатная программа для создания видео. Уникальность утилиты обусловлена большой скоростью работы и малой загрузкой центрального процессора, что удалось достичь благодаря низкоуровневому коду основной части приложения. По этим параметрам утилита превосходит многие платные редакторы. Также существенным отличием приложения является выполнение операций без рекомпрессии, что дает пользователю полный контроль над выполняемыми действиями.
Основные функции приложения: видеозахват, резка / склеивание, использование нескольких аудиодорожек, перекодирование, наложение фильтров, поддержка огромного количества форматов, возможность распределенной работы в сети. Эту утилиту можно рассматривать в качестве программы для записи видео. Обогатить функциональность приложения можно достичь с помощью дополнительных плагинов.

Avidemux. Программа нарезки видео, написана на С++, что обеспечивает быструю работу. Программа для редактирования видео является кроссплатформенным приложением с открытым исходным кодом. Avidemux поддерживает огромное множество входных и выходных форматов. Программа для изменения видео отлично работает с кодеками x264, Xvid, Aften, LAME и другими. Приложение быстро производит базовые операции по монтажу: копирование, вставку, обрезку, масштабирование, а также разбивку. Создание визуальных эффектов достигается с помощью всевозможных фильтров, после чего можно производить кодирование. Есть возможность взаимодействия с мобильными и игровыми устройствами.
ZS4 Video Editor – это отличная программа для создания и обработки видео в домашних условиях. С ее помощью вы можете создать качественный клип или фильм на основе изображений, видео и аудио. Расположить все имеющиеся ресурсы предлагается на неограниченном количестве дорожек.
Далее различные инструменты, предназначенные для того, чтобы подогнать кадр, увеличить/уменьшить размер изображения, повернуть его, сделать панораму, выставить баланс, настроить прозрачность, увеличить/уменьшить скорость воспроизведения и нормализовать уровень громкости. Вдобавок к этому в арсенале ZS4 имеется более 150 эффектов. На выходе вы сможете сами выставлять расширение видеофайлов: от 8х8 до 16000х16000 точек. ZS4 Video Editor превосходно работает с такими форматами, как: avi, wmv, wav. При этом предусмотрена возможность конвертации из одного формат в другой.

SONY Vegas Pro используют видеомонтажеры телевидения, веб–разработчики и те, кто занимается выпуском короткометражных фильмов и сериалов. С первого взгляда интерфейс может показаться сложным для восприятия. Диалоговое окно делится на два: в одном находится рабочий проект, а в другом – видео из галереи. Управлять софтом можно как мышью, так и с клавиатуры. Но по ходу работы вы поймете, что все кнопки и закладки расположены там, где им и место.
Выбор инструментов в программе огромен. Уйма видеоэффектов, тонкая настройка звука, подсказки при нарезке и склеивании фрагментов, возможность обработки файлов, разрешение которых достигает 4096х4096, а также работа одновременно с несколькими записями веб–камер. Кроме того, данная версия позволит загрузить любой из существующих на сегодня видеоформат, откорректировать цвет, выставить частоту и записать проект на Blu–Ray или DVD. Пробную версию SONY Vegas Pro вы можете скачать бесплатно. Но она имеет ограниченный срок работы – 30 дней.

Звуковые редакторы

Объединяют функции цифрового магнитофона, звуковой монтажной станции и набора устройств обработки звука (процессоров). Осуществляют запись, воспроизведение и монтаж (вырезка, вклейка, замена фрагментов фонограммы). Чаще всего имеют набор встроенных и/или подключаемых звуковых процессоров, с помощью которых реализуется сложная обработка записанной фонограммы. Редактор может быть многоканальным, допуская раздельную запись и обработку нескольких звуковых дорожек с последующим их сведением (микшированием). Ряд редакторов предоставляет звуковые процессоры реального времени, а также средства для исследования сигнала – спектроанализаторы, взвешивающие фильтры и статистические функции.

Среди типовых функций звуковых редакторов наиболее общими являются:

  • Запись и воспроизведение звукового сигнала через аудиопорт звукового адаптера (карты);

  • Чтение и запись звуковых файлов, преимущественно формата RIFF PCM (WAV), а также других распространенных форматов;

  • Возможность обработки моно– и стереосигнала с разрядностью 8 и 16 и частотой дискретизации до 44 100 Гц (нередко – до 24 разрядов и 96 кГц);

  • Монтаж сигнала (вырезка, вставка, удаление и размножение фрагментов);

  • Различные способы выделения рабочего участка (selection) при монтаже с выравниванием (snap) по точкам пересечения нуля (zero crossing), по времени (time), по ритмическим долям (beats);

  • Пометка точек и фрагментов фонограммы с ведением списка таких пометок, из которого можно быстро перейти к помеченному участку, а также поддержка списка участков проигрывания (play list), с помощью которого можно заменить линейное проигрывание на «рваное»;

  • Основные операции обработки: усиление/ослабление, нормализация (такое масшабирование сигнала, чтобы его амплитуда точно вписалась в заданный диапазон), плавное увеличение/снижение уровня громкости (fade), изменение стереобаланса (pan), сжатие/растяжение динамического диапазона (compress/expand), пороговое пропускание (gate), наложение огибающей (envelope);

  • Основные виды эффект–обработки: phaser, flanger, reverb, delay, echo, overdrive, distortion, fuzz и т.п.;

  • Специальные операции: частотное фильтрование (filter/EQ), изменение высоты (pitch) сигнала или длительности (stretch) участка фонограммы, ослабление шумов (noise, hiss) и щелчков (clicks, pops), формирование музыкальных звуков из участков фонограммы, спектральный анализ всей фонограммы или ее участка;

  • Преобразование формата сигналов – частоты дискретизации, разрядности отсчета и количества каналов, смешивание стереоканалов в один;

  • Генерация сигналов различной формы и характеристик – как стационарных, так и с изменяющимися во времени параметрами, а также шумов с различным распределением;

  • Доступ к зарегистрированным в системе внешним модулям (plugins) обработки звука в стандарте DirectX/ActiveMovie, которым передается для обработки выделенный участок фонограммы;

  • Синхронизация записи/воспроизведения по MIDI – запуск записи или воспроизведения по внешнему событию, посылка синхронизирующих сообщений другим устройствам (ведущее устройство, master sync), синхронизация по приходящим от других устройств сообщениям (ведомое устройство, slave sync).

Sound Forge

Разработчик – Sonic Foundry

Многооконный редактор с поддержкой OLE, видеороликов в формате AVI и дополнительного монитора для их отображения в процессе работы.

При работе с файлами в 16–разрядном формате PCM (WAV) есть возможность открыть файл в режиме непосредственного доступа (Direct mode), без промежуточного копирования. Это заметно ускоряет работу, однако лишает возможности сохранить прежнюю версию файла при аварийном завершении.

Максимально достижимое увеличение – одна точка экрана на один отсчет оцифровки, чего в ряде случаев явно недостаточно для хорошего рассмотрения формы волны.

Автоматическое выравнивание при выделении – по точкам пересечения нуля и временным меткам.

При монтаже удобно пользоваться функциями Preview Cur/Cursor (прослушивание, каким будет результат вырезки, до выполнения самой вырезки) и Pre–roll to Cursor (прослушивание небольшого участка перед курсором).

Поддерживается список помеченных участков (regions) и выборочного проигрывания.

В режиме записи возможно создание «пульта дистанционного управления» – Remote Control. При этом основное окно редактора заменяется на небольшое окно «пульта», находящееся поверх других окон. Эта функция удобна при записи сигнала, формируемого другой программой, либо устройством, управление которым производится из другой программы.

В режиме записи возможен также прямой сброс данных на диск, минуя системный кэш с обратной записью. Это позволяет избавиться от долгих пауз, когда Windows сбрасывает кэш на диск, останавливая при этом все программы, однако работа диска в таком режиме становится весьма напряженной за счет непрерывного позиционирования. Надо сказать, что и при работе через кэш Sound Forge использует диск гораздо более агрессивно, чем большинство других редакторов.

Редактор может работать с внешними семплерами (Akai, E–mu, Kurzweil, Peavey), поддерживающими стандарты MIDI SDS и/или SCSI SMDI. Поддерживается также подготовка семплов для ACID – другой программы Sonic Foundry, предназначенной для создания музыки из готовых фрагментов.

Генератор сигналов выдает простые периодические сигналы и серии DTMF, а также имеет функцию FM Synthesis – частотно–модуляционный операторный синтез, популярный в электронных синтазаторах начала 80–х.

Поддерживаются собственные подключаемые модули. При помощи модуля Batch Converter можно создать последовательность операций обработки, которая затем может быть автоматически применена к одному или нескольким файлам. CD Architect предназначен для формирования и записи звуковых компакт–дисков. Spectrum Analysis служит для спектрального анализа фонограммы, Noise Reduction – для ослабления помех и шумов, Q–Sound – для придания звуку эффекта объемности.

Синхронизация по MIDI возможна в обоих режимах – ведущем и ведомом.

Имеется любительская локализация SF 4.5 на русском языке (переведены тексты меню и сообщений). Качество перевода среднее.

WaveLab

Разработчик – Steinberg

Один из наиболее мощных и удобных современных редакторов. Поддерживает форматы до 24 разрядов и 96 кГц.

Предоставляет все необходимые монтажные операции, нормализацию, преобразования динамики, коррекцию высоты/времени звучания. Операции сложной обработки немногочисленны: трехполосный эквалайзер, гармонайзер на 16 голосов (создает дополнительные гармоники основного голоса), качественный Chorus.

Основное внимание при обработке уделено поддержке модулей реального времени – собственных, DirectX и VST (от Cubase VST). Для управления модулями сделана специальная панель эффектов (Master Section), в которой можно выбрать до шести модулей одновременно. Для модулей WaveLab/VST изображаются панели управления, стилизованные под вид аппаратных стоечных блоков. Панели модулей, а также панели инструментов WaveLab (toolbars) могут находиться в любом месте экрана, а не только в окне редактора.

Имеет функции сравнения двух файлов, генерации тестового сигнала с огибающей, построения трехмерной спектрограммы с показом ее с различных точек зрения.

Функция Batch Processor позволяет сформировать алгоритм пакетной обработки набора файлов.

Поддерживает обмен данными с аппаратными семплерами AKAI, Ensoniq, E–mu, Kurzweil, Roland в стандартах SDS/SMDI. Может считывать звуковые дорожки с компакт–дисков. Содержит встроенный CD–рекордер с возможностью задания длительности пауз между дорожками.

Технология распознавания лиц

Надежность работы системы, высокие процент распознавания, точность и скорость идентификации обеспечиваются использованием специально разработанными алгоритмами. Преимущества технологии ISS позволяют успешно использовать систему "Face–Инспектор" на различных объектах: железнодорожных и автовокзалах, в аэропортах, на станциях метрополитена, в местах проведения массовых мероприятий, промышленных и стратегически важных объектах для решения широкого спектра задач обеспечения безопасности, контроля и ограничения доступа, регистрации и идентификации людей.

I этап. Поиск лица в видеопотоке

Поиск лиц в видеопотоке для их дальнейшего распознавания производится путем выделения симметрий в каждом видеокадре. Для этого применяется определенный набор симметричных сверток в заданном диапазоне масштабов изображения, после чего видеоизображение обрабатывается нейросетью.

Этот алгоритм обеспечивает такие преимущества данной технологии как устойчивость к шуму и неравномерной засветке лица.

II этап. Трекинг (отслеживание) лица между кадрами видеопотока

Лицо человека, единожды попав в поле зрения видеокамеры, с использованием алгоритма предсказания вектора движения и корреляционных алгоритмов будет автоматически отслеживаться от кадра к кадру. Все изображения будут сохраняться во временном буфере. В результате будет выбран кадр с оптимальным ракурсом лица и качеством изображения.
III этап. Выделение основных признаков лица

На этом этапе с использованием алгоритма анализа контуров производится выделение на видеоизображении лица его основных признаков: глаз, носа, рта и т.д.

Преимуществом этого метода является надежная работа при нефронтальном позиционировании лица.

IV этап. Нормализация изображения лица

После выделения основных признаков лица, его изображение приводится к стандартному виду: для надежного распознавания изображение лица должно иметь определенные размеры, необходимо выдержать расстояние между глазами, положение лица относительно центра. Для этого изображение масштабируется, разворачивается, в некоторых случаях также определяется положение лица (фас, положение в три четверти или точные 3D координаты), автоматически нормализуется яркость и контрастность.
V этап. Преобразование индивидуальных признаков лица

Непосредственное сравнение полученного изображения лица с изображениями из базы данных – ресурсоемко и неэффективно. Решение этой проблемы преобразование его характерных признаков в форму, максимально подходящую для быстрого сравнения – в вектор малой размерности.

VI этап. Сравнение полученного векторного представления с базой данных

Полученное векторное представление сравнивается с изображениями из базы данных, хранящимися в таком же формате. В итоге сравнения "один к многим" выбираются наиболее близкие по характеристикам вектора: результатом заключительного этапа является идентификация лица, попавшего в поле зрения видеокамеры с изображениями из базы данных.

Раздел 5. Автоматизированные информационные системы в профессиональной деятельности

1   ...   19   20   21   22   23   24   25   26   ...   29

Похожие:

В юридической деятельности iconСтатьей 20 Закона определены категории граждан, имеющих право на...
Порядок оказания бесплатной юридической помощи в Управлении Федерального казначейства

В юридической деятельности iconОказание бесплатной юридической помощи в Управлении Федерального...
Российской Федерации, организационно-правовые основы формирования государственной и негосударственной систем бесплатной юридической...

В юридической деятельности iconКто имеет право на получение бесплатной юридической помощи?
Согласно ст. 20 Федерального закона от 21. 11. 2011 n 324-фз "О бесплатной юридической помощи в Российской Федерации" и ст. 4 Закона...

В юридической деятельности iconМ. И. Еникеев юридическая психология. 4
I. Предмет, методы и структура юридической психологии. Краткий очерк исторического развития юридической психологии 4

В юридической деятельности iconАдвокатура и адвокатская деятельность
Оказание юридической помощи гражданам РФ бесплатно. Гарантии предоставления юридической помощи малоимущим. Эксперимент по созданию...

В юридической деятельности iconАдвокатура и адвокатская деятельность
Оказание юридической помощи гражданам РФ бесплатно. Гарантии предоставления юридической помощи малоимущим. Эксперимент по созданию...

В юридической деятельности iconОтчет по практике Название дисциплины
Цель учебной практики – обучение практическим навыкам организационно управленческой деятельности в сфере юридической практики, закрепление,...

В юридической деятельности iconМетодические рекомендации для адвокатов апбо, участвующих в государственной...
Федеральным законом от 21. 11. 2011 №324-фз «Об оказании бесплатной юридической помощи в Российской Федерации», Законом Белгородской...

В юридической деятельности iconМетодические рекомендации по оказанию бесплатной юридической помощи Правовые основания
Статья 18 Закона РФ «О бесплатной юридической помощи в рф» №324-фз от 21 ноября 2011 г

В юридической деятельности iconМетодические рекомендации по оказанию бесплатной юридической помощи Правовые основания
Статья 18 Закона РФ «О бесплатной юридической помощи в рф» №324-фз от 21 ноября 2011 г

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск