Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология»


НазваниеУчебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология»
страница6/8
ТипУчебно-методический комплекс
1   2   3   4   5   6   7   8
Тема3. Устройство компьютера

Цель и задачи:

Изучение устройства компьютера. Рассмотрение основных блоков и элементов компьютера.

Учебные вопросы:

1. Развитие и поколения вычислительной техники.

2. Принципы фон Неймана и архитектура компьютера.

3. Основные блоки компьютера.

4. Основные элементы компьютера.

5. Периферийные устройства.

Учебная информация:

1. Развитие и поколения вычислительной техники.

Непосредственными предшественниками ЭВМ были релейные вычислительные машины. Электромеханическое реле – это двухпозиционный переключатель, который имеет два состояния: включено и выключено. Это свойство позволяет использовать реле для кодирования информации в двоичном виде.

В процессе работы релейной машины происходят переключения тысяч реле из одного состояния в другое. Релейная машина «Марк-2», созданная в 1947 г. содержала около 13000 реле. Одной из наиболее совершенных релейных машин была машина советского конструктора Н.И. Бессонова – РВМ-1. Она была построена в1956 году и проработала почти 10 лет, конкурируя с существовавшими уже в то время ЭВМ. Реле сильно ограничивало скорость работы таких машин. Скорость РВМ-1 составляла 50 сложений или 20 умножений в секунду.

Первая половина ХХ века ознаменовалась бурным развитием радиоэлектроники. Основным элементом радиоэлектроники являлись электронно-вакуумные лампы, которые стали технической основой первых ЭВМ.

Первая ЭВМ – универсальная машина на электронных лампах – была построена в 1945 году в США. Эта машина называлась ENIAC (электронный цифровой интегратор и вычислитель). Скорость счёта этой машины превосходила скорость релейных машин того времени в тысячу раз. В машине ENIAC было около 18000 электронных ламп, которые при работе сильно нагревались, поэтому требовалось специальное охлаждение. Машина весила около 30 тонн и потребляла мощность почти 150 кВт.

ENIAC программировался штекерно-коммунитационным способом. Программа набиралась при помощи штекеров, вручную. На коммутационной доске соединялись проводниками отдельные блоки машины.

В 1949 году была построена первая ЭВМ с архитектурой фон Неймана – английская машина EDSAC.

В 1950 году появилась американская ЭВМ EDVAC. Эти машины существовали в единственных экземплярах. Серийное производство ЭВМ началось в развитых странах в 50-х годах ХХ века.

В нашей стране первая ЭВМ была создана в 1951 году. Называлась она МЭСМ – малая электронная счётная машина. Конструктором МЭСМ был Сергей Алексеевич Лебедев. Институт электротехники АН УССР возглавляемый С.А. Лебедевым находился в Киеве.

Под руководством С.А. Лебедева в 50-х годах в СССР были построены серийные ламповые ЭВМ БЭСМ-1 (быстродействующая электронная счётная машина), БЭСМ-2, М-20. В то время эти машины были одними из лучших в мире.

В 60-х годах ХХ века С.А. Лебедев руководил разработкой полупроводниковых ЭВМ БЭСМ-3М, БЭСМ-4, М-220, М-222. Выдающимся достижением того периода была машина БЭСМ-6. Это первая отечественная и одна из первых в мире ЭВМ с быстродействием 1 миллион операций в секунду.

Электронно-вычислительную технику принято делить на поколения. Смены поколений чаще всего были связаны со сменой элементной базы. Это всегда приводило к росту быстродействия и объёма памяти.

I поколение (1940 – 1955 гг.): Это эпоха становления вычислительной техники. Большинство машин первого поколения были экспериментальными устройствами. Элементная база машин первого поколения – электронно-вакуумные лампы.

Эти ЭВМ требовали большой площади помещения. Работоспособность машин поддерживал штат опытных инженеров, способных быстро находить неисправность и устранять её. Системное программное обеспечение отсутствовало. Основная специализация – решение математических задач.

II поколение (1955-1965 гг.): Элементной базой стали полупроводниковые приборы – транзисторы и диоды. Сократились размеры машин, потребление электроэнергии, что позволило открыть серийное производство этих ЭВМ, в состав которых входили печатающие устройства, магнитные накопители для хранения информации. Вместе с машинами II поколения появились языки программирования: Фортран, Алгол, Кобол, Бэйсик.

ЭВМ II поколения использовались не только для решения задач вычислительной математики, но и для решения задач обработки данных, например в бухгалтерском учёте, для учёта товаров на складе, организации различных каталогов.

К машинам этого поколения относятся: «РАЗДАН-2», «IВМ-7090», «Минск-22», «Урал-14», «БЭСМ-3», «М-220» и др.

Применение полупроводников в электронных схемах ЭВМ II поколения привели к увеличению производительности до 30 тыс. операций в секунду, и оперативной памяти до 32 Кб.

В программном обеспечении компьютеров второго поколения впервые появилось то, что сегодня называется операционной системой.

III поколение (1965 – 1980 гг.): Основу элементной базы машин III поколения составляли интегральные схемы. Интегральные схемы – это обычные электронные схемы, состоящие из транзисторов, конденсаторов и сопротивлений, изготовленные на многослойной кристаллической плёнке. На 1 мм2 такой плёнки располагаются электронные схемы, содержащие тысячи и даже сотни миллионов элементов.

Соответственно резко уменьшились габариты ЭВМ, и в то же время значительно выросло их быстродействие. В составе ЭВМ появились удобные для пользователей устройства вывода информации – дисплеи.

У нас в стране серию машин III поколения составляло семейство ЕС, за рубежом (США, 1965 г.) – IBM/360.

Производительность этих машин составляла 500 тыс. – 2 млн. операций в секунду, объём оперативной памяти достигал 8 – 192 Мб.

Для этого поколения характерно то, что в 1962 г. зародилась первая глобальная компьютерная сеть – прообраз того, что сейчас называется Интернетом. В 1969 г. появились операционная система Unix и язык программирования С («Си»), оказавшие огромное влияние на программный мир.

В 1971 году фирма Intel создала микропроцессор. Соединение микропроцессора с устройствами ввода/вывода, внешней памяти, позволило получить новый тип компьютера: микроЭВМ.

В 1974 г. фирма MITS начало производство компьютера Altair 8800, который, как считается, положил начало персональным компьютерам. Одна из причин успеха этого компьютера заключалась в простоте архитектуры по отношению к «большим ЭВМ».

IV поколение (1980 г. – по настоящее время): На смену ЭВМ III поколения пришли многопроцессорные машины. Элементной базой машин IV стали БИС (большие интегральные схемы), в которых на одном кристалле кремния размещаются сотни тысяч логических элементов.

С 1980 года передовым производителем компьютеров становится фирма IBM. Её конструкторам удалось создать такую архитектуру, которая стала фактически международным стандартом на персональные компьютеры (ПК). Машины этой серии получили название IBM PC (Personal Computer).

В конце 80-х – начале 90-х годов ХХ века большую популярность приобрели машины фирмы Apple Corporation марки Macintosh.

V поколение: ЭВМ пятого поколения – это машины будущего. В машинах пятого поколения планируется реализовать искусственный интеллект: голосовое общение пользователя с компьютером, машинное «зрение», машинное «осязание». Для увеличения памяти и быстродействия будут использоваться достижения оптоэлектроники, биопроцессоры и нанотехнологии для создания новых средств вычислительной техники с заданной атомной структурой.

2. Принципы фон Неймана и архитектура компьютера.

Основные идеи (принципы), по которым долгие годы развивалась вычислительная техника, были разработаны в 1945 году крупнейшим американским математиком Джоном фон Нейманом:

1. Принцип двоичного кодирования. Согласно этому принципу, вся информация, поступающая в ЭВМ, кодируется с помощью двоичных сигналов.

2. Принцип программного управления. Из него следует, что программа состоит из набора команд, которые выполняются процессором автоматически друг за другом в определенной последовательности.

3. Принцип однородности памяти. Программы и данные хранятся в одной и той же памяти. Поэтому ЭВМ не различает, что хранится в данной ячейке памяти – число, текст или команда. Над командами можно выполнять такие же действия, как и над данными.

4. Принцип адресности. Структурно основная память состоит из пронумерованных ячеек и процессору в любой момент времени доступна любая ячейка. Отсюда следует возможность давать имена областям памяти, так, чтобы к запомненным в них значениям можно было бы впоследствии обращаться или менять их в процессе выполнения программы с использованием присвоенных имен.

Согласно тезису Чёрча–Тьюринга, все известные типы вычислительных машин качественно эквивалентны в своих возможностях: любое действие, выполнимое на одной вычислительной машине, также выполнимо и на другой. Это один из основных фундаментальных принципов информатики, который заложен в основу архитектуры современных компьютеров.

Архитектура компьютера разработана Тьюрингом и фон Нейманом. Однако в рамках современной информатики учёные изучают также и другие типы машин такие, как параллельные и квантовые компьютеры, а также сугубо абстрактные математические модели, например, РАМ-машина, которая имеет бесконечное число регистров.

Архитектура фон Неймана (см. рис. 3.1) основана на принципе совместного хранения программ и данных в памяти компьютера. Вычислительные машины, построенные на этом принципе, часто обозначают термином «Машина фон Неймана». В общем случае, когда говорят об архитектуре фон Неймана, подразумевают физическое отделение процессного модуля от устройств хранения программ и данных.
ПАМЯТЬ

(ОЗУ, ПЗУ)

ПРОЦЕССОР

ВНЕШНЯЯ ПАМЯТЬ

УСТРОЙСТВА

ВВОДА

УСТРОЙСТВА

ВЫВОДА
Рисунок 3.1 – Функциональная схема ЭВМ, предложенная фон Нейманом
В соответствии с принципами фон Неймана современные вычислительные машины состоят из:

  • процессора;

  • устройств ввода-вывода;

памяти для хранения данных и программ.

3. Основные блоки компьютера.

Компьютер состоит из следующих основных блоков:

  • системный блок;

  • монитор;

  • клавиатура.

Системный блок – основной блок компьютера, в котором находятся основные элементы компьютера, такие как:

  • материнская плата:

  • процессор;

  • оперативная память;

  • чипсет;

  • микросхема постоянного запоминающего устройства (ПЗУ);

  • энергозависимая память CMOS;

  • шинные интерфейсы;

  • слоты;

  • жесткий диск;

  • дисковод гибких дисков;

  • дисковод компакт-дисков;

  • видеокарта (видеоадаптер);

  • звуковая карта.

Монитор (дисплей) – устройство для визуального отображения информации.

Клавиатура – клавишное устройство управления персональным компьютером. Служит для ввода информации, а также команд управления. Стандартная клавиатура имеет 101 клавишу, функционально распределенных по трём группам: основную, управления курсором и цифровую.

По основным блокам компьютера имеется достаточное количество различных источников информации, некоторые из которых указаны в списке литературы настоящего пособия.

4. Основные элементы компьютера.

К основным элементам компьютера относятся:

  • материнская плата;

  • процессор;

  • оперативная память (ОЗУ);

  • постоянное запоминающее устройство (ПЗУ);

  • видеокарта;

  • звуковая карта.

Рассмотрим основные из них.

Материнская плата – основная плата персонального компьютера, определяющая его возможности с помощью подключения различных элементов. Имеет следующие шинные интерфейсы, через которые осуществляется подключение устройств: ISA, EISA, VLB, PCI, FSB, AGP, PCMCIA, USB.

Процессор – основная микросхема компьютера, выполняющая арифметико-логические операции и вычисления по программному коду, находящемуся в памяти и руководит работой всех устройств компьютера. Конструктивно состоит из ячеек. Внутренние ячейки процессора называют регистрами.

Основные параметры процессора:

  • рабочее напряжение;

  • разрядность;

  • рабочая тактовая частота;

  • коэффициент внутреннего умножения тактовой частоты;

  • размер кэш-памяти.

С другими устройствами компьютера процессор связан несколькими группами проводников, которые называются шинами. Основных шин три: шина данных, адресная шина и командная шина.

Процессор – это «мозг» компьютера.

Оперативная память – это массив кристаллических ячеек, способных хранить данные. Основные характеристики модулей оперативной памяти: объем памяти и время доступа. При выключении питания все данные, находящиеся в оперативной памяти, стираются.

Чипсет (микропроцессорный комплект) – набор микросхем, управляющих работой внутренних устройств компьютера и определяющих основные функциональные возможности материнской платы.

Постоянное запоминающее устройство (ПЗУ) – устройство для длительного хранения информации. Микросхема ПЗУ способна длительное время хранить информацию, даже когда компьютер выключен. Комплект программ, находящихся в ПЗУ, образует базовую систему ввода-вывода (BIOS). Основное назначение программ этого пакета – проверить состав и работоспособность компьютерной системы и обеспечить взаимодействие с клавиатурой, монитором, жестким диском и дисководом гибких дисков.

Энергозависимая память (CMOS). В микросхеме CMOS хранятся данные о гибких дисках, о процессоре, о некоторых других устройствах материнской платы. От оперативной памяти она отличается тем, что ее содержимое не стирается во время выключения компьютера, а от ПЗУ – тем, что данные в нее можно заносить и изменять самостоятельно.

Жёсткий диск – устройство для долговременного хранения больших объемов информации и программ.

Дисковод CD – устройство для считывания числовых данных с помощью лазерного луча, отражающегося от поверхности CD-диска. Основной параметр CD-дисководов – скорость чтения данных.

Видеокарта (видеоадаптер) – устройство, преобразующее изображение, находящееся в памяти компьютера, в видеосигнал для монитора. Физически видеоадаптер выполнен в виде отдельной платы, которая вставляется в один из слотов материнской платы.

Звуковая картаустройство для вывода звука. Подключается к одному из слотов материнской платы в виде платы или встраивается непосредственно в материнскую плату. Выполняет вычислительные операции, связанные с обработкой звука, речи, музыки.

5. Периферийные устройства.

К компьютеру могут подключаться различные дополнительные устройства ввода и вывода информации. Эти устройства называются периферийными. К таким устройствам относятся: мышь, принтер, сканер, модем, факс, средства мультимедиа.

Этот список можно перечислять и дальше, например, к компьютеру можно подключить сотовый телефон, видеокамеру и т. д. С помощью подключения специальных периферийных устройств обычный персональный компьютер можно превратить в тренажёрный комплекс, метеорологическую лабораторию, средство управления бытовыми приборами.

Выводы по теме:

1. Электронно-вычислительная техника делится на поколения. Смены поколений чаще всего связаны со сменой элементной базы. Это всегда приводит к росту быстродействия и объёма памяти.

2. Согласно тезису Чёрча–Тьюринга, все известные типы вычислительных машин качественно эквивалентны в своих возможностях: любое действие, выполнимое на одной вычислительной машине, также выполнимо и на другой. Это один из основных фундаментальных принципов информатики, который заложен в основу архитектуры современных компьютеров.

3. Основные идеи (принципы), по которым долгие годы развивалась вычислительная техника, были разработаны в 1945 году крупнейшим американским математиком Джоном фон Нейманом:

4. Архитектура компьютера разработана Тьюрингом и фон Нейманом. Однако в рамках современной информатики учёные изучают также и другие типы машин такие, как параллельные и квантовые компьютеры, а также сугубо абстрактные математические модели, например, РАМ-машина, которая имеет бесконечное число регистров.

5. Компьютер состоит из блоков и элементов. К компьютеру могут подключаться различные дополнительные устройства ввода и вывода информации, которые называются периферийными.

Вопросы для самопроверки:

1. Какими были первые вычислительные машины?

2. Как можно охарактеризовать поколения вычислительной техники?

3. Какие принципы развития вычислительной техники разработал Джон фон Нейман?

4. В чём заключается один из основных принципов информатики?

5. Что такое архитектура компьютера?

6. Что относится к основным блокам компьютера?

7. Из каких основных элементов состоит компьютер?

8. Какие периферийные устройства подключаются к компьютеру?

Список литературы по теме:

1. Информатика для юристов и экономистов / Симонович С. В. и др.  СПб: Питер, 2001.  688 с.

2. Информатика: учебник / Н.В. Макарова [и др.]; под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2009. – 765 с.

3. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики.  2-е изд., перераб. и доп..  М.: Наука, 1968.

4. Фадюшин С. Г. Информатика для начинающих.  Владивосток: Дальрыбвтуз, 1998.  60 с.

5. Фадюшин С. Г. Информатика для менеджеров (электронный ресурс: http://library.fentu.ru/book/iu/386/index.html).

6. Фадюшин С. Г. Информатика и информационные технологии: Учеб. пособие. – Владивосток: ДВФУ, 2012. – 174 с.




Тема 4. Информация

Цель и задачи:

Изучение основных понятий теории информации.

Учебные вопросы:

1. Основные понятия.

2. Основные единицы измерения информации.

3. Расчёт количества информации.

4. Кодирование информации.

5. Помехозащитное кодирование.

Учебная информация:

1. Основные понятия.

Все формулировки информации основаны на том, что это динамический объект, не существующий в природе сам по себе, а образующийся в ходе взаимодействия материальных объектов, описываемых количественными данными. Он существует ровно столько, сколько длится это взаимодействие, а все остальное время пребывает в виде количественных данных. Приведём некоторые из формулировок этого понятия.

Информация – это нематериальная сущность, при помощи которой можно описывать все явления материального мира.

Информация – отражение предметного мира, выражаемого в виде сигналов и знаков.

Информация – это некоторые сведения, совокупность каких-либо данных, знаний.

Согласно Федеральному закону РФ «Об информации, информационных технологиях и о защите информации»:

«информация – сведения (сообщения, данные) независимо от формы их представления;

информационные технологии – процессы, методы поиска, сбора, хранения, обработки, предоставления, распространения информации и способы осуществления таких процессов и методов;

Защита информации представляет собой принятие правовых, организационных и технических мер, направленных на:

1) обеспечение защиты информации от неправомерного доступа, уничтожения, модифицирования, блокирования, копирования, предоставления, распространения, а также от иных неправомерных действий в отношении такой информации;

2) соблюдение конфиденциальности информации ограниченного доступа,

3) реализацию права на доступ к информации».

В некоторых законодательных актах, например, в статьях УК РФ по преступлениям в сфере компьютерной информации, приводится определение «компьютерная информация». Понятие этого определения дается в Соглашении о сотрудничестве государств – участников Содружества Независимых Государств в борьбе с преступлениями в сфере компьютерной информации (от 1 июня 2001 г.). Согласно пункту б) статьи 1 названного Соглашения компьютерная информация – это информация, находящаяся в памяти компьютера, на машинных или иных носителях в форме, доступной восприятию ЭВМ, или передающаяся по каналам связи.

2. Основные единицы измерения информации.

В информатике и вычислительной технике принята система представления данных двоичным кодом. Наименьшей единицей такого представления является бит.

Бит – это бинарная единица, которая может принимать два значения: 0 или 1. Бит содержит в себе такое количество информации, которое уменьшает неопределённость знания в 2 раза.

Существуют другие, более крупные единицы измерения информации.

Байт – это группа взаимосвязанных битов. 1 байт = 8 бит.

1 Килобайт (Кб)=210 байт = 1024 байт.

1 Мегабайт (Мб) = 1024 Кб.

1 Гигабайт (Гб) =1024 Мб.

1 Терабайт (Тб) = 1024 Гб.

Кроме перечисленных есть другие, более крупные единицы измерения информации.

Скорость передачи информации измеряется в битах в секунду и бодах. Бит/сек – это скорость передачи непосредственно самой информации, а бод – скорость передачи сигнала (характеризует быстродействие устройства, передающего информацию, например, модема).

3. Расчёт количества информации.

К настоящему времени сформировалось несколько подходов к расчёту количества информации: алфавитный, содержательный и вероятностный. При алфавитном подходе под количеством информации подразумевается размер данных, сведений и знаний, выраженных в виде сигналов и знаков, представляющих собой алфавит какого-либо языка передачи информации. Следовательно, при таком подходе для определения количества информации необходимо подсчитать количество символов, содержащихся, например, в текстовом сообщении (включая цифры, пробелы, знаки препинания и пунктуации). Один символ текстового сообщения будет соответствовать определённому количеству байт, принятому в данной кодировке. В русскоязычном тексте один символ, как правило, кодируется одним байтом. Поэтому количество информации в текстовом сообщении будет соответствовать количеству подсчитанных символов.

Пример. Считая, что один символ кодируется одним байтом, определить, чему равен информационный объём в битах и в килобайтах следующего предложения:

Информация – сведения (сообщения, данные) независимо от формы их представления.

Решение. После подсчёта в данном предложении оказалось 79 символов, т.е. информационный объём предложения равен 79 байтам. Для перевода байтов в биты, необходимо 79 байтов умножить на 8 и в результате будет получено 632 бита. Для того чтобы перевести байты в килобайты, 79 байтов нужно разделить на 1024, в результате чего будет получено 0,0771484375 килобайта.

В теории информации понятие количества информации связано со степенью новизны сведений о каком-то событии, которая, в свою очередь, является следствием неопределенности исхода этого события.

Однако если исход какого-либо события состоит из N равновероятных вариантов, то количество информации, которое содержится в нём, можно вычислить по формуле, предложенной в 1928 г. американским инженером Р. Хартли:



где I – количество информации; N – количество равновероятных вариантов исхода какого-либо события.

Иными словами при равновероятных вариантах исхода какого-либо события количество информации равно степени, в которую необходимо возвести 2, чтобы получить число равновероятных вариантов, т.е. 2I = N.

При равновероятных вариантах исхода какого-либо события для того чтобы определить количество информации, содержащейся в этом событии, достаточно задать минимальное количество элементарных вопросов, для того чтобы выведать эту информацию. Ответ, на задаваемый вопрос, «да», или «нет» будет являться 1 битом информации.

На формуле Хартли основан содержательный подход к расчёту количества информации.

Примеры:

1. Сколько информации содержит в себе сообщение о выпадении «орла» или «решки» после подбрасывания монеты?

Ответ: 1 бит.

2. В игре участвовал 1 игрок. Сколько информации несёт в себе сообщение о победителе?

Ответ: 0 бит.

3. В игре участвовало 4 игрока. Сколько информации несёт в себе сообщение о победителе?

Ответ: 2 бита.

Так как каждый из вариантов (событий) имеет равновероятный исход p = 1/N, то отсюда N = 1/p. Здесь p – вероятность события. Тогда формулу Хартли можно записать так:



При расчётах по формуле Хартли не учитывается возможность того, что варианты исхода какого-либо события могут иметь разную вероятность. Даже при подбрасывании монеты существует вероятность, хотя и незначительная, что монета при падении может встать на ребро.

В 1948 г. американский инженер и математик К. Шеннон предложил формулу для вычисления количества информации для событий с различными вероятностями [33]. Вероятностный подход к расчёту количества информации основан на понятии энтропии в смысле К. Шеннона.

Энтропия (мера неопределённости) дискретной случайной величины – это минимум среднего количества бит, которое нужно передать по каналу связи о текущем состоянии данной дискретной случайной величины. Рассчитывается по формуле:



где pi – вероятность события.

При вероятностном подходе, предложенном К. Шенноном, для расчёта количества информации используются следующие формулы.

Для одной дискретной случайной величины X, заданной законом распределения pi:



Для дискретных случайных величин X и Y, заданных законами распределения pi, qj и их совместным распределением pij, количество информации содержащейся в X относительно Y равно:



Данная формула учитывает то обстоятельство, что, например, в каком-либо текстовом сообщении некоторые символы или слова могут иметь разную вероятность их появления, зависящую от предыдущего символа или слова. Например, в некоторых предложениях после слова «успевающий», вероятнее всего, последует слово «студент».

Пример: Найти количество информации, содержащееся в следующем текстовом сообщении, состоящем из 551 буквы.

Информация  это те сведения, которые помогают ориентироваться в окружающем нас мире. В настоящее время информация нужна как воздух, вода и пища. Но если в предыдущие века человек имел дело только с «ручейками» информации, то теперь его окружают бездонные «моря» разнообразных сведений, способные поглотить необразованного специалиста в своих пучинах. Легко преодолеть ручей. Но чтобы переплыть море, нужны корабли и навигационные карты, нужна наука о кораблях и кораблевождении. «Информатика»  это наука о навигации в «Тихом океане» информации, а электронные вычислительные машины (компьютеры)  океанские лайнеры, покоряющие информационные просторы.

Решение:

1. Находим закон распределения букв, содержащихся в заданном текстовом сообщении (см. табл. 1).

Таблица 1 – Распределение букв, содержащихся в заданном текстовом сообщении

Буква

а

б

в

г

д

е

ж

з

и

й

к

Количество данной буквы в тексте

44

8

19

7

10

51

6

5

46

4

23

P

0,08

0,01

0,03

0,01

0,02

0,09

0,01

0,01

0,08

0,01

0,04

Буква

л

м

н

о

п

р

с

т

у

ф




Количество данной буквы в тексте

17

17

44

62

14

34

15

25

12

6




P

0,03

0,03

0,08

0,11

0,03

0,06

0,03

0,05

0,02

0,01




Буква

х

ц

ч

ш

щ

ы

ь

э

ю

я




Количество данной буквы в тексте

6

8

6

1

5

18

8

3

5

9




P

0,01

0,01

0,01

0,00

0,01

0,03

0,01

0,01

0,01

0,02




Примечание: p = количество данной буквы в тексте / общее количество букв.

2. Рассчитываем количество информации:



Ответ: В заданном текстовом сообщении содержится информации 4, 3 бита/символ.

При расчётах количества информации по формулам, предложенным К. Шенноном, ответ получается в битах на символ, что удобно при исследовании и сравнении различных текстовых сообщений. Для того, чтобы получить ответ в битах, необходимо полученный результат умножить на количество символов.

4. Кодирование информации.

Информация передается с помощью языков в виде непрерывных и дискретных сигналов. Основа любого языка – алфавит, т.е. конечный набор знаков (символов) любой природы, из которых конструируются сообщения на данном языке. Алфавит может быть латинский, русский, десятичных чисел, двоичный и т.д.

Кодирование – это представление символов одного алфавита символами другого. Простейшим алфавитом, достаточным для кодирования любого другого, является алфавит, состоящий из двух символов 0 и 1, т. е. двоичный алфавит.

При кодировании буквам алфавита ставится в соответствие числовой код, обычно в десятеричной или шестнадцатеричной системах счисления. Буквы и соответствующие им коды хранятся в специальных таблицах, которые называются таблицами кодировок. Одной из распространённых таблиц кодировок является ASCII (American Standard Code for Information Interchange). В этой таблице русская буква А, например, кодируется числом 128 в десятичной системе счисления, а закодированное слово «информация» в двоичной системе счисления будет состоять из 80 бит: 10101000 10101101 11100100 10101110 11100000 10101100 10100000 11100110 10101000 111011111.

Для кодирования русских букв используются следующие таблицы кодировок:

  • KOI8-R – вариант кодировки КОИ-8 (KOI8) для описания русского алфавита (КОИ-8 – код обмена информацией, 8 битов. Это восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов);

  • Windows-1251  набор символов и кодировка, являющаяся стандартной 8-битной кодировкой для всех русских версий Microsoft Windows;

  • Unicode (Юникод или Уникод) – стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков, в которой для кодирования символов отводится от 1 до 6 бит на символ;

  • ISO 8859-5 – 8-битная кодовая страница из семейства кодовых страниц стандарта ISO-8859 для представления кириллицы. Устанавливается на некоторых иностранных системах для русского языка и др.

При сжатии и передаче информации по каналам без шума применяется эффективное кодирование, которое базируется на основной теореме К. Шеннона для каналов без шума. В этой теореме К. Шеннон доказал, что сообщения, составленные из букв некоторого алфавита, можно закодировать так, что среднее число двоичных символов на букву будет сколь угодно близко к энтропии источника этих сообщений, но не меньше этой величины.

Сущность эффективного кодирования заключается в том, что, учитывая статистические свойства какого-либо сообщения, можно минимизировать среднее число двоичных символов, требующихся для выражения одной буквы сообщения, что при отсутствии шума позволяет уменьшить время передачи или объем запоминающего устройства. Этот вид кодирования используется в архиваторах для сжатия информации. К числу эффективных кодов относятся коды: Шеннона-Фэно, Хаффмана и другие.

Пример. Построить эффективный код для сообщения в виде слова «информация».

Решение. Для построения кода воспользуемся методикой Шеннона-Фэно. По этой методике код строится следующим образом. Буквы алфавита сообщений выписываются в таблицу в порядке убывания вероятностей (см. табл. 2). Затем они разделяются на две группы так, чтобы суммы вероятностей в каждой из групп были по возможности одинаковы (см. табл. 3). Всем буквам верхней половины в качестве первого символа приписывается 1, а всем нижним – 0. Каждая из полученных групп разбивается на две подгруппы с одинаковыми суммарными вероятностями и т. д. Процесс повторяется до тех пор, пока в каждой подгруппе останется по одной букве.
Таблица 2 – Таблица статистического распределения букв

Буква

и

н

ф

о

Р

м

а

ц

я

p

2/10

1/10

1/10

1/10

1/10

1/10

1/10

1/10

1/10



Таблица 3 – Таблица кодирования

и

2/10

1

1







н

1/10

1

0

1




ф

1/10

1

0

0

1

о

1/10

1

0

0

0

р

1/10

0

1

1




м

1/10

0

1

0




а

1/10

0

0

1




ц

1/10

0

0

0

1

я

1/10

0

0

0

0


Ответ: и – 11; н – 101; ф – 1001; о – 1000; р – 011; м – 010; а – 001; ц – 0001; я – 0000.

Таким образом, в двоичном виде закодированное с помощью кода Шеннона-Фэно слово «информация» будет содержать 30 бит и выглядеть так: 111011001100001101000100010000 (30 бит).

5. Помехозащитное кодирование.

Помехоустойчивое кодирование базируется на основной теореме К. Шеннона для дискретного канала с шумом. Эта теорема заключается в следующем: при любой скорости передачи двоичных символов меньшей, чем пропускная способность канала, существует такой код, при котором вероятность ошибочного декодирования будет сколь угодно мала. Вероятность ошибки не может быть сделана произвольно малой, если скорость передачи больше пропускной способности канала.

При помехозащитном кодировании в код вводится избыточность, которая позволяет так выбрать передаваемые последовательности символов, чтобы они удовлетворяли дополнительным условиям, проверка которых на приемной стороне дает возможность обнаружить и исправить ошибки.

Помехозащитные коды используются как для исправления ошибок (корректирующие коды), так и для их обнаружения.

К числу помехозащитных кодов относятся: код Хэмминга, полиноминальные, циклические избыточные CRC-коды (Cyclical Redundancy Check) и другие

CRC-коды используются очень широко: модемами, телекоммуникационными программами, программами архивации и проверки целостности данных, в сотовых телефонах и многими другими программными и аппаратными компонентами вычислительных систем.

Выводы по теме:

1. Все формулировки информации основаны на том, что это динамический объект, не существующий в природе сам по себе, а образующийся в ходе взаимодействия материальных объектов, описываемых количественными данными. Он существует ровно столько, сколько длится это взаимодействие, а все остальное время пребывает в виде количественных данных.

2. К настоящему времени сложилось два подхода к понятию информация: алфавитный и содержательный.

3. В информатике и вычислительной технике принята система представления данных двоичным кодом. Наименьшей единицей такого представления является бит.

4. При алфавитном подходе к понятию информация под количеством информации, содержащемся в текстовом сообщении, подразумевается размер этого сообщения, выраженный в битах или других единицах измерения информации.

Дл определения количества информации необходимо подсчитать количество символов, содержащихся в текстовом сообщении (включая цифры, пробелы, знаки препинания и пунктуации). Один символ текстового сообщения будет соответствовать определённому количеству байт, принятому в данной кодировке. В русскоязычном тексте один символ, как правило, кодируется одним байтом. Поэтому количество информации в тексте будет соответствовать количеству подсчитанных символов.

5. Вероятностный подход к расчёту количества информации основан на понятии энтропии в смысле К. Шеннона. Энтропия дискретной случайной величины (мера неопределённости) – это минимум среднего количества бит, которое нужно передать по каналу связи о текущем состоянии данной дискретной случайной величины.

Вопросы для самопроверки:

1. Что такое информация?

2. Что такое информация, информационные технологии и защита информации согласно Федеральному закону РФ «Об информации, информационных технологиях и о защите информации»?

3. В чём заключается сущность алфавитного и содержательного подходов к расчёту количества информации?

4. Какие существуют основные единицы измерения информации?

5. На чём основан вероятностный подход к расчёту количества информации?

6. Что такое энтропия в смысле К. Шеннона?

7. Что такое кодирование информации?

8. Какие таблицы кодировок используются для кодирования русских букв?

9. В чём заключается сущность эффективного кодирования?

10. На чём базируется помехозащитное кодирование?

Список литературы по теме:

1. Информатика для юристов и экономистов / Симонович С. В. и др.  СПб: Питер, 2001.  688 с.

2. Информатика: учебник / Н.В. Макарова [и др.]; под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2009. – 765 с.

3. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики.  2-е изд., перераб. и доп..  М.: Наука, 1968.

4. Фадюшин С. Г. Информатика для менеджеров (электронный ресурс: http://library.fentu.ru/book/iu/386/index.html).

5. Фадюшин С. Г. Информатика и информационные технологии: Учеб. пособие. – Владивосток: ДВФУ, 2012. – 174 с.
1   2   3   4   5   6   7   8

Похожие:

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины составлен на основании требований...
Учебно-методический комплекс дисциплины составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины русский язык и культура речи...
Учебно-методический комплекс дисциплины составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconСамостоятельная работа 80 час. Всего часов аудиторной нагрузки 134...
Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины «Деловое общение»
Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс «Социологическое обеспечение кадровой службы»
Учебно-методический комплекс составлен на основании требований федерального государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины
Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины «русский язык и культура речи»
Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины
Учебно-методический комплекс составлен на основании требований федерального государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины «русский язык и культура речи»
Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального...

Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального образования второго поколения образовательной программы «Социология» iconУчебно-методический комплекс дисциплины «Русский язык и культура речи»
Учебно-методический комплекс составлен на основании требований государственного образовательного стандарта высшего профессионального...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск