Информатика, вычислительная техника и инженерное образование 2011, №1(3) эволюционное моделирование, генетические и бионические алгоритмы

Скачать 1.19 Mb.

Название	Информатика, вычислительная техника и инженерное образование 2011, №1(3) эволюционное моделирование, генетические и бионические алгоритмы
страница	5/8
Тип	Решение

filling-form.ru > Туризм > Решение

1 2 3 4 5 6 7 8

ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ НОВОГО ПОКОЛЕНИЯ И НЕЙРОКОМПЬЮТЕРЫ

УДК 004.021
П.Н. Филиппенко, А.А. Шашелов, С.В. Сеитова
МАТЕМАТИЧЕСКИЕ ПРОБЛЕМЫ ПАРАЛЛЕЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ АЛГОРИТМОВ

В статье рассмотрены математические проблемы больших вычислений. Приводится необходимость параллельного программирования и связанные с ним трудности. Показаны условия построения математически корректных быстрых параллельных алгоритмов. Рассмотрена информационная структура параллельных алгоритмов.

Степень параллелизма, параллельная форма, зернистость задачи, ошибки округления.
P.N. Filippenko, A.A. Shashelov, S.V. Seitova
MATHEMATICAL PROBLEMS OF PARALLEL CACLULATION ALGORITHMS
Mathematical problems of large calculations are discussed in the article. Necessity of parallel programming and related difficulties are given. Conditions for creating mathematically correct and robust parallel algorithms are shown. Informational structure of parallel algorithms is considered.

Degree of parallelism, parallel form, task granularity, rounding errors.
Введение

Возможность быстрого решения задач на вычислительной технике вынуждает пользователей изменять весь привычный стиль взаимодействия с компьютерами. Сложность задач решаемых пользователем заставляет пересмотреть концепции разработки программного обеспечения (ПО). Это ведет к изменению, как ПО, так и аппаратных решений. По сравнению, например, с персональными компьютерами и рабочими станциями меняется практически всё: применяются другие языки программирования, видоизменяется большинство алгоритмов, от пользователей требуется предоставление многочисленных нестандартных и трудно добываемых характеристик решаемых задач, интерфейс перестает быть дружественным и т.п. Важным является то обстоятельство, что неполнота учета новых условий работы может в значительной мере снизить эффективность использования новой, достаточно дорогой техники.

Для обычного пользователя инструментарий, т.е. техника и программное окружение, всегда является чем-то заданным. Если инструментарий и может быть изменен, то в ограниченных пределах. Остается подстраивать под его требования объекты, т.е. алгоритмы [1,2].

Математические проблемы параллельных вычислений

Общий характер трудностей, сопровождающих развитие параллельных вычислений, в целом выглядит таким же, каким он был и во времена последовательных. Только для параллельных вычислений все трудности проявляются в более острой форме. Во многом из-за большей сложности самой предметной области. Но, главным образом, вследствие того, что к началу активного внедрения вычислительных систем параллельной архитектуры в практику решения больших прикладных задач не был построен нужный теоретический фундамент и не был развит математический аппарат исследований [1,3].

За время развития последовательных вычислений пришло довольно чёткое понимание, что такое последовательный алгоритм. Вокруг данного понятия сформировался большой раздел математики, называемый теорией алгоритмов, изучающий общие свойства последовательных вычислений. Уточнённое понятие алгоритма в терминах идеализированных вычислительных машин привело к важному понятию машины Тьюринга. По существу, этот автомат стал теоретическим прообразом первых ЭВМ. Присоединение к машине Тьюринга памяти сделало её весьма полезным и даже приближенным к реальности инструментом исследований. Но в основе всего лежали последовательные действия. Не удивительно поэтому, что и ЭВМ в течение длительного периода также развивались по пути реализации именно последовательных действий [1,3].

Общая направленность последовательного выполнения операций сохранялась долго, но в разработке вычислительной техники незаметно назревали изменения, приведшие, к пересмотру представлений о вычислениях. Причиной возникновения изменений стал параллелизм, внедряемый в вычислительную технику для повышения производительности. В определённый момент параллелизма в компьютере стало столь много, что его присутствие уже нельзя было прикрывать техническими решениями. И тогда от пользователя стало необходимо получать дополнительную информацию о структуре используемых им алгоритмов. Эта информация нужна для того, чтобы эффективно использовать заложенный в компьютер параллелизм [2,5].

К началу массового внедрения вычислительных систем параллельной архитектуры многие математические вопросы параллельных процессов оказались в зачаточном состоянии. Не было никакой целостной теории параллельных алгоритмов, аналогичной теории алгоритмов для последовательных вычислений. Существовали лишь отдельные разрозненные результаты. Не было даже сколько-нибудь ясного представления, что же нужно понимать под параллельным алгоритмом. Отсутствовал какой-либо формальный математический аппарат, который можно было бы назвать параллельным аналогом машины Тьюринга [3].

Эти причины привели к тому, что в течение долгого времени параллельные вычисления не удавалось сформировать как самостоятельную математическую науку, и рассматривались они как совокупность каких-то полуэвристических приемов приспособления алгоритмов к требованиям новой техники.

Новые параллельные алгоритмы

Интерес к их построению на основе математически эквивалентных преобразований возник в 60-70-х годах прошлого столетия в связи с появлением первых вычислительных систем параллельной архитектуры [6-8].

Чтобы оценить время реализации алгоритма на параллельной системе, алгоритм представляют в виде последовательно выполняемых ансамблей операций. В каждом ансамбле все операции не должны быть связаны друг с другом. Если архитектура параллельной системы позволяет реализовывать одновременно все операции каждого ансамбля, то без учёта времени на передачи данных время выполнения алгоритма будет пропорционально числу ансамблей. Число ансамблей называют высотой алгоритма. Алгоритмы, в которых высота меньше общего числа операций называют параллельными, а их представление через последовательность ансамблей из независимых операций – параллельной формой [3].

Очевидно, что в зависимости от структуры связей между операциями один и тот же алгоритм может быть представлен различными способами в виде совокупности ансамблей. В частности, обычная последовательная реализация означает, что в каждом ансамбле содержится только одна операция. Для большинства алгоритмов даже таких представлений может существовать очень много. Ясно, что для каждой задачи особый интерес представляет нахождение алгоритмов минимальной высоты. Согласно теории последовательных алгоритмов представления одного и того же алгоритма различными ансамблями необходимо рассматривать как разные алгоритмы, так как изменяется, как минимум, порядок выполнения операций. Следовательно, некоторые характеристики этих разных алгоритмов окажутся заведомо различными, но какие-то наверняка сохранятся [1,6].

Чтобы задача построения быстрых параллельных алгоритмов стала математически корректной, необходимо сделать какие-то предположения относительно свойств параллельной вычислительной системы. Они очень просты: система имеет бесконечно много параллельно работающих процессоров; все они работают синхронно под общим управлением и выполняют любую операцию точно и за одно и то же время; система имеет бесконечно большую память; все обмены информацией между процессорами и памятью, а также между самими процессорами осуществляются мгновенно и без конфликтов. Концепция построения алгоритмов для подобных параллельных систем получила название концепции неограниченного параллелизма. Она идеализирована, но полученные в её рамках результаты интересны и поучительны [3,7].

Рассмотрим обычный процесс суммирования n чисел а₁… а_n, когда на каждом шаге к частичной сумме прибавляется очередное слагаемое. Обычный последовательный алгоритм:

S ← а₁, S←S+ а_i, i = 2,…,n

(1)

непригоден для параллельных вычислений. Однако задача может быть решена другим методом. На рис. 1 показано, как можно осуществить суммирование восьми чисел в три этапа при помощи алгоритма сдваивания [8].

Задача суммирования разделена на меньшие подзадачи, которые могут решаться независимо. Для n = 2^q чисел алгоритм сдваивания состоит из q = log₂ⁿ этапов; на первом этапе выполняются n/2 сложений, на втором – n/4, и т.д., пока на последнем этапе не будет выполнено единственное сложение. Общее число операций сложения равно n-1: такое же, как в последовательном алгоритме [8].

Рис. 1. Схема алгоритма сдваивания[8]
Очевидно, что на первом этапе степень параллелизма (число операций, которые на данном этапе можно выполнять параллельно) равна n/2, на втором – n/4, и так далее. Подобный алгоритм может быть применён и для других целей, например, для нахождения максимального элемента в массиве и даже для сортировки [8].

Сложение алгоритмом сдваивания имеет ещё одно преимущество перед последовательным сложением: он обеспечивает лучшую (в среднем) точность суммирования при использовании чисел с плавающей точкой.

Средней степенью параллелизма численного алгоритма называется отношение общего числа операций алгоритма к числу его этапов. Очевидно, для алгоритма сдваивания средняя степень параллелизма равна [8]:

S = .

(2)

Со степенью параллелизма также связано понятие зернистости. Крупнозернистость задачи означает наличие в ней больших независимых подзадач, которые можно обрабатывать параллельно. Примером может служить задача решения нескольких различных больших систем линейных уравнений, решения которых комбинируются на более поздних стадиях вычислительного процесса. Мелкозернистость соответствует возможности параллельного выполнения малых подзадач. Так, для сложения двух векторов подзадачей является сложение компонент, имеющих одинаковый номер. Крупнозернистые алгоритмы сложно распараллелить на большом числе процессоров [8].

Оба алгоритма основаны на реализации математически эквивалентных выражений суммирования чисел, но они имеют разные свойства, с точки зрения параллельных вычислений. У них много и других различий: они по-разному реагируют на ошибки округления, по-разному используют память и т.п. Поэтому эти алгоритмы следует считать принципиально различными, несмотря на то, что они математически эквивалентны [2].

Пусть какой-то алгоритм существенно зависит от n входных данных и реализуется через некоторую совокупность операций, имеющих не более p аргументов. Легко показать, что такой алгоритм не может иметь высоту меньше, чем log_pn. Высота любого алгоритма ограничена сверху общим числом выполняемых операций. Эти две границы являются ориентирами для построения алгоритмов минимальной высоты. Например, сразу становится ясно, что суммирование чисел по принципу сдваивания относится к оптимальным алгоритмам. Другие задачи оказываются значительно сложнее [2,3].

Высота алгоритма является очень важной характеристикой, так как показывает потенциальную возможность быстрого решения задачи на вычислительной системе параллельной архитектуры. Однако пока параллельные алгоритмы малой высоты не вошли в практику использования сколько-нибудь широко. Причина: подавляющее большинство из них требует огромного числа процессоров, имеет сложные коммуникационные связи и катастрофически неустойчиво [3].

Среди всех быстрых параллельных алгоритмов заметным исключением являются только суммирование чисел по принципу сдваивания и некоторые его аналоги. Подобные алгоритмы используются на практике достаточно широко [1-3].

Предельная абстрагированность от реальности концепцией неограниченного параллелизма вычислительной техники сделала её привлекательной для математиков. Тем не менее, на сегодняшний день все достижения в рамках этой концепции скорее представляют набор отдельных изобретений в области численных методов, чем систематически развивающийся раздел математики. Практически все быстрые параллельные алгоритмы на могут рассматриваться как результат математически эквивалентных преобразований формульных выражений, описывающих хорошо известные последовательные алгоритмы.

Ошибки округления

Основой математически эквивалентных преобразований было предположение о точном выполнении операций. На всех без исключения компьютерах на представление любого числа отводится только конечное, строго фиксированное число разрядов. Поэтому после выполнения каждой операции результат “обрезается” до нужной длины. Эта процедура вносит в результат ошибку, которая называется ошибкой округления [1].

Сами по себе ошибки округления отдельных операций очень малы. Ни одна используемая на практике стандартная программная среда не имеет инструментальных средств контроля за распространением этих ошибок. А это распространение происходит. Важнейшим фактором, объясняющим влияние ошибок округления компьютерных операций на окончательный результат, является радикальное изменение свойств математических операций. Именно, на множестве чисел, представленных в компьютере в форме с плавающей запятой, все операции перестают обладать свойствами коммутативности, ассоциативности и дистрибутивности. Известно, что даже такая простая операция как перестановка слагаемых в суммах чисел может привести из-за ошибок округления к катастрофически большим различиям [3,11].

Информационная структура алгоритмов

Вычислительные эксперименты показывают, что практически все новые параллельные алгоритмы, даже те из них, которые очень эффективны в теоретическом отношении, на практике не конкурентоспособны. Поэтому на текущий момент единственно надёжным источником создания параллельных программ является подходящая реструктуризация проверенных временем последовательных программ и математических описаний. Выбор этих форм записей объясняется тем, что только они позволяют описать алгоритмы более или менее точно.

Формально реструктуризация сводится к математически эквивалентным заменам в записях всех или части формульных выражений с целью явно указать обнаруженные в алгоритмах скрытый параллелизм, возможность использования распределенной памяти и т.п. Ключевым моментом становится контроль над влиянием ошибок округления на результат. Нужно иметь эффективные технологии для выявления требуемых свойств алгоритмов. Очень важно, чтобы все такие технологии были максимально независимы от пользовательских знаний, касающихся решаемых задач и используемых алгоритмов [13].

Рассмотрим все математически эквивалентные записи какого-либо алгоритма. Пусть каждая из них сделана на своем языке и реализуется на своем компьютере. Будем лишь считать едиными правила приближенного выполнения операций над числами. Среди указанных записей заведомо существует какое-то множество, которое для одних и тех же входных данных будет давать при реализации один и тот же результат с учетом влияния всех ошибок округления. Естественно предположить, что у всего этого множества должно быть какое-то общее ядро. И тогда возникают вопросы, как оно выглядит, как его находить, как использовать и т.п. [1,12]

Чтобы найти общее ядро, необходимо, прежде всего, очистить записи от всех языковых наслоений. После такой очистки остается лишь некоторая совокупность выполняемых операций, связанных между собой отношениями “результат-аргумент”. Это задает граф, получивший название граф алгоритма. Можно показать, что для того чтобы в одинаковых условиях разные записи алгоритмов приводили к одним и тем же результатам, необходимо и достаточно, чтобы были изоморфны их графы. Построенные графы описывают информационные сущности алгоритмов. Они не зависят ни от используемых языков описания, ни от применяемых вычислительных средств. Поэтому вполне естественно их считать информационными ядрами самих алгоритмов [3].

Граф алгоритма имеет очень прозрачный смысл. Поэтому его легко применять в теоретических исследованиях. Однако чтобы этот граф использовать в реальных приложениях, он должен быть явно задан в какой-либо форме, приемлемой для таких целей. На практике он никогда не бывает, известен в нужном виде, и граф алгоритма приходится находить с помощью специальных методик из описывающих сам алгоритм программ или математических соотношений [3,13].

В настоящее время решены различные связанные с реструктуризацией теоретические вопросы. Разработаны различные методы обнаружения параллельных ветвей вычислений. Предложены способы минимизации коммуникационных затрат при передачах информации между процессорами, а также между процессорами и памятью. Последнее имеет особое значение в связи с развитием распределенных вычислений. Всё это сформировало новую область исследований, называемую информационной структурой алгоритмов. В её основе лежит выделение из записей алгоритма его информационного ядра, очищенного от всех элементов описания. Доказаны очень важные утверждения, из которых следует, что для широкого класса алгоритмов информационное ядро может быть описано и исследовано с помощью конечных наборов простых функций, как правило, кусочно-линейных. Построены эффективные методы вычисления, исследования и использования таких функций. Параллельная структура программ является составной частью информационной структуры алгоритмов и может быть исследована с учетом всего сказанного выше [1-3,11-13].

1 2 3 4 5 6 7 8

	Информатика, вычислительная техника и инженерное образование. 2011. №2 (4) В настоящем выпуске размещены работы по проблемам филологии, педагогики и методике обучения иностранным языкам, а в следующем выпуске...		О. М. Топоркова информационные технологии Учебное пособие предназначено для студентов вузов, обучающихся по направлениям подготовки Информатика и вычислительная техника; Прикладная...
	Методические указания к практическим занятиям для студентов направления... Б90 Использование субд для создания программных систем и их компонентов: Методические указания к практическим занятиям для студентов...		Диплом государственного образца о неполном высшем «Информатика и вычислительная техника» 2 курс (заочное обучение, платные места)
	Методические указания ...		Методические указания по выполнению междисциплинарной курсовой работы... Методические указания по выполнению междисциплинарной курсовой работы студентами образовательной программы «Информатика и вычислительная...
	Краевая олимпиада обучающихся по группе специальностей 09. 00. 00... Правильный ответ помечается знаком × в бланке ответов. Исправления в бланке ответов не допускаются		Методические указания к практическим работам по дисциплине Информационные... Федерального государственного образовательного стандарта по специальности среднего профессионального образования, входящей в состав...
	Основная образовательная программа высшего профессионального образования... Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования		Отчет по результатам самообследования основной образовательной программы... Федеральное государственное автономное образовательное учреждение высшего профессионального образования «национальный исследовательский...

Информатика, вычислительная техника и инженерное образование 2011, №1(3) эволюционное моделирование, генетические и бионические алгоритмы

ВЫЧИСЛИТЕЛЬНЫЕ КОМПЛЕКСЫ НОВОГО ПОКОЛЕНИЯ И НЕЙРОКОМПЬЮТЕРЫ

Похожие: