Литература


НазваниеЛитература
страница16/66
ТипЛитература
1   ...   12   13   14   15   16   17   18   19   ...   66

Способы обеспечения и ускорения сходимости


  1. Выбор начальных весов

Перед тем, как начинать процесс обучения нейронной сети, необходимо присвоить весам начальные значения. Цель состоит в том, чтобы найти как можно более хорошее начальное приближение к решению и таким образом сэкономить время обучения и улучшить сходимость. Классический подход к этой проблеме состоит в том, чтобы случайным образом выбрать малые значения для всех весов, чтобы быть уверенным, что ни один из сигмоидных элементов не перенасыщен. Однако это не дает полной гарантии, что такое приближение приведет к глобальному минимуму или уменьшит время сходимости.

  1. Упорядочение данных

Чтобы обучение не двигалось в ложном направлении при обработке задачи классификации или распознавания, но не задачи аппроксимирования временных рядов, данные нужно перемешивать случайным образом. Иначе нейросеть "выучит" последовательность случайно оказавшихся рядом значений как истинное правило, и потом будет делать ошибку.

  1. Импульс

Иногда при изменении весов связей нейронов кроме текущего изменения веса к нему прибавляют вектор смещения с предыдущего шага, взятый с некоторым коэффициентом. В этом случае говорят, что учитывается предыдущий импульс движения. Формула изменения веса связи будет выглядеть следующим образом:



где  - число в интервале (0,1), которое задается пользователем.

  1. Управление величиной шага

Ранее я уже говорил, что  - величина шага сети. По сути это - мера точности обучения сети. Чем он больше, тем более грубым будет следующее уменьшение суммарной ошибки сети. Чем он меньше, тем больше времени сеть будет тратить на обучение и тем более возможно ее попадание в окрестность локального минимума ошибки. Поэтому управление шагом имеет важное значение для улучшения сходимости нейронной сети. В современных нейросетевых пакетах пользователь может сам определять, как будет изменяться величина шага. Очень часто по умолчанию берется линейная или экспоненциальная зависимость величины шага от количества итераций сети.

  1. Оптимизация архитектуры сети

Одной из самых больших проблем при использовании нейросетей является невозможность предварительного определения оптимального количества скрытых слоев и нейронов в них. Если нейронов будет слишком мало, то это равносильно потере каких-то нелинейных связей в модели, если нейронов будет много, то это может привести к "переобучению" сети, то есть она просто "выучит" данные, а не распознает их структуру. Поэтому применяется два основных подхода:

  • деструктивный подход: берется сеть заведомо большего размера, чем нужно, и в процессе обучения из нее удаляются связи и даже сами нейроны;

  • конструктивный подход: первоначально берется маленькая сеть, и к ней, в соответствии со структурой и сложностью задачи, добавляются новые элементы.

  1. Масштабирование данных

При рассмотрении решающих функций внутри нейронов я сказал, что диапазон выходных значений нейрона лежит в интервале (0,1) либо (-1,1). Поэтому для лучшей работы сети следует предварительно масштабировать данные обучающей выборки к интервалу от 0 до 1. Это даст меньшие ошибки при обучении и работе нейросети.

Организация процесса обучения


Из теоремы об отображении практически любой функции с помощью многослойной нейросети следует, что обучаемая нами нейронная сет в принципе способна сама подстроиться под любые данные с целью минимизации суммарной квадратичной ошибки. Чтобы этого не происходило при обучении нейросетей используют следующий способ проверки сети. Для этого обучающую выборку еще перед началом обучения разбивают случайным образом на две подвыборки: обучающую и тестовую. Обучающую выборку используют собственно для процесса обучения, при этом изменяются веса нейронов. А тестовую используют в процессе обучения для проверки на ней суммарной квадратичной ошибки, но при этом не происходит изменение весов. Если нейросеть показывает улучшение аппроксимации и на обучающей, и на тестовой выборках, то обучение сети происходит в правильном направлении. Иначе может снижаться ошибка на обучающей выборке, но происходить ее увеличение на тестовой. Последнее означает, что сеть "переобучилась" и уже не может быть использована для прогнозирования или классификации. В этом случае немного изменяются веса нейронов, чтобы вывести сеть из окрестности локального минимума ошибки.
1   ...   12   13   14   15   16   17   18   19   ...   66

Похожие:

Литература iconЛитература |
Студентам: электронная книга | литература | указатель | форум | мнения | однокурсники | рейтинг

Литература iconЛитература по курсу 16 Основная литература 16
Оценочные средства для текущего контроля успеваемости, промежуточной аттестации по итогам освоения дисциплины 9

Литература iconРусская литература XIX века. Русская литература в контексте мировой культуры
Наименование циклов, разделов, модулей, требования к знаниям, умениям, практическому опыту

Литература iconМетодические рекомендации и задания для самостоятельной работы по...
Документационное обеспечение управления и архивоведение (базовая подготовка), изучающих учебную дисциплину «Литература» – Пермь:...

Литература iconЛитература для подготовки по изучаемой теме Основная литература:...
Специальность: 40. 05. 01 (030901. 65) Правовое обеспечение национальной безопасности; специализация уголовно-правовая

Литература iconЛитература Справочная литература

Литература iconЛитература по курсу «Международный коммерческий арбитраж»
Литература по курсу «Международный коммерческий арбитраж», подлежащая изучению к Семинару №11 по теме: «Определение арбитражного...

Литература iconЛитература по курсу «Международный коммерческий арбитраж»
Литература по курсу «Международный коммерческий арбитраж», подлежащая изучению к Семинару №8 по теме: «Возбуждение арбитражного разбирательства....

Литература iconЛитература по курсу «Международный коммерческий арбитраж»
Литература по курсу «Международный коммерческий арбитраж», подлежащая изучению к Семинару №9 по теме: «Отдельные элементы арбитражного...

Литература iconЛитература по курсу «Международный коммерческий арбитраж»
Литература по курсу «Международный коммерческий арбитраж», подлежащая изучению к Семинару №5 по теме: «Договорный и обязательный...

Вы можете разместить ссылку на наш сайт:


Все бланки и формы на filling-form.ru




При копировании материала укажите ссылку © 2019
контакты
filling-form.ru

Поиск