Скачать 0.82 Mb.
|
На основе данной таблицы строится бинарное дерево (Рисунок 25).Рис. 25 Расчет штрафа за неправильную кластеризацию происходит на основе данных таблицы и дерева. Так, для данного кластера штраф будет равен 3. При прохождении первичной кластеризации может возникнуть случай, когда одна транзакция имеет общие предметы с несколькими другими. Например, транзакция 1 будет иметь общие предметы как с транзакцией 3, так и с транзакцией 7. В таком случае происходит построение двух предварительных кластеров и сравнение их штрафов за неправильную кластеризацию. Соответственно, более удачным кластером будет являться тот кластер, у которого данный штраф будет ниже. Тогда, худший кластер удаляется, т.е удаляется дерево для этого кластера, таблица предмета учета предметов для данного кластера, а также запись о нем в таблице учета количества транзакций в кластере. В случае, если транзакция не имеет общих предметов ни с одной из существующих транзакций, то из нее образуется кластер, содержащий только эту транзакцию. Что произойдет с этими кластерами будет описано позднее. 3.3.2.2 Вторичный проход по базе кластеров и расчет возможного улучшения кластеризации После завершения первичной кластеризации необходимо произвести вторичный проход и возможную вторичную кластеризацию. Для этого будем пытаться объединять кластеры в более крупные, аналогично с тем, как мы это делали с транзакциями. Рис. 26 Кластеры до вторичной кластеризации Как это делалось с транзакциями, берем кластер и ищем, существует ли другой кластер с хотя бы одним общим предметом. Если таких кластеров не существует, то переходим к следующему и производим ту же операцию. В случае если в ходе повторной кластеризации обнаруживается, что кластер, состоящий из одной транзакции не имеет возможности объединиться с другим кластером (т.е не имеет ни с одним кластером общих предметов), то такой кластер удаляется, т.к является одиночным. Так же, как и на предыдущем шаге, необходимо рассчитывать штраф за неправильную кластеризацию, чтобы на его основе разрешить спорные моменты при образовании новых кластеров. Рассмотрим пример образования нового кластера на основе двух уже существующих. Например, попытаемся объединить ранее рассмотренный кластер ([a, b, c, d, e] , [c, d, e, f]), состоящий из двух транзакций и новый кластер ([c, d, l, z], [y, l, z]), также состоящий из двух транзакций. Для нового кластера таблица учета предметов будет иметь следующий вид:
Также, в связи с добавлением новых элементов, будет перестроено бинарное дерево (Рисунок 27). Рис. 27 В данном случае частота встречаемости больших предметов будет не менее 3х (0,7*4 = 2,8 округляем в большую сторону). Рассчитаем штраф для новообразованного кластера, а также для двух кластеров отдельно. В новом кластере количество «больших предметов» 2, остальные 7 являются «малыми». Следовательно, по формуле, штраф в данном случае будет равен 7. Теперь проверим, является ли эффективной кластеризация, т.е посчитаем возможный штраф, если данные кластеры не будут объединяться в один. Кластер ([a, b, c, d, e] , [c, d, e, f]) имеет 3 «больших» и 3 «малых» предмета, кластер ([c, d, l, z], [y, l, z]) – 2 «больших» и 3 «малых». Исходя из этих значений, получаем штраф равный 11, что еще раз доказывает, что даже один общий предмет стимулирует объединение в общий кластер. Алгоритм кластеризации заканчивает свою работу в том случае, если больше не существует кластеров, имеющих общие предметы, т.е когда эффективная кластеризация больше невозможна. |
Во время выполнения дипломной работы студент развивает навыки ведения самостоятельной научно-исследовательской работы, овладевает... | Прошу разрешить мне изменить тему дипломной (курсовой) работы с «Развитие познавательного интереса младших школьников во внеклассной... | ||
О выпускной квалификационной (дипломной) работе дипломированного специалиста, обучающегося на факультете физической культуры ниу... | Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования | ||
Правила оформления дипломной работы (подготовлены на основе Положения о выпускной квалификационной работе). 15 | Выполнение дипломной работы является заключительным этапом обучения студентов. Дипломная работа представляет собой самостоятельную... | ||
Исторические этапы становления туроператорской деятельности в России и зарубежных странах | В дипломной работе будет рассмотрена тема «Документационное обеспечение деятельности государственного учреждения (на примере гу со... | ||
Настоящее положение разработано в соответствии с положением об итоговой государственной аттестации выпускников гбоу впо вгма им.... | Особое внимание уделено выбору темы и организации выполнения дипломной работы, ее плану и структуре; подготовке дипломной работы... |
Поиск Главная страница   Заполнение бланков   Бланки   Договоры   Документы    |