From 55ec79082313a43c09e5031c2a66791797257db7 Mon Sep 17 00:00:00 2001 From: tnn Date: Sun, 18 Aug 2019 15:44:59 +0300 Subject: [PATCH] text edit --- tex/30-digital_identity.tex | 5 +++++ tex/50-implementation.tex | 12 ------------ 2 files changed, 5 insertions(+), 12 deletions(-) diff --git a/tex/30-digital_identity.tex b/tex/30-digital_identity.tex index 722966f..4aa5f5b 100644 --- a/tex/30-digital_identity.tex +++ b/tex/30-digital_identity.tex @@ -180,6 +180,11 @@ \section{Кластерный анализ цифровых личностей Выбор применения данного алгоритма исходит из ознакомления с его применением к схожей задаче. В корпоративной системе поддержки принятия решений для банков, именуемой Banksealer\cite{Carminati15}, данный алгоритм применяется для кластеризации пользователей банка в соответствии с их манерой трат. Другими словами, пользователи, чьё поведение схоже, более вероятно оказываются в одном кластере. Если быть более точным, в рамках решения Banksealer используется модификация исходного алгоритма, о которой речь пойдет далее. +Модификация алгоритма DBSCAN, для простоты именуемая далее итеративной, была предложена как решение проблемы, когда в результате кластеризации получается один большой кластер и несколько маленьких. Для более +равномерной кластеризации, предлагается итеративно, на каждом шаге, брать самый большой кластер и применять к нему исходный алгоритм, а затем объединять результат, сохраняя малые кластеры как есть, с каждым +шагом постепенно уменьшат радиус поиска соседей. Условием останова является локальная максимизация качества кластеризации, что может быть измерено множеством подходов. В нашей версии, был использован индекс +Дэвиса-Болдина (Davies-Bouldin index)\cite{Davies79}. Чем меньше значение индекса, тем выше качество кластеризации. + \section{Классификация жителей умного города на основе параметров цифровой личности} %%% Local Variables: diff --git a/tex/50-implementation.tex b/tex/50-implementation.tex index b593667..0ad3f16 100644 --- a/tex/50-implementation.tex +++ b/tex/50-implementation.tex @@ -380,18 +380,6 @@ \subsubsection*{\textbf{Кластеризация методом DBSCAN}} количества кластеров и доминирования одного большого, было решено применить для решения задачи модифицированную версию алгоритма DBSCAN. -Модификация алгоритма DBSCAN, для простоты именуемая далее итеративной, -была предложена как решение проблемы, когда в результате кластеризации -получается один большой кластер и несколько маленьких. Для более -равномерной кластеризации, предлагается итеративно, на каждом шаге, -брать самый большой кластер и применять к нему исходный алгоритм, а -затем объединять результат, сохраняя малые кластеры как есть, с каждым -шагом постепенно уменьшат радиус поиска соседей. Условием останова -является локальная максимизация качества кластеризации, что может быть -измерено множеством подходов. В нашей версии, был использован индекс -Дэвиса-Болдина (Davies-Bouldin index)\cite{Davies79}. Чем меньше значение -индекса, тем выше качество кластеризации. - В результате, используя те же входные параметры и уменьшая на каждом шаге радиус поиска вдвое, было получено 208 кластеров при отсутствии шума. Кластеризация завершилась при достижении значения индекса в 0.12. -- GitLab