ШВИДКА НЕЧІТКА ПРАВДОПОДІБНА КЛАСТЕРИЗАЦІЯ НА ОСНОВІ АНАЛІЗУ ПІКІВ ЩІЛЬНОСТІ РОЗПОДІЛУ ДАНИХ. (Ukrainian)

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • Additional Information
    • Alternate Title:
      FAST FUZZY CREDIBILISTIC CLUSTERING BASED ON DENSITY PEAKS DISTRIBUTION OF DATA BROAKYSIS. (English)
      БЫСТРАЯ НЕЧЕТКАЯ ПРАВДОПОДОБНАЯ КЛАСТЕРИЗАЦИЯ НА ОСНОВЕ АНАЛИЗА ПИКОВ ПЛОТНОСТИ РАСПРЕДЕЛЕНИЯ ДАННЫХ. (Russian)
    • Abstract:
      Context. The problem of clustering (classification without a teacher) is often occures when processing data arrays of various natures, which is quite an interesting and integral part of artificial intelligence. To solve this problem, there are many known methods and algorithms based on the principles of the distribution density of observations in the analyzed data. However, these methods are rather complicated in software implementation and are not without drawbacks, namely: the problem of determining significant clusters in datasets of different densities, multiepoch self-learning, getting stuck in local extrema of goal functions, etc. It should be noted that the methods based on the analysis of the peaks of the data distribution density are clear in nature, therefore, to expand the capabilities of these methods, it is advisable to introduce their fuzzy modification. Objective. The aim of the work is to introduce fast fuzzy data clustering using density peaks distribution of the datasets, that can find the prototypes (centroids) of clusters that overlapping regardless of the amount of incoming data. Method. The problem of fuzzy clustering data arrays based on a hybrid method that based on the simultaneous use of a credibilistic approach to fuzzy clustering and an algorithm for finding the types of distribution density of the initial data is proposed. A feature of the proposed method is computational simplicity and high speed, due to the fact that the entire array is processed only once, that is, eliminates the need for multi-era self-learning, implemented in traditional fuzzy clustering algorithms. Results. A feature of the proposed method of fast fuzzy credibilistic clustering using of density peaks distribution is characterized by computational simplicity and high speed due to the fact that the entire array is processed only once, that is, the need for multiepoch self-learning is eliminated, which is implemented in traditional fuzzy clustering algorithms. The results of the computational experiment confirm the effectiveness of the proposed approach in clustering problems under conditions in the case when the clusters are ovelap. Conclusions. The experimental results allow us to recommend the developed method for solving the problems of automatic clustering and data classification, as quickly as possible to find the centroids of clusters. The proposed method of fast fuzzy credibilistic clustering using of density peaks distribution of dataset is intended for use in computational intelligence systems, neuro-fuzzy systems, in training artificial neural networks and in clustering problems. [ABSTRACT FROM AUTHOR]
    • Abstract:
      Актуальность. Проблема кластеризации (классификации без учителя) часто встречается при обработке массивов данных различной природы и является достаточно интересной и неотъемлемой частью искусственного интеллекта. Для решения этой задачи существует множество известных методов и алгоритмов основанных на анализе плотности распределения наблюдений в анализируемых данных. Однако эти методы достаточно сложны в программной реализации и не лишены недостатков, а именно: проблемы определения значимых кластеров в наборах данных различной плотности, многоэпоховое самообучение, застревание в локальных экстремумах целевых функций и тому подобное. Следует отметить, что методы, основанные на анализе пиков плотности распределения данных, являются по своей природе четкими, поэтому для расширения возможностей этих методов целесообразно ввести их нечеткую модификацию. Цель. Цель работы заключается в введении быстрой процедуре нечеткой кластеризации данных с использованием пиков плотности распределения данных, которая может находить экстемумы (центры) кластеров, которые пересекаются независимо от количества поступающих данных. Метод. Рассмотрена задача нечеткой кластеризации массивов данных на основе гибридного метода, основанного на одновременном использовании правдоподобного подхода к нечеткой кластеризации и алгоритма нахождения типов плотности распределения исходных данных. Особенностью предлагаемого метода является вычислительная простота и высокая скорость, связанная с тем, что весь массив обрабатывается только один раз, то есть исключается необходимость в многоэпоховом самообучении, реализуемом в традиционных алгоритмах нечеткой кластеризации. Результаты. Особенностью предложенного метода быстрой нечеткой правдоподобной кластеризации на основе анализа пиков плотности распределения данных является вычислительная простота и высокая скорость, связанная с тем, что весь массив обрабатывается только один раз, то есть исключается необходимость в многоэпоховом самообучении, что реализуется в традиционных алгоритмах нечеткой кластеризации. Результаты вычислительного эксперимента подтверждают эффективность предложенного подхода в задачах кластеризации в условиях, когда кластеры пересекаются. Выводы. Результаты эксперимента позволяют рекомендовать разработанный метод для решения проблем автоматической кластеризации и классификации данных, максимально быстро находить центры кластеров. Предложенный метод быстрой нечеткой правдоподобной кластеризации на основе анализа пиков плотности распределения данных предназначен для использования в системах вычислительного интеллекта, нейро-фаззи системах, в обучении искусственных нейронных сетей и в задачах кластеризации. [ABSTRACT FROM AUTHOR]
    • Abstract:
      Copyright of Radio Electronics, Computer Science, Control is the property of Zaporizhzhia National Technical University and its content may not be copied or emailed to multiple sites or posted to a listserv without the copyright holder's express written permission. However, users may print, download, or email articles for individual use. This abstract may be abridged. No warranty is given about the accuracy of the copy. Users should refer to the original published version of the material for the full abstract. (Copyright applies to all Abstracts.)