• Title/Summary/Keyword: k-means 군집 알고리즘

Search Result 191, Processing Time 0.027 seconds

The Design of a Mobile Robot Path Planning using a Clustering method (클러스터링 기법을 이용한 모바일 로봇 경로계획 알고리즘 설계)

  • Kang, Won-Seok;Kim, Jin-Wook;Kim, Young-Duk;An, Jin-Ung;Lee, Dong-Ha
    • Proceedings of the KIEE Conference
    • /
    • 2008.10b
    • /
    • pp.341-342
    • /
    • 2008
  • GA(Genetic Algorithm)는 NP-Complete 도메인이나 NP-Hard 도메인 내의 문제들에 대해서 최적의 해를 찾기 위해서 많이 사용되어 지는 진화 컴퓨팅 방법 중 하나이다. 모바일 로봇 기술 중 경로계획은 NP-Complete 도메인 영역의 문제 중 하나로 이를 해결하기 위해서 Dijkstra 등의 그래프 이론을 이용한 연구가 많이 연구되었고 최근에는 GA등 진화 컴퓨팅 기법을 이용하여 최적의 경로를 찾는 연구가 많이 수행되고 있다. 그러나 모바일 로봇이 처리해야 될 공간 정보 크기가 증가함에 따라 기존 GA의 개체의 크기가 증가되어 게산 복잡도가 높아져 시간 지연등의 문제가 발생할 수 있다. 이는 모바일 로봇의 잠재적 오류로 발생될 수 있다. 공간 정보에는 동적이 장애물들이 예측 불허하게 나타 날 수 있는데 이것은 전역 경로 계획을 수립할 때 또한 반영되어야 된다. 본 논문에서는 k-means 클러스터링 기법을 이용하여 장애물 밀집도 및 거리 정보를 기반으로 공간정보를 k개의 군집 공간으로 재분류하여 이를 기반으로 N*M개의 그리드 개체 집단을 생성하여 최적 경로계획을 수립하는 GA를 제시한다.

  • PDF

Application recommender system based on personalized collaborative-filtering using user's emotion information from smartphone (스마트폰에서 사용자 감성정보를 이용한 개인화된 협업필터링 기반 애플리케이션 추천 시스템)

  • Lee, Chang-Hyun;Lee, Sung-Young;Chung, Tae-Choong;Yun, Seok-Hwan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.224-226
    • /
    • 2012
  • 최근 스마트폰의 대중화와 더불어 스마트폰 애플리케이션의 공급과 수요 또한 활성화 되고 있다. 이에 스마트폰의 애플리케이션 시장 또한 활성화 되었다. 하지만 기하급수적으로 증가한 애플리케이션에 사용자가 자신에게 적합한 애플리케이션을 선택하기가 용이하지 않다. 이에 본 논문에서는 사용자 개인 정보와 감정을 이용한 애플리케이션 추천 시스템을 제안한다. 사용자 정보와 감정을 k-means 알고리즘을 이용하여 군집화를 시켜주었으며 사용자가 평가한 애플리케이션에 대한 만족도를 이용하여 유사도를 검출 및 추천하기 위하여 피어슨 상관계수와 교차추천을 이용하였다. 또한 협업 필터링의 신규 사용자에 대한 초기 평가치 부재에 의한 콜드 스타트(cold-start) 문제를 해결하기 위해 신규 사용자의 개인정보와 감성정보를 활용하여 기존 사용자와의 유사도를 비교한다. 이웃사용자를 추출하고 이웃사용자로부터 추천을 받는다. 즉, 추천시스템 데이터베이스 내의 정보가 충분한 사용자에게는 협업필터링을 그렇지 않은 신규 사용자에게는 협업필터링 대신 제시한 방법을 적용하는 하이브리드 추천 방법을 제안하였다.

A Study on the Deduction of Social Issues Applying Word Embedding: With an Empasis on News Articles related to the Disables (단어 임베딩(Word Embedding) 기법을 적용한 키워드 중심의 사회적 이슈 도출 연구: 장애인 관련 뉴스 기사를 중심으로)

  • Choi, Garam;Choi, Sung-Pil
    • Journal of the Korean Society for information Management
    • /
    • v.35 no.1
    • /
    • pp.231-250
    • /
    • 2018
  • In this paper, we propose a new methodology for extracting and formalizing subjective topics at a specific time using a set of keywords extracted automatically from online news articles. To do this, we first extracted a set of keywords by applying TF-IDF methods selected by a series of comparative experiments on various statistical weighting schemes that can measure the importance of individual words in a large set of texts. In order to effectively calculate the semantic relation between extracted keywords, a set of word embedding vectors was constructed by using about 1,000,000 news articles collected separately. Individual keywords extracted were quantified in the form of numerical vectors and clustered by K-means algorithm. As a result of qualitative in-depth analysis of each keyword cluster finally obtained, we witnessed that most of the clusters were evaluated as appropriate topics with sufficient semantic concentration for us to easily assign labels to them.

Characteristics of Gas Furnace Process by Means of Partition of Input Spaces in Trapezoid-type Function (사다리꼴형 함수의 입력 공간분할에 의한 가스로공정의 특성분석)

  • Lee, Dong-Yoon
    • Journal of Digital Convergence
    • /
    • v.12 no.4
    • /
    • pp.277-283
    • /
    • 2014
  • Fuzzy modeling is generally using the given data and the fuzzy rules are established by the input variables and the space division by selecting the input variable and dividing the input space for each input variables. The premise part of the fuzzy rule is presented by selection of the input variables, the number of space division and membership functions and in this paper the consequent part of the fuzzy rule is identified by polynomial functions in the form of linear inference and modified quadratic. Parameter identification in the premise part devides input space Min-Max method using the minimum and maximum values of input data set and C-Means clustering algorithm forming input data into the hard clusters. The identification of the consequence parameters, namely polynomial coefficients, of each rule are carried out by the standard least square method. In this paper, membership function of the premise part is dividing input space by using trapezoid-type membership function and by using gas furnace process which is widely used in nonlinear process we evaluate the performance.

Design of pRBFNN Based on Interval Type-2 Fuzzy Set (Interval Type-2 퍼지 집합 기반의 pRBFNN 설계)

  • Kim, In-Jae;Oh, Sung-Kwun;Kim, Hyun-Ki
    • Proceedings of the KIEE Conference
    • /
    • 2009.07a
    • /
    • pp.1871_1872
    • /
    • 2009
  • 본 논문 에서는 Type-2 퍼지 논리 시스템을 설계하고, 불확실한 정보를 갖는 입력 데이터에 대하여 Type-1 퍼지 논리 시스템과 성능을 비교한다. Type-1 퍼지 논리 시스템은 외부 잡음에 민감한 단점을 가지고 있는 반면, Type-2 퍼지 논리 시스템은 불확실한 정보를 잘 표현 할 수 있다. 따라서 Type-2 퍼지 논리 시스템을 이용하여 이러한 단점을 극복하고자 2가지의 모델을 설계한다. 첫 번째 모델은 규칙의 전 후반부가 Type-1 퍼지 집합으로 구성된 Type-1 퍼지 논리 시스템을 설계 한다. 두 번째는 규칙 전 후반부에 Type-2 퍼지 집합으로 구성된 Type-2 퍼지 논리 시스템을 설계한다. 여기서 규칙 전반부의 입력 공간 분할 및 FOU(Footprint Of Uncertainty)형성에는 FCM(Fuzzy C_Means) clustering 방법을 사용하고, 입자 군집 최적화(Particle Swarm Optimization) 알고리즘을 사용하여 최적의 파라미터를 설계한다. 본 논문 에서는 또한 입력 데이터에 인위적으로 가하는 노이즈에 따른 각각 모델의 성능을 비교한다. 마지막으로 비선형 모델 평가에 주로 사용되는 NOx 데이터를 제안된 모델에 적용하고, 실험을 통하여 노이즈가 첨가되고, 불확실한 정보를 다루기에 Type-1 퍼지 논리 시스템 보다 Type-2 퍼지 논리 시스템이 효율적이라는 것을 보인다.

  • PDF

A Study on improvement of sounding density of ENCs (전자해도 수심 밀집도 개선에 관한 연구)

  • Oh, Se-Woong;Park, Jong-Min;Suh, Sang-Hyun;Lee, Moon-Jin;Jeon, Tae-Byung
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2011.06a
    • /
    • pp.34-36
    • /
    • 2011
  • ENCs is edited based on the numerical charts for publishing paper charts and serviced in forms of grid styles. For this reason, the density of sounding information of ENCs is not consistent and was required for improvement. In this study, K-Means, ISODATA clustering algorithm as classification methods for satellite image was reviewed and adopted to case study. The developed results include loading module of ENC data, improvement algorithm of sounding information, writing module of ENC data. According to the results of algorithm, we could confirm the improved result.

  • PDF

Comparative analysis of linear model and deep learning algorithm for water usage prediction (물 사용량 예측을 위한 선형 모형과 딥러닝 알고리즘의 비교 분석)

  • Kim, Jongsung;Kim, DongHyun;Wang, Wonjoon;Lee, Haneul;Lee, Myungjin;Kim, Hung Soo
    • Journal of Korea Water Resources Association
    • /
    • v.54 no.spc1
    • /
    • pp.1083-1093
    • /
    • 2021
  • It is an essential to predict water usage for establishing an optimal supply operation plan and reducing power consumption. However, the water usage by consumer has a non-linear characteristics due to various factors such as user type, usage pattern, and weather condition. Therefore, in order to predict the water consumption, we proposed the methodology linking various techniques that can consider non-linear characteristics of water use and we called it as KWD framework. Say, K-means (K) cluster analysis was performed to classify similar patterns according to usage of each individual consumer; then Wavelet (W) transform was applied to derive main periodic pattern of the usage by removing noise components; also, Deep (D) learning algorithm was used for trying to do learning of non-linear characteristics of water usage. The performance of a proposed framework or model was analyzed by comparing with the ARMA model, which is a linear time series model. As a result, the proposed model showed the correlation of 92% and ARMA model showed about 39%. Therefore, we had known that the performance of the proposed model was better than a linear time series model and KWD framework could be used for other nonlinear time series which has similar pattern with water usage. Therefore, if the KWD framework is used, it will be possible to accurately predict water usage and establish an optimal supply plan every the various event.

Effective Classification Method of Hierarchical CNN for Multi-Class Outlier Detection (다중 클래스 이상치 탐지를 위한 계층 CNN의 효과적인 클래스 분할 방법)

  • Kim, Jee-Hyun;Lee, Seyoung;Kim, Yerim;Ahn, Seo-Yeong;Park, Saerom
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.81-84
    • /
    • 2022
  • 제조 산업에서의 이상치 검출은 생산품의 품질과 운영비용을 절감하기 위한 중요한 요소로 최근 딥러닝을 사용하여 자동화되고 있다. 이상치 검출을 위한 딥러닝 기법에는 CNN이 있으며, CNN을 계층적으로 구성할 경우 단일 CNN 모델에 비해 상대적으로 성능의 향상을 보일 수 있다는 것이 많은 선행 연구에서 나타났다. 이에 MVTec-AD 데이터셋을 이용하여 계층 CNN이 다중 클래스 이상치 판별 문제에 대해 효과적인지를 탐구하고자 하였다. 실험 결과 단일 CNN의 정확도는 0.7715, 계층 CNN의 정확도는 0.7838로 다중 클래스 이상치 판별 문제에 있어 계층 CNN 방식 접근이 다중 클래스 이상치 탐지 문제에서 알고리즘의 성능을 향상할 수 있음을 확인할 수 있었다. 계층 CNN은 모델과 파라미터의 개수와 리소스의 사용이 단일 CNN에 비하여 기하급수적으로 증가한다는 단점이 존재한다. 이에 계층 CNN의 장점을 유지하며 사용 리소스를 절약하고자 하였고 K-means, GMM, 계층적 클러스터링 알고리즘을 통해 제작한 새로운 클래스를 이용해 계층 CNN을 구성하여 각각 정확도 0.7930, 0.7891, 0.7936의 결과를 얻을 수 있었다. 이를 통해 Clustering 알고리즘을 사용하여 적절히 물체를 분류할 경우 물체에 따른 개별 상태 판단 모델을 제작하는 것과 비슷하거나 더 좋은 성능을 내며 리소스 사용을 줄일 수 있음을 확인할 수 있었다.

  • PDF

Development of Monitoring System for the LNG plant fractionation process based on Multi-mode Principal Component Analysis (다중모드 주성분분석에 기반한 천연가스 액화플랜트의 성분 분리공정 감시 시스템 개발)

  • Pyun, Hahyung;Lee, Chul-Jin;Lee, Won Bo
    • Journal of the Korean Institute of Gas
    • /
    • v.23 no.4
    • /
    • pp.19-27
    • /
    • 2019
  • The consumption of liquefied natural gas (LNG) has increased annually due to the strengthening of international environmental regulations. In order to produce stable and efficient LNG, it is essential to divide the global (overall) operating condition and construct a quick and accurate monitoring system for each operation condition. In this study, multi-mode monitoring system is proposed to the LNG plant fractionation process. First, global normal operation data is divided to local (subdivide) normal operation data using global principal component analysis (PCA) and k-means clustering method. And then, the data to be analyzed were matched with the local normal mode. Finally, it is determined the state of process abnormality through the local PCA. The proposed method is applied to 45 fault case and it proved to be more than 5~10% efficient compared to the global PCA and univariate monitoring.

Processing large-scale data with Apache Spark (Apache Spark를 활용한 대용량 데이터의 처리)

  • Ko, Seyoon;Won, Joong-Ho
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.6
    • /
    • pp.1077-1094
    • /
    • 2016
  • Apache Spark is a fast and general-purpose cluster computing package. It provides a new abstraction named resilient distributed dataset, which is capable of support for fault tolerance while keeping data in memory. This type of abstraction results in a significant speedup compared to legacy large-scale data framework, MapReduce. In particular, Spark framework is suitable for iterative machine learning applications such as logistic regression and K-means clustering, and interactive data querying. Spark also supports high level libraries for various applications such as machine learning, streaming data processing, database querying and graph data mining thanks to its versatility. In this work, we introduce the concept and programming model of Spark as well as show some implementations of simple statistical computing applications. We also review the machine learning package MLlib, and the R language interface SparkR.