• 제목/요약/키워드: hard clustering

검색결과 116건 처리시간 0.023초

HCM과 하이브리드 동정 알고리즘을 이용한 퍼지-뉴럴 네트워크 구조의 최적 설계 (Optimal Design of Fuzzy-Neural Networkd Structure Using HCM and Hybrid Identification Algorithm)

  • 오성권;박호성;김현기
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제50권7호
    • /
    • pp.339-349
    • /
    • 2001
  • This paper suggests an optimal identification method for complex and nonlinear system modeling that is based on Fuzzy-Neural Networks(FNN). The proposed Hybrid Identification Algorithm is based on Yamakawa's FNN and uses the simplified inference as fuzzy inference method and Error Back Propagation Algorithm as learning rule. In this paper, the FNN modeling implements parameter identification using HCM algorithm and hybrid structure combined with two types of optimization theories for nonlinear systems. We use a HCM(Hard C-Means) clustering algorithm to find initial apexes of membership function. The parameters such as apexes of membership functions, learning rates, and momentum coefficients are adjusted using hybrid algorithm. The proposed hybrid identification algorithm is carried out using both a genetic algorithm and the improved complex method. Also, an aggregated objective function(performance index) with weighting factor is introduced to achieve a sound balance between approximation and generalization abilities of the model. According to the selection and adjustment of a weighting factor of an aggregate objective function which depends on the number of data and a certain degree of nonlinearity(distribution of I/O data), we show that it is available and effective to design an optimal FNN model structure with mutual balance and dependency between approximation and generalization abilities. To evaluate the performance of the proposed model, we use the time series data for gas furnace, the data of sewage treatment process and traffic route choice process.

  • PDF

맵리듀스 기반 DFP-Tree를 이용한 클러스터링 알고리즘 (Clustering Algorithm using the DFP-Tree based on the MapReduce)

  • 서영원;김창수
    • 인터넷정보학회논문지
    • /
    • 제16권6호
    • /
    • pp.23-30
    • /
    • 2015
  • 빅 데이터가 이슈화됨에 따라 데이터 분석의 결과를 기반으로 동작하는 많은 응용들이연구되고 왔고, 대표적인 응용들은 전자상거래 시스템의 상품 추천 서비스, 검색 엔진에서의 검색 서비스, 소셜 네트워크 서비스에서의 친구 추천 서비스 등이 있다. 본 논문은 기존의 데이터 마이닝 기법 중 데이터 집합에서 나타나는 유사한 패턴들을 마이닝하는 빈발 패턴 트리와 컴퓨터 과학의 이론에 기초한 결정트리를 결합하여 결정 빈발 트리 알고리즘을 제안한다. 이는 기존의 빈발 패턴 트리 알고리즘은 패튼 트리에서 패턴 생성에 대한 정확성은 보장되나 소셜 데이터처럼 다양한 패턴이 나타는 데이터에 대해서는 많은 수의 패턴들을 생성시켜 분석에 대한 어려움이 있어, 서브트리들과의 수렴 여부를 판단하는 모델로 변형시켜 문제를 개선한다. 또한 맵리듀스로 모델링하여 분산처리를 통한 고속 처리 알고리즘을 제시한다.

인터넷 게시물의 댓글 분석 및 시각화 (Analysis and Visualization for Comment Messages of Internet Posts)

  • 이윤정;지정훈;우균;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제9권7호
    • /
    • pp.45-56
    • /
    • 2009
  • 오늘날 인터넷 사용자들은 블로그나 뉴스, 인터넷 게시판 등의 매체에서 댓글을 통해 다른 사람의 의견을 살피고 자신의 의견을 나타내고 있다. 그러나 현재 대부분의 블로그나 인터넷 포털 사이트의 경우 기사나 댓글들을 순차적인 목록 형태로 제공하므로 사용자가 원하는 내용의 댓글을 검색하거나 살펴보는 것은 힘든 일이다. 또한 댓글 사용자가 증가함에 따라 스팸 댓글이나 악플 등이 사회 문제가 되기도 한다. 본 논문에서는 다음 아고라(Daum AGORA) 웹 블로그의 게시글과 댓글을 통계적으로 분석하고 유사도를 기반으로 클러스터링하는 시스템을 제안한다. 본 시스템은 클러스터링 결과를 시각화하여 간단한 스크린 뷰(screen view)로 보여준다. 또한, 본 시스템은 생물정보학에서 잘 알려진 정렬 기법인 Needleman-Wunsch 알고리즘을 이용해 스팸 댓글을 필터링한다.

군집분석을 이용한 전시장비의 취약성 그룹 재분류 (Reclassification of the vulnerability group of wartime equipment)

  • 이한우;김수환;주경식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.581-592
    • /
    • 2015
  • 현재 한국군의 전시장비소요산정은 미군의 모델인 ELCON을 기반으로 하고 있다. 하지만 전시장비소요산정을 위해 ELCON에서 적용하는 22개의 취약성그룹에 대한 구체적인 분류기준은 알려져 있지 않다. 따라서 이번 연구에서는 2014년 국방전시기본품목 505종에 대해 데이터를 수집하고, 군집분석 방법을 통해 ELCON에서 사용되는 취약성그룹과 다른 새로운 취약성그룹을 제시하였다. 이번 연구를 통해 한국의 상황에 맞는 전시장비들의 취약성그룹을 분류하는 방법을 제시하였을 뿐만 아니라 새로 추가될 장비 역시 해당 장비의 특성을 통해 분류 할 수 있는 기준을 제시함으로 전시 정확한 장비소요를 예측할 수 있도록 하였다.

비선형 공정에서의 입력 공간 분할에 의한 퍼지 추론 시스템의 특성 분석 (Characteristics of Fuzzy Inference Systems by Means of Partition of Input Spaces in Nonlinear Process)

  • 박건준;이동윤
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.48-55
    • /
    • 2011
  • 본 논문은 비선형 공정의 퍼지 모델을 동정하기 위해 전체 입력의 공간 분할 및 퍼지 추론 방법에 따른 퍼지 추론 시스템의 입출력 특성을 분석하며, 퍼지 모델의 입력 변수와 퍼지 입력 공간 분할 및 후반부 다항식 함수에 의한 구조 동정과 파라미터 동정을 통해 비선형 공정을 표현한다. 퍼지 규칙에서 전반부 파라미터의 동정에는 입출력 데이터의 최소 값과 최대 값을 이용하는 최소-최대 방법 및 입출력 데이터를 군집으로 형성하는 C-Means 클러스터링 알고리즘을 사용하여 입력 공간을 분할한다. 또한 전반부 멤버쉽 함수는 삼각형 멤버쉽 함수를 사용하여 입력 공간을 형성한다. 후반부 동정에서 퍼지 추론 방법은 간략 추론 및 선형 추론에 의해 시스템을 표현한다. 또한, 각 규칙의 후반부 파라미터들, 즉 후반부 다항식의 계수를 동정하기 위해 표준 최소자승법을 사용한다. 마지막으로, 비선형 공정으로는 널리 이용되는 가스로 데이터를 사용하며 이 공정에 대해 성능을 평가한다.

An Energy Harvesting Aware Routing Algorithm for Hierarchical Clustering Wireless Sensor Networks

  • Tang, Chaowei;Tan, Qian;Han, Yanni;An, Wei;Li, Haibo;Tang, Hui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권2호
    • /
    • pp.504-521
    • /
    • 2016
  • Recently, energy harvesting technology has been integrated into wireless sensor networks to ameliorate the nodes' energy limitation problem. In theory, the wireless sensor node equipped with an energy harvesting module can work permanently until hardware failures happen. However, due to the change of power supply, the traditional hierarchical network routing protocol can not be effectively adopted in energy harvesting wireless sensor networks. In this paper, we improve the Low-Energy Adaptive Clustering Hierarchy (LEACH) protocol to make it suitable for the energy harvesting wireless sensor networks. Specifically, the cluster heads are selected according to the estimation of nodes' harvested energy and consumed energy. Preference is given to the nodes with high harvested energy while taking the energy consumption rate into account. The utilization of harvested energy is mathematically formulated as a max-min optimization problem which maximizes the minimum energy conservation of each node. We have proved that maximizing the minimum energy conservation is an NP-hard problem theoretically. Thus, a polynomial time algorithm has been proposed to derive the near-optimal performance. Extensive simulation results show that our proposed routing scheme outperforms previous works in terms of energy conservation and balanced distribution.

자기구성 지도를 이용한 인터넷 FAQ의 자동응답 및 개념적 브라우징 (Automatic Response and Conceptual Browsing of Internet FAQs Using Self-Organizing Maps)

  • 안준현;류중원;조성배
    • 한국지능시스템학회논문지
    • /
    • 제12권5호
    • /
    • pp.432-441
    • /
    • 2002
  • 최근 인터넷상의 정보를 가공하여 사용자에게 효율적으로 제공하는 서비스들이 많아지고 있지만, 컴퓨터에 익숙하지 않은 사용자들은 이러한 서비스를 쉽게 이용하지 못하기 때문에 사용자들을 돕는 시스템이 필요하다. 예를 들어, 웹사이트의 경우 전자우편을 통한 사용자들의 질문에 대해 관리자가 직접 답을 해줘야 하는데, 사용자의 증가로 질의응답 업무의 양이 커지고 있다. 본 논문에서는 이를 해결하기 위하여 사용자의 질의를 자동으로 분류하여 응답하고 사용자가 FAQ를 개념적으로 브라우징할 수 있도록 하는 시스템을 제안한다. 이 시스템은 다양한 크기의 질의 메일을 정형화된 크기로 만들기 위한 키워드 클러스터링 자기구성 지도(SOM)와 이를 실제 해당 답변 클래스로 분류하는 전자 우편 분류 SOM의 이단계 구조로 구성되어 사용자의 질의에 해당하는 답변을 자동으로 전송할 수 있으며, 사용자가 이차원상에 표현된 문서 지도를 이용하여 쉽게 전체 자료의 분포를 파악하여 검색할 수 있다. 실제 한 달간 수집한 2,206개의 한메일넷 질의 데이터에 대한 실험 결과, 95%의 분류율을 보여 그 유용성을 볼 수 있었으며, 단계별 검색이 가능하여 사용자가 효율적으로 검색할 수 있음을 확인할 수 있었다.

데이터 정보입자 기반 퍼지 추론 시스템의 최적화 (Optimization of Fuzzy Inference Systems Based on Data Information Granulation)

  • 오성권;박건준;이동윤
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권6호
    • /
    • pp.415-424
    • /
    • 2004
  • In this paper, we introduce and investigate a new category of rule-based fuzzy inference system based on Information Granulation(IG). The proposed rule-based fuzzy modeling implements system structure and parameter identification in the efficient form of “If..., then...” statements, and exploits the theory of system optimization and fuzzy implication rules. The form of the fuzzy rules comes with three types of fuzzy inferences: a simplified one that involves conclusions that are fixed numeric values, a linear one where the conclusion part is viewed as a linear function of inputs, and a regression polynomial one as the extended type of the linear one. By the nature of the rule-based fuzzy systems, these fuzzy models are geared toward capturing relationships between information granules. The form of the information granules themselves becomes an important design features of the fuzzy model. Information granulation with the aid of HCM(Hard C-Means) clustering algorithm hell)s determine the initial parameters of rule-based fuzzy model such as the initial apexes of the membership functions and the initial values of polynomial function being used in the Premise and consequence Part of the fuzzy rules. And then the initial Parameters are tuned (adjusted) effectively with the aid of the improved complex method(ICM) and the standard least square method(LSM). In the sequel, the ICM and LSM lead to fine-tuning of the parameters of premise membership functions and consequent polynomial functions in the rules of fuzzy model. An aggregate objective function with a weighting factor is proposed in order to achieve a balance between performance of the fuzzy model. Numerical examples are included to evaluate the performance of the proposed model. They are also contrasted with the performance of the fuzzy models existing in the literature.

머신 러닝 알고리즘을 이용한 COVID-19 Risk 분석 및 Safe Activity 지원 시스템 (COVID-19 Risk Analytics and Safe Activity Assistant Systemwith Machine Learning Algorithms)

  • 전도영;송명호;김수동
    • 인터넷정보학회논문지
    • /
    • 제22권1호
    • /
    • pp.65-77
    • /
    • 2021
  • 최근 COVID-19으로 인하여 전세계적으로 수많은 감염자와 사망자가 발생하였다. 아직까지도 효과적인 COVID-19에 대한 백신의 개발은 성공하지 못한 상태이다. 따라서 사람들은이 질병의 감염에 크게 우려하고 있다. 그간 정부 공공기관이 제공한 감염 정보는 거의 단순한 합산 및 통계 숫자에 불과하다. 따라서, 개인이나 개인이 있는 장소의 구체적인 위험도는 판단하기 어렵다. 본 논문에서는 머신러닝 알고리즘 기반 COVID-19의 위험도 분석과 안전 활동에 대한 정보 제공에 대한 방법을 제안한다. 이 논문은COVID-19 감염 및 사망 위험도와 관련된 포괄적인 메트릭 체계를 제안하고, 이를 통해 개인 및 그룹에 대한 위험도를 정량적으로 제공하는 기법을 제시한다. 제시된 시스템은 개인 및 지역 정보와 특성을 반영한 한 클러스터링 알고리즘 등 효과적인 SW 기법들을 활용한다.

이동 상황에서의 실시간 차선 인식을 통한 무인자동차 제어 - labeling을 사용한 dynamic한 상황에서의 강인한 차선 인식 (Lane detection system for self-driving car)

  • 김현준;류문욱;이석한
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.205-209
    • /
    • 2008
  • 최근 하드웨어의 발달로 영상처리를 사용한 운전자 보조 기능의 차선인식 시스템이 상용화 되고 있다. 하지만 고속도로 주행과 같은 차선이 확실하고 곡률이 완만한 비교적 이상적인 상황에서의 차선인식을 전제로 만들어진 시스템이 많아 시내도로와 같이 상대적으로 곡률이 크고 일부 차선이 확실치 않은 장소에서는 차선인식이 힘들어 무인 자동차 제어에는 적용하기 힘들다. 본 논문은 무인차량의 자동주행을 위해 labeling과 차선예측을 통해 급격한 곡선 차로나 차선이 한쪽만 그려져 있는 경우에도 강인하게 차선인식이 가능한 시스템을 제안한다. 제안된 방법을 이용하여 이상적인 경우가 아닌 급격한 곡선차로가 있거나, 차선이 한쪽만 있는 실제 환경의 경우에서도 차선인식이 가능함을 보였다.

  • PDF