• 제목/요약/키워드: 군집화 기법

검색결과 498건 처리시간 0.026초

히스토그램 군집화를 이용한 영상 대비 향상 (A Image Contrast Enhancement Using Clustering of Image Histogram)

  • 홍석근;박준우;강병조;최유나;조석제
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.379-380
    • /
    • 2009
  • 히스토그램 스트레칭이나 히스토그램 균등화 등 기존 대비 향상 기법들과 히스토그램 균등화 기반의 수많은 방법들은 저대비에 소수의 화소들이 넓게 퍼져 있는 영상에 대해서 만족할만한 결과를 내지 못한다. 따라서 본 논문은 군집화 방법을 이용한 새로운 영상 대비 향상 기법을 제안한다. 히스토그램의 군집수는 원영상의 히스토그램을 분석하여 얻을 수 있다. 히스토그램 성분들을 K-means 알고리즘을 이용하여 군집화한다. 그리고 히스토그램 군집 범위와 군집의 화소수 비율을 비교하여 히스토그램 스트레칭과 히스토그램 균등화를 선택적으로 적용한다. 실험 결과로부터 제안한 방법이 기존의 대비 향상 기법들보다 더 효과적임을 확인할 수 있었다.

자율 군집 네트워크에서 군집 탐지 기법 (A Technique of Cluster Detection to Self-Organized Network)

  • 김바울;김경덕;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.115-118
    • /
    • 2012
  • 다양한 네트워크에서 군집을 분석하고 그 구조를 발견하는 것은 그 네트워크의 복잡도를 낮추어 전체 시스템을 이해하고 관리하는데 중요하다. 특히 기본적인 컴퓨팅이 가능한 여러 기기들이 자율적으로 서로 통신하여 군집을 이루는 자율 군집 네트워크에서 군집을 정확하게 발견하는 것은 집단행동 서비스를 실현하는데 있어서 중요한 기술이다. 따라서 본 연구에서는 자율 군집 네트워크에서 군집 탐지 기법을 제안한다. 제안하는 기법은 군집을 발견하고 그 군집을 식별하기 위해 해당 네트워크에서 한 노드를 공유하는 두 개의 간선 쌍에 대해 계층 군집화를 수행하고 계층 간에 간선 유사도를 계산하여 비교한다. 계층 군집화를 통한 간선들은 트리 구조로 표현할 수 있으며 최적의 분할 밀도를 이용하여 노드들을 클러스터링한 후 최종 군집으로 분리 한다.

온톨로지 개념 합병 기반 문서 군집화 기법 (Text Clustering Algorithm Based on Ontology Concepts Combination)

  • 관향동;김우생
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.722-724
    • /
    • 2012
  • 문서 군집화를 통하여 문서를 효율적으로 조직, 관리, 검색 할 수 있다. 일반적으로 문서 군집화는 많은 단어와 개념들을 포함하고 있기 때문에 차원이 큰 벡터 공간 모델에서 군집화를 수행한다. 본 논문에서 문서 집합에 대응하는 온톨로지를 이용하여 문서 벡터 공간의 차원을 줄여 효율적으로 군집화하는 방법을 제안하고, 실험을 통하여 기존 방법보다 우수함을 보인다.

  • PDF

DNA Chip 데이터의 군집화 성능 향상을 위한 Particle Swarm Optimization 알고리즘의 적용기법 (Applying Particle Swarm Optimization for Enhanced Clustering of DNA Chip Data)

  • 이민수
    • 정보처리학회논문지D
    • /
    • 제17D권3호
    • /
    • pp.175-184
    • /
    • 2010
  • 최근 DNA 칩의 등장으로 유전자 관련 실험과 연구가 매우 용이해졌으며 이를 활용한 다양한 실험 결과로 대량의 데이터가 제공되고 있다. DNA칩에 의해 제공된 데이터는 2차원 행렬로 표현되며 하나의 축은 유전자를 나타내고 다른 하나의 축은 샘플정보를 나타낸다. 이러한 데이터에 대하여 빠른 시간 안에 좋은 품질의 군집화를 수행함으로써 이후의 분석 단계인 분류화 작업의 정확도와 효율성을 높일 수 있다. 본 논문에서는 생태계 모방 알고리즘의 하나인 Particle Swarm Optimization 알고리즘을 사용하여 방대한 양의 DNA칩 데이터에 대한 효율적인 군집화 기법을 제안하였으며 실험을 통해서 PSO 기반의 군집화 알고리즘이 기존의 군집화 알고리즘들보다 수행속도 및 품질 면에서 우수한 성능을 가짐을 보였다.

개선된 FCM 알고리즘을 이용한 한방의 질병 분류 시스템 (Disease Classification System of Oriental Medicine using Enhanced FCM Algorithm)

  • 장수재;최경열;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 춘계학술대회
    • /
    • pp.93-96
    • /
    • 2011
  • 본 논문에서는 개선된 FCM 알고리즘을 적용하여 통계청에서 제공하는 한국 표준 질병 사인 분류표(K.C.D)를 기초로 질병을 분류한 후, 질병을 도출하고 애매한 증상의 차이의 정도를 퍼지 추론기법을 사용하여 정확한 질병 상세를 도출할 수 있는 한방 질병 분류 시스템을 제시한다. 기존의 FCM 알고리즘은 입력 벡터들과 각 군집 중심과의 거리를 이용하여 측정된 유사도에 기초한 목적 함수의 최적화 방식을 사용한다. 하지만 측정된 패턴과 군집 공간상의 패턴들의 분포에 따라 바람직하지 못한 군집화 결과를 보일 수 있다. 따라서 본 논문에서는 군집들의 대칭성 측도에 퍼지 이론을 적용하여 기존의 FCM 알고리즘으로 군집화 한 결과를 재 군집화 하여 군집화의 정확성을 개선시킨 후, 증상의 차이를 구분하기 위해서 애매한 증상의 정도를 퍼지 추론 방법을 적용하여 정확한 질병 상세를 도출할 수 있는 방법을 제시한다. 본 논문에서는 개선된 FCM 알고리즘을 적용하여 질병을 분류한 후, 퍼지 제어 기법으로 질병을 추출함으로써 기존의 한방 자가진단 시스템 보다 정확하게 질병을 도출한 것을 확인하였다.

  • PDF

텍스트 데이터의 정보 손실을 방지하기 위한 군집화 기반 언더샘플링 기법 (A Clustering-based Undersampling Method to Prevent Information Loss from Text Data)

  • 김종휘;신사임;장진예
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.251-256
    • /
    • 2022
  • 범주 불균형은 분류 모델이 다수 범주에 편향되게 학습되어 소수 범주에 대한 분류 성능을 떨어뜨리는 문제를 야기한다. 언더 샘플링 기법은 다수 범주 데이터의 수를 줄여 소수 범주와 균형을 이루게하는 대표적인 불균형 해결 방법으로, 텍스트 도메인에서의 기존 언더 샘플링 연구에서는 단어 임베딩과 랜덤 샘플링과 같은 비교적 간단한 기법만이 적용되었다. 본 논문에서는 트랜스포머 기반 문장 임베딩과 군집화 기반 샘플링 방법을 통해 텍스트 데이터의 정보 손실을 최소화하는 언더샘플링 방법을 제안한다. 제안 방법의 검증을 위해, 감성 분석 실험에서 제안 방법과 랜덤 샘플링으로 추출한 훈련 세트로 모델을 학습하고 성능을 비교 평가하였다. 제안 방법을 활용한 모델이 랜덤 샘플링을 활용한 모델에 비해 적게는 0.2%, 많게는 2.0% 높은 분류 정확도를 보였고, 이를 통해 제안하는 군집화 기반 언더 샘플링 기법의 효과를 확인하였다.

  • PDF

자기 조직화 지도 모형을 이용한 인종별 얼굴 영상 군집화 기법 (Face Data Clustering Method for Face Recognition Using Self Organizing Feature Map)

  • 권혜련;고병철;변혜란;이일병
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.577-579
    • /
    • 2003
  • 본 논문에서는 생체인식 분야 중 얼굴인식의 검색 정확성 향상 및 검색 시간을 단축하기 위한 단계로 인종별 얼굴영상 데이터베이스에 대한 군집화 기법을 연구하였다. 우선, 일반적으로 얼굴 및 이미지 검색에 사용되는 다양한 특징을 추출하고, 추출한 다차원의 특징 데이터들로부터 다 인종 얼굴 데이터를 유사한 인종별로 정확하게 군집화 하기 위해 최적의 특징벡터를 자동으로 선택 할 수 있는 방법을 제안하였다. 군집결과 분석을 위해 자기 조직화 지도 모형을 이용하였는데, 이는 2차원 분석 및 가시화에 유용하며, 학습 후 코드북벡터를 사용하여 유사한 의미간의 거리부터 검색할 수 있는 특징을 가지고 있다. 특징추출에 관한 실험결과 인종별 구분을 위한 특징벡터로는 웨이블릿 주파수 성분(lowpass 성분)과 CbCr 특징벡터가 인종별 군집화에 가장 유용한 특징으로 선택되었으며. 추출된 특징을 바탕으로 semantic map을 구성하여 제안방법의 효율성을 제시하였다.

  • PDF

시계열자료의 효율적 군집분석을 위한 구간특징화와 계층적 베이지안 기법의 융합 (A Fusion of the Period Characterized and Hierarchical Bayesian Techniques for Efficient Cluster Analysis of Time Series Data)

  • 정영애;전진호
    • 디지털융복합연구
    • /
    • 제13권7호
    • /
    • pp.169-175
    • /
    • 2015
  • 주가지표처럼 동적이며 시간흐름을 따르는 시계열자료들을 이해하는 효과적인 방법은 주어진 시계열자료들에 대하여 모델을 결정함으로서 이해하는 것이 좋다. 주어진 자료들에 대한 모델 결정과정은 수집되어진 대용량 시계열자료 전체를 한 번에 다 살펴보는 것보다 자료를 특정의 중요한 몇 개의 하위그룹으로 군집화하여 각 군집별 모델결정을 통해 자료 전체를 이해하는 것이 효율적이다. 본 연구에서는 주어진 시계열자료들에 대하여 하위그룹으로의 효율적 군집화 과정 그리고 각 군집별 모델결정의 두 과정 중 첫 번째 과정인 하위집단으로 군집화 과정에 자료의 구간특징화 기법과 휴리스틱 베이지안기법의 융합을 이용하여 시간 및 계산비용을 감소시킬 수 있는 기법을 제안하였으며 실제적인 주가지표를 이용한 실험을 통해 제안하는 기법의 유효성을 확인하였다.

인자 점수를 이용한 이상치 데이터의 군집화 (Outlier Data Clustering using Factor Score)

  • 전성해;임민택;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.77-80
    • /
    • 2002
  • 이상치를 포함한 학습 데이터의 군집화 전략은 일반적으로 이상치를 포함하여 학습하거나, 이상치를 제거하는 두 가지 선택이 가능하다. 이상치를 제거하지 않고 학습에 반영시켜야 할 경우 한 개 또는 소수의 이상치가 독자적인 군집을 형성하거나 객관적인 군집화를 방해하는 문제가 발생할 수 있다. 이 때 주어진 학습 데이터의 군집 결과가 이상치의 영향으로부터 벗어나기 위해 원래의 학습 데이터에 대한 변환 작업을 거친 후 군집화를 수행할 수 있다. 이러한 변환 방법으로서 본 논문에서는 차원 축소의 기법으로 알려진 인자 분석의 점수를 사용하였다. 인자 점수로 변환된 학습 데이터에 대해 계층적 군집화, K-means 그리고 자기조직화 지도 등과 같은 군집화 알고리즘을 적용하면 이상치가 자신만의 군집을 별도로 형성하지 않고 다른 학습 데이터의 군집에 소속되면서 이상회의 영향으로부터 벗어남을 실험을 통하여 확인하였다.

  • PDF

통계적 학습이론을 이용한 최적 군집화 (An Optimal Clustering Using Statistical Learning Theory)

  • 최준혁;전성해;오경환
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 추계학술대회 학술발표 논문집 제15권 제2호
    • /
    • pp.229-233
    • /
    • 2005
  • 모집단의 최적군집 수를 자동으로 결정하고 군집내의 분산은 최소로 하고 군집 간의 분산은 최대로 하는 최적 군집화에 대한 연구는 대부분의 지능형 시스템에서 필요로 하는 모형전략이다. 하지만 아직도 대부분의 군집화 과정에서 분석가의 주관적인 경험에 의존하여 군집수가 결정되어 군집화가 이루어지고 있다. 예를 들어 K-평균 군집화 알고리즘에서도 초기에 K 값을 결정해 주어야 한다. 모집단을 제대로 대표하지 못한 K 값에 의한 군집화 결과는 심각한 오류를 범하게 된다. 본 논문에서는 통계적 학습이론을 이용하여 이러한 문제점을 해결하려고 하였다. VC-차원에 의한 Support Vector를 이용하여 최적의 군집화 기법을 제안하였다. 제안 방법의 성능 평가를 위하여 UCI 기계학습 데이터를 이용하여 객관적인 실험을 수행하였다.

  • PDF