• Title/Summary/Keyword: 군집화 기법

검색결과 501건 처리시간 0.027초

붓스트랩 기법과 유전자 알고리즘을 이용한 최적 군집 수 결정 (Determination of Optimal Cluster Size Using Bootstrap and Genetic Algorithm)

  • 박민재;전성해;오경환
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.12-17
    • /
    • 2003
  • 데이터의 군집화를 수행할 때 최적 군집수 결정은 군집 결과의 성능에 많은 영향을 미친다. 특히 K-means 방법에서는 초기 군집수 K에 따라 군집결과의 성능 차이가 많이 나타난다. 하지만 대다수의 군집분석에서 초기 군집수의 결정은 경험을 바탕으로 하여 주관적으로 결정된다. 이때 개체수와 속성수가 증가하면 이러한 결정은 더욱 어려워지며 이때 결정된 군집수가 최적이 된다는 보장도 없다. 본 논문에서는 군집의 수를 자동으로 결정하고 그 결과의 유효성을 보장하기 위해 유전자 알고리즘에 기반한 최적 군집수 결정 방안을 제안한다. 데이터의 속성에 근거한 초기 해 집단이 생성되고, 해 집단 내에서 최적화된 군집수를 찾기 위해 교차 연산이 이루어진다. 적합도 값은 전체 군집화의 비 유사성의 합의 역으로 결정되어 전체적인 군집화 성능이 향상되는 방향으로 수렴된다. 또한 지역 국소값을 해결하기 위해 돌연변이 연산이 사용된다. 그리고 유전자 알고리즘의 학습 시간의 비용을 줄이기 위해 붓스트랩 기법이 적용된다

곤충 발자국 인식을 위한 자동 영역 추출기법 (Automatic Extraction Method for Basic Insect Footprint Segments)

  • 신복숙;우영운;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.275-278
    • /
    • 2007
  • 이 논문에서는 곤충의 발자국을 인식하기 위한 전 단계로서 인식대상이 되는 의미 있는 단위의 발자국 영역을 자동 추출하고자 한다. 인식의 대상이 되는 곤충들은 크기와 종류에 따라 남겨지는 발자국 패턴의 크기 및 간격이 다르게 나타난다. 따라서 이 논문에서는 패턴의 크기와 간격에 관계 없이 인식의 기본 단위가 되는 영역을 추출할 수 있도록 하기위해 개선된 군집화 알고리듬을 제안하였다. 제안한 알고리듬에서는 군집화를 위한 임계값이 군집화의 대상이 되는 모든 패턴들의 거리를 축적한 그래프의 형태에 따라 자동으로 설정되도록 하였다. 이러한 제안된 기법으로 군집화 된 영역은 의미 있는 주변 정보에 의해 곤충 인식에 기본 단계의 세그먼트를 자동 추출하게 된다.

  • PDF

클러스터링을 고려한 다차원척도법의 개선: 군집 지향 척도법 (Improved Multidimensional Scaling Techniques Considering Cluster Analysis: Cluster-oriented Scaling)

  • 이재윤
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.45-70
    • /
    • 2012
  • 개체들 사이의 관계를 저차원 공간에 매핑하는 다차원척도법을 수행하기 위한 다양한 방법과 알고리즘이 개발되어왔다. 그러나 PROXSCAL이나 ALSCAL과 같은 기존의 기법들은 50개 이상의 개체를 포함하는 데이터 집합을 대상으로 개체 간의 관계와 군집 구조를 시각화하는데 있어서 효과적이지 못한 것으로 나타났다. 이 연구에서 제안하는 군집 지향 척도법 CLUSCAL(CLUster-oriented SCALing)은 기존 방법과 달리 입력되는 데이터의 군집 구조를 고려하도록 고안되었다. 50명의 저자동시인용 데이터와 85개 단어의 동시출현 데이터에 대해서 적용해본 결과 제안한 CLUSCAL 기법은 군집 구조를 잘 식별할 수 있는 MDS 지도를 생성하는 유용한 기법임이 확인되었다.

Development of a Method for Analyzing and Visualizing Concept Hierarchies based on Relational Attributes and its Application on Public Open Datasets

  • Hwang, Suk-Hyung
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.13-25
    • /
    • 2021
  • 인터넷과 정보통신, 인공지능기술을 기반으로 하는 디지털 혁신 시대를 맞이하면서 거대한 규모의 데이터집합이 발생, 수집, 축적되어, 다양한 공공기관에서 온라인에 오픈하여 유용한 공공정보를 제공하고 있다. 데이터를 분석하여 유용한 통찰력과 정보를 얻기 위하여, 데이터집합에 내재되어 있는 객체와 속성 사이의 이진 관계를 기반으로 데이터를 분석, 분류, 군집화 및 시각화하는 형식개념분석기법이 성공적으로 사용되어 왔다. 본 논문에서는 형식개념분석기법을 확장하여, 객체의 속성뿐만 아니라 객체들 사이의 관련 관계를 기반으로 데이터집합을 분류하고 개념화하여 가시화하기 위한 기법과 지원도구를 제안한다. 일부 공공 오픈 데이터집합을 대상으로 본 논문의 제안기법을 적용하여 몇 가지 실험을 수행한 결과, 데이터집합으로부터 개념 계층구조를 생성하고 시각화하여 보다 유용한 지식을 추출함으로써 제안기법의 타당성과 유용성을 실증하였다. 본 논문에서 제안한 분석기법은 효과적인 데이터분석, 분류, 군집화, 시각화, 정보검색 등을 위한 유용한 도구로 사용될 수 있다.

비형식의 군집 유효화 지수의 분석과 새로운 지수 개발 (Analysis and New Indices of Cluster Validity Indices in Ratio Type)

  • 김민호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.601-603
    • /
    • 2005
  • 군집 유효화 평가는 군집화 알고리즘을 진정한 의미의 비감독 학습이 가능하도록 만든다는 의미에서 그 중요성이 더해지고 있다. 본 논문에서는 이 군집 유효화 평가에 일반적으로 이용되는 군집 유효화 지수들의 설계원리를 분석하고 기존 지수들의 부합성을 분석한다. 우리는 제 (I) 부에서 합 형식의 지수들을 다루었으며, 본 논문에서는 비 형식의 지수들을 다룬다. 합형식의 CVI에서처럼 저역 필터링의 문제점을 해결하였으며, 또한, 부작용 없이 비형식의 지수들의 성능을 향상시킬 수 있는 새로운 기법을 제시한다. 새로운 지수들의 성능은 실험 학습을 통해 제시된다.

  • PDF

다중 드론 운용 시뮬레이션을 위한 순서 기반 동기화 기법 (Sequence based Synchronization for Multi Drone Operation Simulation)

  • 김덕엽;서강복;이권철;이우진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.1-4
    • /
    • 2019
  • 드론은 여러 센서를 사용할 수 있고 자율적으로 비행 가능하다는 이점 때문에 다양한 분야에 활용할 수 있다. 그러나 단일 드론으로는 수행할 수 있는 작업이나 미션이 제한적이기 때문에 최근에는 다중 드론을 활용한 군집 비행 기술 연구가 활발하게 이루어지고 있다. 드론은 테스트를 통해 동작 검증이 이루어지는데 테스트 비용이 크고 파손의 위험이 있기 때문에 시뮬레이션을 이용한 사전 검증이 먼저 이루어진다. 그런데 다중 드론을 이용한 군집 비행 시뮬레이션의 경우 드론들이 밀집해 있기 때문에 시뮬레이션 중 드론의 충돌사고가 발생할 수 있다. 동기화가 제대로 이루어지지 않은 시뮬레이션은 각 드론 소프트웨어의 정확한 동작을 보장할 수 없기 때문이다. 이러한 문제를 해결하기 위해서 본 논문에서는 순서 기반의 동기화 기법을 제안한다. 제안하는 기법은 기존 동기화 기법과는 달리 순서 기반의 동기화로 시뮬레이션 오버헤드를 줄이며 다중 드론의 군집 비행 시뮬레이션에서 예상하지 못한 드론의 동작을 최소화 할 수 있다.

  • PDF

분산 게이트웨이 환경에서의 K-means Clustering을 이용한 센서 데이터 평준화 기법 (Sensor Data Standardization using K-means Clustering in Distributed-Gateway System)

  • 이태호;임환희;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.195-196
    • /
    • 2018
  • 본 논문에서는 IIoT(Industrial IoT) 환경에서 사용되는 각 종 센서의 특성을 고려하여 K-means clustering을 이용해 측정 주기에 따른 군집화를 통해 평준화함으로써 센서에서 게이트웨이로의 데이터 전송 시 일어날 수 있는 1:1 독점 통신 현상 및 작업부하를 해결 할 수 있는 기법을 제안한다. 본 논문에서는 해당 기법의 효율을 보다 극대화할 수 있는 분산 게이트웨이 환경에서 실험을 진행하였으며, 해당 실험의 결과에 따르면 분산 게이트웨이 시스템에서 사용되는 게이트웨이들의 작업부하가 현저히 낮아졌고 각 종 센서들이 할당되는 빈도수가 일정하게 나타남으로써 신뢰성과 정확성을 확보에 보다 우수함을 보인다.

  • PDF

첨도에 의한 분석성분의 군집성을 고려한 독립성분분석 (Independent Component Analysis for Clustering Analysis Components by Using Kurtosis)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.429-436
    • /
    • 2004
  • 본 논문에서는 침도를 추가한 뉴우턴법과 할선법에 기초한 고정점 알고리즘의 독립성분분석을 각각 제안하였다. 여기서 첨도의 추가는 유사한 속성을 가지는 성분의 군집화된 분석순서를 얻기 위함이고, 고정점 알고리즘은 학습파라미터와 무관한 빠른 성분분석과 우수한 분석성능을 얻기 위함이다. 제안된 두 가지 독립성분분석 각각을 500개 샘플을 가지는 6개의 혼합신호와 $512\times512$ 픽셀을 가지는 10개의 혼합영상 분리에 각각 적용한 결과, 제안된 두 가지 기법은 항상 일정한 분석순서를 유지하여 첨도가 추가되지 않은 기존의 기법들에서 알고리즘의 수행 때마다 랜덤하게 변하는 분석순서의 제약을 해결할 수 있었다. 특히 군집화의 속성을 가진 제안된 독립성분분석들은 신호나 영상의 분류나 식별에도 적용할 수 있다. 한편 할선법의 제안된 기법이 뉴우턴법의 제안된 기법보다 빠르면서도 우수한 분리성능이 있음을 확인하였다.

GHSOM을 이용한 대용량 데이터 처리의 군집화 방법 (A Clustering Method using GHSOM for Processing Large Data)

  • 김만선;이상용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.393-396
    • /
    • 2002
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 실제 응용분야에선 수집된 데이터는 시간이 지날수록 데이터의 양이 늘어나게 되고, 중복되는 속성과 잡음을 갖게 되어 마이닝 기법을 이용하는데 많은 시간과 비용이 소요된다. 또한 어느 속성이 중요한지 알 수 없어 중요한 속성이 중요하지 않은 속성에 의해 왜곡되거나 제대로 분석되지 않을 수 있다. 본 연구는 이러한 문제점들을 해결하기 위해 GHSOM을 이용한 계층적 신경망 군집화 방법을 제안한다. 제안하는 방법은 비리 군집의 개수를 정해줄 필요가 없고, 다양한 레벨의 군집들을 얻을 수 있는 계층적 군집화를 이루어낸다는 장점을 갖는다. 본 논문에서는 신경망 GHSOM의 구조와 특성에 대해 간략히 살펴보고 시스템 처리과정에 대해 설명한다.

  • PDF

사람인식 및 클러스터링 기법을 이용한 군집분석 시스템 (Crowd Analysis System Using Human Recognition and Clustering Techniques)

  • 박태정;박지호;서보윤;신준하;최경환;유홍석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.485-487
    • /
    • 2023
  • 최근 코로나 19 방역지침 해제로 인한 대면적인 활동이 많아지면서 사람에 대한 서비스 제공이 중요한 이슈가 되었다. 하지만 사람들이 밀집되어있는 곳에서는 서비스가 원할하게 이루어지지 않는 경우가 대부분이다. 본 논문에서는 객체인식 알고리즘 기술인 Yolo와 OpenCv를 통해 카메라로 영상 속의 사람들을 인식하여 군집화 기술인 K-means 클러스터링을 이용해서 사람에 대한 군집화를 진행후 우선순위를 선정하고 좌표를 지정하여서 로봇이 군집의 좌표로 이동하여서 사람들에게 직접 접근하여 서비스를 제공할 수 있도록 하였다.

  • PDF