• 제목/요약/키워드: K-Means 클러스터링

검색결과 363건 처리시간 0.023초

다중 물체 추적에서의 모션 히스토그램을 이용한 샘플 생성 기법 (A generating samples method for multiple object tracking using motion histogram)

  • 천기홍;강행봉
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.744-749
    • /
    • 2007
  • 물체 추적시스템은 비디오 감시 시스템, 화상회의 시스템과 같은 다양한 비전 응용 분야에서 점점 비중이 높아지고 있다. 이 시스템에서 가장 널리 사용되고 있는 방법 중 하나로 Particle-Filter를 들 수 있다. 하지만, 이 Particle-Filter의 단점은 유사한 여러 물체를 추적할 때에 그 물체들이 겹치거나 사라질 경우 정확한 추적을 하기 어렵다는 것이다. 이 단점을 극복하기 위해 많은 연구가 진행되고 있으며, 본 논문에서는 이 문제를 극복하기 위한 새로운 방법을 제안하고자 한다. 다중 물체 추적에서 빈번히 일어나는 문제는 두 가지로 요약할 수 있는데, 동일한 다중 물체가 부분적으로 엇갈리거나 다른 객체에 완전히 겹친 후 떨어질 때 한 물체를 중복하여 추적하는 문제(merge and split problem)와 이 때 분리되어 추적은 됐지만, 물체를 혼동하여 추적하는 문제(Labeling problem)이다. 본 논문에서는 이 러한 문제들을 풀기 위해 이미지 필드에서 보다 정확한 확률분포를 만들고, 이 확률분포의 신뢰성을 높이기 위해서 물체의 특징정보를 표현하는 몇 가지 방법을 제안한다. 전자의 문제는 두 가지 문제로 나누어 생각해 보았다. 첫째, 복잡환 환경에서의 분포를 찾아내는 것과 둘째, 추적 중인 물체를 잃어버릴 경우 새로운 샘플을 생성함으로써 나누어 보았다. 이 문제 중 첫번째는 K-means 클러스터링을 이용하여 유사한 물체가 주변에 퍼져 있을 때, 하나의 후보 위치가 아닌, K개의 후보 위치들을 만들어 내어 보다 정확한 추적이 가능하게 하였으며, 두 번째 문제는 추적 중인 물체가 다른 커다란 물체에 가려질 경우이다. 이 상황에서 샘플을 생성하는 방법은 지금까지 해왔던 간단한 환경에서의 생성 범위와는 다르게 넓게 해야 생성시켜야 한다. 이 때 샘플링의 수를 늘리지 않으면서, 최대한 정확하게 추적하기 위해서 동영상에서 물체의 모션을 이용한 모션 히스토그램을 얻어내고, 그 정보를 이용하여 샘플을 생성하는 위치를 조절함으로써 이 문제를 풀어 보았다. 그리고, 후자의 문제인 이미지 필드상에서 확률분포의 신뢰성을 높이기 위한 특징 정보는 기존에 많이 사용하던 칼라 히스토그램에 공간정보의 의미를 부여하는 칼라 히스토그램을 분할하는 방법과 SIFT에서 사용하는 방향정보와 크기정보를 사용했다. 이것들을 사용하여 보다 정확한 물체추적시스템을 다음과 같이 제안한다.

  • PDF

LSI를 이용한 차원 축소 클러스터 기반 키워드 연관망 자동 구축 기법 (Automatic Construction of Reduced Dimensional Cluster-based Keyword Association Networks using LSI)

  • 유한묵;김한준;장재영
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1236-1243
    • /
    • 2017
  • 본 논문은 기존의 TextRank 알고리즘에 상호정보량 척도를 결합하여 군집 기반에서 키워드 추출하는 LSI-based ClusterTextRank 기법과 추출된 키워드를 Latent Semantic Indexing(LSI)을 이용한 연관망 구축 기법을 제안한다. 제안 기법은 문서집합을 단어-문서 행렬로 표현하고, 이를 LSI를 이용하여 저차원의 개념 공간으로 차원을 축소한다. 그 다음 k-means 군집화 알고리즘을 이용하여 여러 군집으로 나누고, 각 군집에 포함된 단어들을 최대신장트리 그래프로 표현한 후 이에 근거한 군집 정보량을 고려하여 키워드를 추출한다. 그리고나서 추출된 키워드들 간에 유사도를 LSI 기법을 통해 구한 단어-개념 행렬을 이용하여 계산한 후, 이를 키워드 연관망으로 활용한다. 제안 기법의 성능을 평가하기 위해 여행 관련 블로그 데이터를 이용하였으며, 제안 기법이 기존 TextRank 알고리즘보다 키워드 추출의 정확도가 약 14% 가량 개선됨을 보인다.

러프 엔트로피를 이용한 범주형 데이터의 클러스터링 (lustering of Categorical Data using Rough Entropy)

  • 박인규
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권5호
    • /
    • pp.183-188
    • /
    • 2013
  • 객체를 분류하기 위하여 유사한 특징을 기반으로 하는 다양한 클러스터해석은 데이터 마이닝에서 필수적이다. 그러나 많은 데이터베이스에 포함되어 있는 범주형 데이터의 경우에 기존의 분할접근방법은 객체간의 불확실성을 처리하는데 한계가 있다. 범주형 데이터의 분할과정에서 식별불가능에 의한 동치류의 불확실성에 대한 접근논리가 러프집합의 대수학적인 논리에만 국한되어서 알고리즘의 안정성과 효율성이 떨어지는 요인으로 작용하고 있다. 본 논문에서는 범주형 데이터에 존재하는 속성의 의존도를 고려하기 위하여 정보이론적인 척도를 기반으로 러프엔트로피를 정의하고 MMMR이라는 알고리즘을 제안하여 분할속성을 추출한다. 제안된 방법의 성능을 분석하고 비교하기 위하여 K-means, 퍼지에 의한 방법과 표준편차를 이용한 기존의 방법과 비교우위를 ZOO데이터에 국한하여 알아본다. ZOO데이터를 이용하여 기존의 범주형 알고리즘과의 비교우위를 살펴보고 제안된 알고리즘의 효율성을 검증한다.

지능형 클러스터링 기법에 기반한 풍력발전 고장 검출 시스템 (A Fault Detection System for Wind Power Generator Based on Intelligent Clustering Method)

  • 문대선;김선국;김성호
    • 제어로봇시스템학회논문지
    • /
    • 제19권1호
    • /
    • pp.27-33
    • /
    • 2013
  • Nowadays, the utilization of renewable energy sources like wind energy is considered one of the most effective means of generating massive amounts of electricity. This is evident in the rapid increase of wind farms all over the world which comprise a huge number of wind turbines. However, the drawback of utilizing wind turbines is that it requires maintenance, which could be a costly operation. To keep the wind turbines in pristine condition so as to reduce downtime, the implementation of CMS (Condition Monitoring System) and FDS (Fault Detection System) is mandatory. The efficiency and accuracy of these systems are crucial in deciding when to carry out a maintenance process. In this paper, a fault detection system based on intelligent clustering method is proposed. Using SCADA data, the clustering model was trained and evaluated for its accuracy through rigorous simulations. Results show that the proposed approach is able to accurately detect the deteriorating condition of a wind turbine as it nears a downtime period.

퍼지 클러스터링 알고리즘 기반의 라벨 병합을 이용한 이동물체 인식 및 추적 (Recognition and Tracking of Moving Objects Using Label-merge Method Based on Fuzzy Clustering Algorithm)

  • 이성민;성일;주영훈
    • 전기학회논문지
    • /
    • 제67권2호
    • /
    • pp.293-300
    • /
    • 2018
  • We propose a moving object extraction and tracking method for improvement of animal identification and tracking technology. First, we propose a method of merging separated moving objects into a moving object by using FCM (Fuzzy C-Means) clustering algorithm to solve the problem of moving object loss caused by moving object extraction process. In addition, we propose a method of extracting data from a moving object and a method of counting moving objects to determine the number of clusters in order to satisfy the conditions for performing FCM clustering algorithm. Then, we propose a method to continuously track merged moving objects. In the proposed method, color histograms are extracted from feature information of each moving object, and the histograms are continuously accumulated so as not to react sensitively to noise or changes, and the average is obtained and stored. Thereafter, when a plurality of moving objects are overlapped and separated, the stored color histogram is compared with each other to correctly recognize each moving object. Finally, we demonstrate the feasibility and applicability of the proposed algorithms through some experiments.

관광객 공유한 사진 및 머신 러닝을 활용한 도시 색채 특성 분석 연구 - 중국 대리시를 대상으로 - (Research on Characterizing Urban Color Analysis based on Tourists-Shared Photos and Machine Learning - Focused on Dali City, China -)

  • 인샤오옌;정태열
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.39-50
    • /
    • 2024
  • 색채는 중요한 시각적 요소로서 도시 이미지와 사람들의 인식 형성에 중요한 영향을 미친다. 도시환경에서 색채를 정량적으로 분석하는 작업은 복잡한 과정을 필요로 하여 과거에는 실행하기가 어려웠다. 그러나 최근 머신 러닝 기술의 급속한 발전으로 관광객이 공유한 사진을 이용하여 도시 색채를 분석하는 것이 가능해졌다. 본 연구는 중국의 인기 관광지인 대리시를 사례로 선정하여 관광객이 공유한 대리시의 사진을 수집하였으며, 머신 러닝 기술을 결합하여 대규모 도시 색채를 측정하는 방법을 탐색하였다. 구체적으로는 먼저 DeepLabv3+ 모델을 사용하여 ADE20k 데이터 셋을 기반으로 관광객이 공유한 사진의 의미 분할을 수행하여 사진에서 인공 요소를 분리했다. 다음으로 K-means 클러스터링 알고리즘을 사용하여 대리시의 인공 요소의 주요 색상을 추출하고, 이러한 색상 간의 상관관계를 분석하기 위해 인접 매트릭스를 구축했다. 연구 결과에 따르면 대리시의 인공 요소의 주요 색상은 주황-회색이 가장 높은 비율을 차지한다. 또한, 회색 계열의 색상이 다른 색상과 자주 조합되어 사용되는 경향이 있다. 분석에 따르면 대리시의 인공 요소의 색채 특성은 지역의 민족 문화와 불교 문화의 영향을 받는 것으로 나타났다. 본 연구는 색채 분석을 위한 새로운 접근 방법을 제공하며, 연구 결과는 대리시가 관광객의 기대에 부합하는 도시 색채 이미지를 형성하는 데 도움이 될 뿐만 아니라 향후 대리시의 색채 계획을 위한 참고 자료를 제공하고자 한다.

소프트웨어 공수 예측의 정확성에 대한 이상치 제거의 영향 분석 (Analyzing Influence of Outlier Elimination on Accuracy of Software Effort Estimation)

  • 서영석;윤경아;배두환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.589-599
    • /
    • 2008
  • 정확한 소프트웨어 공수 예측은 소프트웨어 관련 여러 커뮤니티들에서 예전부터 항상 이슈가 되어 왔다. 소프트웨어 공수 예측의 정확도를 향상시키기 위해 지금까지 많은 연구들에서는 데이타 품질이 공수 예측에 중요한 요소들 중 하나임에도 불구하고 이것에 대한 고려 없이 공수 예측 기법들에만 초점을 맞추어 왔다. 본 연구에서는 소프웨어어 공수 예측 기법과 이상치 제거 기법들 사이의 영향 관계를 공수 예측 정확도의 관점에서 실험적으로 살펴본다. 두 개의 프로젝트 데이타들(ISBSG와 국내의 한 금융 조직으로부터 수집된 데이타)에 대해 일반적으로 많이 사용되는 세 가지 공수 예측 기법(최소제곱법, 신경망 네트워크, 그리고 베이지안 네트워크)과 두 가지 이상치 제거 기법(최소절사제곱법과 K-means 클러스터링)을 적용시켜 결과들을 서로 비교해 보고 이상치 제거 기법을 적용하지 않은 결과와도 비교해 본다.

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition using the Transformed Successive State Splitting and Demi-syllable pair)

  • 김동옥;박노진
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1625-1631
    • /
    • 2005
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, FSN 노드를 두음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 연한 오 인식을 줄이기 위해 인식단위를 반음절쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징레벨에서 K-means 알고리즘(4)으로 클러스터링 하여 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문백종속 음소모델에서 $10.5\%$, 음향모델에서 인식단위를 반음절쌍으로 하였을 경우 문백종속 음소모델에 비해 $12.5\%$, 변형된 연쇄 상태분할을 하였을 경우 $1.5\%$의 인식률을 향상시킬 수 있었다.

사용자 맞춤형 건강정보 추천 앱 구현 (Implementation of App System for Personalized Health Information Recommendation)

  • 박성민;박정수;이윤규;채우준;신문선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.316-318
    • /
    • 2019
  • 최근 고령화사회의 진입으로 건강수명이 이슈가 되고 있으며 삶의 질 향상을 위한 지속적 건강관리에 관심이 높아지고 있다. 본 논문에서는 사용자들의 편리한 건강관리를 위한 사용자 맞춤형 건강정보 추천 앱 시스템을 구현하였다. 사용자는 생활습관, 질병, 신체조건 등의 기본 정보를 입력하고 입력된 사용자의 PHR(Personal Health Record)는 서버에 저장된다. 저장된 다수의 사용자들을 PHR프로파일에 따라 유사한 군집으로 분류하여 유사 사용자들에게 헬스케어 관련 콘텐츠를 제공하고자 하였다. 사용자의 PHR에 따른 유사군집의 생성을 위하여 K-Means 클러스터링을 적용하였으며 지식베이스에 저장된 건강정보 콘텐츠들을 맞춤형으로 제공하기 위하여 개미군집 알고리즘을 사용하였다. 개발된 앱은 사용자의 PHR 프로파일로 분류된 군집에 따라 위험한 질병, 개선해야 할 생활 습관 등에 대한 정보를 제공하여 사용자의 자가 헬스케어에 활용될 수 있다.

  • PDF

오토인코더 기반 수치형 학습데이터의 자동 증강 기법 (Automatic Augmentation Technique of an Autoencoder-based Numerical Training Data)

  • 정주은;김한준;전종훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.75-86
    • /
    • 2022
  • 본 연구는 딥러닝 기반 변분 오토인코더(Variational Autoencoder)를 활용하여 수치형 학습데이터 내 클래스 불균형 문제를 해결하고, 학습데이터를 증강하여 학습모델의 성능을 향상시키고자 한다. 우리는 주어진 테이블 데이터에 대하여 인위적으로 레코드 개수를 늘리기 위해 'D-VAE'을 제안한다. 제안 기법은 최적의 데이터 증강을 지원하기 위해 우선 이산화와 특징선택을 수반한 전처리 과정을 수행한다. 이산화 과정에서 k-means 클러스터링을 적용하여 그룹화한 후, 주어진 데이터가 원-핫 인코딩(one-hot encoding) 기법으로 원-핫 벡터(one-hot vector)로 변환한다. 이후, 특징 선택 기법 중 RFECV 기법을 활용하여 예측에 도움이 되는 변수를 가려내고, 이에 대해서만 변분 오토인코더를 활용하여 새로운 학습데이터를 생성한다. 제안 기법의 성능을 검증하기 위해 4가지 유형의 실험 데이터를 활용하여 데이터 증강 비율별로 그 유효성을 입증한다.