• 제목/요약/키워드: K-Means 클러스터링

검색결과 366건 처리시간 0.022초

강인한 움직임 영역 검출과 화재의 효과적인 텍스처 특징을 이용한 화재 감지 방법 (Fire Detection Approach using Robust Moving-Region Detection and Effective Texture Features of Fire)

  • 트룩 뉘엔;강명수;김철홍;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권6호
    • /
    • pp.21-28
    • /
    • 2013
  • 본 논문은 그레이레벨히스토그램을 이용한 움직임 영역검출, 퍼지 클러스터링을 이용한 칼라 분할, 그레이 레벨 동시발생 행렬을 이용한 특징 추출 및 서포터 벡터 머신을 이용한 화재 분류 등과 같은 다중 이종 알고리즘을 포함하고 있는 효과적인 화재 감지 방법을 제안한다. 제안한 방법은 움직임 영역을 검출하기 위해그레이레벨히스토그램에 기초한 최적의 임계값을 결정하고 난 후, CIE LAB 칼라 공간에서 퍼지 클러스터링을 적용하여 칼라 분할을 수행한다. 이러한 두 단계는 화재의 후보 영역을 기술하는데 도움이 된다. 다음으로 그레이 레벨 동시발생 행렬을 이용하여 화재의 특징을 추출하고, 이러한 특징들은 화재인지 아닌지를 분류하기 위해 서포터 벡터 머신의 입력으로 사용된다. 제안한 방법을 평가하기위해 기존의 두 알고리즘과 화재 검출율 및 오류 화재 검출율에서 비교하였다. 모의실험결과, 제안한 방법은 97.94%의 화재 검출율 및 4.63%의 오류 화재 검출율을 보임으로써 기존의 화재 감지 알고리즘보다 우수성을 보였다.

FCM 기반 추정 가속도 보상을 이용한 기동표적 추적기법 설계 (Designing Tracking Method using Compensating Acceleration with FCM for Maneuvering Target)

  • 손현승;박진배;주영훈
    • 전자공학회논문지SC
    • /
    • 제49권3호
    • /
    • pp.82-89
    • /
    • 2012
  • 본 논문에서는 기동표적의 위치오차에서 구해지는 가속도를 보상하는 지능형 추적 알고리즘을 소개한다. 관측치와 예상위치와의 차이값은 가속도와 순수잡음으로 분리된다. 이때, 최적의 가속도를 얻기 위하여 퍼지 c-means 클러스터링 기법과 예상명중위치기법이 이용되었다. 분리된 가속도와 잡음에 대한 퍼지 이론의 멤버쉽 함수를 결정되고, 이에 따라 기동표적의 기동특성이 인식되어진다. 분리된 가속도와 잡음은 추적 알고리즘 내에서 추정된 오차값을 보상하는데 이용된다. 표적의 추정값을 계산하는 일련의 과정중 필터링 과정은 기동표적의 비선형성을 선형성으로 인식하게 된다. 이것은 필터가 위치오차에서 가속도를 추출하여 남겨진 잡음만을 인식하기 때문이다. 필터링 과정 이후 추출된 가속도를 보상하여 표적의 추정값을 구해낸다. 제안된 기법은 퍼지 시스템의 멤버쉽 함수에서 파라미터를 조절하여 적응성과 강인성을 향상 시켰다. 제안된 시스템의 효율성을 극대화하기 위하여 제안된 기법을 다중모델 구조로 형성한다. 또한 제안된 기법은 온라인 시스템으로서의 수행이 가능하다. 마지막으로 제안된 알고리즘의 효율성을 보여주기 위하여 몇 가지 예를 추가하였다.

극치강수량의 시공간적 특성을 이용한 지역빈도분석 (Regionalization of Extreme Rainfall with Spatio-Temporal Pattern)

  • 이정주;권현한;김병식;윤석영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1429-1433
    • /
    • 2010
  • 수공구조물의 설계, 수자원 관리계획의 수립, 재해영향 검토 등을 수행할 때, 재현기간에 따른 확률개념의 강우량, 홍수량, 저수량 등을 산정하여 사용하게 되며, 보통 대상지역의 장기 수문관측 자료를 이용하여 수문사상의 확률분포를 산정한 후 재현기간을 연장하여 원하는 설계빈도에 해당하는 양을 추정하게 된다. 미계측지역 또는 관측자료의 보유기간이 짧은 지역의 경우는 지역빈도 분석 결과를 이용하게 된다. 지역빈도해석을 위해서는 강우자료들의 동질성을 파악하는 것이 가장 기본적인 과정이 되며 이를 위해 통계학적인 범주화분석이 선행되어야 한다. 지점 빈도분석의 수문학적 동질성 판별을 위해 L-moment 방법, K-means 방법에 의한 군집분석 등이 주로 사용되며 관측소 위치좌표를 이용한 공간보간법을 적용하여 시각화하고 있다. 강수량은 시공간적으로 변하는 수문변량으로서 강수량의 시간적인 특성 또한 강수량의 특성을 정의하는데 매우 중요한 요소이다. 이러한 점에서 본 연구를 통해 강수지점의 공간적인 좌표 및 강수량의 양적인 범주화에 초점을 맞춘 기존 지역빈도분석의 범주화 과정에 덧붙여 시간적인 영향을 고려할 수 있는 요소들을 결정하고 이를 활용할 수 있는 범주화 과정을 제시하고자 한다. 즉, 극치강수량의 발생 시기에 대한 정량적인 분석이 가능한 순환통계기법을 이용하여 관측 지점별 시간 통계량을 산정하고, 이를 극치강수량과 결합하여 시 공간적인 특성자료를 생성한 후 이를 이용한 군집화 해석 모형을 개발하는데 연구의 목적이 있다. 분석 과정에 있어서 시간속성의 정량화 및 일반화는 순환통계기법을 사용하였으며, 극치강수량과 발생시점의 속성자료는 각각의 평균과 표준편차를 이용하였다. K-means 알고리즘을 이용해 결합자료를 군집화 하고, L-moment 방법으로 지역화 결과에 대한 검증을 수행하였다. 속성 결합 자료의 군집화 효과는 모의데이터 실험을 통해 확인하였으며, 우리 나라의 58개 기상관측소 자료를 이용하여 분석을 수행하였다. 예비해석 단계에서 100회의 군집분석을 통해 평균적인 centroid를 산정하고, 해당 값을 본 해석의 초기 centroid로 지정하여, 변동적인 클러스터링 경향을 안정화시켜 해석이 반복됨에 따라 군집화 결과가 달라지는 오류를 방지하였다. 또한 K-means 방법으로 계산된 군집별 공간거리 합의 크기에 따라 군집번호를 부여함으로써 군집의 번호순서대로 물리적인 연관성이 인접하도록 설정하였으며, 군집간의 경계선을 추출할 때 발생할 수 있는 오류를 방지하였다. 지역빈도분석 결과는 3차원 Spline 기법으로 도시하였다.

  • PDF

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

K-Means Clustering 기법과 원격탐사 자료를 활용한 탄소기반 글로벌 해양 생태구역 분류 (Classification of Carbon-Based Global Marine Eco-Provinces Using Remote Sensing Data and K-Means Clustering)

  • 김영준;배덕원;임정호;정시훈;추민기;한대현
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.1043-1060
    • /
    • 2023
  • 최근 기후변화의 가속화로 바다에 의한 탄소의 흡수 작용을 칭하는 '블루 카본(blue carbon)'에 대한 관심이 많아지고 있지만, 탄소 순환의 핵심이 되는 해양 생태계에 대한 우리의 이해는 아직 부족한 실정이다. 본 연구는 탄소 순환을 고려한 글로벌 해양 생태 권역(marine eco-province)을 k-means clustering 기법을 활용하여 분류·분석하였다. 지난 20년 간(2001-2020) 위성을 활용하여 생산된 Carbon-based Productivity Model (CbPM) 순 일차 생산량(Net primary production, NPP), particulate inorganic and organic carbon (PIC and POC), 위성 관측과 재분석모델을 결합하여 생산한 해수면 염분(sea surface salinity, SSS) 및 온도(sea surface temperature, SST) 총 다섯가지 자료를 활용하였다. 최적화 과정을 거쳐 총 9개의 생태권역을 도출하였으며, 각 권역의 공간분포와 특성을 분석하였다. 이 중 5개의 권역은 주로 대양의 특성을 반영하고, 4개의 권역은 연안 및 고위도 해역의 특성을 반영하는 것으로 나타났다. 또한, 기존에 알려진 해양 생태 권역과의 정성적 비교를 통하여 탄소순환을 고려한 해양 생태권역의 특징을 상세히 분석하였다. 마지막으로 과거 5년 단위(2001-2005, 2006-2010, 2011-2015, 2016-2020)로 생태 권역의 변화를 분석하였으며, 연안생태계의 빠른 변화와 특히 담수유입으로 인해 생산량이 높고 생태적으로 중요한 권역의 감소를 확인하였다. 이러한 연구 결과는 탄소 순환 및 기후변화를 고려한 해양 생태 권역 분류 및 연안 관리에 대한 중요한 참고자료로 활용 될 수 있으며, 기후 변화에 취약한 지역에 대한 체계적인 관리 지침 개발에 활용될 수 있다.

유전알고리즘을 이용하여 최적화된 방제 자원 배치안의 분포도 분석 (Distribution Analysis of Optimal Equipment Assignment Using a Genetic Algorithm)

  • 김혜진;김용혁
    • 한국융합학회논문지
    • /
    • 제11권4호
    • /
    • pp.11-16
    • /
    • 2020
  • 해양 오염사고를 대비한 계획으로, 최적화된 배치안들을 수집하여 분석하는 연구가 필수적이지만, 해양 오염사고 대응을 위한 최적을 배치안을 다양화하고 분석한 연구는 아직 선행되지 않았다. 이러한 필요성에 따라, 우리는 방제자원 배치 최적화를 위한 유전알고리즘을 고안하고 이를 통해 최적의 방제 자원 배치안을 10,000 개 도출하였다. k-평균 알고리즘으로 군집화한 결과, 예상 최대 유출지역인 여수, 대산, 울산에 대하여 두 개의 군집으로 확연히 구분되었다. 우리는 이러한 군집을 새몬 맵핑을 통해 이차원으로 사영하여 배치안의 분포도를 분석하였고, 군집에 포함되는 배치안들이 그렇지 않은 배치안보다 시뮬레이션의 결과가 우수함을 확인했다. 향후, 본 연구를 기반으로 성능이 우수한 근사모델을 구현하는 것이 가능할 것으로 보인다.

OpenCV를 이용한 안드로이드 플랫폼 기반 꽃 인식 시스템 (Flower Recognition System Using OpenCV on Android Platform)

  • 김강철
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.123-129
    • /
    • 2017
  • 고성능 카메라와 고용량 메모리가 장착된 스마트폰이 출시되어 사람들은 야외나 산에서 촬영한 아름다운 경치, 꽃 등을 SNS에 많이 올리고 있다. 본 논문에서는 이동통신이 원활하지 않은 곳에서도 꽃의 정보를 얻을 수 있는 꽃 인식 시스템을 개발한다. 개발된 시스템은 OpenCV를 기반으로 안드로이드 스마트폰에서 사용할 수 있으며, 기준 꽃등록부와 꽃인식부로 구성된다. 인식처리 시간을 줄이기 위하여 RGB 색채널과 k-평균 클러스터링을 이용한 새로운 색분류방법을 제안하고, 특징 추출을 위하여 ORB, 매칭을 위하여 브루트포스 해밍 알고리즘을 사용한다. 4부류의 12 종류의 꽃에 대하여 60개의 이미지를 기준 DB 설계에 사용하고, 60개의 이미지를 테스트에 사용하였다. 모의 실험 결과 성공률은 83.3%이고, 화웨이 ALEUL100 스마트폰에서 평균인식 시간은 2.58 s 이며, 제안된 시스템은 통신이 되지 않는 곳에서도 휴대용 스마트폰에 적용가능하다는 것을 확인하였다.

머신러닝을 활용한 음원 차트와 뉴미디어 데이터를 활용한 K-POP 아이돌 인기 요인 분석 (Analyzing K-POP idol popularity factors using music charts and new media data using machine learning)

  • 최지원;정다연;최강규;임태인;김대훈;정종균;노승민
    • Journal of Platform Technology
    • /
    • 제12권1호
    • /
    • pp.55-66
    • /
    • 2024
  • K-POP 시장은 문화를 넘어 외교, 환경 운동 등 사회 전반에 미치는 영향력이 지대해지고 있다. 이에 따라 아이돌의 성공 요인을 알아내고자 음원, 음반 등 전통적 데이터를 활용하여 머신러닝 기반으로 다양한 논문들이 수행되고 있다. 하지만, 기존의 선행 연구는 최근 아이돌의 인지도에 미치는 인스타그램 릴스, 유튜브 쇼츠, 틱톡, 트위터 등과 같은 뉴미디어 플랫폼의 영향을 반영하지 못했다는 한계점이 있다. 따라서 기존의 연구로는 매일 변화하는 미디어 트렌드를 고려하지 못하여 최근 아이돌 성공 요인의 인과관계를 뚜렷하게 밝히는데 어려움이 있었다. 이러한 문제점을 해결하기 위해, 본 논문은 아이돌 관련 데이터의 수집 시스템과 분석 방법론을 제안한다. 아이돌 데이터의 특이성을 반영한 컨테이너 기반 실시간 데이터 수집 자동화 시스템을 개발해, 아이돌 데이터 수집의 안정성과 확장성을 확보하고 K-Means 클러스터링 기반 이상치 탐지 모델을 통해 성공 아이돌 군집을 비교, 분석한다. 그 결과, 성별, 앨범 발매 시기 후 성공 시점, 뉴미디어와의 연관성 등 성공 아이돌들의 공통점을 파악할 수 있었다. 이를 통해, 최종적으로 각 아이돌별, 앨범 형태별, 컴백 시기에 따른 최적 컴백 프로모션을 기획해 아이돌의 성공 가능성을 증진할 수 있을 것으로 기대한다.

  • PDF

빠른 클러스터 개수 선정을 통한 효율적인 데이터 클러스터링 방법 (Efficient Data Clustering using Fast Choice for Number of Clusters)

  • 김성수;강범수
    • 산업경영시스템학회지
    • /
    • 제41권2호
    • /
    • pp.1-8
    • /
    • 2018
  • K-means algorithm is one of the most popular and widely used clustering method because it is easy to implement and very efficient. However, this method has the limitation to be used with fixed number of clusters because of only considering the intra-cluster distance to evaluate the data clustering solutions. Silhouette is useful and stable valid index to decide the data clustering solution with number of clusters to consider the intra and inter cluster distance for unsupervised data. However, this valid index has high computational burden because of considering quality measure for each data object. The objective of this paper is to propose the fast and simple speed-up method to overcome this limitation to use silhouette for the effective large-scale data clustering. In the first step, the proposed method calculates and saves the distance for each data once. In the second step, this distance matrix is used to calculate the relative distance rate ($V_j$) of each data j and this rate is used to choose the suitable number of clusters without much computation time. In the third step, the proposed efficient heuristic algorithm (Group search optimization, GSO, in this paper) can search the global optimum with saving computational capacity with good initial solutions using $V_j$ probabilistically for the data clustering. The performance of our proposed method is validated to save significantly computation time against the original silhouette only using Ruspini, Iris, Wine and Breast cancer in UCI machine learning repository datasets by experiment and analysis. Especially, the performance of our proposed method is much better than previous method for the larger size of data.

산업용 CT 볼륨데이터에서 템플릿 매칭을 통한 이물질 자동 검출 (Automatic Detection of Foreign Body through Template Matching in Industrial CT Volume Data)

  • 지혜림;홍헬렌
    • 한국멀티미디어학회논문지
    • /
    • 제16권12호
    • /
    • pp.1376-1384
    • /
    • 2013
  • 본 논문에서는 산업용 CT 볼륨데이터에서 템플릿 매칭을 통하여 제품의 이물질을 자동 검출하는 기법을 제안한다. 제안방법은 다음과 같은 세 단계로 이루어진다. 첫째, 다운 샘플링 데이터에서 잡음제거 후 제품을 배경과 분리하고, 영상의 평균값 및 표준편차를 이용하여 초기 이물질 후보를 추출한 후, K-평균 클러스터링을 이용하여 이물질 후보를 추출한다. 둘째, 템플릿 매칭을 이용하여 제품과 유사도가 다른 이물질을 검출한다. 이 때, 검출하고자 하는 이물질의 크기에 따라 밝기값평균차이(SSD)와 조인트 엔트로피를 이용한 유사도 평가를 통하여 이물질을 검출한다. 셋째, 원 볼륨데이터에서 이물질 검출률을 개선하기 위하여 여과기법으로 제품의 이물질을 최종 검출한다. 본 제안 방법의 결과를 평가하기 위해 산업용 CT 볼륨데이터와 시뮬레이션 데이터를 사용하여 육안평가, 정확성 평가와 수행시간 측정을 수행하였다. 정확성 평가를 위하여 기존 밝기값 기반 검출 기법을 비교방법으로 사용하고, 다이스 계수 유사도를 측정하였다.