• 제목/요약/키워드: k-means 군집 알고리즘

검색결과 191건 처리시간 0.028초

SPOT/VEGETATION 영상을 이용한 눈과 구름의 분류 알고리즘 (SPOT/VEGETATION-based Algorithm for the Discrimination of Cloud and Snow)

  • 한경수;김영섭
    • 대한원격탐사학회지
    • /
    • 제20권4호
    • /
    • pp.235-244
    • /
    • 2004
  • 본 연구는 SPOT-4 위성의 VEGETATION-1 센서의 가시 채널, 근적외 채널, 단파 적외채널 자료를 이용하여 눈과 구름을 구별하기 위해 새롭게 제시된 알고리즘을 평가하기 위한 것이다. 눈과 구름의 마스크를 위해 전통적으로 이용되고 있는 임계치 방법들은 본 연구에서 좋은 결과를 보여 주지 못하였다 따라서 K-means 군집화 방법이 이러한 임계치 방법 대신 본 연구에서 사용되었다. 군집화에서는 두 임계치 알고리즘을 통합하여 적설과 구름을 그룹화 시켜 동시에 추출한 화소들을 적용하였다. 이것은 전체 영상을 군집화에 적용시킬 때와 비교해 군집화의 과정을 단순화시키고 나아가 정확도를 향상시킬 수 있다. 본 연구는 이러한 과정을 통해 얻어진 결과를 임계치 방법이 적용되었을 때의 결과와 비교함과 동시에 VEGETATION 자료의 분별능력을 평가하였다. 본 연구에서 제시한 방법을 이용하였을 때, 구름과 눈의 분별 능력은 상당히 향상되었다. 분별 오차는 임계치 방법을 사용하였을 때 보다 구름에 대해 19.4% 적설에 대해 9.7% 정도 감소하였다.

약물부작용감시시스템에서 재현성 평가를 통한 마이닝 모델 개발 (Development of Mining model through reproducibility assessment in Adverse drug event surveillance system)

  • 이영호;윤영미;이병문;황희정;강운구
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권3호
    • /
    • pp.183-192
    • /
    • 2009
  • 약물부작용감시시스템 (Adverse drug event surveillance system)은 약물부작용신호를 이용하여 약물의 부작용 여부를 식별하는 시스템이다. 기존의 자발적 보고나 차트리뷰 보다 효율성이 뛰어난 시스템으로 분류할 수 있다. 본 논문에서는 약물부작용감시시스템을 구현하기 위하여 임상데이터마트(GDM)를 구축하였다. 특히, 데이터 품질관리 기법을 적용하여 구축된 CDM에 지식 탐사 기법 중 비교사학습 기법으로 적용하여 모델의 재현성을 평가하여 최적의 약물부작용 군집화 개수(n=4)를 도출하였다. 군집화 개수(n=4)를 이용하여 약물부작용 판별을 위한 K-means, Kohonen, two-step clustering model 알고리즘에 적용하여 분석함으로써 K-means 알고리즘이 가장 우수한 군집 효과를 나타냄을 확인하였다.

AI 군집 알고리즘을 활용한 학업 성취도 데이터 분석 (Analysis of Academic Achievement Data Using AI Cluster Algorithms)

  • 구덕회;정소영
    • 정보교육학회논문지
    • /
    • 제25권6호
    • /
    • pp.1005-1013
    • /
    • 2021
  • 코로나 19가 장기화되면서 기존 학력 격차가 더욱 심화되고 있다. 본 연구의 목적은 담임교사에게 학업 성취도 분석을 통해 학년 및 학급 내 학력 격차 실태를 시각적으로 확인하고, 이를 활용하여 학력 격차를 개선하기 위한 수업 설계 및 방안 탐색에 도움을 주기 위함이다. 학생들의 학년 초 국어, 수학 진단평가 점수 데이터를 K-means 알고리즘을 활용하여 클러스터로 시각화하였으며, 그 결과 유의미한 군집이 형성된 것을 확인했다. 또한, 교사 인터뷰 결과를 통해서 학생의 학습 수준 및 학업 성취 확인, 개별 보충지도 및 수준별 학습과 같은 수업 설계 등 학력 격차 개선에 본 시스템이 유의미한 것으로 확인되었다. 이는 곧, 학업 성취도 데이터 분석 시스템이 학력 격차 개선에 도움이 된다는 것을 의미한다. 본 연구가 담임교사에게 학년 및 학급 내 학력 격차 개선 방안을 탐색하는 데에 실질적인 도움을 제공하며, 궁극적으로 학력 격차 개선에 기여하기를 기대한다.

샘플 군집화를 이용한 개선된 아다부스트 알고리즘 (An Improved AdaBoost Algorithm by Clustering Samples)

  • 백열민;김중근;김회율
    • 방송공학회논문지
    • /
    • 제18권4호
    • /
    • pp.643-646
    • /
    • 2013
  • 본 논문에서는 아다부스트의 과적합 문제를 해결하기 위해 샘플 군집화를 이용한 개선된 아다부스트 알고리즘을 제안한다. 아다부스트는 다양한 객체 검출 방법에서 좋은 성능을 보이는 방법으로 알려져 있지만 훈련 샘플에 노이즈가 존재하는 경우 과적합 현상이 발생하는 문제가 있다. 이를 해결하기 위해 제안하는 방법은 우선 훈련 샘플의 긍정 샘플을 k-평균 군집화 알고리즘을 이용하여 K개의 군집으로 나눈다. 이후 아다부스트의 약분류기 훈련 시 K개의 군집 중 훈련 오차를 최소화하는 하나의 군집만을 선택하여 사용한다. 이로써, 제안하는 방법은 매 회 반복되는 약분류기의 훈련 시 훈련 샘플들이 과분할 되는 것과 노이즈 샘플이 훈련에 사용되는 것을 방지함으로써 기존 아다부스트의 과적합 현상을 효과적으로 줄여준다. 실험 결과, 제안하는 방법은 다양한 실제 데이터셋에서 기존의 부스팅 기반 방법들에 비해 더 나은 분류 성능 및 일반화 성능을 보여주었다.

영역정보기반의 유전자알고리즘을 이용한 텍스트 후보영역 검출 (Detection of Text Candidate Regions using Region Information-based Genetic Algorithm)

  • 오준택;김욱현
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.70-77
    • /
    • 2008
  • 본 논문은 화소 단위의 정보가 아닌 분할된 영역들의 정보를 기반으로 유전자 알고리즘을 이용한 텍스트 후보영역 검출방안을 제안한다. 먼저, 영상분할을 수행하기 위해 색상별 화소분류와 비동질적인 군집의 감소를 위한 영역 단위의 재분류 알고리즘을 수행한다. 색상별 화소분류에 이용되는 EWFCM(Entropy-based Weighted Fuzzy C-Means) 알고리즘은 공간정보를 추가한 개선된 FCM 알고리즘으로써, 잡음에 강건한 특징을 가진다. EWFCM 알고리즘에 의해 분류된 화소들의 군집정보를 기반으로 수행되는 영역 단위의 재분류는 화소나 군집 단위의 재분류에 비해 효과적으로 영상에 존재하는 비동질적인 군집들을 감소시킬 수 있다. 그리고 텍스트 후보영역 검출은 분할된 영역들로부터 추출한 방향성 에지 성분에 대한 분산값 및 에너지, 크기, 개수 등의 정보를 기반으로 유전자알고리즘에 의해 수행된다. 이는 화소 단위의 정보를 이용한 방법보다 더 명확한 텍스트 영역정보를 획득할 수 있으며, 향후 자동문자인식에서 좀 더 손쉽게 이용될 수 있다. 실험 결과 제안한 분할방법은 기존 방법이나 화소나 군집 기반의 재분류보다 좋은 결과를 보였으며, 텍스트 후보영역 검출에서도 화소 단위의 정보를 이용한 기존 방법보다 더 좋은 결과를 보여 제안방법의 유효성을 확인하였다.

상황인식 기반 클러스터링의 적응적 자율 학습 분할 알고리즘 (Context-awareness Clustering with Adaptive Learning Algorithm)

  • 도윤형;정래진;전일규;이강환
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.501-503
    • /
    • 2022
  • 본 논문은 이동 노드간 클러스터링을 함에 있어 보다 효율적인클러스터링을 제공하고 유지하기 위한 딥러닝의 자율학습에 따른 군집적 알고리즘을 제안한다. 대부분의 클러스터링 군집데이터를 처리함에 있어 상호관계에 따른 분류체계가 제공된다. 이러한 경우 새롭게 입력되거나 변경된 데이터가 비교정보에서 오염된 정보로 분류될 경우 기존 분류된 클러스터링으로부터 오염된 정보로 이해되어 군집성을 저하시키는 요인으로 작용 할 수가 있다. 본 논문에서는 이러한 상황정보를 이해하고 클러스터링을 유지할 수 있는 자율학습기반의 학습 모델을 제시 한다.

  • PDF

적응형 정점 군집화를 이용한 메쉬 분할 (A Mesh Partitioning Using Adaptive Vertex Clustering)

  • 김대영;김종원;이혜영
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제15권3호
    • /
    • pp.19-26
    • /
    • 2009
  • 본 논문에서는 분할 축과 평면의 위치를 동적으로 결정하는 적응형 KD 트리 구조를 이용한 정점 군집화(Adaptive Vertex Clustering) 알고리즘과 이를 이용한 새로운 메쉬 분할 방법을 소개하고자 한다. 정점 군집화는 주로 한 개의 거대한 3차원 메쉬를 여러 개의 파티션(Partition)으로 분할하여 효율적으로 처리하고자 할 때 사용되는 기법으로, 옥트리 구조를 이용한 공간 분할 기법과 K-평균 군집화(K-Means Clustering) 방법 등이 있다. 그러나 옥트리 방식은 공간 분할 축과 이에 따른 분할된 공간의 크기가 고정되어 있어서 파티션 메쉬 면의 정렬 상태가 고르지 못하고 포함된 정점의 개수가 균등하지 못한 단점이 있다. 또한, K-평균군집화는 균등한 파티션을 얻을 수 있는 반면 반복처리와 최적화를 위해 많은 시간이 소요된다는 단점이 있다. 본 논문에서는 적응형 정점 군집화를 통해 빠른 시간에 균등한 메쉬 분할을 생성하는 알고리즘을 제안하고자 한다. 본 적응형 KD 트리는 메쉬가 포함된 경계상자(Bounding Box) 공간을 정점의 개수와 분할 축의 크기를 기준으로 계층적으로 분할한다. 그 결과 각 파티션 메쉬는 컴팩트성(compactness)의 특성을 유지하며 균등한 수의 정점을 포함하게 되어 각 파티션의 균등한 처리시간 및 메모리 소요량 등의 장점을 살려 향후 메쉬 간소화 및 압축 등의 다양한 메쉬 처리에 활용될 수 있기를 기대한다. 본 방법을 적용한 3차원 모델의 실험 통계와 분할된 파티션 메쉬의 시각적인 결과도 함께 제시하였다.

  • PDF

영상의 히스토그램 군집화에 의한 영상 대비 향상 (A Image Contrast Enhancement by Clustering of Image Histogram)

  • 홍석근;이기환;조석제
    • 융합신호처리학회논문지
    • /
    • 제10권4호
    • /
    • pp.239-244
    • /
    • 2009
  • 영상 대비 향상은 영상 처리 분야에서 중요한 역할을 한다. 히스토그램 스트레칭이나 히스토그램 균등화 등 기존 대비 향상 기법들과 히스토그램 균등화 기반의 수많은 방법들은 저대비에 소수의 화소들이 넓게 퍼져 있는 영상에 대해서 만족할만한 결과를 내지 못한다. 따라서 본 논문은 군집화 방법에 기반한 새로운 영상 대비 향상 기법을 제안한다. 히스토그램의 군집수는 원영상의 히스토그램을 분석하여 얻을 수 있다. 히스토그램 성분들을 K-means 알고리즘을 이용하여 군집화한다. 그리고 히스토그램 군집 범위와 군집의 화소수 비율을 비교하여 히스토그램 스트레칭과 히스토그램 균등화를 선택적으로 적용한다. 실험 결과로부터 제안한 방법이 기존의 대비 향상 기법들보다 더 효과적임을 확인할 수 있었다.

  • PDF

단어 군집 기반 모바일 애플리케이션 범주화 (Word Cluster-based Mobile Application Categorization)

  • 허정만;박소영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.17-24
    • /
    • 2014
  • 본 논문에서는 단어 군집 정보를 활용하여 모바일 애플리케이션의 범주를 분류하는 방법을 제안한다. 제안하는 방법은 모바일 애플리케이션 설명이 짧을 수 있다는 점을 고려하여, 모바일 애플리케이션 설명에 포함된 단어 정보 뿐만 아니라 각 단어의 단어 군집 대표 정보를 범주화 자질로 활용한다. 그리고, 모바일 애플리케이션의 카테고리가 세분화되어 있으므로, 제안하는 방법은 범주별 단어 발생 빈도를 K 평균 군집화 알고리즘에 적용하여 단어 군집을 생성한다. 모바일 애플리케이션 설명이 설치사양과 같이 범주와 관련없는 내용이 있을 수 있다는 점을 반영하여, 제안하는 방법은 단어 군집 중에서 범주화에 유용한 일부 단어 군집만을 선별하여 활용한다. 실험결과 제안하는 방법은 단어 군집 정보를 활용하여 모바일 애플리케이션 범주화 재현율을 5.65% 개선시켰다.

효율적인 실내 측위를 위한 최적화된 KNN/IFCM 알고리즘 (Optimized KNN/IFCM Algorithm for Efficient Indoor Location)

  • 이장재;송익호;김종화;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권2호
    • /
    • pp.125-133
    • /
    • 2011
  • WLAN 환경하에서 알고리즘 기반의 패턴 매칭을 위해 training 단계에서는 여러 개의 AP에서 신호 잡음비의 특성값을 데이터베이스에 만들어 활용하고 estimation 단계에서는 단말기(MU)의 2차원 좌표값을 단말기로부터 새롭게 얻은 SNR과 데이터베이스에 저장된 fingerprint을 비교함으로써 추정한다. Fingerprinting 방식에서 KNN은 WLAN 기반 실내 측위에 가장 많이 적용되고 있지만 KNN의 성능은 k 개의 이웃 수와 RP의 수에 따라 민감하다. 논문에서는 KNN 성능을 향상시키기 위해 PFCM 군집화를 적용한 KNN과 PFCM을 혼합한 알고리즘을 제안하였다. 제안한 알고리즘은 신호잡음비 데이터를 KNN 방법에 적용하여 k개의 RP을 선택한 후 선택된 RP의 신호잡음비를 PFCM에 적용하여 k개의 RP를 군집하여 분류한다. 실험 결과에서는 위치 오차가 2m 이내에서 KNN/IFCM 알고리즘이 KNN, KNN/FCM, KNN/PFCM 알고리즘보다 성능이 우수하다.