• 제목/요약/키워드: K-means 알고리즘

검색결과 770건 처리시간 0.037초

유전자 알고리즘을 이용한 벡터 양자화 (Vector Quantization using Genetic Algorithm)

  • 임현택
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.197-200
    • /
    • 1998
  • 본 논문에서는 유전자 알고리즘(genetic Algorithm)을 사용하여 벡터 양자화(vector quantization : VQ)를 수행하는 방법을 제안하고자 한다. 벡터 양자화를 수행하여 코드북(codebook)을 생성할 때 생성된 코드북과 학습벡터(training vector)사이에는 반드시 양자화 오차(quantization error)가 발생하는데 기존의 K-means 알고리듬을 사용하여 코드북을 생성했을 경우 양자화 오차를 줄이는데 한계가 있었다. 본 논문에서 제안하는 유전자 알고리즘을 이용한 벡터 양자화는 이 양자화 오차를 감소시키기 위해서 연구되었다. 제안한 방법의 성능을 평가하기 위해 음성데이터를 기존의 K-means 알고리즘에서 클러스터의 중심을 선택하는 방법중의 하나인 Minimax방법으로 코드북을 생성하여 제안한 방법과 양자화 오차를 비교한 결과 양자화 오차가 감소됨을 알 수 있었다.

  • PDF

K-평균 군집화 기반 WSN에서 클러스터 헤드 선택 방법 제안 (Proposal of Cluster Head Election Method in K-means Clustering based WSN)

  • 윤대열;박세영;황치곤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.447-449
    • /
    • 2021
  • 에너지 소비를 최소화하여 네트워크를 오랫동안 유지하기 위해 다양한 무선 센서 네트워크 프로토콜이 제안되었다. K-평균 군집화 알고리즘을 사용하면 최종 군집이 설정될 때까지 중심점을 반복적으로 이동해야 하기 때문에 기존 계층형 알고리즘보다 군집화에 시간이 더 오래 걸린다. K-평균 클러스터링 기반 프로토콜의 경우 클러스터 헤드가 선택되었을 때 클러스터 중심점 근처의 노드 또는 노드의 잔류 에너지만 고려된다. 본 논문에서는 앞서 언급한 문제를 개선하면서 에너지 효율을 개선하기 위해 K-평균 클러스터링을 기반으로 하는 새로운 무선 센서 네트워크 프로토콜을 제안한다.

  • PDF

대용량 위성영상의 무감독 분류를 위한 K-means 군집화 알고리즘의 병렬처리 (Parallel Processing of K-means Clustering Algorithm for Unsupervised Classification of Large Satellite Imagery)

  • 한수희
    • 한국측량학회지
    • /
    • 제35권3호
    • /
    • pp.187-194
    • /
    • 2017
  • 본 연구는 대용량 위성영상의 신속한 무감독 분류를 위해 k-means 군집화 알고리즘을 병렬처리하는 방법을 소개한다. K-means 군집화 알고리즘은 대표적인 무감독분류 알고리즘으로서 주로 감독분류의 전처리 단계로 활용되지만 연산 집약적이고 사용자의 개입이 적어 병렬처리의 효과를 분명하게 나타낼 수 있다. 병렬처리 코드는 OpenMP 기반의 멀티쓰레딩을 이용하여 구현하였다. 실험은 1대의 PC에서 시행하였으며 이 PC의 CPU에는 8개의 멀티코어가 집적되어 있다. 실험 영상으로는 7개 밴드로 구성한 30m 해상도의 LANDSAT 8 OLI 영상과 8개 밴드로 구성한 10m 해상도의 Sentinel-2A 영상을 사용하였다. 각각 10개 군집을 사용하여 순차처리 및 병렬처리를 수행한 결과 병렬처리가 순차처리에 비해 6배 내외의 속도를 나타내었다. 순차처리와 병렬처리 결과의 일치성 평가를 위해 각 군집의 중심값과 분류된 화소의 수를 비교하고 분류 결과 영상간 차분을 수행하였고 결과로 모든 정보가 일치하였다. 본 연구는 병렬처리를 통해 대용량 위성영상의 처리 속도를 상당히 향상시킬 수 있음을 입증하고 있다는 점에서 의미가 있다고 판단된다. 아울러 OpenMP 기반의 멀티쓰레드를 이용하면 비교적 쉽게 병렬처리를 구현할 수 있지만 false sharing의 발생을 억제하도록 코드를 설계하는데 주의를 기울여야 함도 확인할 수 있었다.

FCM을 이용한 역광 이미지의 효율적인 컬러 색상 보정 (Efficiently Color Compensation in Back-Light Image using Fuzzy c-means Clustering Algorithm)

  • 김영탁;유재형;한헌수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2011년도 제43차 동계학술발표논문집 19권1호
    • /
    • pp.37-38
    • /
    • 2011
  • 본 논문은 상대적으로 대비도 차이가 크게 나타나는 역광 이미지에 대해서 Retinex 알고리즘을 적용하여 보정 했을 경우 발생하는 밝은 영역에서의 컬러 성분의 손실을 개선하기 위한 새로운 기법을 제안한다. 역광 이미지의 경우 밝은 영역과 어두운 영역에 대한 밝기 차이가 매우 크게 발생하기 때문에 Retinex 알고리즘을 이용하여 영상의 대비도를 향상시킬 경우 밝은 영역에서의 컬러 성분이 손실되는 현상이 발생한다. 이러한 손실을 보완하기 위해서 원본 영상의 밝은 영역에 해당하는 컬러 성분을 Retinex 알고리즘으로 보정된 영상에 추가해준다. Fuzzy c-means 군집화 알고리즘을 이용하여 원본 영상에서의 밝은 영역과 어두운 영역에 대하여 모든 화소의 소속 정도를 나타내는 퍼지 소속 함수를 구한다. 밝은 영역에 대해서의 컬러 성분은 원본 영상 값에 밝은 영역 퍼지 소속 함수를 적용하고, 어두운 영역에 대해서의 컬러 성분은 Retinex 복원 영상 값에 어두운 영역 퍼지 소속 함수를 이용한다. 제안하는 알고리즘의 성능 평가를 위해 역광 현상이 강하게 나타나는 자연영상들을 대상으로 적용하여 기존의 Retinex 알고리즘(MSRCR) 보다 우수한 성능을 가지고 있음을 보였다.

  • PDF

K-means를 이용한 아파치 스파크 및 맵 리듀스 성능 분석 (Apache Spark and Map Reduce with Performance Analysis using K-Means)

  • 정영교;정동영;송준석;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제53차 동계학술대회논문집 24권1호
    • /
    • pp.77-78
    • /
    • 2016
  • 빅 데이터의 데이터 수집 및 분석 기술에 대한 연구는 컴퓨터 과학 분야에서 각광 받고 있다. 또한 소셜 미디어로 인한 대량의 비정형 데이터 분석을 요구하는 다양한 분야에 접목되어 효용성을 인정받고 있다. 그러나 빅 데이터 개념을 기반으로 하는 하둡과 스파크는 유즈케이스에 따라 성능이 크게 달라진다는 문제점이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 하둡의 맵리듀스를 줄이고 아파치 스파크를 이용한 빅 데이터 분석을 위하여 머신러닝 알고리즘인 K-Means 알고리즘을 이용하여 프로세싱 모델의 성능을 비교한다.

  • PDF

GMM 지원을 위해 k-means 알고리즘을 이용한 어휘 인식 성능 개선 (Vocabulary Recognition Performance Improvement using k-means Algorithm for GMM Support)

  • 이종섭
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.135-140
    • /
    • 2015
  • 일반적인 CHMM 어휘 인식 시스템은 어휘 인식에 대한 모델들의 관측 확률 인식률이 낮고, 일부 단위 음소 모델에만 적용되어 제한적으로 사용되는 문제점이 있다. 또한, 어휘 탐색에서 어휘의 의미가 다양하여 탐색된 어휘가 사용자의 요구에 부합되지 않는 문제점을 가진다. 이러한 문제를 개선하기 위해 GMM(Gaussian Mixture Model)을 이용한 음소인식을 수행하고, 개선된 k-means 알고리즘을 이용하여 어휘 특성에 따른 제한적인 탐색 문제점을 해결하였다. 성능 실험은 기존의 시스템과 비교하여 정확도와 재현율로 대변되는 효과성을 측정하였으며, 성능 실험 결과 정확도는 83%, 재현율은 67%로 나타났다.

4 방향 윤곽선 추적과 K-Means 알고리즘을 이용한 색조 도플러 초음파 영상에서 상환 동맥의 혈류 영역 추출 (Extraction of Blood Flow of Brachial Artery on Color Doppler Ultrasonography by Using 4-Directional Contour Tracking and K-Means Algorithm)

  • 박준성;김광백
    • 한국정보통신학회논문지
    • /
    • 제24권11호
    • /
    • pp.1411-1416
    • /
    • 2020
  • 본 논문에서는 색조 도플러 초음파 영상에서 K-Means 알고리즘을 적용하여 혈류 영역을 추출하는 방법을 제안한다. 제안된 방법에서는 ROI 영역을 추출하고, 추출된 ROI 영역에서 최대 명암도를 임계치로 설정한 이진화 기법을 적용하여 ROI 영역을 이진화한다. 이진화된 ROI 영역에서 4 방향 윤곽선 추적 기법을 적용하여 상완 동맥의 혈류 영역이 존재하는 사다리꼴 형태의 영역을 추출한다. 추출된 사다리꼴 형태의 영역에서 상완동맥의 혈류영역을 정확히 추출하기 위하여 K-Means 기반 양자화 기법을 적용한다. 실험에서 제안 된 방법은 현장 전문가의 검증을 거쳐 30건 중 28건 (93.3%)에서 혈류 영역을 성공적으로 추출하였다. 그리고 제안된 K-Means 기반 혈류 영역 추출 방법을 30개의 색조 도플러 초음파 영상에 적용하여 전문의가 제공한 상완동맥 혈류 영역과 제안된 방법을 비교 분석한 결과, 정확도가 평균적으로 94.27%로 나타났다.

K-means 기반 사물인터넷 서비스 분류 기법 (An Internet of Things (IoT) Service Clustering Method based on K-means Algorithm)

  • 양찬우;조정훈;이대원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.1326-1328
    • /
    • 2017
  • 4차 산업 혁명을 맞이하여 다양한 사물 인터넷(IoT) 서비스가 폭발적으로 등장하고 있다. 현재의 IoT 서비스는 독립 서비스로 제공되는 상황이지만 향후 IoT 서비스는 기존 IoT 서비스의 활용과 결합을 목표로 개발되고 있다. IoT 서비스 간 결합 시 발생할 수 모듈의 중복성 문제를 해결하고 새로운 IoT 서비스의 이식성을 높이기 위해 본 연구에서는 K-means 알고리즘을 활용하여 IoT 서비스 간 유사도를 고려한 IoT 서비스 분류 알고리즘을 제안한다. 실험 및 분석을 통하여 K=8,9인 경우 37개의 상용 IoT 서비스가 효율적이고 적합하게 클러스터됨을 증명하였다.

음악 무드의 변화 기반 유사 음악 검색 기법 (A Music Retrieval Scheme based on Variation of Musical Mood)

  • 전상훈;한병준;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.760-762
    • /
    • 2008
  • 음악에서는 다양한 감정의 표현을 시간에 따른 음악 무드의 전이로 표현한다. 본 연구에서는 Longest Common Subsequence (LCS) 알고리즘 및 k-Means 알고리즘에 기반한 유사 음악 검색 기법을 제안한다. 우선, 음악 무드의 흐름을 무드 세그먼트 단위로 나누고, 이를 추출된 다양한 음악 특성을 k-Means 알고리즘으로 분류하여 무드 시퀀스로 변환한다. 또한, 유사한 무드의 흐름을 가지는 음악을 검색하기 위해 LCS 알고리즘에 기반한 무드 시퀀스의 유사도를 정의한다. 본 논문은 제안된 내용을 바탕으로 실험과 설문 조사를 통해, 기존의 전역적 특성 검색 방식보다 시퀀스를 이용한 검색방식이 좀 더 효율적임을 증명하였다.

TF-IDF를 활용한 k-means 기반의 효율적인 대용량 기사 처리 및 요약 알고리즘 (Article Analytic and Summarizing Algorithm by facilitating TF-IDF based on k-means)

  • 장민서;오수진;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.271-274
    • /
    • 2018
  • 본 논문에서는 뉴스기사 데이터를 활용하여 대규모 뉴스기사를 소주제로 분류하는 군집 분석 방법을 제안한다. 또한, 분류된 뉴스기사를 사용자가 빠르게 이해하고 접할 수 있도록 핵심 문장을 추출하여 제공하는 방법을 제안한다. 분석 데이터는 포털 사이트 점유율 1위인 네이버의 경제 분야 뉴스기사를 크롤링하여 수집한다. 뉴스기사의 분석을 위해 전 처리를 통해 특수문자, 조사, 어미, 구두점 등의 불 용어 처리를 수행한다. 또한, k-means 알고리즘을 이용하여 대용량의 뉴스기사를 주제 별로 분류하는 것을 진행하며 그것을 토대로 핵심 문장을 추출한다. 추출된 핵심 문장은 분류된 뉴스기사의 주제를 나타내며 사용자에게 빠르게 정보를 전달하기 위해 활용한다. 본 논문의 연구 내용이 여러 언론사 사이트에 반영되면 사이트 품질과 사용자 만족도 향상에 기여할 수 있을 것으로 보인다.