• Title/Summary/Keyword: K-means 알고리즘

검색결과 771건 처리시간 0.029초

색인어 가중치 부여 방법에 따른 K-Means 문서 클러스터링의 LSI 분석 (Latent Semantic Indexing Analysis of K-Means Document Clustering for Changing Index Terms Weighting)

  • 오형진;고지현;안동언;박순철
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.735-742
    • /
    • 2003
  • 정보검색 시스템에서 문서 클러스터링 기술은 사용자 질의에 대해 검색된 문서들을 문서간의 유사도를 기반으로 특정 주제에 따라 재배치하여 놓는 기술로써 사용자에게 검색의 편의성을 제공하고, 그 결과들을 시각적으로 보여줄 수 있다. 본 논문에서는 K-Means 알고리즘을 사용하여 문서를 클러스터링하며 문서를 대표하는 색인어에 가중치를 부여하는 기법에 대하여 논한다. 클러스터링 결과를 시각적으로 보여주기 위하여 문서와 클러스터 중심들을 2차원 공간으로 사상하기 위한 Latent Semantic Indexing 접근 방법을 적용하였다. 실험 결과 문서의 색인어에 대한 가중치 부여 방법을 동일하게 하거나 또는 유사한 수식을 적용한 사례보다는 로컬가중치, 글로벌가중치, 정규화 요소를 모두 부여한 사례에서 문서들이 2차원 벡터 공간에서 군집하여 분포하는 클러스터링 효과가 우수하였다. 특히 로컬 가중치와 글로벌 가중치에 logarithm을 적용하였을 때 문서 분포의 군집도는 현저하게 나타남을 알 수 있었다.

K-MEANS 알고리즘을 이용한 인지 재활 훈련 방법의 개선 (Improvement of Cognitive Rehabilitation Method using K-means Algorithm)

  • 조하연;이혁민;문호상;신성욱;정성택
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.259-268
    • /
    • 2018
  • 본 연구의 목적은 인지기능 훈련 콘텐츠들을 사용하는 동안 사용자들의 흥미와 몰입도를 높이기 위하여 인지 능력 수준에 맞춘 훈련 방법을 제시하는 것이다. 사용자의 인지 능력 수준은 K-means 알고리즘을 적용한 협업 필터링을 사용하여 사용자들의 정보와 한국형 아동 간이 정신 상태 검사 점수를 기반으로 군집화한 결과를 바탕으로 이루어졌다. 이 결과를 구현된 인지기능 훈련 통합 시스템에 적용하여 사용자의 인지 능력 수준에 알맞은 인지기능 훈련 영역 별 콘텐츠 순서와 난이도를 추천하였다. 특히 콘텐츠 난이도 조절은 사용자들이 긴장감과 편안함을 반복적으로 느낄 수 있도록 제안한 '몰입이론' 방법을 적용하여 높은 몰입감을 주고자 하였다. 결론적으로 본 논문에서 제안한 사용자 맞춤형 인지기능 훈련 방법은 기존의 치료사가 콘텐츠 순서와 난이도를 주관적으로 설정하는 것보다 더욱 효과적이고 재활 결과를 기대할 수 있을 것이다.

천연가스 누출 예측을 위한 OrdinalEncoder 기반 DNN (OrdinalEncoder based DNN for Natural Gas Leak Prediction)

  • 홍고르출;이상무;김미혜
    • 한국융합학회논문지
    • /
    • 제10권10호
    • /
    • pp.7-13
    • /
    • 2019
  • 대부분의 천연가스(NG)는 공기 중으로 누출 되며 그중에서도 메탄가스의 누출은 기후에 많은 영향을 준다. 미국 도시의 거리에서 메탄가스 누출 데이터를 수집하였다. 본 논문은 메탄가스누출 정도를 예측하는 딥러닝(Deep Neural Network)방법을 제안하였으며 제안된 방법은 OrdinalEncoder(OE) 기반 K-means clustering과 Multilayer Perceptron(MLP)을 활용하였다. 15개의 특징을 입력뉴런과 오류역전파 알고리즘을 적용하였다. 데이터는 실제 미국의 거리에서 누출되는 메탄가스농도 오픈데이터를 활용하여 진행하였다. 우리는 OE 기반 K-means알고리즘을 적용하여 데이터를 레이블링 하였고 NG누출 예측을 위한 정규화 방법 OE, MinMax, Standard, MaxAbs. Quantile 5가지 방법을 실험하였다. 그 결과 OE 기반 MLP의 인식률이 97.7%, F1-score 96.4%이며 다른 방법보다 상대적으로 높은 인식률을 보였다. 실험은 SPSS 및 Python으로 구현하였으며 실제오픈 데이터를 활용하여 실험하였다.

Modified ISODATA 집단화방법을 이용한 불특정화자 단독어 인식 (Speaker-Independent Isolated Word Recognition Using A Modified ISODATA Method)

  • 황우근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1987년도 학술발표회 논문집
    • /
    • pp.66-69
    • /
    • 1987
  • 본 논문은 불특정화자의 한국어 단독음인식에 관한 연구로써 새로운 집단화 방법인 Modified-ISODATA 집단화방법을 제안한다.본 알고리즘의 목적은 종래의 ISODATA 알고리즘에서 외부 고립점 처리 및 분리과정을 단순화 하고, Lumping 과정을 제거하여 정확하고도 자동화된 집단의 중심점을 찾는 것이다. 본 알고리즘을 적용한 결과, 10명의 남성 화자와 4명의 여성 화자가 발음한 11개의 ltnt자음에 대하여, 최근에 발표된 Modified K-means 방법보다 좋은 인식율을 나타내어, 보다 정확한 집단의 중심점을 찾아 내었음을 입증해보였다.

  • PDF

SOM의 2단계학습을 이용한 항공영상 클러스터링 (Areal Image Clustering using SOM with 2 Phase Learning)

  • 이경희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.995-998
    • /
    • 2013
  • 본 논문에서는 자기 조직화 기능을 갖는 Kohonen의 SOM(Self Organization Map) 신경회로망에 2단계의 학습과정을 활용하여 항공영상에서 물체를 인근의 물체와 효과적으로 구별하기 위한 접근방법을 제안하고 실제의 항공영상에 적용하여 기존의 고전적인 K-means 알고리즘 및 원래의 SOM 알고리즘보다 우수함을 보인다.

  • PDF

Bhattacharyya 커널을 적용한 Centroid Neural Network (Centroid Neural Network with Bhattacharyya Kernel)

  • 이송재;박동철
    • 한국통신학회논문지
    • /
    • 제32권9C호
    • /
    • pp.861-866
    • /
    • 2007
  • 본 논문은 가우시안 확률분포함수 (Gaussian Probability Distribution Function) 데이터 군집화를 위해 중심신경망 (Centroid Neural Network, CNN)에 Bhattacharyya 커널을 적용한 군집화 알고리즘 (Bhattacharyya Kernel based CNN, BK-CNN)을 제안한다. 제안된 BK-CNN은 무감독 알고리즘인 중심신경망을 기반으로 하고 있으며, 커널 방법을 이용하여 데이터를 특징공간에서 투영한다. 입력공간의 비선형 문제를 선형적으로 해결하기 위해 제안한 커널 방법인데, 확률분포 사이의 거리측정을 위해 Bhattacharyya 거리를 이용한 커널방법을 사용하였다. 제안된 BK-CNN을 영상데이터 분류의 문제에 적용했을 때, 제안된 BK-CNN 알고리즘이 Bhattacharyya 커널을 적용한 k-means, 자기조직지도(Self-Organizing Map)와 중심 신경망등의 기존 알고리즘보다 1.7% - 4.3%의 평균 분류정확도 향상을 가져옴을 확인할 수 있었다.

PCA알고리즘을 이용한 최적 pRBFNNs 기반 나이트비전 얼굴인식 시스템 설계 (Design of Optimized pRBFNNs-based Night Vision Face Recognition System Using PCA Algorithm)

  • 오성권;장병희
    • 전자공학회논문지
    • /
    • 제50권1호
    • /
    • pp.225-231
    • /
    • 2013
  • 본 연구에서는 PCA알고리즘을 이용한 최적 pRBFNNs 기반 나이트비전 얼굴인식 시스템을 설계 하고자 한다. 조명이 없는 주위 상태 하에서 조도가 낮기 때문에 CCD 카메라를 이용하여 영상을 획득하는 것이 어렵다. 본 논문에서는 낮은 조도에 의해 왜곡된 이미지의 품질을 나이트 비전 카메라와 히스토그램 평활화를 사용하여 향상시킨다. 그리고 얼굴과 비얼굴 이미지 영역 사이에서 얼굴 이미지를 검출하기 위하여 Ada-Boost 알고리즘을 사용한다. 추출된 고차원 특징 데이터를 저차원의 특징 데이터로 변환하기 위하여 데이터 차원축소 기법인 주성분 분석법(Principal Components Analysis; PCA)을 사용한다. 또한 인식 모듈로서 pRBFNNs(Polynomial- based Radial Basis Function Neural Networks) 패턴분류기를 소개한다. 제안된 다항식 기반 RBFNNs은 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 구성되어 있다. 조건부는 FCM (Fuzzy C-means) 클러스터링을 사용하여 입력공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 그리고 차분진화 (Differential Evolution; DE) 알고리즘을 사용하여 모델의 파라미터를 최적화 한다.

FCM 알고리즘을 이용한 애견 영상에서의 백내장 추출 및 분석 (Cannie Cataract Extraction and Analysis from Pet Image by Using FCM Algorithm)

  • 김민석;최명준;김백천;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.94-96
    • /
    • 2016
  • 본 논문에서는 기존의 백내장 추출 방법을 개선하기 위해 FCM(Fuzzy C_Means) 알고리즘을 적용하여 백내장을 추출하고 분석하는 방법을 제안한다. 제안된 방법은 애견 안구 영상에서 ROI 영역을 추출한다. 추출된 ROI 영역에서 Fuzzy Stretching 기법을 적용하여 픽셀의 상한 값과 하한 값을 조정한다. 퍼지 스트레칭 기법이 적용된 ROI 영역에 Max-Min 기반 평균 이진화 기법을 적용하여 ROI 영역을 이진화한다. 그리고 퍼지 스트레칭 기법이 적용된 ROI 영역에 FCM 알고리즘을 적용하여 양자화한 후에 양자화된 ROI 영역에서 밝기 평균 이진화 기법을 적용하여 이진화한다. 따라서 Max-Min 기반 이진화 기법을 적용하여 이진화된 ROI 영역과 밝기 평균 이진화 기법을 적용하여 이진화된 ROI 영역을 AND 연산을 적용하여 백내장의 후보 영역을 추출한다. 추출된 백내장의 후보 영역에서 침식, 팽창 기법을 적용하여 ROI 영역의 픽셀 크기를 확대 또는 축소하고 타원 형태를 가진 객체 중에서 ROI의 전체 영역의 크기가 1/5보다 적은 객체를 잡음으로 간주하여 제거한다. 잡음이 제거된 백내장의 후보 영역에서 크기가 3/5이상인 영역을 백내장 영역으로 추출한다. 제안된 방법의 성능을 분석하기 위하여 기존의 백내장 추출 방법과 제안된 백내장 추출 방법을 15개의 백내장 영상을 대상으로 실험한 결과, 제안된 방법이 기존의 백내장 추출 방법보다 백내장 추출률이 개선된 것을 확인하였다.

  • PDF

K-means 알고리즘을 사용한 칼라 동영상 링잉 노이즈 감쇄 방법의 개선 (Improvement of Reduction method for Ringing Artifacts in color moving-pictures using K-means algorithm)

  • 김병현;장준영;장원우;최현철;강봉순
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.576-582
    • /
    • 2011
  • 본 논문에서는 CODEC을 사용한 동영상의 손실 압축에 의해 발생하는 블러링 현상과 복원 과정 중 발생하는 링잉 노이즈를 감쇄하기 위한 개선된 선명도 향상 알고리즘을 제안하였다. 기존 알고리즘은 RGB 색 좌표계의 세 가지 칼라 값을 사용하는 연산으로 인해 많은 연산량을 요구한다. 이를 개선하기 위해 YCbCr 색 좌표계 중 휘도 값만을 사용하여 연산하였다. 시뮬레이션을 통해 RGB 칼라 값을 사용하는 기존 알고리즘과 휘도 성분인 Y 칼라 값만을 사용하는 개선된 알고리즘의 성능이 동등함을 확인하였다. 또한 Kodak 표준 이미지를 사용한 연산 처리 속도 측정을 통해서 개선된 알고리즘의 연산 처리 속도가 기존 알고리즘에 비해 약 24% 향상함을 확인하였다.

네트워크 침입 탐지를 위한 최적 특징 선택 알고리즘 (An optimal feature selection algorithm for the network intrusion detection system)

  • 정승현;문준걸;강승호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.342-345
    • /
    • 2014
  • 기계학습을 이용한 네트워크 침입탐지시스템은 선택된 특징 조합에 따라 정확성 및 효율성 측면에서 크게 영향을 받는다. 하지만 일반적으로 사용되는 침입탐지용 특징들로부터 최적의 조합을 찾아내는 일은 많은 계산량을 요구한다. 예를 들어 n개로 구성된 특징들로부터 가능한 특징조합은 $2^n-1$ 개이다. 본 논문에서는 이러한 문제를 해결하기 위한 최적 특징 선택 알고리즘을 제시한다. 제안한 알고리즘은 최적화 문제 해결을 위한 대표적인 메타 휴리스틱 알고리즘인 지역탐색 알고리즘에 기반 한다. 또한 특징 조합을 평가를 위해 선택된 특징 요소와 k-means 군집화 알고리즘을 이용해 구해진 군집화의 정확성을 비용함수로 사용한다. 제안한 특징 선택 알고리즘의 평가를 위해 NSL-KDD 데이터와 인공 신경망을 사용해 특징 모두를 사용한 경우와 비교한다.

  • PDF