• 제목/요약/키워드: 신경망 클러스터링

검색결과 85건 처리시간 0.027초

GLVQ클러스터링을 위한 필기체 숫자의 효율적인 특징 추출 방법 (The Efficient Feature Extraction of Handwritten Numerals in GLVQ Clustering Network)

  • 전종원;민준영
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.995-1001
    • /
    • 1995
  • 패턴인식은 전처리, 특징추출, 식별의 과정을 거쳐 인식을 하게된다. 식별과정 에서 여러개의 패턴이 흩어져 있을 경우에 유사한 패턴끼리 클러스터링을 위하여 한 카테고리 내에서 패턴을 분할하게 된다. 클러스터링 방법에는 통계적인 방법으로 k-means 방법, ISODATA알고리즘등이 있으며〔1〕, 최근에는 신경망에 의한 클러스터링 방법으로 T, Kohonen의 LVQ(Learning Vector Quantization)가 주로 이용되었다〔6〕. Nikhil R, Pal. et al은 LVQ알고리즘을 보다 개선한 방법으로 GLVQ(Generalized LVQ, 1993)를 제안하였다〔4〕.본 논문은 GLVQ 알고니즘으로 패턴을 클러스터링 할 경우에 효율적인 특징추출 방법을 제안한다. 본 논문에서는 20명의 필기체 숫자 0에서 9까지 의 200개 패턴을 여러 가지 방법으로 특징 추출하여 GLVQ알고리즘으로 10개(0-9의 패턴) 의 클러스터로 구분하고, 해당 클러스터에서 오분류되는 패턴의 비율로서 그 효율성을 비교 하였다. 그 결과 투영조합 방법을 이용하였을 경우 98.5%의 분류율을 나타내었다.

  • PDF

경계변수 값의 동적인 변경을 이용한 점층적 클러스터링 알고리즘 (Incremental Clustering Algorithm by Modulating Vigilance Parameter Dynamically)

  • 신광철;한상용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1072-1079
    • /
    • 2003
  • 본 논문은 점층적으로 대규모 문서 분류를 할 수 있는 새로운 클러스터링 알고리즘에 대한 것으로, 고차원의 대규모 문서 집합에 대한 클러스터링을 수행하는 spherical k-means (SKM) 알고리즘과 점층적인 방식으로 클러스터링을 수행하는 퍼지(fuzzy) ART(adaptive resonance theory) 신경망의 특징을 이용하였다. 즉, SKM의 벡터 공간 모델과 개념벡터를 토대로 퍼지 ART의 경계변수의 개념을 결합한 것이다. 제시하는 알고리즘은 점층적 클러스터링의 지원과 함께 최적의 클러스터 수를 자동으로 결정할 뿐 아니라 이상치(outlier)와 노이즈(noise)에 의한 overfitting의 문제도 해결하였다. 또한 생성된 클러스터들의 질을 평가할 수 있는 응집도를 측정하는 목적 함수의 값에 있어서도 CLASSIC3 데이타 집합으로 실험한 결과 기존의 SKM에 비해 평균 8.04%의 향상된 응집도를 나타냈다.

스킵연결이 적용된 오토인코더 모델의 클러스터링 성능 분석 (Clustering Performance Analysis of Autoencoder with Skip Connection)

  • 조인수;강윤희;최동빈;박용범
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권12호
    • /
    • pp.403-410
    • /
    • 2020
  • 오토인코더의 데이터 복원(Output result) 기능을 이용한 노이즈 제거 및 초해상도와 같은 연구가 진행되는 가운데 오토인코더의 차원 축소 기능을 이용한 클러스터링의 성능 향상에 대한 연구도 활발히 진행되고 있다. 오토인코더를 이용한 클러스터링 기능과 데이터 복원 기능은 모두 동일한 학습을 통해 성능을 향상시킨다는 공통점이 있다. 본 논문은 이런 특징을 토대로, 데이터 복원 성능이 뛰어나도록 설계된 오토인코더 모델이 클러스터링 성능 또한 뛰어난지 알아보기 위한 실험을 진행했다. 데이터 복원 성능이 뛰어난 오토인코더를 설계하기 위해서 스킵연결(Skip connection) 기법을 사용했다. 스킵연결 기법은 기울기 소실(Vanishing gradient)현상을 해소해주고 모델의 학습 효율을 높인다는 장점을 가지고 있을 뿐만 아니라, 데이터 복원 시 손실된 정보를 보완해 줌으로써 데이터 복원 성능을 높이는 효과도 가지고 있다. 스킵연결이 적용된 오토인코더 모델과 적용되지 않은 모델의 데이터 복원 성능과 클러스터링 성능을 그래프와 시각적 추출물을 통해 결과를 비교해 보니, 데이터 복원 성능은 올랐지만 클러스터링 성능은 떨어지는 결과를 확인했다. 이 결과는 오토인코더와 같은 신경망 모델이 출력된 결과 성능이 좋다고 해서 각 레이어들이 데이터의 특징을 모두 잘 학습했다고 확신할 수 없음을 알려준다. 마지막으로 클러스터링의 성능을 좌우하는 잠재변수(latent code)와 스킵연결의 관계를 분석하여 실험 결과의 원인에 대해 파악하였고, 파악한 결과를 통해 잠재변수와 스킵연결의 특징정보를 이용해 클러스터링의 성능저하 현상을 보완할 수 있다는 사실을 보였다. 이 연구는 한자 유니코드 문제를 클러스터링 기법을 이용해 해결하고자 클러스터링 성능 향상을 위한 선행연구이다.

차분 진화알고리즘 기반 다중 출력 방사형 기저 함수 다항식 신경 회로망 구조 설계 (Structural Design of Differential Evolution-based Multi Output Radial Basis Funtion Polynomial Neural Networks)

  • 김욱동;마창민;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.1964-1965
    • /
    • 2011
  • 본 연구에서는 패턴분류를 위해 기존의 방사형 기저 함수 신경회로망(Radial Basis Funtion Neural Network)과 다항식 신경회로망(Polynomial Neural Network)을 결합한 다중 출력 방사형 기저 함수다항식 신경회로망 (Multi Output Radial Basis Funtion Polynomial Neural Network)의 분류기를 제안한다. 제안된 모델은 PNN을 기본 구조로 하여 1층에 기존의 다항식 노드 대신 다중 출력 형태의 RBFNN을 적용 한다. RBFNN의 은닉층에는 기존의 활성함수가 아닌 fuzzy 클러스터링을 사용하여 입력 데이터의 특성을 고려한 적합도를 사용하였다. PNN은 입력변수의 수와 다항식 차수가 모델의 성능을 결정함으로 최적화가 필요하며 본 논문에서는 Differential Evolution(DE)을 사용하여 모델의 구조 및 파라미터를 최적화시켜 모델의 성능을 향상시켰다. 패턴분류기로써의 제안된 모델을 평가하기 위해 pima 데이터를 이용하였다.

  • PDF

모폴로지와 ART2를 이용한 번호판 위치 검출 및 문자 세그멘테이션에 관한 연구 (A Study of Car Plate Extraction and Segmentation using Morphology and ART2)

  • 강동구;김도현;최선아;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.328-330
    • /
    • 2001
  • 컴퓨터 비전을 이용한 자동차 번호판 인식은 자동차에 특별한 장치가 필요없어 비용면에서 유리하다. 자동차 번호판을 인식하기 위해서는 번호판의 영역을 추출한 후 번호판에서 문자와 숫자 영역을 분리하고 그 세그먼트를 신경 회로망 혹은 다른 방법을 통하여 인식한다. 본 논문은 자동차 번호판 위치 검출 방법과 세그멘테이션 방법에 대하여 제안한다. 자동차 번호판 위치 검출을 위하여 모폴로지 기법과 ART2 클러스터링 방법을 이용하였고 검출한 번호판 영역에서 세그멘테이션은 모폴로지 연산을 이용한 이진화와 레이블링을 이용한다.

  • PDF

신경망과 k-means 클러스터링을 이용한 사용자의 퍼지값 선호도 학습 방법 (A method for learning users' preference on fuzzy values using neural networks and k-means clustering)

  • 윤태복;나현종;박두경;이지형
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.716-720
    • /
    • 2006
  • 퍼지 이론을 이용하면 여러 정보를 통합 요약하기에 수월하여, 웹 상에서 사용자에게 제공할 정보를 가공하는 방법으로 많이 사용되고 있다. 하지만 퍼지의 애매모호한 특성 때문에 사용자에게 맞게 퍼지 집합으로 표현된 같은 정보라 하여도 사용자마다 자신의 퍼지값 선호도에 따라 다른 선택을 할 수 있다. 따라서 애매한 퍼지값을 선택함에 있어 사용자의 퍼지값에 대한 선호도를 반영할 필요가 있다. 그러나 기존의 방법들은 정해진 기준을 획일적으로 적용하여, 사용자의 개인적인 선택 기준을 반영하지 못하는 문제가 있다. 본 논문에서는 사용자의 선호도를 학습하여, 사용자의 선호도에 맞는 정보를 선택하는 방법을 제안한다. 사용자의 선호도를 학습하기 위해서 학습 데이터가 필요한데, 이 데이터는 사용자에게 직접 물어 사용자의 선호도론 얻는데 사용된다. 이때, 사용자에게 너무 많은 데이터로 질문을 한다면, 사용자에게 부담을 줄 수 있고, 또 너무 적은 데이터를 사용한다면, 학습을 잘 못하는 경향이 생길 수 있다. 이러한 문제에 대처하기 위해서 10개 정도의 데이터를 이용하여 사용자의 선호도를 학습하는 방법을 제안한다. 제안하는 방법은 먼저 두 퍼지값이 서로 겹칠 수 있는 모든 경우의 상대적 위치를 조사한 후 클러스터링을 이용하여 몇 가지 그룹으로 나누고, 나누어진 그룹을 이용하여 학습하였다. 이렇게 학습된 모델은 새로운 애매하게 겹치는 퍼지값에 대해 사용자를 대신해 어느 것을 어느 정도 선호하는지 추론하게 된다.

뉴스 클러스터링 개선을 위한 문서 임베딩 및 이미지 분석 자질의 활용 (Document Embedding and Image Content Analysis for Improving News Clustering System)

  • 김시연;김상범
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.104-108
    • /
    • 2015
  • 많은 양의 뉴스가 생성됨에 따라 이를 효과적으로 정리하는 기법이 최근 활발히 연구되어왔다. 그 중 뉴스클러스터링은 두 뉴스가 동일사건을 다루는지를 판정하는 분류기의 성능에 의존적인데, 대부분의 경우 BoW(Bag-of-Words)기반 벡터유사도를 사용하고 있다. 본 논문에서는 BoW기반의 벡터유사도 뿐 아니라 두 문서에 포함된 사진들의 유사성 및 주제의 관련성을 측정, 이를 분류기의 자질로 추가하여 두 뉴스가 동일사건을 다루는지 판정하는 분류기의 성능을 개선하는 방법을 제안한다. 사진들의 유사성 및 주제의 관련성은 최근 각광을 받는 딥러닝기반 CNN과 신경망기반 문서임베딩을 통해 측정하였다. 실험결과 기존의 BoW기반 벡터유사도에 의한 분류기의 성능에 비해 제안하는 두 자질을 사용하였을 경우 3.4%의 성능 향상을 보여주었다.

  • PDF

효과적인 패턴분류를 위한 개선된 FCM 기반 하이브리드 네트워크 (Enhanced FCM Based Hybrid Network for Effective Pattern Classification)

  • 김태형;차의영;김광백
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.35-40
    • /
    • 2009
  • FCM 알고리즘은 입력 벡터와 각 클러스터의 유클리드 거리를 이용하여 구해진 소속도만를 비교하여 데이터를 분류하기 때문에 클러스터링 된 공간에서의 데이터들의 분포에 따라 바람직하지 못한 클러스터링 결과를 보일 수 있다. 이러한 문제점을 개선하기 위해 대칭적 성질을 이용하는 대칭성 측도에 퍼지 이론을 적용하여 군집간의 거리에 따른 변화와 군집 중심의 위치, 그리고 군집 형태에 따라 영향을 덜 받는 개선된 FCM이 제안되었다. 본 논문에서는 효과적으로 패턴을 분류하기 위해 개선된 FCM 알고리즘을 적용한 개선된 하이브리드 네트워크를 제안한다. 제안된 하이브리드 네트워크는 개선된 FCM 알고리즘을 입력층과 중간층의 학습구조 적용하고 중간층과 출력층의 학습구조는 일반화된 델타학습법을 적용한다. 제안된 방법의 인식성능을 평가하기 위해 2차원 좌표평면 상의 데이터를 기존의 Max_Min 신경망을 이용한 FCM 기반 RBF 네트워크와 FCM 기반 RBF 네트워크, HCM 기반 네트워크와 제안된 방법 간의 학습 및 인식 성능을 비교 및 분석하였다.

  • PDF

SOFM 신경회로망을 이용한 한국어 음소 인식 (Korean Phoneme Recognition Using Self-Organizing Feature Map)

  • 전용구;양진우;김순협
    • 한국음향학회지
    • /
    • 제14권2호
    • /
    • pp.101-112
    • /
    • 1995
  • 본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 클러스터러(clusterer)로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사상(local topographical mapping)에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해 먼저, 인식 대상음소는 모음군 17개, 자음의 경우 파열음9개, 마찰음 3개, 파찰음 3개, 유음 및 비음 4개, 음소의 성질이 다른 종성 7개의 음소군으로 모두 43개의 음소를 대상으로 실험하였으며, 각 음소군에 대한 특징 지도를 구성하여 레이블러(labeler)의 기능을 수행하게 하였다. 화자 종속 인식 실험 결과 $87.2\%$의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.

  • PDF

클러스터링 방법을 이용한 차종인식 모형 (Recognition Model of the Vehicle Type usig Clustering Methods)

  • 조형기;민준영;최종욱
    • 한국정보처리학회논문지
    • /
    • 제3권2호
    • /
    • pp.369-380
    • /
    • 1996
  • 최근에 이르기까지 교통분야에서 차량에 관한 정보를 수집하기 위하여 사용되고 있는 검지쳬계는 유도식 루프검지기 (Inductive Loop Detector,ILD)이다. 유도식 검지기로 부터 수집되는 교통자료는 점유시간(차량이 검지기를 점유한시간)과 비점유시간(통행 차량과 차량간의 시간차)및 교통량이 기초 수집자료가 된다. 특히 점유 시간은 신호의 현시 길이를 결정 및 과포화제어를 위한 대기행렬예측 등 다양한 관제알고리즘에 있어서 핵심적인 자료이므로 높은 신뢰도가 요구된다. 이러한 신뢰도는 검지로 부터 수집될 수 있는 자료들을 토대로 통행 차종을 식별함으로써 향상시킬 수 있으며, 관련 관제 알고리즘의 신뢰도 향상은 물론 최근 관심이 고조되고 있는 무인자동감시 체계 및 교통정보 자동 수집장치의 개발을 유도할 수 있다. 본 논문에서는 통행하는 차량들에 대하여 수집 되는 기초자료를 기반으로 인식하기 위한 방법으로 통계적 클러스터링 방법 두 가지와 신경망 클러스터링 방법 등 세가지 방법을 제시하고, 결과로서 무인 자동감시 체계에 관한 활용 방법을 제시한다.

  • PDF