• 제목/요약/키워드: 집단화

검색결과 156건 처리시간 0.025초

주제어 기반 문서 클러스터링 알고리즘 (Keyword-based Document C lustering Algorithm)

  • 장성호;강승식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.469-471
    • /
    • 2002
  • 높은 연관성을 갖는 문서들을 서로 집단화시키는 문서 클러스터링은 문서와 문서간의 연관성을 확인할 수 있는 문서의 주제어 추출이 중요한 문제이며 일반적인 정보검색 시스템에서 사용하는 출현빈도에 의한 주제어 추출은 성능 향상에 한계가 있다. 또한, 문서 클러스터링은 문서를 집단화시키기 위해 문서간 연관성을 확인하기 위해 유사도 계산에 따른 시간과 공간을 많이 소비하는 문제를 가지고 있다. 본 논문에서는 주제어 추출 기법을 적용하여 주제어 연관성에 의해 문서들을 집단화시키는 새로운 방법의 문서 클러스터링 알고리즘을 제안한다.

  • PDF

Modified ISODATA 집단화방법을 이용한 불특정화자 단독어 인식 (Speaker-Independent Isolated Word Recognition Using A Modified ISODATA Method)

  • 황우근
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1987년도 학술발표회 논문집
    • /
    • pp.66-69
    • /
    • 1987
  • 본 논문은 불특정화자의 한국어 단독음인식에 관한 연구로써 새로운 집단화 방법인 Modified-ISODATA 집단화방법을 제안한다.본 알고리즘의 목적은 종래의 ISODATA 알고리즘에서 외부 고립점 처리 및 분리과정을 단순화 하고, Lumping 과정을 제거하여 정확하고도 자동화된 집단의 중심점을 찾는 것이다. 본 알고리즘을 적용한 결과, 10명의 남성 화자와 4명의 여성 화자가 발음한 11개의 ltnt자음에 대하여, 최근에 발표된 Modified K-means 방법보다 좋은 인식율을 나타내어, 보다 정확한 집단의 중심점을 찾아 내었음을 입증해보였다.

  • PDF

LPC Cepstrum과 집단화를 이용한 한국어 고립단어 인식에 관한 연구 (A Study on Korean isolated word recognition using LPC cepstrum and clustering)

  • 김진영;성굉모
    • 한국음향학회지
    • /
    • 제6권4호
    • /
    • pp.44-54
    • /
    • 1987
  • 본 논문은 화자독립 고립단어 인식에 있어서 LP모델의 문제점과 그 해결 방안으로서 cepstrum영역에 있어서 lifter를 이용한 해결에 대해서 고찰하였다. 한편, 각 인식 단어의 기준 패턴을 구하기 위한 방법으로서 집단화의 방법에 대해 논하였다. 집단화의 방법으로서는 UWA방법과 K-iteration방법을 변형시킨 KMA 방법을 제시 비교하였다. 인식실험결과 정현파 lifter와 KMA의 집단화 방법을 사용하였을 때 $95\%$의 최고 인식률을 보였다.

  • PDF

지연과 대역폭이 민감한 망에서의 효율적인 링크 집단화 방법 (Efficient Link Aggregation in Delay-Bandwidth Sensitive Networks)

  • 권소라;전창호
    • 인터넷정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.11-19
    • /
    • 2011
  • 본 논문에서는 계층적 QoS 라우팅을 위해 소스 라우팅 방식을 채택하고 있는 전달망에서 집단화된 링크 상태 정보의 정확성을 높이기 위한 서비스경계라인 근사법을 제안한다. 이 방법은 기존 집단화 과정에서 몇몇 경로 가중치들의 소멸로 높아지는 정보 왜곡을 줄이기 위해 주요 경로 가중치를 선정한 후 집단화 정보와 함께 외부망에 전달하는 것으로 지연과 대역폭을 동시에 QoS 파라미터로 갖는 집단화에 유용하다. 본 논문에서는 주요 경로 가중치를 가외치(outlier)로 정의한다. 제안 방법은 링크 당 집단화된 상태 정보를 저장하기 위해서 2k+5개의 파라미터를 갖는다. k는 가외치 개수로 가외치 선정 방법에 따라 달라진다. 모의 실험 결과 제안 방법이 가외치 선정이란 특수성 때문에 기존 방법들에 비해 1.5~2배 이상의 저장 공간을 갖지만 저장 공간과 정보 정확성 증가 비율로 고려한다면 제안 방법이 정보 정확성이 높음을 알 수 있었다.

ATM망에서의 효율적인 토폴로지 집단화 방법 (Efficient Topology Aggregation in ATM Networks)

  • 유영환;안상현;김종상
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.171-173
    • /
    • 2000
  • 본 논문에서는 ATM PNNI(Private Network-Network Interface) 망에서 경로 배정을 위해 필요로 하는 링크 상태 정보(link state information)를 효율적으로 집단화(aggregation)하는 두 가지 방법을 제시한다. 이 방법들은 집단화할 동료 집단(peer group)의 경계노드(border node)들을 셔플넷(shufflenet)이나 de Bruijn 그래프의 노드들로 사상시킴으로써 표현해야 할 링크의 수를 완전 그물망 방법(full-mesh approach)의 N2에서 aN(a는 정수, N은 경계노드 수)으로 줄인다. 이는 공간 복잡도가 0(N)인 신장 트리(apanning tree) 방법에서 필요로 하는 링크의 수와 비슷하지만, 신장 트리 방법과는 달리 비대칭망(asymmetric network)에서 사용할 수 있다는 것이 큰 장점이다. 모의 실험 결과 셔플넷 방법은 aN개의 링크만을 표현하면서도 상태 정보의 정확성은 완전 그물망 방법에 근접함을 알 수 있었고, de Bruijn 방법은 정보의 정확성에서는 셔플넷 방법에 못 미치지만 가장 널리 사용되고 있는 별모양 방법(star approach) 방법보다는 훨씬 정확하며, 계산 복잡도 면에서 셔플넷 방법보다 효율적이었다.

  • PDF

집단화를 위한 병렬 알고리즘의 구현 (Parallel Algorithm For Level Clustering)

  • 배용근
    • 한국정보처리학회논문지
    • /
    • 제2권2호
    • /
    • pp.148-155
    • /
    • 1995
  • 많은 양의 패턴들을 분석할 때, 이 패턴들을 어떤 평가함수에 의해서 여러 군으로 집단화할 필요가 있다. 이 과정은 입력 패턴의 수가 많을 경우 상당한 량의 계산을 필 요로 하며, 이를 위한 병렬화 알고리즘이 요구된다. 이 문제를 해결하기 위하여 본 논 문은 K-means 알고리즘을 병렬화한 병렬 집단화 알고리즘을 제안하고, 메세지 전송을 근간으로 하는 MIMD 병렬 컴퓨터하에서 이를 수행하였다. 실험 및 성능 분석을 통하여 입력 패턴이 많을 경우, 본 병렬 알고리즘이 적절함을 알 수 있었다.

  • PDF

비선형 집단화와 완화기법을 이용한 VQ/HMM에 관한 연구 (A Study on VQ/HMM using Nonlinear Clustering and Smoothing Method)

  • 정희석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.95-98
    • /
    • 1998
  • 본 논문에서는 이산적인 HMM(Hidden Markov Model)을 이용한 고립단어 인식 시스템에서 입력특징 벡터의 변별력을 향상시키기 위해 수정된 집단화 알고리듬을 제안하므로써 K-means나 LBG 알고리듬을 이용한 기존의 HMM에 비해 2.16%의 인식율을 향상시켰다. 또한 HMM학습과정에서 불충분한 학습데이타로 인해 발생되는 인식율저하의 문제를 해소하기 위해 개선된 smoothing 기법을 제안하므로써 화자독립 실험에서 3.07%의 인식율을 향상시켰다. 본 논문에서 제안한 두가지 알고리듬을 모두 적용하여 최종적으로 실험한 VQ/HMM에서는 기존의 방식에 비해 화자독립 인식실험 결과 평균 인식율이 4.66% 개선되었다.

  • PDF

집단화를 이용한 한국어 숫자음성의 표준 패턴 설정에 관한 연구 (A Study on Creating Refrence Pattern of Korean Digits by using the Clustering)

  • 김계국
    • 한국음향학회지
    • /
    • 제5권2호
    • /
    • pp.3-12
    • /
    • 1986
  • 본 논문은 불특정 화자의 음성을 인식시키기 위하여 한국어 150 숫자음에 대하여 10개의 표준 패턴을 설정하는데 목적을 두고 연구하였다. 남성 화자 3인이 각 숫자음을 5번씩 반복 발음한 150숫자 음을 집단화 하여 표준 패턴을 설정하였다. 특징 피라미터는 포르만트 주파수를 이용하였고 유크리드 거리 측정법을 유사도 비교에 사용하였다. 실험 결과는 85.3%의 인식율을 얻었다.

  • PDF