• Title/Summary/Keyword: 클러스터 생성

검색결과 415건 처리시간 0.03초

문장 클러스터링에 기반한 자동요약 모형 (A Text Summarization Model Based on Sentence Clustering)

  • 정영미;최상희
    • 정보관리학회지
    • /
    • 제18권3호
    • /
    • pp.159-178
    • /
    • 2001
  • 본 연구에서는 문장 클러스터로부터 대표문장을 선정하여 요약문을 생성하는 자동요약 모형을 제시하고. 학습문서 집단을 미용하여 최적의 요약 환경을 구축한 후 요약 실험을 수행하였다. 학습 과정에서 문장의 클러스터링 기법으로는 7개의 계층적 기법들을 비교한 결과 클러스터를 구성하는 문장 수의 편차가 가장 적고 단일 문장 클러스터를 가장 적게 생성하는 센트로이드 기법이 선택되었다. 또한 각 클러스터를 대표하는 문장의 선정을 위해 용어 및 문장 가중치를 합산한 문장값과 클러스터-문장 벡터간 유사도의 두 기준을 비교한 결과 문장값 기준이 선택되었다. 용어 가중치로는 역문장빈도와 표제어 가중치, 그리고 문장의 위치 가중치가 자동요약 성능을 개선시키는 것으로 나타났으며, 적절한 요약문의 길이는 전체 문서의 1/3인 것으로 나타났다. 실험문서 집단으로는 문서의 길이와 특성이 다른 신문기사와 잡지기사의 두 집단을 이용하였다. 요약 모형의 검증 실험 결과 요약 정확률은 신문기사 집단에서는 53%, 잡지기사 집단에서는 47%인 것으로 나타났다. 두 실험 모두 랜덤하게 생성한 베이스라인 요악문보다 성능이 우수하였으나, 리드문장들로 구성된 베이스라인 요약문과의 비교에서는 짧은 길이의 신문기사의 경우 요약 모형의 성능이 오히려 떨어지는 것으로 나타났다.

  • PDF

점진적 개념학습의 클러스터 응집도 개선 (The Study on Improvement of Cohesion of Clustering in Incremental Concept Learning)

  • 백혜정;박영택
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.297-304
    • /
    • 2003
  • 요즘, 인터넷 등장 이후 폭발적으로 증대되는 웹 정보를 효율적으로 사용하기 위한 시스템들이 요구되고 있다. 이러한 요구를 해결하기 위해 개발된 시스템들은 서비스 정보의 질을 향상시키기 위하여 클러스터링 기법을 이용하고 있다. 클러스터링은 무질서한 데이터들의 상호 연관관계를 정의하고 이를 통하여 보다 체계적으로 데이터를 군집화하는 것이다. 클러스터링을 이용한 시스템은 비슷한 내용을 묶어 사용자에게 제공함으로, 사용자는 보다 효율적으로 정보를 파악할 수 있다. 그래서 이전 연구에서 대량의 데이터를 효율적으로 클러스터링 하기 위하여 통합 클러스터링 방식을 제안하였다. 이 방식은 COBWEB 알고리즘을 이용하여 초기 클러스터를 생성한 후 Etzioni 알고리즘을 이용하여 클러스터링을 생성하는 방식이다. 본 논문은 이러한 기존의 통합 클러스터링 방식의 정확성과 효율성을 높이기 위하여, 다음 두 가지 방식을 제안한다. 첫째, 클러스터할 데이터의 속성의 가중치클 고려한 클러스터링 방식을 제안한다. 둘째, 기존의 클러스터링 방식의 효율성을 지원하기 위하여, 초기 클러스터를 생성하는 평가 함수를 재정의한다. 본 논문에서 제안하는 클러스터링 방식은 방대한 양의 데이터를 효율적으로 처리 할 수 있으며 데이터의 입력 순서의 의존도를 줄여, 데이터를 효과적으로 클러스터, 양질의 사용자 프로파일 구축에 도움을 주게 된다.

Ad hoc 네트워크에서 제어메시지 부하를 감소시키는 클러스터 유지 방법 (A Cluster Maintenance Scheme to Reduce the Control Overhead in Mobile Ad hoc Networks)

  • 왕기철;방상원;조기환
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권1호
    • /
    • pp.62-69
    • /
    • 2004
  • 클러스터 구조는 Ad hoc 네트워크내의 전체 호스트로 데이타를 방송하는 경우에, 재전송 되는 메시지의 수를 감소시킨다. 이러한 클러스터 구조의 이점을 보존하기 위해 클러스터 유지방법이 이용된다. 그러나 기존의 클러스터 유지방법들은 이웃정보 파악을 위한 제어메시지 외에도 클러스터 재구성을 위한 추가적인 메시지 교환을 필요로 한다. 이로 인해 클러스터 구조의 유지에 따른 이점은 크게 약화된다. 본 논문에서는 클러스터 구조의 중첩성을 이용하여 Hello 시간에 클러스터 헤드들만 제어메시지를 broadcast 전송하고 일부 멤버 호스트들은 제어메시지의 unicast 전송을 통해 분리된 게이트웨이를 파악하는 클러스터 유지방법을 제안한다. 제안하는 방법은 클러스터 재구성이 필요할 때에도, 각 호스트간에 전송되는 제어메시지를 최소한으로 줄이기 위한 전략을 사용한다. 제안된 방법은 이 과정에서 2흡 클러스터의 정의를 파괴하지 않으며, 클러스터를 완전히 분산된 방법으로 생성한다. 본 논문에서 제안한 방법은 실험결과에 의해 LCC(1)보다 우수한 것으로 평가된다.

클러스터 생성을 이용한 자기구성 퍼지 모델링 (Self-Organizing Fuzzy Modeling using Creation of Clusters)

  • 고택범
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.245-251
    • /
    • 2002
  • 본 논문에서는 상대적으로 큰 퍼지 엔트로피를 갖는 입력-출력 데이터 집단에 다중 회귀 분석을 적용하여 다차원 평면 클러스터를 생성하고, 이 클러스터를 새로운 퍼지 모델의 규칙으로 추가한 후 퍼지 모델 파라미터의 개략 동조와 정밀 동조를 수행하는 자기구성 퍼지 모델링을 제안한다. Weighted recursive least squared 알고리즘과 fuzzy C-regression model 클러스터링에 의해 퍼지 모델의 파라미터를 개략적으로 동조한 후 gradient descent 알고리즘에 의해 파라미터를 정밀 동조하면서 감수분열 유전 알고리즘을 이용하여 최적의 학습률을 탐색한다. 그리고 자기 구성 퍼지 모델링 기법을 이용하여 Box-Jenkins의 가스로 데이터, 다변수비선형 정적 함수의 데이터와 하수 처리 활성오니 공정의 모델링을 수행하고, 기존의 방법에 의한 모델링 결과와 비교하여 그 성능을 입증한다.

  • PDF

가중치 패턴 클러스터를 이용한 한글 문자 인식 (The Recognition of The Korean Characters Using The Weighted Pattern Cluster)

  • 김도형;이선화;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.319-321
    • /
    • 2001
  • 본 논문에서는 스캐너로 입력된 한글 문서 영상에서 한글 문자를 인식하는 방법을 제시한다. 입력된 한글 문자를 한글의 구조적 특징에 따라 6개의 유형으로 분리하고, 각 유형에서의 모음의 형태학적 특징에 근거하여 모음을 인식한다. 각 유형에서의 자음의 인식을 위해서 가중치 패턴 클러스터를 생성하고 생성된 클러스터와 원영상간의 유사도 측정을 통해 자음을 인식하게 된다. 오인식 가능성이 있는 자음은 오인식 교정을 위한 세부 유사도 매칭과정을 통해 최종적으로 인식된다. 제안하는 알고리즘을 바탕으로 실험한 결과 스캐너로 입력받은 상용 한글 문자 14,983자에 대해 최종 95.68%의 인식률을 보였으며, 차후 정형화된 한글 문서 인식 시스템에 응용될 수 있을 것이다.

  • PDF

CPLD 구조를 고려한 게이트 레벨 글리치 제거 방법 (Glitch Removal Method in Gate Level consider CPLD Structure)

  • 김재진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
    • /
    • pp.145-146
    • /
    • 2017
  • 본 논문에서는 CPLD 구조를 고려한 게이트 레벨 글리치 제거 방법에 대해 제안하였다. CPLD는 AND-OR 게이트의 2단 구조를 가진 LE를 기본 구조로 구성되어 있는 소자이다. CPLD로 구현할 회로에 대한 DAG를 CPLD 구조에 맞도록 그래프를 분할하여 매핑가능클러스터를 생성한다. 생성된 매핑가능클러스터는 내부의 글리치와 전체 회로에 대한 글리치 발생 가능성을 검사하여 글리치를 제거한다. AND게이트와 OR게이트를 사용하는 2단 구조는 게이트가 달라 글리치가 발생될 수 있는 가능성을 검사하기 어렵다는 단점이 있어 AND-OR 게이트의 2단 구조와 동일한 구조를 가지고 있으며 게이트가 동일한 NAND 게이트를 이용하여 전체 회로를 변환한 후 글리치 발생여부를 검사함으로서 정확한 글리치 발생 가능성을 제거한다. 실험 결과는 제안 된 알고리즘 [10]과 비교하였다. 소비 전력이 2 % 감소되어 본논문에서 제안한 방법의 효율성이 입증되었다.

  • PDF

수행시간을 개선한 CPLD 기술 매핑 알고리즘 개발 (Development of CPLD Technology Mapping Algorithm Improving Run-Time)

  • 윤충모;김장욱;김재진;박남서
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.683-686
    • /
    • 2002
  • 본 논문은 시간 제약 조건하에서 수행 시간을 개선한 CPLD 기술 매핑 알고리즘을 제안하였다. 제안된 기술 매핑 알고리즘은 주어진 시간 제약 조건을 고려하여 가장 빠른 시간에 기술 매핑을 수행 할 수 있도록 속도의 개선에 중점을 두었다. 입력된 회로를 DAG로 표현한 후 입력부터 출력의 방향으로 노드들을 검색하여 매핑 가능 클러스터를 생성한다. 생성된 매핑 가능 클러스터들 중에서 시간 제약 조건에 적합한 매핑 가능 클러스터를 선택하여 기술 매핑을 수행함으로서 전체 수행 시간이 다른 알고리즘에 비해 빠르게 수행된는 결과를 나타내었다.

  • PDF

진화 알고리즘을 위한 가상 클러스터 기반 재조합 연산자 및 세대차 모델 (Virtual Cluster based Recombination Operator and Generation Gap Model for Evolutionary Algorithm)

  • 최준석;서기성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.288-291
    • /
    • 2008
  • 본 논문은 실수 진화 알고리즘에 대해서 가상의 클러스터를 이용한 재조합 연산자 및 새로운 세대차 모델을 소개한다. 가상 클러스터의 자가 적응적인 크기 변화를 통해 자손의 생성범위를 적절히 조절하고, 선택과 대치를 포함한 진화방식을 개선하여 효율적인 세대차 크기를 구함으로서, 개체의 다양성 유지 및 탐색성능의 향상을 꾀하였다. 제안된 방법을 벤치마크 테스트 문제에 적용하여 G3 알고리즘과 CMA-ES 등과 성능을 비교하였다.

  • PDF

비선형 공정에 대한 자기구성 퍼지 모델 (Self-Organizing Fuzzy Model for Nonlinear Processes)

  • 고택범
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1846-1847
    • /
    • 2007
  • 본 논문에서는 비선형 공정의 모델링 성능을 향상시키기 위하여 퍼지 엔트로피 분석을 통해 새로운 클러스터를 생성하고, 이 클러스터를 퍼지 모델의 새로운 규칙으로 추가하는 자기구성 퍼지 모델을 제안한다. 퍼지 엔트로피가 상대적으로 큰 데이터 집합으로 새로운 클러스터를 구성하면 퍼지 모델의 애매모호한 정도가 작아져서 모델링 오차가 줄어들 가능성이 크게 된다. 제안한 방법의 유용성을 입증하기 위해 이를 Box-Jenkins의 가스로 공정에 적용하여 퍼지 규칙수의 증가에 따른 모델링 성능의 변화를 보이고, 기존의 방법에 의한 모델링 결과와 비교한다.

  • PDF