• 제목/요약/키워드: 클러스터링 관리

검색결과 318건 처리시간 0.026초

문헌 클러스터링을 위한 유사계수간의 연관성 측정 (A Measurement of Relationship among Similarity Coefficients for Document Clustering)

  • 한승희;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.25-28
    • /
    • 1999
  • 자동분류나 정보검색에 주로 이용되는 문헌 클러스터링에서는 문헌간의 유사성을 측정하기 위해 다양한 유사계수를 이용하는데, 모든 유사계수가 동일한 클러스터링 결과를 가져오는 것은 아니다. 본고에서는 50건의 신문기사를 대상으로 SPSS 통계 패키지를 이용하여 다양한 유사계수에 각각 달라지는 문헌 클러스터링의 결과를 살펴본 후, 유사계수간의 연관성을 측정하였다.

  • PDF

문헌 클러스터링 결과의 성능 평가 방법에 관한 비교 연구 (A Comparative Study on Performance Evaluation of Document Clustering Results)

  • 김정하;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.45-50
    • /
    • 2000
  • 자동분류나 정보검색에 활용되는 문헌 클러스터링 결과의 성능을 평가하는 방법에는 여러가지가 있다. 본 논문에서는 제시된 몇 가지 평가방법의 개념과 특징에 대해 알아본다 학술논문 초록 집합인 KTSET과 신문기사 집합인 KFCM-CL을 대상으로 각각 유사계수를 변화시켜가며 클러스터링한 결과에 대해 각 평가방법을 적응해본 후, 특징과 문제점을 살려 보았다.

  • PDF

인용문헌 표제를 이용한 문헌 클러스터링에 관한 연구 (Document Clustering Using Reference Titles)

  • 최상희
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.241-252
    • /
    • 2010
  • 본 연구에서는 원문헌의 표제가 문헌클러스터링에서 문헌의 주제를 나타내는데 효과적인 자질로 인식되고 있지만 동의어나 유사어를 포함하여 문헌의 주제를 대표하는데 한계가 있음을 인지하고 인용문헌의 표제로 클러스터링 자질을 확대하는 방안을 제시하였다. 문헌 클러스터링의 자질로 원 문헌의 표제 용어와 인용문헌의 표제 용어, 두 종류의 표제 용어를 혼합하여 적용하여 인용문헌의 표제가 클러스터링 성능을 향상시키는 정도를 측정하였다. 각 자질별로 계층적 클러스터링 기법 3개, within group average linkage, complete linkage, Ward 기법을 결합하여 클러스터를 생성하는 성능을 비교, 분석하였는데 원문헌과 인용문헌 표제어를 혼합하여 within group average linkage 기법으로 클러스터링 한 경우가 가장 좋은 결과를 나타내었다.

지식 분류의 자동화를 위한 클러스터링 모형 연구 (Development of a Clustering Model for Automatic Knowledge Classification)

  • 정영미;이재윤
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.203-230
    • /
    • 2001
  • 본 연구에서는 문헌을 기반으로 한 지식의 자동분류를 위해 최적의 클러스터링 모형을 제시하고자 하였다. 클러스터링 실험을 위해서 신문기사 실험집단과 학술논문 초록 실험집단을 구축하였고, 분류 성능 평가 척도인 WACS를 개발하였다. 분류자질로 사용한 용어의 집합은 다양한 자질 축소 기준을 적용하여 생성하였으며, 다양한 용어 가중치를 사용하였다. 유사계수 공식으로는 코사인 계수와 자카드 계수를 적용하였으며, 클러스터링 알고리즘으로는 비계층적 기법인 완전연결 기법과 계층적 기법인 K-means기법을 각각 사용하였다. 실험 결과 신문기사 원문 집단에서의 성능이 좋았으며, 완전연결 기법의 성능이 K-means 기법보다 높게 나타났다. 역문헌빈도의 적용은 완전연결 클러스터링에서는 긍정적인 효과가 나타났으나, K-means 클러스터링에서는 그렇지 못했다. 분류자질은 전체의 7.66%만 사용하였을 경우에도 성능 저하가 크지 않았으며, K-means 클러스터링에서는 오히려 성능 향상 효과가 있었다.

  • PDF

촬영시각 차이를 고려한 우선순위 큐 기반의 사진 클러스터링 (A Priority Queue-Based Photo Clustering Method Using Temporal Information)

  • 류동성;김광휘;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.497-500
    • /
    • 2011
  • 이전 필름 카메라 시대에는 한 필름에 촬영 가능한 사진의 수가 제한되고 인화와 현상에 대한 비용과 시간 소모로 인해, 꼭 필요하거나 중요한 순간에 사진을 촬영하였다. 그러나 최근에는 디지털 카메라의 보급과 대용량화된 메모리로 인해, 이전의 필름 카메라 시대와는 달리 일반 사람들도 한번에 많은 양의 사진을 촬영하는 일이 많아졌다. 이와 같이 관리해야 할 사진의 수가 많아질수록 사진을 분류하고 관리하는 작업에 많은 노력과 비용이 소모된다. 본 논문에서는 윈도우와 우선순위 큐를 이용하여, 촬영시각 문맥 (temporal context)의 흐름이 약한 순서대로 사진들을 클러스터링하는 방법을 제안한다. 제안한 방법의 평가를 위해서, Cooper 가 제안한 이벤트 클러스터링 방법과 정확도와 재현율을 비교하였으며, 사진 촬영 시각 차이의 분포의 편차가 작을수록, 제안한 클러스터링 방법이 높은 정확도를 보였다. 본 논문에서 제안한 촬영 시각 클러스터링은 많은 수의 사진들을 이벤트 기반으로 자동 분류하는데 활용될 수 있으며, 클러스터링된 정보들을 그룹별로 시각화하기 위한 인터페이스를 개발하는 것을 향후 연구과제로 제시한다.

MPEG-7 데이터의 효율적인 관리를 위한 클러스터링 방법 (Clustering of MPEG-7 Data for Efficient Management)

  • 안병태;강병수;조건화;강현석
    • 한국멀티미디어학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-12
    • /
    • 2007
  • 모바일 환경의 제한된 자원 하에서 멀티미디어 데이터를 이용하기 위해서는 XML로 표현되는 MPEG-7 문서의 효율적인 관리 방법이 필요하다. 이 때 XML 문서 클러스터링 방법들을 이용할 수 있겠으나 보다 효율성을 높이기 위해 MPEG-7 문서의 특성을 반영한 새로운 클러스터링 방법이 요구된다. 새로운 클러스터링은 모바일 환경에서 멀티미디어 검색시 질의 처리 속도가 향상되며 다양한 응용에 적합한 문서 저장이 가능하다. 본 논문에서는 대용량의 멀티미디어 데이터를 MPEG-7 문서로 효율적으로 관리하기 위해 MPEG-7 문서의 엘리먼트들 사이에 나타나는 의미 관련성을 이용해 저장할 수 있는 새로운 클러스터링 방법을 제안하고, 이를 기존 방법들과 비교하였다.

  • PDF

OPAC에서 자동분류 열람을 위한 계층 클러스터링 연구 (Hierarchic Document Clustering in OPAC)

  • 노정순
    • 정보관리학회지
    • /
    • 제21권1호
    • /
    • pp.93-117
    • /
    • 2004
  • 본 연구는 OPAC에서 계층 클러스터링을 응용하여 소장자료를 계층구조로 분류하여 열람하는데 사용될 수 있는 최적의 계층 클러스터링 모형을 찾기 위한 목적으로 수행되었다. 문헌정보학 분야 단행본과 학위논문으로 실험집단을 구축하여 다양한 색인기법(서명단어 자동색인과 통제어 통합색인)과 용어가중치 기법(절대빈도와 이진빈도), 유사도 계수(다이스, 자카드, 피어슨, 코싸인, 제곱 유클리드), 클러스터링 기법(집단간 평균연결, 집단내 평균연결, 완전연결)을 변수로 실험하였다. 연구결과 집단간 평균연결법과 제곱 유클리드 유사도를 제외하고 나머지 유사도 계수와 클러스터링 기법은 비교적 우수한 클러스터를 생성하였으나, 통제어 통합색인을 이진빈도로 가중치를 부여하여 완전연결법과 집단간 평균연결법으로 클러스터링 하였을 때 가장 좋은 클러스터가 생성되었다. 그러나 자카드 유사도 계수를 사용한 집단간 평균연결법이 십진구조와 더 유사하였다.

분산 모바일 서비스의 다중 스트리밍을 위한 가변 클러스터링 관리 (Variable Clustering Management for Multiple Streaming of Distributed Mobile Service)

  • 정택원;이종득
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.485-492
    • /
    • 2009
  • 모바일 서비스 환경에서 시간 동기화에 의해 생성된 패턴들은 데이터 스트리밍으로 인하여 인스턴스 값들이 다르게 스트리밍 된다. 본 논문에서는 유연한 클러스터링을 지원하기 위해 가변클러스터링 관리 기법을 제안하며, 이 구조는 다중 데이터 스트리밍을 동적으로 관리하도록 지원한다. 제안되는 기법은 일반적인 스트리밍기법과 달리 데이터 스트림 환경에서 동기화를 효율적으로 지원하는 기능을 수행하며, 구조적 표현단계와 적합성 표현단계를 거쳐 클러스터링 스트리밍이 관리된다. 구조적 표현 단계는 레벨정합과 누적정합을 수행하여 스트림 구조가 표현되며, 동적 세그먼트와 정적세그먼트 관리를 통해서 클러스터링 관리가 가변적으로 수행되도록 하였다. 제안된 기법의 성능 평가를 위해서 k-means 기법, C/S 서버기법 그리고 CDN 기법과 시뮬레이션평가를 수행하였으며 그 결과 제안된 기법의 성능이 효율적임을 알 수 있었다.

JMX를 이용한 동적 서버 클러스터링의 관리 (The Management Technology of Dynamic Server Clustering Using JMX)

  • 채희성;윤수현;송하윤;김한규;이기철;박중기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1309-1312
    • /
    • 2002
  • 인터넷 서비스 환경은 모바일 단말기들을 지원하는 비즈니스 및 서비스 환경으로 급변하고 있다. 이러한 변화에 따라 기존 유선 인터넷 뿐 아니라 모바일 환경의 서비스에서도 쉽게 사용할 수 있는 모바일 응용서버에 관한 연구가 필요하다. 서버 환경에서는 시스템 접근 요구가 많은 대규모 서비스를 위해 상시 가동을 기본적으로 필요로 하며, 큰 트래픽의 효과적인 분산을 통해 부하분산, 확장성, 가용성 등의 기능을 제공해 주기 위해서 클러스터링 기법을 이용한다. 이 논문에서는 클러스터링의 효과적인 관리를 위해 JMX(Java Management Extensions) 프레임웍을 이용하여 서버의 동적 클러스터링을 관리하는 새로운 기법을 제시한다.

  • PDF

E-Commerce에서의 퍼지 클러스터링 알고리즘을 적용한 추천 시스템

  • Lyou, Hae-Ri;Kim, Moon-Hyun
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2003년도 춘계학술대회
    • /
    • pp.410-415
    • /
    • 2003
  • 인터넷의 발전으로 전 세계적으로 다양한 인터넷 서비스들이 점차 확대되고 있으며, 특히 수익을 내는 방법으로서의 인터넷 전자상거래는 큰 비중을 차지하고 있다. 이에 수많은 사이트, 쇼핑몰은 상품과 고객들의 수많은 데이터를 데이터베이스 모듈로 관리하고 있다. 이렇게 고객에게 맞는 상품을 추천하기 위해 효율적으로 클러스터링 하는 방법이 요구된다. 이에 본 논문에서는 여러 클러스터링 방법 중에서 퍼지 이론을 기반으로 개선된 클러스터링 알고리즘을 이용하여 상품을 추천하고자 한다 이 방법은 클러스터의 개수가 한정되어 있는 기존의 방법에 클러스터의 유사도에 따른 유사성을 부여함으로써 더 세밀하고 정확한 클러스터링을 가능케 하여 이에 따른 개인의 성향에 맞게 개인화된 상품을 추천하는 시스템을 설계하고자 한다.

  • PDF