• 제목/요약/키워드: 지도 군집화

검색결과 592건 처리시간 0.025초

군집 중심 기반 문헌 검색 결과의 시각화 (Visualization Method of Document Retrieval Result based on Centers of Clusters)

  • 지태창;이현진;이일병
    • 한국콘텐츠학회논문지
    • /
    • 제7권5호
    • /
    • pp.16-26
    • /
    • 2007
  • 기존의 문헌검색시스템은 검색 결과를 시각화하기 어렵기 때문에 문헌 제목과 검색어가 존재하는 부분에 대한 요약문을 보여주는 형태가 대부분이다. 이러한 방식은 문헌 검색 결과가 많은 경우 한 번에 문헌들을 살펴보는데 어려움이 있고, 문헌들간의 연관성을 알아보기 어렵다. 따라서, 본 논문에서는 웹 환경에 적합하도록 실시간으로 문헌 검색 결과를 시각화하는 방법을 제안하였다. 이를 위하여, 군집의 중심을 다차원 척도에 의해 저 차원 평면에 투사하는 단계와 오비탈 모형에 기반하여 개별 문헌들을 군집 중심을 기준으로 저 차원 평면에 표현하는 2단계 시각화 알고리즘을 제안하여, 문헌 군집의 관계를 쉽게 알아보고 개별 문헌들 사이의 유사성을 쉽게 확인할 수 있도록 하였다. 벤치마크 데이터와 실 데이터에 적용하여 실험하였으며, 실시간으로 검색 결과를 시각화 할 수 있다는 것을 실험을 통해 확인할 수 있었다.

GPCR 분류에서 ART1 군집화를 위한 퍼지기반 임계값 제어 기법 (Fuzzy-based Threshold Controlling Method for ART1 Clustering in GPCR Classification)

  • 조규철;마용범;이종식
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.167-175
    • /
    • 2007
  • 퍼지이론은 생명정보공학에서 지식을 표현하는데 활용되고 제어시스템 모델을 이해하는데 활용되어 왔다. 본 논문에서는 생명정보학의 응용 프로그램에서 중요한 데이터 분류에 초점을 맞추었다. 최적의 임계값 유도를 위한 GPCR 분류에서 기존의 순차기반 임계값 제어기법은 임계값 결정범위와 최적의 임계값 유도 시간의 문제점을 보였고, 이진기반 임계값 제어기법은 임계값 결정 초기에 시스템의 안정성에 대한 단점이 있었다. 이를 보완하기 위해 우리는 ART1 군집화를 위한 퍼지기반 임계값제어기법을 제안한다. 제안된 방법의 성능을 평가하기 위해 ART1 군집화를 위한 퍼지기반 임계값 제어기법을 구현하여 기존의 순차기반 임계값 제어기법과 이진기반 임계값 제어기법과의 인식률에 대한 구동시간의 변화, 임계값의 변화에 따른 시스템의 구동시간을 측정하였다. 퍼지기반 임계값제어 기법은 GPCR 데이터 분류에서 인식률과 구동시간에 대한 정보를 통해 분류 임계값을 조정하여 높은 인식률과 낮은 구동시간을 지속적으로 유도하여 안정적이고 효과적인 분류 시스템을 만들 수 있었다.

  • PDF

첨예정점의 측지거리 평균군집화를 이용한 메쉬 분할 (Mesh Segmentation With Geodesic Means Clustering of Sharp Vertices)

  • 박영진;박찬;이위;하종성;유관희
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.94-103
    • /
    • 2008
  • 본 논문에서는 주어진 3차원 메쉬의 분할에 $\kappa$-평균군집화 기법을 적용한다. 국부적인 최적의 수렴을 피하고 계산시간을 빠르게 하기 위하여 먼저 주어진 메쉬에 대한 첨예정점들을 인지과학적 측면에서 각각 국부적 전역적 기하 특성을 반영하는 곡률과 볼록성을 분석하여 추출한다. 다음에 추출된 첨예정점들은 그들간의 유클리디언 거리대신 측지거리에 기반한 $\kappa$-평균군집화 기법의 반복 수렴으로 $\kappa$ 개의 군집으로 분할된다. $\kappa$-평균군집화의 효과성에 매우 중요한 요인은 적절한 $\kappa$의 초기값을 부여하는 것이다. 따라서 본 논문에서는 $\kappa$의 초기값으로 합리적인 군집 개수를 자동으로 계산한다. 최종적으로 첨예정점들에 속하지 않는 메쉬의 나머지 정점들은 측지거리로 가장 가까이 존재하는 $\kappa$개의 군집에 병합함으로써 메쉬분할이 완성된다.

소셜 네트워크 분석을 위한 동적 하위 그룹 생성 (Generation of Dynamic Sub-groups for Social Networks Analysis)

  • 이현진
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권1호
    • /
    • pp.41-50
    • /
    • 2013
  • 소셜 네트워크 분석은 1개의 연결을 가지는 n개의 노드를 대상으로 한다. 노드 수 n이 수십 또는 수백 정도의 소셜 네트워크를 분석할 때는 전체 데이터를 대상으로 분석이 가능하지만, 그 이상이 되면 육안으로 분석하기는 어렵다. 따라서 전체 소셜 네트워크를 분리할 필요가 있는데 이 때 사용할 수 있는 방법이 군집화이다. 군집화를 통해 전체 노드를 하위 그룹으로 구성하면, 소셜 네트워크의 특징 분석이나 노드간의 관계 분석을 쉽게 수행할 수 있게 된다. 군집화 기법은 하위 그룹의 개수를 미리 설정해야 하기 때문에 사용자와의 상호 작용이 필요하고, 이렇게 생성된 하위 그룹이 최적의 결과라는 것을 보증할 수 없다. 본 논문에서는 외부 커뮤니티 연관도를 활용한 동적인 하위 그룹 생성 방법을 제안한다. 발견된 하위 그룹의 개수와 하위 그룹 순도를 기준으로 기존의 연구들과 비교하였고, 실험 결과 제안하는 방법의 우수성을 확인할 수 있었다.

공유모델 인식 성능 향상을 위한 효율적인 연속 어휘 군집화 모델링 (Efficient Continuous Vocabulary Clustering Modeling for Tying Model Recognition Performance Improvement)

  • 안찬식;오상엽
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.177-183
    • /
    • 2010
  • 연속 어휘 인식 시스템에서는 통계적 방법에 의한 어휘 인식을 수행하기 위하여 확률분포를 이용하며 이는 음소 단위의클러스터링을사용하여모델링하여샘플들을기반으로 확률 파라미터를 추정한다. 어휘 검색 시 추정된 확률 파라미터로부터 인식 결과를 나타내는데 미리 정의되지 않은 음소와 추가되어진 음소로부터 인식률이 저하되는 문제점이 발생하며, 하나의 클러스터링으로 모델링하므로 가우시안 모델이 정확성을 확보하지 못한다는 단점이 있다. 이를 개선하기 위하여 확률 분포의 혼합 가우시안 모델을 최적화하여 유사도를 기반으로 Euclidean과 Bhattacharyya 거리 측정 방법을 혼합한 군집화 모델을 제안하고, 군집화된 모델에서 음소 단위로 확률 모델을 탐색할 수 있는 시스템을 모델링하였다. 본 논문에서 제안한 시스템을 적용한 결과 시스템 성능에서 어휘 종속 인식률은 98.63%, 어휘 독립 인식률은 97.91%의 인식률을 나타내었다.

키워드 군집화를 이용한 연구 논문 분류에 관한 연구 (A Study on Research Paper Classification Using Keyword Clustering)

  • 이윤수;;이종혁;길준민
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권12호
    • /
    • pp.477-484
    • /
    • 2018
  • 컴퓨터 기술의 발전으로 힘입어 수많은 논문이 출판되고 있으며, 새로운 분야들도 계속 생기면서 사용자들은 방대한 논문들 중 자신이 필요로 하는 논문을 검색하거나 분류하기에 많은 어려움을 겪고 있다. 사용자의 이러한 어려움을 완화하기 위해 본 논문에서는 유사 내용의 논문을 분류하고 이를 군집화하는 방법을 제한한다. 본 논문의 제안 방법은 TF-IDF를 이용하여 각 논문의 초록으로부터 주요 주제어를 추출하고, K-평균 클러스터링 알고리즘을 이용하여 추출한 TF-IDF 값을 근거로 논문들을 유사 내용의 논문으로 군집화한다. 제안 방법의 실효성을 검증하기 위해 실제 데이터인 FGCS 저널의 논문 데이터를 사용하였으며, 엘보우 기법을 적용하여 클러스터 개수를 도출하고 실루엣 기법을 이용하여 클러스터링 성능을 검증하였다.

엔트로피 가중치 및 SVD를 이용한 군집 특징 선택 (Cluster Feature Selection using Entropy Weighting and SVD)

  • 이영석;이수원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.248-257
    • /
    • 2002
  • 군집화는 객체들의 특성을 분석하여 유사한 성질을 갖고 있는 객체들을 동일한 집단으로 분류하는 방법이다. 전자 상거래 자료처럼 차원 수가 많고 누락 값이 많은 자료의 경우 입력 자료의 차원축약, 잡음제거를 목적으로 SVD를 사용하여 군집화를 수행하는 것이 효과적이지만, SVD를 통해 변환된 자료는 원래의 속성 정보를 상실하기 때문에 군집 결과분석에서 원본 속성의 가치 해석이 어렵다. 따라서 본 연구는 군집화 수행 후 엔트로피 가중치 및 SVD를 이용하여 군집의 중요한 속성을 발견하기 위한 군집 특징 선택 기법 ENTROPY-SVD를 제안한다. ENTROPY-SVD는 자료의 속성들과 유사객체 군과의 묵시적인 은닉 구조를 활용하기 위하여 SVD를 이용하고 유사객체 군에 포함된 응집도가 높은 속성들을 발견하기 위하여 엔트로피 가중치를 사용한다. 또한 ENTROPY-SVD를 적용한 모델 기반의 협력적 여과기법의 추천 시스템 CFS-CF를 제안하고 그 효용성 및 효과를 평가한다.

클러스터링을 고려한 다차원척도법의 개선: 군집 지향 척도법 (Improved Multidimensional Scaling Techniques Considering Cluster Analysis: Cluster-oriented Scaling)

  • 이재윤
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.45-70
    • /
    • 2012
  • 개체들 사이의 관계를 저차원 공간에 매핑하는 다차원척도법을 수행하기 위한 다양한 방법과 알고리즘이 개발되어왔다. 그러나 PROXSCAL이나 ALSCAL과 같은 기존의 기법들은 50개 이상의 개체를 포함하는 데이터 집합을 대상으로 개체 간의 관계와 군집 구조를 시각화하는데 있어서 효과적이지 못한 것으로 나타났다. 이 연구에서 제안하는 군집 지향 척도법 CLUSCAL(CLUster-oriented SCALing)은 기존 방법과 달리 입력되는 데이터의 군집 구조를 고려하도록 고안되었다. 50명의 저자동시인용 데이터와 85개 단어의 동시출현 데이터에 대해서 적용해본 결과 제안한 CLUSCAL 기법은 군집 구조를 잘 식별할 수 있는 MDS 지도를 생성하는 유용한 기법임이 확인되었다.

효과적인 기업용 S/W 판매전략 공유를 위한 인지지도 기반의 암묵지 관리 방법

  • 정남호;이남호;이건창
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.363-370
    • /
    • 2006
  • 정보기술의 급격한 발전은 기업용 S/W 판매자들에게 새로운 판매 전량을 요구하고 있다. 즉, 기업용 S/W의 유형에 다양화 되고 고객의 니즈가 매우 정교화되고 있는바 이러한 요구사항을 충분히 고려하지 못할 경우 성공적인 판매전량을 수립할 수 없다. 그러나 이러한 기업용 S/W 판매전략에 있어서 고려해야 하는 다양한 요소들은 기업용 S/W의 유형에 따라 매우 다르고, 체계적으로 관리하기 어려운 암묵지인 관계로 지금까지 충분히 논의되지 못하였다. 이에 본 연구에서는 인지지도를 이용하여 다양한 기업용 S/W 판매사례에 대하여 기업용 S/W 선정에 영향을 미치는 요인간의 관계를 도출하였다. 이를 통하여 유사한 사례별로 인지지도를 군집화 하여 그 특성을 도출하고 이를 이용하여 기업용 S/W 판매전략에 실질적으로 도움이 될 수 있도록 하였다.

  • PDF

반려동물 사료 추천시스템을 위한 유사성 측정 알고리즘에 대한 연구 (A Study of Similarity Measure Algorithms for Recomendation System about the PET Food)

  • 김삼택
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.159-164
    • /
    • 2019
  • ICT 기술 발전으로 강아지와 고양이등 반려동물 돌보기와 건강에 대한 관심도가 높아지고 있다. 본 논문에서는 반려동물 산업의 다양한 분야에 활용될 수 있도록 반려동물 사료의 성분 데이터를 기반으로 군집분석을 수행하고 적합한 서비스에 대해 고찰한다. 군집분석을 위해 시중에서 유통되고 있는 300여 개의 강아지 및 고양이 펫푸드를 대상으로 성분별 상관관계를 분석하여 유사성을 측정하며, Hierarchical, K-Means, Partitioning around medoids(PAM), Density-based, Mean-Shift 등의 다양한 클러스터링 기법을 활용하여 군집화 하여 분석한다. 또한 반려동물의 개인화 추천시스템도 제안한다. 본 논문의 연구 결과는 반려동물을 대상으로 한 사료 추천시스템 등의 맞춤형 개인화 서비스에 활용할 수 있다.