• 제목/요약/키워드: 분석적 계층화 기법

검색결과 258건 처리시간 0.031초

계층 발생 프레임워크를 이용한 군집 계층 시각화 (Visualizing Cluster Hierarchy Using Hierarchy Generation Framework)

  • 신동화;이세희;서진욱
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권6호
    • /
    • pp.436-441
    • /
    • 2015
  • 군집화 알고리즘은 그 종류에 따라 만들어낼 수 있는 군집의 종류와 보여줄 수 있는 정보의 수준이 차이가 난다. 밀도기반 군집화 알고리즘은 데이터 분포 상의 임의의 모양을 가진 군집을 잘 잡아내지만 보여줄 수 있는 계층정보가 매우 적거나 없는 수준이고, 반면 계층적 군집화 알고리즘은 자세한 계층 정보를 보여주지만 구 모양의 군집 외에는 잘 잡아내지 못한다. 이 논문에서는 이러한 두 군집화 방식의 대표적 알고리즘인 OPTICS와 응집 계층 군집화 알고리즘의 장점만을 취하는 계층 발생 프레임워크를 제시하고 이와 더불어 효과적 데이터 분석을 위한 여러 시각화, 상호작용 기법을 지원하는 시각적 분석 애플리케이션을 제공한다.

정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구 (Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval)

  • ;강대현;박한샘;권경락;정인정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

공간 데이터 웨어하우스에서 시공간 데이터의 효율적인 집계 정보 관리 기법 (Efficient Aggregate Information Management of Spatiotemporal Data in Spatial Data Warehouses)

  • 유호선;유병섭;박순영;이재동;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.43-46
    • /
    • 2005
  • 다차원 분석을 위한 OLAP 연산에서는 사용자의 요청에 빠르게 응답하기 위해 집계 값을 미리 계산하여 저장해 두는 사전 집계 방식을 이용한다. 시공간 데이터에 대한 사전 집계 기법으로는 R-트리의 각 노드에 대한 과거 집계 값을 요약 테이블로 관리하는 기법과 R-트리의 노드에서 현재 집계 값을 관리하는 기법이 있다. 그러나 이 기법들은 현재와 과거 모두의 집계 정보를 필요로 하는 시스템에서는 성능이 저하되며, 특히 과거 집계 정보의 경우 시간에 따른 계층화가 되어있지 않아 시간에 대한 계층 분석에 어려움이 있다. 본 논문에서는 시공간 데이터의 현재와 과거 집계 정보를 효율적으로 관리하는 기법을 제안한다. 제안 기법은 aR-tree를 이용하여 해당 영역에 대한 현재 집계 정보를 저장하고, 각 노드에 과거 집계 정보에 대한 연결을 위하여 링크를 추가하였다. 과거 집계 정보는 각 노드의 과거에서 현재까지의 집계 정보를 계층 구조로 유지하는 시간 요약 집계 테이블을 만들어 저장한다. 따라서 제안한 기법은 현재와 과거 집계 정보를 모두 유지할 수 있으므로 현재와 과거 집계 정보에 대한 처리 성능을 향상시킨다. 또한 제안 기법에서는 공간 정보를 공간 인덱스인 R-트리로 유지하고, 과거로부터의 시간 정보를 시간 요약 집계 테이블을 이용하여 계층화시켜 유지하므로 시간과 공간에 대한 계층 분석이 용이하다.

  • PDF

한글 저자명 군집화를 위한 계층적 기법 비교 (Exploration of Hierarchical Techniques for Clustering Korean Author Names)

  • 강인수
    • 정보관리연구
    • /
    • 제40권2호
    • /
    • pp.95-115
    • /
    • 2009
  • 저자식별은 학술문헌에 출현한 동명저자명들을 실세계의 서로 다른 사람들로 대응시키는 것이다. 이를 위해 임의의 동명저자명쌍의 유사도를 계산하고 이를 바탕으로 동명저자명 개체들을 군집화하는 단계를 거친다. 저자명의 군집화 기법으로 주로 계층적 군집법이 사용되었으나 다양한 계층적 군집법에 대한 비교 평가는 미흡했다. 이 연구는 다이스계수, 코사인유사도, 유클리디안 거리, 자카드계수, 피어슨 상관계수 등의 다양한 개체거리/유사도수식과 계층적 군집법들의 상관관계와 계층적 군집기법들의 한글 저자식별 성능에 대한 비교/분석을 다룬다.

자기 조직화 지도와 계층적 군집화를 이용한 유전자 발현 데이터 군집화 기법 (Clustering of Gene Expression Data by using SOM and Hierarchical Clustering)

  • 박창범;이동환;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.784-786
    • /
    • 2003
  • 본 논문에서는 유전자 발현 데이터를 분석하는데 있어서 자기 조직화 지도와 계층적 군집화 기법을 상호 보완적으로 사용하여 사용자가 보다 직관적으로 군집화 결과를 해석할 수 있는 방법을 제안한다. 제안된 방법을 사용하면 빠른 처리 속도로 대용량 데이터 처리에 적합한 자기 조직화 지도의 장점을 살릴 수 있으며 계층적 군집화의 장점인 가시화 기능을 이용하여 자기 조직화 지도의 단점인 군집 경계에 대한 불명확성을 해소하여 군집화 결과를 사용자가 쉽게 이해하고 직관적으로 해석할 수 있도록 도와준다. 본 논문에서 제안된 방법의 효용성을 검증하기 위해 세 종류의 데이터를 사용하여 실험을 수행한 결과 제안된 방법이 기존 방법에 비해 더 나은 성능을 보이는 것을 확인할 수 있었다.

  • PDF

정보시각화에 대한 스킴모형별 비교 분석 (A Three Schematic Analysis of Information Visualization)

  • 서은경
    • 한국문헌정보학회지
    • /
    • 제36권4호
    • /
    • pp.175-205
    • /
    • 2002
  • 인터넷과 대용량 데이터베이스가 정보검색환경을 주도하게 되면서 이용자가 원하는 정보를 효율적으로 찾을 수 있는 강력한 검색도구가 요구되었다. 정보시각화 기법은 이러한 요구에 부응하여 개발된 것으로 복잡하고도 대규모의 데이터를 의미적으로 그리고 조직적으로 보여주는 시각표상 기법이라 할 수 있다. 본 연구는 정보검색시스템에서 다각적으로 응용되고 있는 정보시각화 기법을 조사 분석하였다. 그 결과, 첫째 연구결과 데이터, 검색대상인 문헌, 검색결과로 나타난 검색정보를 시각화 대상으로 하여 연구가 진행되고 있었다. 둘째, 이용자의 상호작용과 항해를 수월하게 하는 정보시각화 기법으로는 줌과 팬기법, focus+ context기법, 점증탐사기법, 클러스터링 기법 둥을 들 수 있다. 셋째, 이용자에게 실제 시각메타포로 보여주는 방식으로 선형구조 표현방식, 계층구조 표현방식, 네트워크구조 표현방식, 벡터분산구조 표현방식을 찾아볼 수 있었다. 정보검색시스템에 계속적으로 정보시각화 기법이 응용되고 구현되기 위해서는 기존 기법의 평가와 이용자 요구분석이 수행되어야 하므로 본 연구의 결과 또한 새로운 시각화 인터페이스 개발에 도움이 될 것으로 본다.

데이터 가치분석에 따른 정보수명주기 기반 스토리지 계층화 적용에 대한 사례 연구 (A Case Study for the Application of Storage Tiering based on ILM through Data Value Analysis)

  • 김호연;윤천균
    • 디지털융복합연구
    • /
    • 제10권8호
    • /
    • pp.159-172
    • /
    • 2012
  • 최근 데이터 폭증으로 인한 시스템 및 스토리지 성능저하에 따른 upgrade와 용량증설 등의 요구가 거세지고 있어 단편적인 증설에 의한 해결보다는 보다 근원적이고 장기적 관점의 해결책이 요구되고 있다. 본 논문에서는 이에 대한 해결책으로 기업의 운영 중인 스토리지 시스템의 운영 상태와 데이터 가치 분석을 통한 정보수명주기 기반 스토리지 계층화 방안을 개선안으로 제시하고 구현하였다. 본 연구를 통해 체계화된 데이터 관리방안 수립과 정보수명주기 기반 계층화된 스토리지 시스템으로 재구성한 후 기존 대비 약 21%의 전체 Throughput이 개선되었고 장기적 관점에서 지속적인 품질유지 및 운영비용 절감에 매우 효과적임을 확인하였다.

계층화분석기법을 통한 구조물적 홍수방어 최적대안 선정 방안 연구 (A Method for Selecting a Structural Optimal Flood Mitigation Plan Using Analytic Hierarchy Process)

  • 이정호;전영준;안재현;김태웅
    • 한국방재학회 논문집
    • /
    • 제9권3호
    • /
    • pp.117-126
    • /
    • 2009
  • 유역종합치수계획 수립 시 유역 내 적용이 가능한 구조물적 비구조물적 치수계획은 매우 광범위하고, 특히 그 중에서도 구조물적 홍수방어 시설들의 특성은 매우 다양하다. 이들을 조합하여 유역의 홍수 저감능력을 최대화 하는 최적대안을 선정하는 것은 쉬운 일이 아니며, 현재 구조물적 홍수방어 후보대안에 대한 적절한 평가 기준이나 다양한 홍수방어 후보대안들 중 최적대안의 선정에 관한 지침 또한 미흡한 실정이다. 본 연구에서는 유역종합치수계획의 구조물적 홍수방어 후보대안들에 대한 치수경제성 및 정책성 평가 결과를 바탕으로 최적대안을 선정하는 과정에서, 의사결정기법 중의 하나인 계층화분석기법을 도입하여 적용함으로써 평가항목들 간의 가중치 결정 및 최적대안을 도출하는 과정을 예시하였다. 후보대안들 각각의 하위 세부 평가항목들의 가중치 결정에는 계층화분석기법 전용 프로그램인 Expert Choice 11.5를 활용하였으며, 연구 결과를 바탕으로 유역종합치수계획의 구조물적 홍수방어 최적대안 선정에 있어 보다 표준화된 절차를 제시하였다.

육군 미래전투체계 구축을 위한 우선순위 결정에 관한 연구 ((A Study on the Priority Determination for Building Army Future Combat System))

  • 서용채;송영일
    • 한국국방경영분석학회지
    • /
    • 제35권1호
    • /
    • pp.33-49
    • /
    • 2009
  • 현재 국방 선진국들은 장기적 차원에서 미래전투체계의 개발에 박차를 가하고 있다. 이에 우리 육군도 국방개혁의 연장선에서 미래전에 대비한 전투체계 개발에 역점을 두어야 한다. 먼저, 본 연구는 육군의 미래전투체계 구축에 대한 당위성을 제기하고 둘째, 미래전투체계를 구성하는 개별 전투체계에 대한 우선순위를 계층화 분석기법을 적용하여 분석함으로써 앞으로 있을 육군 FCS 관련사업의 구체적인 마스터플랜 작성에 활용될 수 있는 방안을 제시하고자 한다.

양쪽중단된 지수분포의 모수와 신뢰도에 대한 계층적 베이즈추정 (Hierarchical Bayes Estimation of Parameter and Reliability Function in Doubly Censored Exponential Distribution)

  • 조장식;강상길
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.405-414
    • /
    • 1999
  • 양쪽중단(doubly censored)된 지수분포에서 모수와 신뢰도함수를 계층적 베이지안(hierarchical Bayesian)방법을 이용하여 추정하였다. 베이즈 계산은 깁스표본기법(Gibbs sampler)을 이용하고 또한 완전조건부 분포(full conditional distribution)의 정량화 상수를 모르는 경우에는 적합기각방법(adaptive rejection sampling)을 이용하였다. 그리고 실제자료를 이용하여 분석을 하였다.

  • PDF