• Title/Summary/Keyword: 계층화 분석 기법

Search Result 306, Processing Time 0.036 seconds

Exploration of Hierarchical Techniques for Clustering Korean Author Names (한글 저자명 군집화를 위한 계층적 기법 비교)

  • Kang, In-Su
    • Journal of Information Management
    • /
    • v.40 no.2
    • /
    • pp.95-115
    • /
    • 2009
  • Author resolution is to disambiguate same-name author occurrences into real individuals. For this, pair-wise author similarities are computed for author name entities, and then clustering is performed. So far, many studies have employed hierarchical clustering techniques for author disambiguation. However, various hierarchical clustering methods have not been sufficiently investigated. This study covers an empirical evaluation and analysis of hierarchical clustering applied to Korean author resolution, using multiple distance functions such as Dice coefficient, Cosine similarity, Euclidean distance, Jaccard coefficient, Pearson correlation coefficient.

A Three Schematic Analysis of Information Visualization (정보시각화에 대한 스킴모형별 비교 분석)

  • Seo, Eun-Kyoung
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.36 no.4
    • /
    • pp.175-205
    • /
    • 2002
  • Information visualization in information retrieval is a creating tool that enables us to observe, manipulate, search, navigate, explore, filter, discover, understand, interact with large volumes of data for more rapidly and far more effectively to discover hidden patterns. The focus of this study is to investigate and analyze information visualization techniques in information retrieval system in the three-schematic levels. In result, it was found that first, scientific data, documents, and retrieval result information are visualized through various techniques. Second, information visualization techniques which facilitate navigation and interaction are zoom and pan, focus+context techniques, incremental exploration, and clustering. Third, the visual metaphors used by the visualization systems are presented in the linear structure, hierarchy structure, network structure, and vector scatter structure.

A Method of AHP for PFD estimation method of which the characteristics of the basin (유역의 특성을 고려한 홍수피해잠재능(PFD) 산정기법연구를 위한 계층화분석기법(AHP) 적용)

  • Park, In Dong;Lee, Chae Young;Ahn, Won Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.616-620
    • /
    • 2015
  • 본 연구의 목적은 홍수피해 잠재능 산정을 위하여 항목별 가중치 산정을 통한 계층화분석기법의 적용성을 평가하고자 한다. 홍수피해 잠재능 산정의 경우 유역의 특성에 따른 다양한 항목과 가중치를 적절하게 고려하여야 한다. 그러나 도시화 지역의 경우 외수력과 우수관 미설치에 대한 고려 없이 미리 정해진 절차에 의해 이루어지므로 실제 현장 조건을 정확하게 모사하지 못하고 있다. 따라서 위에서 언급한 것과 같이 두 가지 주요 항목을 홍수피해 잠재능 산정 절차에 반영하여 실제 상황을 보다 잘 모사하고 다양한 전문가 집단의 설문 결과를 반영하여 보다 정확한 판단을 하는 것이 필요하다. 연구결과 항목별 가중치 산정은 주요 항목의 가중치를 산정하는데 효과적인 것으로 나타났다. 또한 외수력과 우수관 설치를 고려한 수정 방법은 홍수피해 잠재능 산정에서 보다 좋은 결과를 제시하였다.

  • PDF

Agglomerative Hierarchical Clustering Using Latent Semantic Analysis in Information Retrieval (정보 검색에서의 잠재 의미 분석 방법을 이용한 응집 계층 군집화 기법 연구)

  • Khiati, Abdel-Ilah Zakaria;Kang, Daehyun;Park, Hansaem;Kwon, Kyunglag;Chung, In-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.952-955
    • /
    • 2014
  • 본 논문에서는 정보 검색 분야에서 잘 알려진 잠재 의미 분석 방법과 계층적 군집화 방법의 단점을 상호 보완하여 보다 효율적인 정보 검색을 위한 혼합형 군집화 방법을 제안한다. 먼저, 잠재 의미 분석 방법은 벡터 연산을 통하여 자동적으로 문서 내에 있는 잠재적인 의미를 찾는 정보 검색분야에서 많이 사용되는 고전적인 방법이다. 그러나 이 방법은 언어의 유의성이나 다의성으로 인하여 발생되는 백-오브-워드(bag-of-word) 문제를 가지고 있다. 두 번째 방법인 문서 군집화를 위하여 범용적으로 사용되고 있는 계층적 군집화 방법이다. 이 방법은 이를 통하여 분석된 군집의 질적 측면에서 볼 때, 여전히 단층적 군집들이 많이 형성되어 세부적인 분석을 통한 추가적인 군집화가 필요함을 알 수 있다. 따라서, 본 논문에서는 앞서 언급한 문제점을 해결하기 위하여 혼합적인 방법으로 잠재 의미 분석 방법을 이용한 응집 계층 군집화 방법을 제안한다. 제안한 방법을 이용하여 잘 알려진 두 개의 데이터에 적용하고 기존의 방법과 그 결과를 비교함으로써 군집의 질적 측면에서의 우수함을 보인다.

Clustering of Gene Expression Data by using SOM and Hierarchical Clustering (자기 조직화 지도와 계층적 군집화를 이용한 유전자 발현 데이터 군집화 기법)

  • 박창범;이동환;이성환
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.784-786
    • /
    • 2003
  • 본 논문에서는 유전자 발현 데이터를 분석하는데 있어서 자기 조직화 지도와 계층적 군집화 기법을 상호 보완적으로 사용하여 사용자가 보다 직관적으로 군집화 결과를 해석할 수 있는 방법을 제안한다. 제안된 방법을 사용하면 빠른 처리 속도로 대용량 데이터 처리에 적합한 자기 조직화 지도의 장점을 살릴 수 있으며 계층적 군집화의 장점인 가시화 기능을 이용하여 자기 조직화 지도의 단점인 군집 경계에 대한 불명확성을 해소하여 군집화 결과를 사용자가 쉽게 이해하고 직관적으로 해석할 수 있도록 도와준다. 본 논문에서 제안된 방법의 효용성을 검증하기 위해 세 종류의 데이터를 사용하여 실험을 수행한 결과 제안된 방법이 기존 방법에 비해 더 나은 성능을 보이는 것을 확인할 수 있었다.

  • PDF

A Case Study for the Application of Storage Tiering based on ILM through Data Value Analysis (데이터 가치분석에 따른 정보수명주기 기반 스토리지 계층화 적용에 대한 사례 연구)

  • Kim, Ho-Yeon;Youn, Chun-Kyun
    • Journal of Digital Convergence
    • /
    • v.10 no.8
    • /
    • pp.159-172
    • /
    • 2012
  • In the recent, due to explosion of Digital Universe, the performance of computer and storage system is reducing. Therefore, the upgrade and capacity expansion needs is growing. Countermeasure for this problem is required fundamental and long-term solutions rather than piecemeal expansion. In this paper, we establish a data management policy for an enterprise through the operational status of storage system and the analysis of data value of it, and implement ILM-based tiered storage system on the basis of these. The results of this study shows the overall throughput was improved about 21% compared to the existing system, it is very effective to maintain continuous quality and reduce operating costs in the long term aspect.

Development of a Method for Analyzing and Visualizing Concept Hierarchies based on Relational Attributes and its Application on Public Open Datasets

  • Hwang, Suk-Hyung
    • Journal of the Korea Society of Computer and Information
    • /
    • v.26 no.9
    • /
    • pp.13-25
    • /
    • 2021
  • In the age of digital innovation based on the Internet, Information and Communication and Artificial Intelligence technologies, huge amounts of datasets are being generated, collected, accumulated, and opened on the web by various public institutions providing useful and public information. In order to analyse, gain useful insights and information from data, Formal Concept Analysis(FCA) has been successfully used for analyzing, classifying, clustering and visualizing data based on the binary relation between objects and attributes in the dataset. In this paper, we present an approach for enhancing the analysis of relational attributes of data within the extended framework of FCA, which is designed to classify, conceptualize and visualize sets of objects described not only by attributes but also by relations between these objects. By using the proposed tool, RCA wizard, several experiments carried out on some public open datasets demonstrate the validity and usability of our approach on generating and visualizing conceptual hierarchies for extracting more useful knowledge from datasets. The proposed approach can be used as an useful tool for effective data analysis, classifying, clustering, visualization and exploration.

A Technique of Cluster Detection to Self-Organized Network (자율 군집 네트워크에서 군집 탐지 기법)

  • Kim, Paul;Kim, Kyungdeok;Kim, Sangwook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.115-118
    • /
    • 2012
  • 다양한 네트워크에서 군집을 분석하고 그 구조를 발견하는 것은 그 네트워크의 복잡도를 낮추어 전체 시스템을 이해하고 관리하는데 중요하다. 특히 기본적인 컴퓨팅이 가능한 여러 기기들이 자율적으로 서로 통신하여 군집을 이루는 자율 군집 네트워크에서 군집을 정확하게 발견하는 것은 집단행동 서비스를 실현하는데 있어서 중요한 기술이다. 따라서 본 연구에서는 자율 군집 네트워크에서 군집 탐지 기법을 제안한다. 제안하는 기법은 군집을 발견하고 그 군집을 식별하기 위해 해당 네트워크에서 한 노드를 공유하는 두 개의 간선 쌍에 대해 계층 군집화를 수행하고 계층 간에 간선 유사도를 계산하여 비교한다. 계층 군집화를 통한 간선들은 트리 구조로 표현할 수 있으며 최적의 분할 밀도를 이용하여 노드들을 클러스터링한 후 최종 군집으로 분리 한다.

Fragmentation Management Method for 6LoWPAN (6LoWPAN에서 단편화 관리 기법)

  • Seo, Hyun-Gon;Han, Jae-Il
    • Journal of the Institute of Electronics Engineers of Korea TC
    • /
    • v.46 no.5
    • /
    • pp.130-138
    • /
    • 2009
  • 6LoWPAN is IPv6 packets transmission technology at Sensor network over the IEEE 802.15.4 Standard MAC and Physical layer. Adaptation layer between IP layer and MAC layer performs fragmentation and reassembly of packet for transmit IPv6 packets. RFC4944, IETF 6LoWPAN WG standard document define packet fragmentation and reassembly. In this paper, we propose the IRM(Immediate Retransmission Method) and SRM(Selective Retransmission Method) to manage packet fragmentation and reassembly at 6LoWPAN. Each time destination receives a fragmented packet, it sends Ack message to the source node on IRM. However, on SRM, the destination node receives all fragmented packet, it sends Ack message or Nak message to the source node. In this case, Nak message include the dropped packet number. To compare the performance of the proposed schemes, we develop a simulator using C++. The result of simulation shows the proposed schemes provider better performance than RFC4944 standard scheme.

A Cross Layer Optimization Technique for Improving Performance of MLC NAND Flash-Based Storages (MLC 낸드 플래시 기반 저장장치의 쓰기 성능 개선을 위한 계층 교차적 최적화 기법)

  • Park, Jisung;Lee, Sungjin;Kim, Jihong
    • Journal of KIISE
    • /
    • v.44 no.11
    • /
    • pp.1130-1137
    • /
    • 2017
  • The multi-leveling technique that stores multiple bits in a single memory cell has significantly improved the density of NAND flash memory along with shrinking processes. However, because of the side effects of the multi-leveling technique, the average write performance of MLC NAND flash memory is degraded more than twice that of SLC NAND flash memory. In this paper, we introduce existing cross-layer optimization techniques proposed to improve the performance of MLC NAND flash-based storages, and propose a new integration technique that overcomes the limitations of existing techniques by exploiting their complementarity. By fully exploiting the performance asymmetry in MLC NAND flash devices at the flash translation layer, the proposed technique can handle many write requests with the performance of SLC NAND flash devices, thus significantly improving the performance of NAND flash-based storages. Experimental results show that the proposed technique improves performance 39% on average over individual techniques.