• Title/Summary/Keyword: 유사도 측정 기법

Search Result 618, Processing Time 0.027 seconds

A Minimization Technique of XML Path Comparison Based on Signature (시그니쳐를 이용한 XML 경로 비교의 최소화 기법)

  • Jang, Kyung-Hoon;Hwang, Byung-Yeon
    • The Journal of Society for e-Business Studies
    • /
    • v.17 no.3
    • /
    • pp.61-72
    • /
    • 2012
  • Since XML allows users to define any tags, XML documents with various structures have been created. Accordingly, many studies on clustering and searching the XML documents based on the similarity of paths have been done in order to manage the documents efficiently. To retrieve XML documents having similar structures, the three-dimensional bitmap indexing technique uses a path as a unit when it creates an index. If a path structure is changed, the technique recognizes it as a new path. Thus, another technique to measure the similarity of paths was proposed. To compute the similarity between two paths, the technique compares every node of the paths. It causes unnecessary comparison of the nodes, which do not exist in common between the two paths. In this paper, we propose a new technique that minimizes the comparison using signatures and show the performance evaluation results of the technique. The comparison speed of proposed technique was 20 percent faster than the existing technique.

Improved PageRank Algorithm Using Similarity Information of Documents (문서간의 유사도를 이용한 개선된 PageRank 알고리즘)

  • 이경희;김민구;박승규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.169-171
    • /
    • 2003
  • 웹에서의 검색 방법에는 크게 Text-Based 기법과 Link-Based 기법이 있다. 본 논문은 그 중에서 Link-Based 기법의 하나인 PageRank 알고리즘에 대해 연구 하고자 한다. 이 PageRank 알고리즘은 각 페이지의 중요성을 수치로 계산하는 방법이다. 하지만 이 알고리즘에서는 페이지에서 페이지로 링크를 따라갈 확률의 값을 일정하게 주어서 모든 페이지의 값을 획일적으로 계산하였기 때문에 각 페이지의 검색 효율성에 문제가 있다고 판단하여, 이를 해결하고자 본 논문은 페이지사이의 유사도를 측정하여 유사도에 따라 링크를 따라가는 확률 값인 Damping factor값을 다르게 부여하여 검색의 효율성을 높였다. 이를 위하여 두 가지 방법의 실험을 통하여 구현, 증명하였다.

  • PDF

Human Resource Allocation Method using Similarity between Software Project Experience and WBS Activity (S/W 프로젝트 수행 경험과 WBS Activity의 유사도 측청을 통한 인력 할당 기법)

  • Kwon, Jinyong;Lee, Euijong;Baik, Doo-Kwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.530-533
    • /
    • 2015
  • 기존의 조사에 따르면 현재 소프트웨어 개발 프로젝트의 실패율은 높은 편이다. 미국의 The Standish Group의 보고서에 따르면 소프트웨어 프로젝트의 성공률은 약 32%로 낮음을 볼 수 있다. 소프트웨어 프로젝트 성공에 영향을 주는 요소 중 하나는 인력배치이다. 이는 소프트웨어 개발 프로젝트의 참여 인력 구성에 따라 생산성, 비용 및 개발기간이 달라지게 되기 때문이다. 즉 인력 구성에 따라 프로젝트 성공률에 많은 영향을 주게 될 수 있다. 프로젝트 인력할당은 WBS(Work Breakdown Structure)에 따라 PM(Project Manager) 또는 부서장이 할당하게 되는데, 이들은 프로젝트 구성원들의 상세한 정보까지 파악이 어렵기 때문에 인력구성의 어려움이 존재한다. 과거에 수행했던 개발 프로젝트에서 유사성이 높은 작업을 했음에도 불구하고 전혀 경험이 없는 작업에 할당되면 상대적으로 업무 지식습득에 어려움을 겪고 시간 지연에 따른 비용이 추가적으로 발생하게 된다. 이러한 문제를 해결하고자 본 연구는 소프트웨어 개발 프로젝트 구성원의 상세한 정보들과 소프트웨어 개발 업무와의 유사도 측정을 통해 인력을 업무에 할당하는 기법을 제안한다. 이를 위하여 제안한 기법을 프로토타입으로 구현한 후 현업에서 실제 개발되는 프로젝트에 적용하여 제안 기법의 우수함을 평가한다.

A Visualization Tool for Similarity Estimation of Sequence Data (서열 정보의 유사성 검사를 위한 가시화 도구)

  • 황미녕;강영민;조환규
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.559-561
    • /
    • 2000
  • 현재 활발한 연구가 진행중인 유전자 분석과 같은 분야에서는 유전자 염기 서열과 같은 대규모 서열 정보들에 대한 효과적인 분석기술을 요구하고 있다. 본 논문은 이러한 서열 정보들 사이의 유사도를 측정하고 분석하는 작업을 효과적으로 지원하기 위한 가시화 도구의 개발을 다룬다. 본 논문에서 사용하는 유사도 가시화 기법은 유전자 정보의 유사도 가시화를 위해 제안되었던 시각적 점-행렬 도면(Graphical Dot-Matrix Plots) 기법을 이용하는데, 이 시각적 점-행렬 도면 기법은 비교 대상이 되는 서열 정보의 크기가 커지면 효율적으로 가시화하기가 힘들다는 단점을 가진다. 본 논문은 시각적 점-행렬 도면 기법의 이러한 문제를 해결하기 위해 서열 정보 유사도 비교 결과를 화면의 해상도 내에서 표현할 수 있도록 데이터를 영역별로 분할하고 각 영역별 일치도를 이분 그래프(bipartite graph)의 최대 평면 일치(maximal planar matching)를 이용하여 결정하고 이를 하나의 화소(pixel)로 출력하는 기법을 제안한다.

  • PDF

Similarity Measure and Clustering Technique for XML Documents by a Parent-Child Matrix (부모-자식 행렬을 사용한 XML 문서 유사도 측정과 군집 기법)

  • Lee, Yun-Gu;Kim, Woosaeng
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.19 no.7
    • /
    • pp.1599-1607
    • /
    • 2015
  • Recently, researches have been developing efficient techniques for accessing, querying, and managing XML documents which are frequently used in the Internet. In this paper, we propose a parent-child matrix to cluster XML documents efficiently. A parent-child matrix analyzes both the content and structural features of an XML document. Each cell of a parent-child matrix has either the value of a node in an XML tree or the value of a child node, where a parent-child relationship exists in the XML tree. Then, the similarity between two XML documents can be measured by the similarity between two corresponding parent-child matrices. The experiment shows that our proposed method has good performance.

A Study on the Searching Model for Class Reuse (클래스 재사용을 위한 검색 모델 연구)

  • 허종오;박만곤
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.11b
    • /
    • pp.796-801
    • /
    • 2002
  • 최근의 소프트웨어 개발은 객체지향 프로그램 개발 기법을 사용하여 소프트웨어를 개발하고 있다. 초보 개발자에게는 적절한 객체를 식별하고 정확한 속성과 행위를 부여하는 객체 지향 기법은 상당히 힘든 문제이다. 객체의 집합, 즉 클래스 모델링 기법에도 재사용 기법을 사용한다면 이미 작성된 모델을 참조하여 객체 지향 개발 기법을 처음 접하는 초보 개발자에게는 학습의 기회를 제공하고, 숙련된 개발자에게는 검증된 모델을 통해 모델링 실패를 방지할 수 있는 안전성을 제공할 수 있다. 본 논문에서는 유사성(Similarity) 측정 기법을 적용하여 클래스간의 유사도를 판단하고, 관계 일치여부를 분석하여, 재사용 가능한 클래스를 검색하는 모델을 제안한다.

  • PDF

Classification of Hyperspectral Images Using Spectral Mutual Information (분광 상호정보를 이용한 하이퍼스펙트럴 영상분류)

  • Byun, Young-Gi;Eo, Yang-Dam;Yu, Ki-Yun
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.15 no.3
    • /
    • pp.33-39
    • /
    • 2007
  • Hyperspectral remote sensing data contain plenty of information about objects, which makes object classification more precise. In this paper, we proposed a new spectral similarity measure, called Spectral Mutual Information (SMI) for hyperspectral image classification problem. It is derived from the concept of mutual information arising in information theory and can be used to measure the statistical dependency between spectra. SMI views each pixel spectrum as a random variable and classifies image by measuring the similarity between two spectra form analogy mutual information. The proposed SMI was tested to evaluate its effectiveness. The evaluation was done by comparing the results of preexisting classification method (SAM, SSV). The evaluation results showed the proposed approach has a good potential in the classification of hyperspectral images.

  • PDF

Measuring Similarity Between Lecture Notes Based on Tree Structure (트리 구조로 된 강의노트 사이의 유사도 측정 기법)

  • Lim, Seon-Kyu;Kim, Myoung-Ho
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.25-28
    • /
    • 2011
  • 본 논문에서는 강의노트의 저장 형식이 XML 문서라는 사실을 기반으로 강의노트 사이의 유사도 계산 문제를 XML 문서 사이의 유사도 계산 문제로 치환해 해결한다. 그리고 유사도를 계산할 때 강의노트가 포함하는 컨텐츠의 논리적 구조의 특징을 반영한다. 본 논문에서 제안한 기법을 사용해 사용자가 소유한 강의노트와 유사한 강의노트들을 정확하게 검색함으로써 사용자가 효과적으로 강의노트를 학습할 수 있도록 도움을 줄 수 있다.

An Object-Oriented Case-Base Design and Similarity Measures for Bundle Products Recommendation Systems (번들상품추천시스템 개발을 위한 객체지향 사례베이스 설계와 유사도 측정에 관한 연구)

  • 정대율
    • Journal of Intelligence and Information Systems
    • /
    • v.9 no.1
    • /
    • pp.23-51
    • /
    • 2003
  • With the recent expansion of internet shopping mall, the importance of intelligent products recommendation agents has been increasing. for the products recommendation, This paper propose case-based reasoning approach, and developed a case-based bundle products recommendation system which can recommend a set of sea food used in family events. To apply CBR approach to the bundle products recommendation, it requires the following 4R steps : \circled1 Retrieval, \circled2 Reuse, \circled3 Revise, \circled4 Retain. To retrieve similar cases from the case-base efficiently, case representation scheme is most important. This paper used OW(Object Modeling Technique) to represent bundle products recommendation cases, and developed a similarity measure method to search similar cases. To measure similarity, we used weight-sum approach basically. Especially This paper propose the meaning and uses of taxonomies for representing case features.

  • PDF

Adaptive Euclidean Distance Measure Method for Numeric Data Distribution (수치 데이터 분포에 적응적 유클리드 거리 측정 기법)

  • Choi, You-Hwan;Joo, Bum-Joon;Jung, Sung-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.67-69
    • /
    • 2011
  • 데이터의 군집 분석에서 두 개의 서로 다른 데이터에 대한 유사도(거리)를 어떻게 정의하는가는 매우 중요한 문제이다. 수치속성에 대한 거리 측정 방법에는 다양한 기법이 존재하지만 각 속성의 크기와 범위가 서로 크게 다를 경우 이들을 동일한 인자로 여기고 거리 측정을 하게 되면 논리적인 오류를 범할 수 있다. 기존의 군집 분석 연구에서 사용된 거리 측정 기법은 데이터의 정규화 과정을 통해 이 문제를 해결하려고 노력하지만 일반적인 정규화는 이상치의 존재나 데이터의 편중된 분포 등의 이유로 속성별 거리가 왜곡될 수 있다. 본 논문은 이러한 문제점을 해결하기 위해 정규화된 데이터에서 각 속성의 비중을 고려한 적응적 유클리드 거리 측정 기법(AEDM: Adaptive Euclidean Distance Measure)을 제안한다. AEDM은 유클리드 거리를 기반으로 정규화 된 데이터의 형태에 따라 가중치를 부여하여 데이터의 분포에 관계없이 각 속성간의 거리를 충분히 반영하기 때문에 더욱 정확한 군집 분석을 가능하게 한다.