• 제목/요약/키워드: Structure similarity

검색결과 994건 처리시간 0.024초

유사도 검색을 위한 데이터 재배열을 이용한 공간 효율적인 역 색인 기법 (A Space-Efficient Inverted Index Technique using Data Rearrangement for String Similarity Searches)

  • 임마누;김종익
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1247-1253
    • /
    • 2015
  • 유사도 검색에서는 효율적으로 유사성을 만족하는 문자열을 찾기 위해서 데이터에 대한 역 색인을 구축하여 이용한다. 일반적으로 기존의 기법들은 빠른 응답속도의 질의처리를 위해서 역 색인을 메모리에 상주시킨다. 하지만 구축된 역 색인은 그 크기가 매우 크다는 문제점을 가지고 있다. 따라서 데이터의 크기가 매우 큰 경우나 자원이 제약적인 환경에서는 역 색인을 이용한 질의처리가 불가능할 수 있다. 본 논문에서는 동일한 q-그램을 포함하는 문자열들이 서로 인접한 위치가 되도록 재배치시킨 후 해당 문자열들을 범위로 표현한다. 실험을 통하여 질의처리의 성능을 희생하지 않으면서도 색인의 크기가 줄어드는 것을 보인다.

구조와 내용 유사도에 기반한 XML 웹 문서 검색시스템 구축 (An Implementation of XML document searching system based on Structure and Semantics Similarity)

  • 박우창;서여진
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.99-115
    • /
    • 2005
  • XML은 인터넷상에서 데이터 표현과 변환을 위한 표준이며, 이러한 XML 문서에서 필요한 정보를 찾아내기 위해 XML 문서 검색 시스템이 필요하다. 본 연구는 이러한 필요성에 기반을 두어 XML 구조를 최대한 활용하여, 주어진 XML 문서에 대해 구조와 내용이 가장 가까운 문서들을 찾아내는 검색 시스템을 개발하였다. 검색 메트릭은 XML 문서들 중 각 태그의 이름에 대한 유사도, 각 태그가 포함하는 값의 유사도와 태그 간 구조에 대한 유사도를 모두 고려하며, 검색 후 유사도의 결과 값에 따라 검색 결과를 순위화 하여 보여준다. 검색 방법은 전통적인 키워드 검색 방식, 태그와 값을 입력하여 검색할 수 있는 방식, XML 문서를 입력하여 검색하는 세 가지 질의 방식을 제공함으로서 사용자들의 기호에 따라 원하는 방식을 골라 검색할 수 있도록 구성하여 시스템의 유용성을 높였다. 개발된 XML 문서 검색 시스템은 INEX에서 제공된 XML 문서들을 대상으로 하여 테스트하였다.

  • PDF

Open-Ball Scheme을 이용한 2D 패턴의 상대적 닮음 정도 측정의 Moment Invariant Method와의 비교 (Similarity Measurement Using Open-Ball Scheme for 2D Patterns in Comparison with Moment Invariant Method)

  • 김성수
    • 대한전기학회논문지:전력기술부문A
    • /
    • 제48권1호
    • /
    • pp.76-81
    • /
    • 1999
  • The degree of relative similarity between 2D patterns is obtained using Open-Ball Scheme. Open-Ball Scheme employs a method of transforming the geometrical information on 3D objects or 2D patterns into the features to measure the relative similarity for object(patten) recognition, with invariance on scale, rotation, and translation. The feature of an object is used to obtain the relative similarity and mapped into [0, 1] the interval of real line. For decades, Moment-Invariant Method has been used as one of the excellent methods for pattern classification and object recognition. Open-Ball Scheme uses the geometrical structure of patterns while Moment Invariant Method uses the statistical characteristics. Open-Ball Scheme is compared to Moment Invariant Method with respect to the way that it interprets two-dimensional patten classification, especially the paradigms are compared by the degree of closeness to human's intuitive understanding. Finally the effectiveness of the proposed Open-Ball Scheme is illustrated through simulations.

  • PDF

A Table Integration Technique Using Query Similarity Analysis

  • Choi, Go-Bong;Woo, Yong-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권3호
    • /
    • pp.105-112
    • /
    • 2019
  • In this paper, we propose a technique to analyze similarity between SQL queries and to assist integrating similar tables. First, the table information was extracted from the SQL queries through the query structure analyzer, and the similarity between the tables was measured using the Jacquard index technique. Then, similar table clusters are generated through hierarchical cluster analysis method and the co-occurence probability of the table used in the query is calculated. The possibility of integrating similar tables is classified by using the possibility of co-occurence of similarity table and table, and classifying them into an integrable cluster, a cluster requiring expert review, and a cluster with low integration possibility. This technique analyzes the SQL query in practice and analyse the possibility of table integration independent of the existing business, so that the existing schema can be effectively reconstructed without interruption of work or additional cost.

XML 문서의 구조와 내용을 고려한 유사도 측정 (Similarity Measure based on XML Document's Structure and Contents)

  • 김우생
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1043-1050
    • /
    • 2008
  • XML(Extensible Markup Language)은 인터넷 상에서 데이터 표현과 교환을 위한 표준으로 자리 잡고 있다. 웹의 발전과 함께 XML문서들이 정보 검색, 문서 관리, 데이터 마이닝 등의 응용에서 폭 넓게 사용되면서 구조적으로 정보가 풍부한 이러한 문서들을 자동으로 처리하고 검색하는 기술들이 요구되고 있다. 본 연구에서는 XML 문서 의 구조와 내용을 고려하여 유사한 문서들을 검색하는 새로운 방법을 제안한다. XML 문서의 구조적 유사성은 간단한 스트링 매칭 기법으로 찾고, 문서 내용의 유사성은 문서 요소(element)들의 이름과 경로를 고려한 가중치를 통해 찾는 방법으로 전체의 시간 복잡도는 비교되는 두 문서의 크기에 선형적으로 비례한다.

  • PDF

유사 구조 기반 XML 문서의 점진적 클러스터링 (Incremental Clustering of XML Documents based on Similar Structures)

  • 황정희;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.699-709
    • /
    • 2004
  • XML은 정보 관리와 데이타 교환에서 점차로 더 중요해지고 있다. 효율적인 구조 검색과 문서 통합을 위한 기초 과정은 유사한 구조를 갖는 문서를 클러스터링 하는 것이다. 이것은 구조가 다른 전체 문서를 대상으로 검색하는 것보다 더 신속하고 유연성을 제공하기 때문이다. 따라서 이 논문에서는 XML 문서의 구조 검색과 통합에 유용한 유사 구조기반의 점진적 클러스터링 기법을 제안한다. 기존의 문서 클러스터링에서 벡터를 이용한 문서의 유사도에 의해 클러스터를 형성하는 것과는 다르게 우리는 대량의 데이타에 유연하게 적용할 수 있는 트랜잭션 데이타를 위한 클러스터링 알고리즘을 사용하였다. 제안 기법은 먼저 순차 패턴 알고리즘을 이용하여 XML 문서의 대표 구조를 추출한다. 그리고 문서를 하나의 트랜잭션으로, 문서의 대표구조를 트랜잭션의 항목으로 간주하여 유사 구조 항목 기반의 점진적인 클러스터링을 수행한다. 아울러, 클러스터의 응집도와 클러스터간의 유사도를 정의하였고, 이를 이용하여 기존 연구와의 실험에 대한 분석을 통해 제안 기법의 효율성을 분석하였다.

Self-similarity in the equation of motion of a ship

  • Lee, Gyeong Joong
    • International Journal of Naval Architecture and Ocean Engineering
    • /
    • 제6권2호
    • /
    • pp.333-346
    • /
    • 2014
  • If we want to analyze the motion of a body in fluid, we should use rigid-body dynamics and fluid dynamics together. Even if the rigid-body and fluid dynamics are each self-consistent, there arises the problem of self-similar structure in the equation of motion when the two dynamics are coupled with each other. When the added mass is greater than the mass of a body, the calculated motion is divergent because of its self-similar structure. This study showed that the above problem is an inherent problem. This problem of self-similar structure may arise in the equation of motion in which the fluid dynamic forces are treated as external forces on the right hand side of the equation. A reconfiguration technique for the equation of motion using pseudo-added-mass was proposed to resolve the self-similar structure problem; specifically for the case when the fluid force is expressed by integration of the fluid pressure.

부유식 유체저장용 2차원 막구조물의 이론적 해석 (An Analytic Analysis for a Two-Dimensional Floating and Fluid-Filled Membrane Structure)

  • 최윤락
    • 한국해양공학회지
    • /
    • 제23권4호
    • /
    • pp.32-37
    • /
    • 2009
  • An analytic similarity shape solution was studied for a two-dimensional floating and fluid-filled membrane structure. The static shape of a membrane structure can be expressed as a set of nonlinear ordinary differential equations. The integration of curvature leads to an analytic solution for the shape, which contains unknown boundary values. Matching the upper and lower shapes at the free surface incorporated with their buoyancy allowed the unknowns to be determined. Some characteristic values of similarity shapes were evaluated and shapes are illustrated for various density ratios and volume efficiency ratios.

상대유사도를 이용한 새로운 무감독학습 신경망 및 경쟁학습 알고리즘 (A New Unsupervised Learning Network and Competitive Learning Algorithm Using Relative Similarity)

  • 류영재;임영철
    • 한국지능시스템학회논문지
    • /
    • 제10권3호
    • /
    • pp.203-210
    • /
    • 2000
  • 본 논문에서는 패턴분류문제를 해결하기 위한 새로운 무감독학습 신경망 및 경쟁학습 알고리즘을 제한한다. 제아하는 신경망은 입력 데이터의 군집을 분류하기 위한 거리측도로서 군집들 상호간의 상대유사도(relative similarity)를 기반으로 하고 있다. 이러한 까닭에 제안하는 신경망과 알고리즘을 상대유사 신경망 (relative similarity network; RSN)및 학습 알고리즘이라 이름한다. 상대유사도를 정의하고 가중벡터 학습 규칙을 구성함으로써, RSN의 구조를 설계하고 학습알고리즘을 구현하기 의한 의사코드를 기술한다. 일반적인 패턴분류에 RSN을 적용한 결과, 초기 학습률이 없음에도 불구하고 기존이 경쟁학습 신경망인 WTAdlsk SOM고 동등한 성능을 나타내었다. 반면 기존 경쟁학습 신경망의 분류성능이 저하되었던 군집이 경걔가 불분명한 패턴, 그리고 군집이 밀집도와 군집의 크기가 다른 패턴들에 대한 실험에서는 기존의 경쟁학습망보다 효과적인 분류결과를 나타내었다.

  • PDF

Community Detection using Closeness Similarity based on Common Neighbor Node Clustering Entropy

  • Jiang, Wanchang;Zhang, Xiaoxi;Zhu, Weihua
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권8호
    • /
    • pp.2587-2605
    • /
    • 2022
  • In order to efficiently detect community structure in complex networks, community detection algorithms can be designed from the perspective of node similarity. However, the appropriate parameters should be chosen to achieve community division, furthermore, these existing algorithms based on the similarity of common neighbors have low discrimination between node pairs. To solve the above problems, a noval community detection algorithm using closeness similarity based on common neighbor node clustering entropy is proposed, shorted as CSCDA. Firstly, to improve detection accuracy, common neighbors and clustering coefficient are combined in the form of entropy, then a new closeness similarity measure is proposed. Through the designed similarity measure, the closeness similar node set of each node can be further accurately identified. Secondly, to reduce the randomness of the community detection result, based on the closeness similar node set, the node leadership is used to determine the most closeness similar first-order neighbor node for merging to create the initial communities. Thirdly, for the difficult problem of parameter selection in existing algorithms, the merging of two levels is used to iteratively detect the final communities with the idea of modularity optimization. Finally, experiments show that the normalized mutual information values are increased by an average of 8.06% and 5.94% on two scales of synthetic networks and real-world networks with real communities, and modularity is increased by an average of 0.80% on the real-world networks without real communities.