• 제목/요약/키워드: XML Document Searching

검색결과 31건 처리시간 0.026초

XML DOM을 이용한 웹문서 검색 알고리즘 (Retrieval algorithm for Web Document using XML DOM)

  • 김노환;정충교
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권6호
    • /
    • pp.775-782
    • /
    • 2001
  • 현재까지 웹 검색엔진은 각 문서가 어떤 키워드를 얼마나 갖고 있는지, 키워드의 빈도수에 따라서, 문서에 키워드를 많이 포함하는 문서가 가까운 문서라는 가정에 의거 문서 순위를 사용자에게 보여주는 형태였다. 이런 형태의 검색은 HTML 웹 데이터처럼 구조적인 정보를 포함하지 않은 일반 문서형태의 경우 키워드의 발생빈도를 고려하는 형태에서는 별 문제가 없지만 구조적인 정보를 갖고 있는 XML로 표현된 웹 데이터일 경우에는 그래프 형태의 모델표현이 가능하기 때문에 단순히 키워드의 빈도만을 고려하는 형태로서는 바른 검색결과를 얻을 수 없다. 따라서 XML 문서의 구조적인 특성을 최대한 활용하여 SQL과 유사한 형태의 질의를 통하여 원하는 데이터만을 추출한다면 단순히 키워드에 의존하는 형태의 질의를 탈피하며 보다 분명한 검색결과를 획득할 수 있다고 생각한다. 본 논문에서는 XML DOM을 이용하여 XML 데이터의 정보검색 시스템을 모델링하고, 이와 관련된 알고리즘을 제안하고자 한다.

  • PDF

XML 기반의 통합형 전자 카탈로그 등록 시스템 (Integrated E-Catalog Registry System Based on XML)

  • 최일선;김창수;정회경
    • 한국정보통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1341-1350
    • /
    • 2003
  • 현재 B2B(Business-To-Business) 전자 상거래에서 사용되고 있는 전자 카탈로그 포맷과 처리 시스템은 각 기업별, 산업별로 다른 시스템 체계를 이용하여 구축되고 있다. 전자 상거래를 이용하는 B2B 기업들은 기업간 거래에 있어서 상호 운용성을 증대시키기 위한 표준 전자 카탈로그 포맷의 필요성을 인식하게 되었으며, 각각의 기업과 산업별로 구축되어 있는 전자 카탈로그 처리 시스템의 정보를 서로 교환 및 처리하기 위한 통합된 전자 카탈로그 시스템의 필요성이 대두되었다. 이에 본 논문에서는 상호 운용성을 증대시키기 위한 데이터 포맷인 XML(eXtensible Markup Language)로 전자 카탈로그 문서의 표준 문서포맷으로 제안하고, XML Schema를 이용하여 통합적으로 상품 정보를 처리 할 수 있는 전자 카탈로그 문서의 구조를 정의하였다 또한, XML로 정의된 전자 카탈로그 문서를 이용하여 각 기업들이 전자 마켓플레이스 거래에 사용할 수 있도록 검색, 등록 서비스를 제공하는 통합형 전자 카탈로그 레지스트리 등록 시스템을 설계 및 구현함으로써 전자 상거래 시 상호 운용성과 재사용성을 향상시킨 전자 카탈로그 문서와 통합된 전자 카탈로그 시스템에 대한 모델을 제시한다.

교량정보모델 기반의 설계정보와 XML 기반의 문서정보 통합 (Integration between XML-based Document Information and Bridge Information Model-based Structural Design Information)

  • 정연석;김봉근;정원석;이상호
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2006년도 정기 학술대회 논문집
    • /
    • pp.208-215
    • /
    • 2006
  • This study provides a new operation strategy which can guarantee the data consistency of engineering information among the various intelligent information systems. We present the strategies for the operation of bridges engineering information and the construction methodology of integrated database. The two core standard techniques are adopted to construct the integrated database. One of these standards is the Standard for the Exchange of Product Model Data (STEP) for CAD/CAE information and the other is the Extensible Markup Language (XML) for engineering document information. This study can transform a document me into a data type for web-based application modules which assist end-users in searching and retrieval of engineering document data. In addition, relaying algorithm is developed to integrate the two different information, e.g. CAD/CAE information and engineering document information. The pilot application modules for management and maintenance of existing bridge are also developed to show application of the strategy.

  • PDF

XML 문서 검색을 위한 경로 역 색인 기법 (The Path Inverted Index Technique for XML Document Retrieval)

  • 문경원;황병연
    • 정보처리학회논문지D
    • /
    • 제17D권2호
    • /
    • pp.103-110
    • /
    • 2010
  • 최근에 관계형 데이터베이스 관리 시스템(RDBMS)의 장점을 이용하여 XML로 표현된 문서를 효과적으로 저장, 관리, 검색하는 XML 문서관리 시스템에 대한 많은 연구들이 활발하게 진행되어 왔다. 그러나 경로 질의 중에서 LIKE 연산과 같은 부분 패턴 매칭 질의의 경우는 비효율적인 비교 연산으로 인해 검색 성능이 현저하게 떨어지기 때문에 RDBMS의 색인의 효과를 볼 수 없다. 본 논문에서는 XML 문서를 RDBMS에 효율적으로 저장하는 계층형 XML 저장 기법과 경로 역 색인 기법을 제안한다. 제안하는 기법은 XML문서의 엘리먼트를 키워드로 보고 해당 키워드가 속한 경로의 식별자와 시퀀스로 포스팅 파일을 구성하여 경로 기반 질의의 검색 속도를 향상하는데 주안점을 둔다. 검색 성능에 관한 실험을 통해서 제안된 기법이 기존의 RDBMS를 이용한 기법보다 약 60% 우수한 성능을 가지고 있음을 입증한다.

XML 기반 교수-학생 학습지도 시스템의 설계 및 구현 (Design and Implementation of Lesson Plan System for teacher-student based on XML)

  • 최문경;김행곤
    • 정보처리학회논문지D
    • /
    • 제9D권6호
    • /
    • pp.1055-1062
    • /
    • 2002
  • 현재 교육현장에서 사용되고 있는 학습지도안 문서는 교육 정보의 체계적인 제공이 미흡하고 교수 개인이 모든 교수 활동에 필요한 지도안을 작성하는데는 어려움이 있으므로 많은 추가적인 시간과 노력이 필요하다. 네트워크가 확산되어 사용되고 있는 현 시점에서는 웹을 기반으로 한 학습지도안 작성이 더욱 요구되어 진다. 따라서, 웹에서 표준화된 XML을 이용하여 문서의 생성과 검색, 그리고 재사용이 가능하도록 제공함으로써, 교수자의 다양한 요구사항을 융통성 있게 수용할 수 있다. 본 논문에서는 학습지도안을 분석하여 공통 DTD(Document Type Definition)를 생성하고 공통 DTD를 통해 표준화된 XML(eXtensible markup Language) 문서를 제공한다. 시스템에서는 학습지도안을 쉽게 작성할 수 있는 에디터를 제공하고. 이미 작성된 학습지도안의 재사용성을 높이기 위해 검색 기능을 제공하고 있다. 검색으로는 구조기반, 패싯, 키워드 검색 방법을 제시하고 있으며, 작성된 학습지도안은 데이타베이스와 연동되어 구현되어진다. 따라서, XML을 이용하여 학습지도안을 작성함으로써 웹 상에서의 정보를 공유할 수 있고, 웹에서 학습지도안을 바로 작성함으로써 시간과 비용이 절약될 수 있으며. 또한 보다 향상된 학습 환경을 제공할 수 있다

구조와 내용 유사도에 기반한 XML 웹 문서 검색시스템 구축 (An Implementation of XML document searching system based on Structure and Semantics Similarity)

  • 박우창;서여진
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.99-115
    • /
    • 2005
  • XML은 인터넷상에서 데이터 표현과 변환을 위한 표준이며, 이러한 XML 문서에서 필요한 정보를 찾아내기 위해 XML 문서 검색 시스템이 필요하다. 본 연구는 이러한 필요성에 기반을 두어 XML 구조를 최대한 활용하여, 주어진 XML 문서에 대해 구조와 내용이 가장 가까운 문서들을 찾아내는 검색 시스템을 개발하였다. 검색 메트릭은 XML 문서들 중 각 태그의 이름에 대한 유사도, 각 태그가 포함하는 값의 유사도와 태그 간 구조에 대한 유사도를 모두 고려하며, 검색 후 유사도의 결과 값에 따라 검색 결과를 순위화 하여 보여준다. 검색 방법은 전통적인 키워드 검색 방식, 태그와 값을 입력하여 검색할 수 있는 방식, XML 문서를 입력하여 검색하는 세 가지 질의 방식을 제공함으로서 사용자들의 기호에 따라 원하는 방식을 골라 검색할 수 있도록 구성하여 시스템의 유용성을 높였다. 개발된 XML 문서 검색 시스템은 INEX에서 제공된 XML 문서들을 대상으로 하여 테스트하였다.

  • PDF

단축-경로와 확장성 해싱 기법을 이용한 경로-지향 질의의 평가속도 개선 방법 (A Way to Speed up Evaluation of Path-oriented Queries using An Abbreviation-paths and An Extendible Hashing Technique)

  • 박희숙;조우현
    • 정보처리학회논문지D
    • /
    • 제11D권7호
    • /
    • pp.1409-1416
    • /
    • 2004
  • 최근 인터넷의 폭발적인 성장과 인기로 인하여 인터넷을 통한 정보 교환이 극적으로 증가하고 있다. 또한 XML은 인터넷상에서 데이터를 교환하기 위한 표준인 동시에 중요한 수단이 되고 있다. 따라서 XML 문서를 검색하는데 있어서, 경로-지향 질의에 대한 평가 속도를 개선하는 문제는 중요한 이슈이다. 본 논문에서는 문서 데이터베이스에서 경로-지향 질의의 검색 성능을 개선하기 위한 새로운 인덱싱 방법을 제안하다. 새로운 인덱싱 방법에서는 경로-지향 질의를 효과적으로 수행하기 위해 단축-경로 파일을 생성하고 그것의 해시 코드 값을 인덱스 키로 사용한다. 또한 검색 평가 속도를 촉진시키기 위하여 단축-경로 파일을 확장성 해싱 기법과 결합하는 것으로 검색질의의 평가속도를 가속화하였다.

함수 변환과 FFT에 기반한 조정자가 없는 XML 문서 클러스터링 기법 (An Unsupervised Clustering Technique of XML Documents based on Function Transform and FFT)

  • 이호석
    • 정보처리학회논문지D
    • /
    • 제14D권2호
    • /
    • pp.169-180
    • /
    • 2007
  • 본 논문은 함수 변환(Function Transform)과 FFT(Fast Fourier Transform)를 사용하는 새로운 XML 문서 클리스터링 기법에 대하여 논한다. 본 문서 클러스터링 기법은 조정자 없이 점진적으로 수행된다. XML 문서는 엘리먼트의 계층적인 구조에 기반하여 이산 함수로 변환된다. 이산 함수는 FFT를 사용하여 벡터로 변환된다. 문서를 나타내는 벡터는 가중치 유클리디안 거리 메트릭을 사용하여 비교된다. 비교 결과가 미리 정의된 값보다 작을 때에는 비교되는 두 개의 문서는 구조적으로 비슷한 것으로 간주되어 동일한 그룹으로 분류된다. XML 문서 클리스터링은 XML 문서의 저장과 검색에 유용하게 사용될 수 있다. 800개의 합서 문서와 520개의 실제 문서를 사용하여 실험하였다. 실험 결과는 함수변환과 FFT는 XML 문서를 엘리먼트의 구조를 기반으로 하여 점진적으로 조정자 없이 효과적으로 분류하는 것을 보여주었다.

분할된 역 인덱스 테이블에서 부모노드의 정보를 이용한 질의 처리 (Query Processing using Information of Parent Nodes in Partitioned Inverted Index Tables)

  • 김명수;황병연
    • 한국멀티미디어학회논문지
    • /
    • 제11권7호
    • /
    • pp.905-913
    • /
    • 2008
  • 최근 XML(Extensible Markup Language) 사용의 증가와 함께 다량의 이질적 구조를 가진 XML문서들이 이용되고 있으며, 이러한 XML문서들의 효율적인 관리를 위해 데이터 저장 구조에 대한 연구의 필요성이 증가하고 있다. 이에 따라 본 논문에서는 이들 XML 문서들의 효율적인 관리를 위하여 분할된 역 인덱스 테이블에서 부모노드의 정보를 이용하여 질의를 처리하는 방법을 제안한다. 이질적 구조를 가진 대규모의 문서들에 대한 질의 처리 횟수와 처리 데이터 량은 검색 성능에 큰 영향을 주기 때문에 데이터 구조를 설계할 때에 이 두 가지 요소들을 신중히 고려해야 한다. 제안된 방법은 부모 노드의 정보를 이용하여 선형 경로 질의를 위한 질의 처리 횟수를 반감시키고, 역 인덱스 테이블을 XML 트리의 깊이에 따라 적절히 분할하여 탐색 대상이 되는 데이터의 양을 줄이기 때문에 XML 문서에 대한 검색 성능을 향상시킨다. 제안하는 방법의 효율성을 입증하기 위해 인터넷에서 수집한 XML 문서들에 대한 XPath 질의 처리 성능이 기존의 역 색인 기법들에 비해 우수함을 보인다.

  • PDF

건설공사 설계도서매뉴얼의 전자화 절차구성 및 실무 적용효과 분석 (Procedure Development for Organizing Electronic Technical Manual of Construction Design Information and Applicability Analysis for Practical Project)

  • 강인석;문현석;곽중민
    • 한국철도학회논문집
    • /
    • 제10권2호
    • /
    • pp.103-111
    • /
    • 2007
  • The existing design materials by document type are restricted in searching and acquiring necessary design information because the materials consist of huge information and various document types. This study suggests a methodology to develop an electronic technical manual that can manage construction design materials by XML-base integrated information system. Electronic technical manual for design materials can provide visualized information through various multimedia tools such as multi-link, virtual reality and animation. Using an integrated electronic manual for construction project can prevent to miss necessary design information. The results of this study includes a data flow diagram to develop an interactive electronic technical manual (IETM) for construction design information. Finally the study suggests some scenarios for practical use and quantitative analysis of application effect analysis by AHP method.