• Title/Summary/Keyword: 문서과

Search Result 2,264, Processing Time 0.027 seconds

A Study of Method for Storing XML Document in RDB (관계형 데이터베이스에서 XML 문서 저장 방안 연구)

  • 류진영;김찬홍;유영호;김경석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.368-370
    • /
    • 1998
  • XML은 SGML의 사용을 보다 쉽고 간단하게 하기 위해 고안되었다. 즉, 문서타입들의 정의를 쉽게 하고 SGML로 정의된 문서들의 저작과 관리를 용이하게 하고, 그것들을 웹상에서 쉽게 전달하고 공유하기 위해 고안된 것이다. 그러한 특성으로 인해 XML이 많은 애플리케이션에서 사용됨에 따라 문서의 효율적인 관리와 저장기법이 요구된다. 이를 위해 본 논문에서는 XML 문서가 가지는 성질인 문서의 구조와 내용을 분리하여 현재 산업계에서 대표적인 데이터베이스인 관계형 데이터베이스에 저장할 수 있는 방안을 제시한다.

Information Retrieval from XML Documents based on Contents (내용기반 XML 문서의 검색)

  • 김수희;조명찬;한예지
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.73-75
    • /
    • 2003
  • 이 연구에서는 XML 문서의 효율적인 검색을 위해 XML 데이터에서 색인어를 추출하고 가중치를 부여하여 내용기반 인덱스를 구축하고, 질의와 문서간의 유사도가 높은 문서들을 사용자에게 제공함으로써 기존의 경로 중심 혹은 패턴매칭 형태의 XML 문서 검색 기능을 확장하고자 한다. 내용기반 검색을 지원하는 XML 문서 검색시스템을 설계하고, 내용기반 검색과 관련한 이슈들을 논의한다. 개발 중에 있는 연구용 프로토타입 시스템을 이용하여 질의에 대한 내용기반 검색 결과를 간단히 소개한다.

  • PDF

Design of Extended SQL and XML DTD Database using RDBMS (RDBMS를 이용한 XML DTD 데이터베이스와 확장 SQL의 설계)

  • 오준환;이병욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.228-230
    • /
    • 2000
  • 최근 XML 문서를 저장 및 검색하기 위한 연구가 활발히 진행되고 있다. 하지만 기존의 연구는 주로 XML문서 저장을 위한 연구들이었다. 즉 XML 문서를 정의해 주는 DTD 문서의 저장에 관한 연구는 상대적으로 적었다. 하지만 DTD 문서를 효율적으로 저장하고 관리하여 재활용함으로써 XML 문서를 효율적으로 관리할 수 있다. 본 논문에서는 DTD를 RDBMS에 저장하기 위한 스키마를 제안하고, 저장 방식은 정보의 중복저장을 막고 DTD의 모든 내용을 수용할 수 있도록 설계하였다. 또 제안하는 데이터모델에 적용하여 SQL의 DDL을 확장하였다. 제안한 DTD 데이터베이스로 인해 DTD의 재활용과 관리를 할수 있게 되었고 SQL의 확장으로 제안 시스템의 사용을 용의하게 하였다.

  • PDF

Improvement of A Concept-Based Text Categorization System(TAXON) Using Weight Determination Heuristic (가중치 부여 휴리스틱을 이용한 개념 기반 문서분류기 TAXON의 개선)

  • 강원석;강현규;김영섬
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.153-155
    • /
    • 1998
  • 본 논문에서는 개념을 기반으로 문서의 분류를 하는 확률벡터 모델의 분류기TAXON(Concept-based Text Categorization System)의 개선을 도모한다. TAXON은 한국어 문장을 분석하여 명사를 추출하고 명사의 개념을 시소러스 도구를 통해 획득한 후 이를 벡터화하여 주제와 입력 문서와의 관계성을 검사하는 문서 분류기이다. 본 논문은 문서 분류기 TAXON의 성능을 향상시키기 위하여 확률벡터 계산에 가중치 부여 휴리스틱을 도입한다. 그리고 시소러스 도구를 확장하여 문서 분류의 질을 높인다.

  • PDF

Visual XML Editor Supporting Integrated Editing Environment (통합 편집 환경을 지원하는 시각적 XML 편집기)

  • 최상길;정영우;곽지현;김건우;김상욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.249-251
    • /
    • 1998
  • XML은 W3C에서 권고안으로 채택됨으로써, 이를 바탕으로한 CDF, RDF, WIDL, WebBroker 등과 같은 많은 웹 어플리케이션들이 개발되고 있다. XML은 HTML과 같은 단일하고 고정적인 문서 구조에서 벗어나서 자신만의 구조를 가지는 문서를 작성할 수 있도록 해준다. 또한 문서의 내용과 그 내용의 표현이 분리되어 있어, 원 문서의 내용을 변화시키지 않고도 여러 가지 형식으로 표현될 수 있다. 본 논문에서는 이러한 확장된 기능을 가지는 XML 문서를 보다 직관적이고 시각적으로 편집할 수 있는 XML 편집기를 제안한다. 본 시각적 XML을 기반으로 하는 다양한 문서를 편집하는데 범용적으로 사용될 수 있다.

  • PDF

XML Conversion of HTML Documents Using Web Schema (웹 스키마를 이용한 HTML 문서의 XML 변환)

  • 오금용;박동문;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.175-177
    • /
    • 2001
  • 최근에 웹(Web) 사용의 지속적이 증가로 인하여 정보가 급증하고, 이로 인하여 웹은 정보교환의 의미뿐아니라 정보 저장이라는 중요한 의미를 지니게 되었다. 하지만 현재 많은 웹 페이지들이 HTML(Hyper Text Markup Language)문서로 제작되어 있어 정보관리의 의미에서 많은 부족함이 있고 이를 보완하기 위한 방법 중에 하나가 구조적이고 기능적 언어로 부상하고 있는 XML(exTensive Markup Language)을 기반으로 하여 문서를 제작하거나 변환하는 것이다. 본 논문은 HTML문서를 XML문서로 변환하는데 있어HTML문서 구조를 분석하고 분석결과를 토대로 형성되는 웹 스키마(Schema)를 이용하여 구조 중심의 변환이 이루어지도록 하는 방법에 대해서 제안한다.

  • PDF

Representing Object-Orented Databases in XML (객체지향 데이터베이스의 XML 로의 표현)

  • 윤정희;박창원;정진완
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.143-145
    • /
    • 2000
  • 데이터 변환은 데이터 재사용, 데이터 교환 및 통합 등에 사용되는 중요한 기술이다. 본 논문에서는 이러한 데이터 변환 기술 중 객체지향 데이터베이스에 저장된 데이터를 XML 문서로 변환시키는 기술을 제시한다. 먼저 객체지향 데이터베이스의 스키마와 데이터, DTD와 XML 문서를 정의한 뒤 이 정의를 기반으로 스키마를 DTD로 변환하는 알고리즘과 데이터를 XML 문서로 변환하는 알고리즘을 제시한다. 그리고 변환에 의한 결과 XML 문서가 잘 구성된 문서이고 결과 DTD에 대해서 유효한 XML 문서임을 보임으로써 제시한 변환 기술의 유용성을 보인다.

  • PDF

Design and Implementation of DOM Interface for an XML Document Storage System (XML문서저장 시스템을 위한 DOM 인터페이스의 설계 및 구현)

  • 김성욱;정호영;김천식;손기락
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.75-77
    • /
    • 2000
  • 구조적 정보의 표현방법으로 제시된 XML 문서를 가공하고 저장하는 방법에 대한 연구가 활발하게 진행되고 있다. XML을 가공하는 형태로는 몇 가지가 제시되어 일반화 되어있으나 계층적 특성을 가진 XML 문서를 관계형 데이터베이스에 효율적으로 저장하기는 어렵다. 본 연구에서는 XML 문서의 계층 구조를 DFS Numbering 으로 저장하고 데이터베이스에 저장된 문서에 대한 DOM 인터페이스를 효과적으로 제공하는 시스템의 설계 및 구현이다. 문서의 변경 내용을 저장할 때 SQL Query 횟수를 최소화하는 효율적인 기법을 제시한다.

  • PDF

Automatic Text Summarization Using Query Expansion (질의확장을 이용한 자동 문서요약)

  • 한경수;백대호;임해창
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.339-341
    • /
    • 2000
  • 문서요약이란 문서의 기본적인 내용을 유지하면서 문서의 복잡도를 줄이는 작업이다. 인터넷과 같은 정보기술의 발달로 정보의 양이 급증함에 따라, 정보 과적재(information over load) 문제의 해결을 위해 자동 문서요약시스템의 필요성이 대두되었다. 본 논문에서는 의사 적합성 피드백(pseudo relevance feedback)에 의한 질의확장(query expansion) 기법을 적용한 자동 문서요약 모델을 제안한다. 제안하는 모델의 특징은 질의를 분해함으로써, 적합성 피드백 과정에서 질의가 편향(bias)되어 요약이 잘못되는 문제를 방지할 수 있다는 것이다. 신문기사를 대상으로 평가한 결과 제안한 모델이 질의확장을 적용하지 않은 방법이나 하나의 질의만을 유지하는 일반적인 적합성 피드백 모델보다 더 좋은 성능을 보였다.

  • PDF

Improved Algorithms for Information Retrieval in a Hyperlinked Environment (하이퍼링크 환경에서 정보검색을 위한 개선 알고리즘)

  • 최익규;김희수;이병희;김민구
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.262-264
    • /
    • 2002
  • 하이퍼링크 환경에서의 정보검색은 주로 문서에 존재하는 링크정보를 이용하여 이루어진다. 본 논문은 하나의 문서에 존재하는 여러 개의 하이퍼링크마다 연결되는 문서와의 유사성을 측정하여 차등적으로 링크의 연결정보를 부여하여 기존의 알고리즘을 개선하였고, 관련이 없는 문서로의 하이퍼링크로 인해 발생되는 topic drift현상을 제거하기 위해 문서와 확장된 질의와의 유사성을 측정하여 문서의 가중치를 계산에 적용하도록 알고리즘을 개선하였다. 개선한 알고리즘의 성능을 확인하고자 TREC10의 web tree부분에 적용하여 향상된 검색 결과를 얻었다.

  • PDF