• 제목/요약/키워드: structured document

검색결과 170건 처리시간 0.027초

구조화된 전자문서 생성을 위한 사용자 중심의 XML 문서편집 시스템에 관한 연구 (Study of XML document editing system that is creation for structural digital document)

  • 차원준;황재각;이용준;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 춘계종합학술대회
    • /
    • pp.277-280
    • /
    • 2003
  • 초기의 웹(Web)이 비구조적인 문서를 사용함으로써 발생하는 단점인 문서 처리와 교환 및 재사용성에 대한 해결책으로서 W3C(World Wide Web Consortium)에서 1998년 2월에 XML(extensible Markup Language)을 제정하였다. XML을 사용함으로써 기존 전자거래는 XML 기반 메시지 교환을 통한 기업간 전자거래 형태로 변화하고 있으며, 이러한 기업간 전자거래에 사용되는 XML 기반의 구조화된 전자문서를 저작 할 수 있는 솔루션에 대한 필요성이 대두되었다. 이에 본 논문에서는 XML 문서를 효율적으로 편집 및 저작 할 수 있는 사용자 중심의 XML 인스턴스 편집기와 XML 문서의 구조를 정의하는 XML 스키마 문서를 저작하기 위한 XML 스키마 편집기를 통합한 XML 문서편집 시스템에 관한 연구를 하였다.

  • PDF

구조화된 전자문서 생성을 위한 사용자 중심의 XML 문서편집 시스템 (XML document editing system that is creation for structural digital document)

  • 최일선;이용준;정회경
    • 한국정보통신학회논문지
    • /
    • 제7권3호
    • /
    • pp.513-518
    • /
    • 2003
  • 초기의 웹(Web)이 비구조적인 문서를 사용함으로써 발생하는 단점인 문서 처리와 교환 및 재사용성에 대한 해결책으로서 W3C(World Wide Web Consortium)에서 1998년 2월에 XML(eXtensible Markup Language)을 제정하였다. XML을 사용함으로써 기존 전자거래는 XML 기반 메시지 교환을 통한 기업간 전자거래 형태로 변화하고 있으며, 이러한 기업간 전자거래에 사용되는 XML 기반의 구조화된 전자문서를 저작할 수 있는 솔루션에 대한 필요성이 대두되었다. 이에 본 논문에서는 XML 문서를 효율적으로 편집 및 저작 할 수 있는 사용자 중심의 XML 인스턴스 편집기와 XML 문서의 구조를 정의하는 XML 스키마 문서를 저작하기 위한 XML 스키마 편집기를 통합한 XML 문서편집 시스템에 관한 연구를 하였다.

SGML 을 기반으로 하는 문서관리시스템 개발 (Document Management System based on SGML)

  • 박남규;신동수
    • 산업공학
    • /
    • 제10권3호
    • /
    • pp.109-116
    • /
    • 1997
  • Document management system is a tool, based on the document life cycle concept, for structured management of various documents within an organization. In this paper, we address a development process of document management system based on SGML. We have developed a document management system which can support a variety of types in documents such as informal data, HTML, CGI and so on. Using the developed system, users can access documents in the system through an internet browser, and also add or modify existing documents.

  • PDF

구조화 문서에서 점진적 갱신을 위한 인텍싱 기법 (An Indexing Scheme for Incremental Updating in Structured Document)

  • 김성완;김선경;이재호;임해철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.190-192
    • /
    • 2002
  • 구조와 문서(structured document)에 대만 효율적인 처리를 위해서는 문서의 임의 엘리먼트에 빠르고 직접적인 접근을 지원하는 인덱싱 기법이 필요하다 이를 위한 기존의 연구들에서는 전통적인 정보 검색 분야에서 사용되는 역 리스트나 시그너쳐 파일을 응용한 기법들이 제안되었다. 그러나 기존의 연구들은 정적인 환경에 적합한 인덱스 구조로써, 문서에 대한 동적인 변경이 있을 경우 인덱스론 전체적으로 재구성해야 하는 부담이 있다. 본 논문에서는 역 리스트를 기반으로 문서에 대만 구조 변경과 내용 변경 등 동적인 변경에 대해 점진적 갱신을 지원하는 인덱스 구조를 설계하였다.

  • PDF

DTD를 이용한 XML문서의 효율적인 스키마 추출 기법 (An Efficient Schema Extracting Technique Using DTD in XML Documents)

  • 안성은;최황규
    • 산업기술연구
    • /
    • 제21권A호
    • /
    • pp.141-146
    • /
    • 2001
  • XML is fast emerging as the dominant standard to represent and exchange data in the Web. As the amount of data available in the Web has increased dramatically in recent years, the data resides in different forms ranging from semi-structured data to highly structured data in relational database. As semi-structured data will be represented by XML, XML will increase the ability of semi-structured data. In this paper, we propose an idea for extracting schema in XML document using DTD.

  • PDF

구조적 상이성 분석에 기반한 XML 문서 변환 시스템의 설계 및 구현 (Design and Implementation of XML Document Transformation System based on Structured Differences Analysis)

  • 조정길;조윤기;구연설
    • 정보처리학회논문지D
    • /
    • 제9D권2호
    • /
    • pp.297-306
    • /
    • 2002
  • 본 논문은 논리적으로는 유사하지만 구문 측면에서는 서로 다른 XML 스키마(Schema) 기반의 XML 문서를 구조적 상이성 분석을 통하여 상호 변환하는 시스템의 설계 및 구현에 관한 것이다. 이를 위해 원시(Source) 문서와 목적(Destination) 문서를 데이터 레지스트리(DataRegistry)와 구조적 상이성 분석을 이용하여 병합 데이터를 생성하고, 생성된 병합 데이터를 기반으로 하는 XML 문서를 생성한다. 이 XML 문서 변환 시스템은 다른 응용 시스템에서 사용하는 XML 문서를 현 시스템에 맞게 변환하는 작업을 시간과 비용 그리고 신뢰성의 측면에서 유용하도록 설계하였다. 이 시스템의 구현환경은 IBM 호환 PC에서 동작하며, Windows 2000 환경의 운영체제에서 Visual Basic 6.0을 사용하여 개발하였다.

독립적인 질의 경로들을 사용하여 이질적인 문서들을 검색하는 XML 문서 검색 모델 (XML Document Retrieval Models for Heterogeneous Data Set using Independent Regular paths)

  • 유신재;민경섭;김형주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.140-152
    • /
    • 2003
  • XML 문서는 태그를 가지고 있고 이 태그가 중첩됨에 따라 구조를 나타낼 수 있다. XML 문서가 DTD를 가지지 않거나 여러 곳에서 XML 문서를 모았을 때 그 구조는 비정규적 일 수 있다. 사용자는 이러한 비정규적인 구조에 대해 잘 알기 어려우며 설사 잘 알고 있다고 하더라도 실수하기 쉽다. 특히 비정규적인 구조를 가지는 문서들에 대해 정확한 구조질의를 작성하는 것은 더욱 어렵다. 따라서 사용자는 구조가 없거나 있다 하더라도 적은 양의 구조정보 만을 기술하는 일반적인 질의를 작성하게 된다. 이런 환경에서 구조 정보를 이용하여 문서의 순위결정에 이용하고 사용자 구조 질의와 문서 구조간의 차이에 대해 보상해 주는 검색 모델을 제안한다. 질의 처리를 단순화하기 위하여 질의 경로간의 독립을 가정하였다 이 가정은 질의 언어의 표현능력의 저하를 가져올 수 있는데 이를 해결하는 질의 모델도 제시한다. 지금까지 어떤 문서를 위한 테스트 컬랙션이 없었기 때문에 TIPSTER 컬랙션에서 일부 문서를 추출하여 작은 테스트 컬랙션을 만들고 여기에 구조가 없는 질의를 수행하여 제시한 검색 모델의 유용성을 보였다. 실험 결과 벡터 모델에 비하여 평균 67%의 정확률 개선효과를 얻을 수 있었다.

GDIT를 기반으로 한 구조적 문서의 효율적 검색과 갱신을 위한 인덱스 설계 (An Indexing Scheme for Efficient Retrieval and Update of Structured Documents Based on GDIT)

  • 김영자;배종민
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.411-425
    • /
    • 2000
  • SGML이나 XML언어를 사용하여 작성된구조적 문서들에 대한 정보검색 시스템들은 문서의 부분검색을 지원한다. 문서의 구조에 바탕을 둔 질의를 효율적으로 처리하기 위해서는 색인에 관련된 메모리 오버헤드를 줄여야 하고, 질의에 대한 응답시간이 빨라야 하고, 문서 구조에 바탕를 둔 다양한 유형의 사용자 질의를 지원해야 하며, 문서 구조에 대한 변경이 발생했을 때 색인 구조에 대한 변경사항을 최소화하여야 한다. 본 논문에서는 전체문서인스턴스트리 구조를 제안하고, 이를 기반으로 텍스트 레벨 엘리먼트만을 색인하여, 색인과 검색의 효율성을 유지하면서 자료의 추가나 삭제등의 갱신이 발생할 때, 갱신의 파장을 최소화시킬 수 있는 색인구조와 질의처리 알고리즘을 제시하고 그 성능을 분석한다.

  • PDF

네비게이션 정보추출에 의한 XML 본문검색시스템 (XML Fulltext Retrieval System by Extracting Navigation Information)

  • 강남규;이응봉;이석형
    • 정보관리학회지
    • /
    • 제19권3호
    • /
    • pp.91-110
    • /
    • 2002
  • 최근, 키워드 기반 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가 연구개발보고서를 대상으로 하였으며, XML 연구보고서의 DTD. 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.

대화형 코퍼스의 설계 및 구조적 문서화에 관한 연구 (A Study in Design and Construction of Structured Documents for Dialogue Corpus)

  • 강창규;남명우;양옥렬
    • 한국콘텐츠학회논문지
    • /
    • 제4권4호
    • /
    • pp.1-10
    • /
    • 2004
  • 음성인식의 연구 대상은 낭독음성에서 대화음성으로 발전해가고 있다. 이를 위해서는 대량의 대화코퍼스가 필요하다. 그러나 아직 충분한 양의 대화코퍼스가 구축되어 있지 못하며 코퍼스의 주석 정보 또한 복잡하고 다양하게 표현하고 있어 효율적인 활용이 어렵다. 따라서 본 논문에서는 TEI를 기반으로 하여 대화 영역을 텔레뱅킹으로 설정하고 대화코퍼스를 구축하여 구축된 대화코퍼스의 주석 정보를 XML(extensible Markup Language)로 표준화할 수 있도록 DTD (Document Type Definition) 정의하고 저장 시스템을 설계하였다.

  • PDF