• Title/Summary/Keyword: 문서지

검색결과 2,040건 처리시간 0.024초

XML 문서의 공통 구조를 이용한 클러스터링 기법 (A Clustering Technique using Common Structures of XML Documents)

  • 황정희;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.650-661
    • /
    • 2005
  • 인터넷의 성장으로 인해 반구조적인 문서의 표준인 XML 문서의 사용이 증가하고 있고 이에 따라 XML 문서의 통합과 검색을 위한 연구가 많이 진행되고 있다. 효율적인 문서의 통합과 검색을 위한 기초 작업은 유사 구조의 XML 문서를 클러스터링 하는 것이다. 기존 연구의 XML 문서 클러스터링에서는 문서간의 구조적 유사도를 이용하여 클러스터를 생성한다. 그러나 이러한 방법은 문서간의 구조적 유사성외 정확한 측정 기준을 만들기 어렵고, 반복적인 유사도의 비교로 인해 처리 속도가 느리다는 단점이 있다. 이러한 문제점을 개선하기 위하여 이 논문에서는 많은 데이타에도 유연하게 적용할 수 있는 트랜잭션 데이타를 위한 클러스터링 알고리즘을 적용하는 새로운 클러스터링 방법을 제안한다. 이 논문에서 제안하는 클러스터링 방법은 하나의 DTD나 XML 스키마를 공유하는 문서 집합이 아닌 스키마가 없는 다양한 구조의 XML 문서들을 대상으로 공통 구조를 이용한다. 공통 구조를 이용하기 위하여 XML 문서의 트리 모델에서 구조를 분리하여 빈발 구조를 추출하고 이를 기반으로 클러스터링을 수행한다. 아울러, 기존 연구와의 비교 및 실험을 통해 제안 기법의 효율성을 보인다.

웹에서의 XML 문서 접근 제어 시스템의 설계 및 구현 (Design and Implementation of an Access Control System for XML Documents on the Web)

  • 이용규
    • 한국정보처리학회논문지
    • /
    • 제7권11S호
    • /
    • pp.3623-3632
    • /
    • 2000
  • 지금까지 XML 문서는 사용자에게 문서내의 모든 내용을 공개하였지만, 전자상거래와 같은 특정 분야의 경우에는 사용자에 따라 문서의 일부만을 공개하는 것이 필요하다. 따라서, 본 논문에서는 사용자에게 XML 문서의 권한을 부여하여 접근 권한을 근간으로 XML 문서에 대해서 접근을 관리하는 접근 제어 시스템을 설계하고 구현한다. 이를 위하여 권한 주체의 기본 단위로 사용자 그룹을 설정하고, XML 문서의 엘리먼트를 권한 객체의 기본 단위로 설정한다. 그리고, XML 문서의 생성자는 문서를 생성할 때 사용자 그룹에게 문서 내의 엘리먼트에 대한 접근 권한을 부여한다. 사용자가 XML 문서를 접근할 경우, 사용자가 속한 그룹의 해당 문서에 대한 접근 권한을 접근 제어 리스트를 이용하여 검사하고 접근 권한을 맞는 문서의 특정 부분만을 보여준다. 그 결과 XML 문서에 대한 접근 관리가 가능하다.

  • PDF

URL 패턴을 이용한 웹문서의 선택적 자동수집 방안 (A Method of Selective Crawling for Web Document Using URL Pattern)

  • 정준영;장문수
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.41-44
    • /
    • 2007
  • 특정 분야별로 구축되는 온톨로지에 관하여 그 언스턴스를 쉽고 빠르게 구축하기 위해서는 구조화된 문서를 이용하는 것이 효율적이다. 그러나, 일반적인 웹 문서는 모든 분야에 대하여 다양한 형식으로 표현되어 존재하기 때문에, 대상이 되는 구조 문서를 자동으로 수집하기는 쉽지 않다. 본 논문에서는 웹사이트의 URL 패턴을 XML 기반의 스크립트로 정의하여, 필요한 웹 문서만을 지능적으로 수집하는 방안을 제안한다. 제안하는 수집 방안은 구조화된 형태로 정보를 제공하는 사이트에 대해서 매우 빠르고 효율적으로 적용될 수 있다. 본 논문에서는 제안하는 방법을 적용하여 5만개 이상의 웹 문서를 수집하였다.

  • PDF

XSL-fo를 적용한 XML 문서표현 시스템의 설계 및 구조 (Design and Implementation of XML Document Presentation System applying XSL-fo)

  • 김진수;강치원;류근호;정회경
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권3호
    • /
    • pp.229-239
    • /
    • 2001
  • 본 논문은 XML 문서의 내용 및 구조 정보를 XSL 스타일시트(stylesheet)의 포맷팅(formatting) 정보를 적용하여 표현하는 포매팅 시스템의 설계 및 구현에 관한 것이다. 본 시스템은 XML 문서를 XSLT(XSL Transformations) 및 Xpath(XML Path Language)를 이용하여 문서를 변환하고, XSL-fo(XSL Formatting Objects)를 적용하여 포맷팅을 지정하는 XML 문서 표현 시스템을 설계 및 구현하였다. 이 XML 문서 표현 시스템은 웹 표준화 기구인 W3C에서 제안하는 XSL 포매팅 처리에 대한 구성을 기반으로 구현함으로써 표준화에 입각한 처리시스템으로써 변화에 능동적으로 대처 가증하고 모듈화 되어 있어 부분적인 수정 및 대체가 가능하도록 설계하였다. 본 시스템은 IBM 호환 PC에서 동작하며, 운영체제는 Windows 2000 환경에서 Visual C++6.0을 사용하여 개발하였다.

  • PDF

UNISQL/X를 이용한XML 문서 저장 시스템 설계 및 구현 (Design and Implementation of XML Documents Storage System using UNISQL/X)

  • 안병태;김현아
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.38-44
    • /
    • 2001
  • 최근 인터넷의 발전으로 인하여 정보교환을 위한 표준으로 XML에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 객체관계 데이터베이스인 uniSQL/X를 이용한 XML 문서 저장 시스템 설계하고 구현하였다. 관계 데이터베이스와 객체지향 데이터베이스의 장점을 수용한 객체관계 데이터베이스(Object-Relational Database : ORDB)를 이용하여 XML 문서 저장 모델을 설계하여 XML 문서의 구조적인 정보를 효과적으로 표현할 수 있다. XML 문서의 빈번한 수정이 용이하도록 분할저장 방식을 사용하였고, DTD에 관계없이 XML 문서를 저장할 수 있도록 DTD 독립적인 모델을 제안하였다. 또한 데이터의 중복문제를 해결함으로써 검색 속도가 향상되었다

  • PDF

전자상거래 통합을 위한 XML 매핑 정형화 기법 (A Method of XML Mapping Canonicalization for E-Business Integration)

  • 안우영;홍창범
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.1-8
    • /
    • 2004
  • XML을 핵심 기술로 사용하는 RosettaNet이나 BizTalk 등의 다양한 전자상거래 프레임워크들이 생겨나기 시작하면서 프레임워즈들은 각자의 표준에 따라 파트너간에 비즈니스 프로세스를 수행하게 된다. 이러한 프레임워크간의 상이함은 전자상거래시 기업 간의 문서의 다양성으로 인하여 문서 교환에 어려움이 따르게 된다. 본 논문에서는 XML문서의 정보를 추출 단계를 거쳐 문서정보를 기반으로 매핑 정보를 생성한 후 문서간의 매핑룰을 적용하여 변환할 수 있도록 설계하였다. 따라서 전자상거래 프레임워크 간 정보의 손실 없이 상호 문서 교환이 가능할 뿐만 아니라 신뢰할 수 있는 교환이 가능하다.

  • PDF

검색 엔진에서 사용자 프로파일을 이용한 문서 순위결정 방법 (Ranking Decision Method of Retrieved Documents Using User Profile from Searching Engine)

  • 김용호;김형균
    • 한국정보통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.1590-1595
    • /
    • 2006
  • 본 논문에서는 검색된 수많은 결과 중에서 특정 사용자의 선호도를 고려 한 최적의 문서만을 제공하기 위하여 사용자 프로파일을 이용한 문서 순위 결정기법을 제안한다. 사용자 프로파일을 구축하여 사용자의 선호도를 표현하고 검색결과 문서들을 대상으로 잠재적 구조를 분석 한 다음, 사용자 프로파일과 분석 결과로 표현된 문서들과의 유사성을 비교한다. 그리고 적합성 정도에 따라 사용자에게 최적의 문서를 제공하는 데에 목적이 있다.

동적 포맷팅 방식에 관한 연구 (A Study on Dynamic Formatting Method)

  • 임광택;이수연
    • 한국통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.730-738
    • /
    • 1993
  • 주기억 장치의 크기등과 같은 하드웨어적 특성에 구애받지 않고, 메뉴얼등과 같은 대용량 문서를 효과적으로 제작할 수 있으며, 단일 문서내의 서로 인접하지 않는 페이지간의 상호 참조나 하이퍼텍스트 응용의 링크 설정에 긴요한 동일 스크린내 복수개 페이지의 동시 표현과 같은 사용자 인터페이스를 실현할 수 있는 동적 포맷팅 방식을 제안한다. 또한 복수개의 문서중 각각의 특정 페이지를 선택적으로 동일 스크린내 표시함으로써 문서의 일부분을 발췌하여 다른 문서에 포함시키거나, 문서간 하이퍼링크의 설정 및 상호 참조등에도 유효하게 적용할 수 있다. 본 연구에서 제안한 방식은 X 윈도우 및 Motif를 이용한 WYSIWYG방식의 전자 출판 시스템의 연구개발의 일환으로 구현하였다.

  • PDF

XML 문서를 위한 DTD 저작 도구의 설계 및 구현 ((Design and Implementation of DTD Authoring Tools for XML Documents))

  • 김현주
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권8호
    • /
    • pp.1093-1104
    • /
    • 2002
  • XML은 전자도서관, 전자상거래, 웹 응용 둥의 분야에서 다양하게 응용되고 있다. 이러한 XML 문서에 대한 생성, 관리, 검색 등에 대한 연구는 XML 응용 시스템 개발에 있어서 필수적인 항목이다. 본 논문에서는 XML 문서의 문서 구조정보를 편리하게 관리해주는 XML DTD 편집기 도구를 설계하고 구현하였다. 본 논문에서 제안한 저작도구는 사용자의 편의성, 문서 DTD 구문 규칙에 대한 신뢰성 보장 및 문서 구조의 가시성 등의 특징을 가지고 있다.

  • PDF

비디오 문서의 구조 질의를 위한 효율적 인덱스 구조 (An Efficient Index Structure Supporting Structure Queries for Video Documents)

  • 이용규
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1109-1118
    • /
    • 1998
  • 최근에 비디오 데이터베이스에 대하여 관심이 집중되고 있다. 비디오 문서도 텍스트 문서와 마찬가지로 계층적 논리 구조를 포함하고 있다. 사용자가 구조 질의로 이 구조를 활용한다면, 내용 질의에만 의존하는 것보다 더 큰 효과를 거둘 수가 있다. 구조 질의를 효율적으로 처리하기 위해서는 비디오의 문서 요소에 빨리 접근 할 수 있도록 지원하는 인덱스 구조가 필수적이다. 이 논문에서는 트리 구조의 비디오 문서 모형을 제시하고 비디오 문서를 위한 새로운 역 인덱스 구조를 제안한다. 그리고 이 인덱스 구조의 저장 장소 요구량과 디스크 접근 시간을 평가하고, 분석 결과를 제시한다.

  • PDF