• 제목/요약/키워드: 문서 구조 분석

검색결과 496건 처리시간 0.027초

엘리먼트 정보 기반의 플러그인 XSLT 편집기 (XSLT Plugin Editor Based on Element analysis)

  • 곽동규;조용윤;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.751-753
    • /
    • 2004
  • XML 문서를 변환하는 목적은 하나의 어플리케이션에서 사용되는 XML 문서가 다른 어플리케이션에서 재 사용될 경우, 사용자에게 동일한 정보를 제공하는데 있다. 문서를 변환하기 위해서는 변환 규칙을 정의해야 한다. 변환 규칙을 생성하기 위해서는 엘리먼트의 정보를 분석하여야 하는데 한 가지 방법으로는 엘리먼트의 정보를 분석하기 어렵다. 그러므로 본 논문은 변환 규칙을 생성하기 위한 엘리먼트 분석으로 다수의 방법을 사용할 수 있는 XSLT 편집기를 제안한다. 본 시스템은 XML의 구조적 특성인 엘리먼트의 포함 관계와 플러그인 방식으로 유사 엘리먼트를 분석하여 사용자에게 제공하는 방법을 보인다. XML의 엘리먼트 구조는 엘리먼트가 표현하고 있는 정보간의 구조와 동일한 구조로 포함되어 있다. 또한, 플러그인 방식 포함할 수 있는 모듈로는 문법적 특성을 이용한 방법을 포함하거나. semantic web의 정보를 이용하는 방법을 추가할 수 있다 또한 기존의 XSLT 처리기를 내장하고 있어 XSLT 문서를 변환 XML에 적용하여 피 변환 XML 문서를 생성할 수 있다. 제안하는 시스템은 기존의 사용자가 사용 패턴을 분석하여 엘리먼트를 분석하고 변환 규칙을 기술하는 방법과 달리 유사한 엘리먼트에 대한 정보를 사용자에게 제공하는 장점이 있다.

  • PDF

웹 정보 검색 엔진을 위한 저장구조의 설계 및 실험 (Design and Study on Structure of Storage for Web Search Engine)

  • 이동광;안동언;정성종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.539-542
    • /
    • 2002
  • 인터넷의 발달은 월드 와이드 웹을 탄생 시켰고 그로 인한 인터넷의 폭발적 성장은 인터넷을 하나의 생활로 만들었다. 인터넷의 엄청난 자료의 양과 친숙해진 인터넷으로 인해 인터넷은 하나의 정보창구의 역할을 하게 되었고, 그에 따라 정보검색이 발전하게 되었다. 초기의 월드 와이드 웹은 많은 웹 문서가 아니었지만, 구글이 현재 20억 페이지를 색인할 만큼 엄청난 규모가 되었다. 또한 앞으로의 검색 엔진은 정보나, 웹상의 링크 정보를 통한 그 문서의 중요도를 분석하여 문서의 중요도를 판단하게 될 것이며, 지금까지의 검색엔진의 저장구조와는 다른 구조를 가지게 될 것이다. 그에 따라 웹 정보검색엔진의 저장구조는 효율적 저장과 속도 향상을 위해 중요한 구조가 되어가고 있다. 본 논문에서는 검색엔진의 저장구조에 따른 용량의 변화와 앞으로의 웹 검색엔진에서 등장할 기능인 문서의 정보나, 문서간의 링크 정보를 통한 문서의 중요도 분석 등을 수행할 수 있는 저장구조를 만들어보고 실험해 보았다.

  • PDF

복잡환 다단 문서 영상으로부터 구조화된 하이퍼문서의 자동 생성 (Automatic Generation of Structured Hyperdocuments from Multi-Column Document Images)

  • 이지연;강희중;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.458-460
    • /
    • 1999
  • 본 논문에서는 다양한 객체를 포함한 다단 문서 영상을 원본 문서와 거의 유사한 형태의 HTML 문서로 변환할 수 있는 방법을 제안한다. 또한 논문이나 매뉴얼, 책의 한 단원 등 여러장의 입력 문서의 경우, 문서의 논리적인 구조 분석을 수행하고 장이나 절 등의 섹션 제목들을 계층화하여 다단 문서의 변환과 동시에 구조화된 목차 페이지도 함께 자동 생성하는 방법을 제안한다. 제안된 다단 문서 변환 알고리즘을 잡지, 신문, 광고지, 매뉴얼 등, 비정형화된 문서에 적용한 결과, 원본 문서의 형태와 구조에 큰 변함없이 유사하게 변환되었고, 논리적인 구조 분석 및 섹션 제목들의 계층화 작업 또한 정확히 수행되어 구조화된 목차 페이지의 자동 생성이 가능하였다.

  • PDF

유사 구조 기반 XML 문서의 점진적 클러스터링 (Incremental Clustering of XML Documents based on Similar Structures)

  • 황정희;류근호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.699-709
    • /
    • 2004
  • XML은 정보 관리와 데이타 교환에서 점차로 더 중요해지고 있다. 효율적인 구조 검색과 문서 통합을 위한 기초 과정은 유사한 구조를 갖는 문서를 클러스터링 하는 것이다. 이것은 구조가 다른 전체 문서를 대상으로 검색하는 것보다 더 신속하고 유연성을 제공하기 때문이다. 따라서 이 논문에서는 XML 문서의 구조 검색과 통합에 유용한 유사 구조기반의 점진적 클러스터링 기법을 제안한다. 기존의 문서 클러스터링에서 벡터를 이용한 문서의 유사도에 의해 클러스터를 형성하는 것과는 다르게 우리는 대량의 데이타에 유연하게 적용할 수 있는 트랜잭션 데이타를 위한 클러스터링 알고리즘을 사용하였다. 제안 기법은 먼저 순차 패턴 알고리즘을 이용하여 XML 문서의 대표 구조를 추출한다. 그리고 문서를 하나의 트랜잭션으로, 문서의 대표구조를 트랜잭션의 항목으로 간주하여 유사 구조 항목 기반의 점진적인 클러스터링을 수행한다. 아울러, 클러스터의 응집도와 클러스터간의 유사도를 정의하였고, 이를 이용하여 기존 연구와의 실험에 대한 분석을 통해 제안 기법의 효율성을 분석하였다.

웹사이트의 구조분석을 위한 소프트웨어 에이전트 (A Software Agent to Analyze the Structure of Web Site)

  • 서연규;김경중;정윤경;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.21-23
    • /
    • 2000
  • 인터넷 사용의 급속한 증가로 인해 사용자는 많은 양의 정보들을 웹페이지를 통해서 공유할 수 있게 되었다. 그러나 웹문서들 중에는 구성이 제대로 되어있지 않아 원하는 정보를 얻기 위해 사용자의 많은 행동을 요구하기도 하며 존재하지 않거나 변경되기 전의 사이트를 링크 함으로써 인터넷 사용의 효율성을 저하시키는 문서들도 있다. 본 논문에서는 웹사이트의 효율성을 검토하기 위한 방법으로 웹사이트의 구조분석을 위한 에이전트의 구현에 대해 설명한다. 웹사이트 구조분석을 위한 에이전트는 해당사이트와 연결된 문서들의 구조 및 이들의 연결관계를 조사하여 사용자에게 제시함으로써 웹사이트의 구조를 한 눈에 파악할 수 있도록 한다. 이러한 구조분석 에이전트는 웹문서 구조에 기반한 정보검색에 유용하게 사용될 수 있다.

  • PDF

문서 영상의 논리적인 구조 분석을 위한 문서 모델의 자동 생성 (An Automated Creation of Document Model for Logical Structure Analysis of Document Images)

  • 이경호;최윤철;조성배;고견
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.103-106
    • /
    • 2000
  • 본 논문에서는 문서 영상으로부터 전자 문서를 자동 생성하기 위한 논리적인 구조 분석을 효율적으로 지원하기 위하여 문서 모델의 자동 생성과 점증적인 학습 기법을 제안한다. 이를 위하여 문서 유형의 논리적인 구조 정보와 기하적인 특성을 효과적으로 기술할 수 있는 문서 모델을 정의한다. 특히 제안된 방법은 문서 모델의 생성 결과로부터 SGML DTD와 DSSSL 스타일 시트를 생성하기 때문에 문서의 재 사용성과 호환성을 지원한다.

  • PDF

함수 변환과 FFT에 의한 XML 문서의 구조 비교 (XML Document Structure Comparison based on Function Transform and FFT)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.28-30
    • /
    • 2006
  • XML 문서의 유사성을 비교하는 연구는 XML 문서의 저장 및 검색에 유용하기 때문에 많은 연구가 진행되었다. XML 문서의 유사성 연구는 크게 edit-distance를 이용하는 방법, 문서의 그래프 모델을 이용하는 방법, 문서의 매트릭스 모델을 이용하는 방법 등이 있다. 최근에는 문서를 encoding 하고 푸리에 변환을 이용하는 방법이 보고되었다. 본 논문에서는 XML 문서를 함수로 변환하고 FFT를 적용하여 문서의 구조적 유사성을 비교하는 새로운 방법을 제안한다. 제안하는 방법은 JAXP로 구현하였으며 XML 문서의 구조를 분석하여 함수로 변환하였다. 그리고 함수에 FFT를 적용하여 XML 문서의 구조적 유사성을 비교하였다. FFT 비교 결과는 XML 문서의 함수 변환이 적합한 것임을 보여주었으며 비교 결과는 예상된 결과를 보여주었다.

  • PDF

GDIT기반의 순수 구조 질의 처리를 위한 색인 구조에 대한 분석 (Analysis of Index Structures for Sturcture-based Retrieval on GDIT)

  • 정채영;김영자;김현주;배종민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.193-195
    • /
    • 2000
  • 구조적 문서는 문서로의 다양한 접근 경로를 제공하므로, 구조적 문서들에 대한 정보 검색 시스템들은 문서의 구조를 사용한 구조 검색 질의를 지원하여 검색의 신뢰도를 높일 수 있다. 그러므로, 구조적 문서가 가지는 엘리먼트간의 구조적 포함관계나 순서등 문서 구조에 바탕을 둔 다양한 유형의 사용자 질의를 지원할 수 있는 색인 구조가 필요하다. 본 논문에서는 엘리먼트와 엘리먼트 사이의 구조적 상관관계나 엘리먼트의 발생순서에 관련된 질의등 여러 유형의 순수 구조 질의를 처리할 수 있는 세가지 색인 구조를 제시하고 그 성능을 평가한다. 제안된 색인 알고리즘은 GDIT 개념[5]에 바탕을 두고, GDIT기반의 색인 기법을 사용한다.

  • PDF

멀티미디어를 활용한 가상대학 XML 문서에서 Paser의 역할 (The Role of Paser for XML Documents using Multimedia in the Crber University)

  • 공범용;황병곤;조세홍
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.745-750
    • /
    • 2002
  • 최근 인터넷기술이 발전하면서 교육환경에서 멀티미디어 기술을 활용한 패러다임 전환이 이루어지고 있고, 이 전환에 가상대학에서 사용되어 지고 있는 문서의 역할의 중요성은 크게 주목을 받고 있다. 문서의 표준화를 위하여 구조적인 문서 처리가 가능한 XML이 대두될 것이다. XML에서 논리적 구조를 표현하는 방법은 사용자 정의인 문서타입(DTD)과 XML Schema의 두 가지 방식이 있으며, 향후 멀티미디어를 활용한 XML 문서에서 Paser의 역할이 중요하게 될 것으로 예측되어진다. 이에 따라 본 논문에서는 멀티미디어를 활용한 XML 문서에 필요한 자료들을 분석하고 가상대학에서 발생되는 문서행정업무를 효율적으로 지원하는 방안을 제안하는 XML 문서에서 Paser의 역할을 제시하고자 한다.

  • PDF

비디오 문서의 구조 질의를 위한 효율적 인덱스 구조 (An Efficient Index Structure Supporting Structure Queries for Video Documents)

  • 이용규
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1109-1118
    • /
    • 1998
  • 최근에 비디오 데이터베이스에 대하여 관심이 집중되고 있다. 비디오 문서도 텍스트 문서와 마찬가지로 계층적 논리 구조를 포함하고 있다. 사용자가 구조 질의로 이 구조를 활용한다면, 내용 질의에만 의존하는 것보다 더 큰 효과를 거둘 수가 있다. 구조 질의를 효율적으로 처리하기 위해서는 비디오의 문서 요소에 빨리 접근 할 수 있도록 지원하는 인덱스 구조가 필수적이다. 이 논문에서는 트리 구조의 비디오 문서 모형을 제시하고 비디오 문서를 위한 새로운 역 인덱스 구조를 제안한다. 그리고 이 인덱스 구조의 저장 장소 요구량과 디스크 접근 시간을 평가하고, 분석 결과를 제시한다.

  • PDF