• Title/Summary/Keyword: 문서

Search Result 7,095, Processing Time 0.03 seconds

A Proposal of the Model for IT Value Added Services based on Certified e-Documents Authorities (공인전자문서보관소 기반 IT 부가서비스모델 제안)

  • Seo, Moon-Seog
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.05a
    • /
    • pp.197-200
    • /
    • 2009
  • 비즈니스 환경에 전자문서를 활용함으로써 종이 없는 사회를 구현하기 위해 정부는 공인전자문서보관소 제도를 추진하고 있다. 이는 업무처리 과정에서 발생한 전자문서를 공인된 전자문서보관소에 보관하고 필요시에 해당 전자문서 혹은 증명서를 발급하여 활용하는 방식으로 업무처리의 간소화, 검색의 용이성 및 문서보관비용 절감 등의 효과를 기대할 수 있다. 그러나 공인전자문서보관소를 기반으로 하는 다양한 비즈니스 모델이 부족하여 기업이 업무환경에 공인전자문서보관소를 이용하는 사례가 부족한 실정이다. 본 논문에서는 전자문서 및 공인전자문서보관소 이용의 활성화를 위해 이를 기반으로 하는 IT 부가서비스 모델과 이의 적용 사례를 제시하고자 한다.

  • PDF

Syntax-Directed Document Editor based XML DTD (XML DTD 기반의 구문지향 문서 작성기)

  • Kim, Young-Chul;Kim, Sung-Keun;Choi, Jong-Myung
    • The Journal of Korean Association of Computer Education
    • /
    • v.7 no.4
    • /
    • pp.67-75
    • /
    • 2004
  • XML is being accepted as a standard for the next generation web documents, as it enables to extend the document structures. However, general users have difficulties in writing valid and well-formed XML documents, since the documents should satisfy the grammatical constraints of XML. In this paper, we present a syntax-directed XML document editor which will ease users in writing valid XML documents. The editor will help users, and increase productivity in writing XML documents.

  • PDF

Performance Improvement of Document Classification by Rule-based Word Clustering (규칙기반 단어 클러스터링에 의한 문서 분류의 성능 향상)

  • Hyun Woo-Seok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.196-198
    • /
    • 2006
  • 분류되지 않은 문서의 문서 분류는 현재까지 아주 중요한 문제로 대두되고 있다. 컴퓨터를 이용한 문서 검색 엔진인 Citeseer에서는 문서 인덱싱을 하기 위해서 자동문서 분류 방법을 사용하고 있다. 문서 분류는 원본 문서의 단어들을 제1의 속성 표현으로 사용한다. 그러나 이와 같은 표현은 고차원과 속성 부족을 초래하게 된다. 단어 클러스터링은 속성 차원과 속성 부족을 감소시키기 위한 효율적인 방법이며 문서 분류 성능을 향상시켜 준다. 본 연구에서는 클러스터 속성 표현을 위한 도메인 규칙기반 단어 클러스터링 방법을 사용한다. 클러스터는 다양한 도메인 데이터베이스들과 단어 철자 속성들로부터 생성되는데, 이와 같은 클러스터 속성 표현은 중요한 차원 감소뿐만 아니라 문서 헤더 라인의 평균 분류 성능에서 향상을 보여 주었고, 원본 문서 단어 기반 속성 표현과 비교해 보았을 때 도서목록 항목 추출의 정확도를 향상시켰다.

  • PDF

Development of a Form-based XML Editing System for Efficient Processing of Variously Structured Documents (다양한 구조 문서를 효율적으로 처리하기 위한 폼(Form) 기반 XML 편집 시스템 개발)

  • 손원성;김재경;고승규;최윤철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.257-259
    • /
    • 2000
  • 다양한 전자문서를 효율적으로 처리하기 위해서는 구조문서 정의가 가능한 SGML(Standard Generalized Markup Language)이나 XML(eXtensible Markup Language)을 이용할 수 있다[1,2]. SGML 및 XML과 같은 구조문서를 생성하기 위해서는 별도의 편집기가 필요하며 현재 다양한 제품이나 연구결과를 살펴볼 수 있다[3,4]. 그러나 기존의 입력, 편집 시스템에서는 사용자가 작성하려는 문서에 대한 구조를 숙지하여야 하는 동시에, DTD(Document Type Definition)에 대한 지식을 필요로 한다. 이를 인해 복잡한 구조의 SGML 및 XML 문서를 일반인들이 사용하기 어렵고, 작성한 결과에 대한 검증 과정이 필수적으로 요구된다. 또한 다양한 분야에서 적용 가능한 전자문서 시스템을 위해서는 효과적인 통합 DTD의 정의와 처리 방법이 필요하다. 따라서 본 논문에서는 구조화 문서에 대한 지식이 없는 일반인들도 쉽게 구조문서 작성이 가능하며, 통합적 DTD의 효율적인 처리가 가능한 Form 기반 편집 시스템의 모델을 제시하며, 특히 웹에서도 적용이 가능한 XML을 지원한다. 그 결과 본 연구에서 개발한 XML 편집 시스템은 Form 기반의 통합 DTD 처리와 XML 문서 작성 및 출력 기능, 그리고 이미지, 테이블 기능 등을 제공함으로써 누구나 쉽고 정확한 XML 문서를 작성할 수 있다.

  • PDF

A development XML schema for non-formal technical documents (비정형 기술문서에 대한 XML 스키마 개발)

  • Jeong Seong-Yun;Kim Seong-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.89-92
    • /
    • 2004
  • 전자거래기술이 발전되면서 인터넷을 통해 다양한 포맷의 전자문서가 유통되기 시작하였다. 이로 인해 상이한 문서 포맷간의 호환성 결여와 문서 데이터의 교환 등의 문제가 대두되기 시작하였다. 이를 위해 많은 전자문서가 XML 포맷으로 작성, 유통되기 시작하였다. 하지만 대부분의 XML 전자문서는 일정한 형식을 가지면서 분량이 적은 서식문서를 대상으로 개발되고 있으며 분량이 방대하고 비정형 구조를 갖는 기술문서에 대한 XML 전자문서의 연구 개발은 많지 않은 실정이다. 본 연구는 이러한 기술문서를 XML 전자문서로 할 때 공통으로 표현될 수 있는 정보요소와 정보로서 가치가 있는 구성 항목 등을 분석하여 35종의 공통 정보요소에 대한 XML 스키마를 개발하였다.

  • PDF

Technique for Path-based Similarity Evaluation of XML Documents (경로 기반의 XML 문서 유사도 계산 기법)

  • Yi Dong-Ae;Jang Duck-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.689-692
    • /
    • 2004
  • XML은 의미적으로는 동일하거나 혹은 유사하지만 서로 다른 구조의 XML 문서들을 허용하므로 XML 문서들을 대상으로 하는 검색, 클러스터링 등의 응용에서는 XML 문서들간의 유사도 계산이 선행되어져야 한다. XML 문서간 유사도를 계산하기 위해서는 문서의 구조 정보인 엘리먼트들과 이들 엘리먼트들의 계층적 구조가 고려되어져야 한다. 본 연구에서는 두 XML 문서가 얼마나 유사한 경로들을 공통으로 가지냐를 두 문서간의 유사도로 보고, 경로 유사도 계산식과, 이를 기반으로 하는 문서 거리 및 문서 유사도 계산식을 정의하여, 유사도 계산 기법을 제안한다. 제안된 기법과 기존 유사도 계산 기법들을 예제 문서들을 통해 계산결과를 비교한다.

  • PDF

Semantic Classification of Web Pages using Ontology Concept Structure (온톨로지의 개념구조에 의한 웹페이지의 의미적 분류)

  • Song, Mu-Hee;Lim, Soo-Yeon;Park, Seong-Bae;Kang, Dong-Jin;Lee, Sang-Jo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.487-489
    • /
    • 2005
  • 본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

Greedy Document Gathering Method Using Links and Clustering (Link와 Clustering을 이용한 적극적 문서 수집 기법)

  • 김원우;변영태
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2001.06a
    • /
    • pp.393-398
    • /
    • 2001
  • 특정 영역에 대해 사용자에게 관련 정보를 제공해 주는 서비스를 하는 정보 에이전트를 개발 중이다. 정보 에이전트는 사용자 질의 처리를 달은 Agent Manager와 지식베이스를 관리하는 KB Manager, 그리고 Web으로부터 해당 영역의 관련 문서를 끌어오는 Web Manager로 구성되어 있다. Web Manager는 방문할 URL을 수집하고, 이들 문서에 대한 관련 평가와 Indexing을 수행한다. Web Manager는 검색 엔진을 이용하거나, 방문한 문서의 link를 이용하여 URL을 수집하는데 이러한 URL수집기법은 많은 관련 문서를 놓치는 문제점이 있다. 이 문제점을 해결하기 위해서 해당 영역과 관련된 Site들을 대상으로 Link를 이용해 문서들을 모아와, 문서들을 TAG들의 패턴으로 얻어낸 문서 형식을 이용해 Clustering하며 관련 문서들의 Group을 찾아내는 적극적 문서 수집 기법을 제안한다. 실험 결과, Link와 Clustering을 이용할 경우 기존보다 효과적으로 관련 문서를 많이 수집할 수 있음을 알 수 있다.

  • PDF

An XML Document Processor Generator using Object-oriented Attribute Grammar (객체지향 속성 문법을 이용한 XML 문서 처리기 생성기)

  • 최종명;유재우
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.2
    • /
    • pp.224-234
    • /
    • 2004
  • An XML document processor should process the XML documents according to their purposes and semantics. It is very hard to automatically generate an XML document processor with DTD, because it does not provide the semantic information. In this paper, we introduce an XML document processor generator and a method for specifying semantics using the object-oriented attribute grammar. The XML document processor generator will reduce costs and efforts in developing XML document processors.

Focused Crawler using Ontology and Sentence Analysis (문장 분석 및 온톨로지를 이용한 Focused Crawler)

  • 최광복;김현주;강진범;홍광희;양재영;최중민
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.100-102
    • /
    • 2004
  • 월드 와이드 웹의 보편화로 인하여 급속하게 증가하고 변화하는 웹 문서는 검색엔진으로 하여금 색인된 웹 문서와 현재의 웹 문서의 일관성을 유지할 수 없을 정도이다. 이러한 문제를 해결하기 위한 방법으로 연구되고 있는 것이 특정한 주제를 정하고 정해진 주제에 관련된 문서를 수집할 수 있는 focused crawler가 제시되고 있다. 지금까지 다양한 접근방법의 focused crawler가 개발되었지만, 모두 웹 링크를 이용하여 연결되어 있는 문서를 평가하는 처리과정을 거치고 있다. 그러나 이러한 과정은 다양한 내용을 포함하고 있는 문서일 경우 관련내용이 존재함에도 문서가 버려지거나 사용되더라도 문서상의 모든 링크를 사용하여 처리하는 비효율적인 문제점이 발생한다. 이 논문에서는 웰 문서 내부에 포함되어 있는 정보를 온톨로지를 이용하여 평가함으로써 다양한 내용을 가진 문서에서 사용자가 원하는 정보를 찾을 수 있을 뿐만 아니라 정보와 관련된 링크만을 사용하여 보다 효율적이고 정확한 문서를 수집하고자 한다.

  • PDF