• 제목/요약/키워드: 문서과

검색결과 2,264건 처리시간 0.026초

비즈니스 웹 폼과 XML 메시지 작성을 위한 폼 생성기의 설계 및 구현 (Design and Implementation of Form Generator for Creating Web Form and XML Message On Business)

  • 조준구;김창수;정회경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.313-315
    • /
    • 2001
  • 인터넷 기반의 B2B(Business To Business) 및 B2C(Business To Customer)의 거래 확대에 따른 비즈니스 상에 이용되어질 문서 양식도 웹(Web)화 되거나 전자화된 전용 양식 형태로 변환되어질 필요가 있다. 이러한 점은 기존의 비즈니스 상에서 이용되어진 종이 형태나 특정 포맷에 의존한 문서 양식이 제작 과정의 여러 단계와 그에 따른 고 비용의 문제를 안고 있으며, 거래 파트너간의 문서 교환을 통한 상호 운용성(Interoperability)을 확보 할 수 없는 문제점을 가지고 있기 때문이다. 이에 본 논문에서는, 인터넷 문서 표준인 XML(eXtensible Markup Language)과 그 표현을 위한 XSL(eXtensible Stylesheet Language) 문서를 이용하여 비즈니스 DTD(Document Type Definition) 문서를 기반을 한 XML 폼 생성기(Form Generator)를 개발하였으며, 그 결과인 폼 XML 문서를 XSL 문서를 이용하여 기존 웹 상에서 이용할 수 있는 HTML 형태의 웹 문서로 생성하고, 사용자 입력을 통해서 비즈니스 DTD 문서 구조에 유효한 비즈니스 XML 메시지를 작성할 수 있도록 설계 및 구현하였다.

효율적 XML 문서 변경 및 검색을 위한 페이징 기법 (Paging Mechanism for Efficient XML Document Updates and Retrieval)

  • 연제원;이강찬;이규철;나중철;이미영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.99-101
    • /
    • 1999
  • 최근 들어 XML에 대한 연구가 늘어나면서, XML(eXtensible Markup Language)문서에 대한 저장/검색에 대한 다양한 방법들이 제시되고 있다. 특히 XML 문서의 구조적인 특성을 살리면서 문서의 저장 및 변경을 원활하게 지원할 수 있는 방안에 대한 요구가 늘고 있다. 기존의 저장관리 시스템을 위한 저장 모델로는 크게, XML 문서의 빠른 검색을 지원할 수 있는 가상분할모델(Virtual Fragmentation Model)과 문서에 대한 변경을 빠르게 지원해 줄 수 있는 분할모델(Decomposition Model)로 나누어 볼 수 있는데, 본 연구에서는 이 두가지 모델의 장점을 취합하여 문서의 검색 속도는 가상분할모델정도로, 문서의 변경속도는 분할모델정도로 빠르게 지원해 줄 수 있는 페이징(Paging)기법에 대해 설계하였다. 본 페이징 기법은 XML문서뿐만 아니라, HTML(HiperText Markup Language) 문서의 저장관리 시스템에서도 똑같이 적용될 수 있다. 본 연구의 후반부에서는 페이징 기법과 다른 기법에 대한 비교를 통하여 페이징 기법의 성능을 분석하였다.

  • PDF

한글 문서의 색인어와 색인 기법

  • 강승식
    • 정보과학회지
    • /
    • 제22권4호
    • /
    • pp.72-77
    • /
    • 2004
  • 정보검색 시스템의 성능을 평가하는 요소는 재현율(recall)과 정확률(precision)이고, 재현율과 정확률을 결정하는데 가장 큰 영향을 미치는 것은 문서에 대한 색인어와 색인어 가중치이다[1]. '질의어'에 적합한 문서를 검색할 수 있는지를 결정하는 것은 "적합 문서에 대해 색인이 되어 있는가\ulcorner"하는 문제이며, 이는 재현율에 직접적인 영향을 미치게 된다. 즉, 적합 문서를 색인할 때 '질의어'에 대한 색인이 되어 있지 않은 문서는 검색이 되지 않으며, 또한 부적합 문서에 색인이 되어 있으면 부적합 문서들이 다수 검색되기 때문에 정확률이 낮아지게 된다.이 낮아지게 된다.

웹에서 효율적인 텍스트 문서 브라우징 (The Efficient Text Documents Browsing on World Wide Web)

  • 김원중;조이기;손철수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.457-459
    • /
    • 2001
  • 웹의 등장으로 우리는 현재 멀티미디어 정복까지도 쉽게 이용할 수 있게 되었지만, 웹에서의 텍스트 문서정보의 브라우징(Browsing)은 많은 마우스 클릭과 스크롤링을 필요로 하고 있다. 또한 현재의 웹 텍스트 문서의 브라우징은 문서의 내용이 클 경우 검색자가 현재 브라우징하고 있는 문서가 본인이 필요로 하는 것인지, 아닌지를 판단하는데 많은 시간과 노력을 요구한다. 본 논문에서는 문서의 제목 부분과 내용 단락의 전체가 아닌 1-2줄만으로도 문서의 전체 윤곽을 쉽게 파악할 수 있다는데 착안하여 웹에서의 효율적인 텍스트 문서 브라우징 시스템을 개발하였다.

  • PDF

메시징 서버를 이용한 콤포넌트 기반의 문서관리 시스템 설계 (A Design of Component based Document Management System Using Messaging Server)

  • 허성영;나연묵
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2000
  • 본 논문에서는 메시징 서버를 이용한 문서 관리 시스템을 제안한다. 본 문서관리 시스템은 각 구성 부분들을 콤포넌트 단위로 설계하고, 메시징 서버를 기본 엔진으로 사용한다. 엔진으로 메시징 서버를 사용하면 각각의 문서를 하나의 객체로 처리할 수 있게 되어 문서 객체들에 대한 직접적인 관리가 가능해지므로 프로젝트 관리, 문서 권한 관리, 새로운 문서 유형의 추가 수정등이 용이하고, 문서들을 계층적 구조로 저장 검색하기에 용이하다. 이 시스템은 워크플로우와 같은 메시징 기반의 시스템과의 연동에 쉽게 적용될 수 있다.

  • PDF

문서 시각화를 위한 개선된 클러스터링 알고리즘 (Advanced Clustering Algorithm for Documents Visualization)

  • 신광철;한상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.256-258
    • /
    • 2002
  • 본 논문은 주어진 문서집합에 대한 유사도 검사를 통해 주어진 문서집합의 내용을 사용자가 직관적으로 파악할 수 있도록 하는 클러스터링 시각화 알고리즘에 관한 것이다. 제안하는 방법의 핵심은 주어진 문서 집합의 각 문서 사이의 유사도를 측정하여 각 문서 주변의 밀집도를 파악하고, 밀집도가 높은 문서들을 묶어 하나의 클러스터로 구성한 후, 구성된 각각의 클러스터의 키워드를 제공함으로 사용자가 해당 문서 집합의 내용을 보다 직관적으로 파악할 수 있도록 한 것이다. 우리는 TIME 데이터 집합에 대해 제시하는 알고리즘을 적용해 실험한 후 그 결과를 기존의 spherical k-means에 의해 클러스터링한 결과와 비교하여 제안하는 방법이 사용자에게 더 나은 시각화 정보를 제공함을 알아보았다.

  • PDF

XML 기반 다목적 컨텐츠 출판 시스템의 설계 (Design of XML Based Publish System for Multipurpose Contents)

  • 김연혜;황병연
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.82-84
    • /
    • 2002
  • 개인용 컴퓨터의 대중화가 이루어지면서 수많은 전자 문서가 작성되어졌다. 그러나 전자 문서의 검색 문제와 문서의 3가지 구성요소인 내용, 구조, 표현의 혼재로 인한 문서의 재작성이 많이 일어났다 이러한 소모적인 문서의 재작성은 특히 동일한 컨텐츠를 가진 여러 목적의 출판에서 두드러진다. 본 논문에서는 이러한 전자 문서의 재작성을 줄이고자 XML 기반 다목적 컨텐츠 출판 시스템을 설계한다. 본 논문에서 설계된 시스템은 전자 문서 변환을 2단계로 분리함 으로써 변환기 중복 구현을 최소화하고 전자 문서 편집기간의 호환성 문제를 해결한다.

  • PDF

XQL를 지원하는 XML 문서 저장 시스템 (Design and Implementation of an XML Document Storage System supporting XQL)

  • 허명식;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.39-41
    • /
    • 1999
  • XML 문서와 같은 구조적 데이터는 관계형 데이터베이스에 저장하고 인터넷 응용 프로그램을 개발하는데 많은 이점을 가지고 있다. 또한 이러한 구조적 문서에 대한 질의 언어를 지원하는 것은 유용하다. 이에 본 논문에서는 XML 문서에 대한 질의 언어로 제안되어진 XQL을 효율적으로 지원할 수 있도록 XML 문서의 각 엘리먼트를 관계형 데이터베이스의 테이블로 매핑시키는 방법과 XQL을 SQL로 변환하는 방법을 제시하고 또한 XML 문서의 DTD를 통해 해당하는 문서의 테이블을 자동으로 생성하는 방법을 제시한다. 이를 통해 XQL을 효율적으로 지원하는 XML 문서 저장 시스템을 설계하고 구현한다.

  • PDF

XSL를 이용한 XML 문서 검색에 관한 연구 (Study for XML document retrieval to use XSL)

  • 김충성;김용성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.66-68
    • /
    • 1999
  • 최근 들어 이 기종 간의 문서 교환을 위해 SGML(Standard Markup Language) 문서보다 XML(eXtend Markup Language) 문서가 인터넷 기반에서 표준으로 자리잡고 있다. 앞으로 인터넷상의 수많은 정보들을 XML을 기반으로 할 것이고 이를 위해 문서 정보 검색 시스템이 필요하게 된다. 문서의 논리 구조를 표현하는 DTD(Document Type Definition) 기반으로 구조 검색을 할 수 있지만 본 논문에서는 XSL(XML Style Sheet Language) 문서에서 DTD의 Element를 지정하는 Pattern을 이용하여 문서 구조와 속성을 새로운 Tree로 표현하며 검색에 필요한 질의어 또한 XSL의 Pattern 자체를 이용하고 있다. 사용자에게 편하고 효율적인 검색 환경을 위해서 검색 인터페이스의 모형을 제안하였다.

  • PDF

신경망 또는 k-NN에 의한 신문 기사 분류와 그의 성능 비교 (The Comparison of Neural Network and k-NN Algorithm for News Article Classification)

  • 조태호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.363-365
    • /
    • 1998
  • 텍스트 마이닝(Text Mining)이란 텍스트형태의 문서들의 패턴 또는 관계를 추출하여 사용자가 원하는 새로운 정보를 가공하거나 기존의 정보를 변형하는 과정을 말한다. 텍스트 마이닝의 기능에는 문서 범주화(Document Categorization), 문서 군집화(Document Clustering), 그리고 문서 요약(Document Summarization)이 이에 해당된다. 문서 범주화란 문서에게 사전에 정의한 범주를 부여하는 과정을 말하고, 문서 군집화란 문서들을 계층적 구조로 형성하는 과정을 말하고, 문서 요약이란 문서의 전체 내용을 대표할 수 있는 내용의 일부만을 추출하는 과정을 말한다. 이 논문에서는 문서 범주화만을 다룰 것이며 그 대상으로는 신문기사로 설정하였다. 그의 범주는 4가지로 정치, 경제, 스포츠, 그리고 정보통신으로 설정하였다. 문서 범주화는 문서 분류(Document Classification)라고도 하며 문서에 범주를 자동으로 부여하여 기존에 인위적으로 부여함으로써 소요되는 시간과 비용을 절감하는 것이 목적이다. 문서 범주화에 대하여 k-NN(k-Nearest Neighbor)와 신경망을 이용하였으며, 신경망을 이용한 경우가 k-NN을 이용한 경우보다 성능이 우수하였다.

  • PDF