• 제목/요약/키워드: Full-text information

검색결과 274건 처리시간 0.031초

광기술을 이용한 연구보고서 관리시스템 구축 (A Study on Construction of Technical Reports Management System Using Optical Technology)

  • 이상헌;김익철
    • 정보관리학회지
    • /
    • 제9권1호
    • /
    • pp.131-164
    • /
    • 1992
  • 본 연구에서는 광기술을 이용한 보고서 서지정보와 원문정보를 관리할 수 있는 보고서관리시스템을 개발하였다. 시스템을 현재 상업적으로 보급되고 있는 문서용 광화일링시스템과의 비교평가를 통하여 보고서관리에 적합하고, 도서관 업무에 효율화에 직접적으로 기여할 수 있는 구조로 설계되었으며, 디지탈 이미지 처리기술, MARC 표준, 영문 OCR등의 기술이 사용되었다. (키워드 : 디지탈 이미지, 광기술, 전문데이타베이스, 표준화, 기술보고서, MARC, 광학문자인식)

  • PDF

A Rule-Based Analysis from Raw Korean Text to Morphologically Annotated Corpora

  • Lee, Ki-Yong;Markus Schulze
    • 한국언어정보학회지:언어와정보
    • /
    • 제6권2호
    • /
    • pp.105-128
    • /
    • 2002
  • Morphologically annotated corpora are the basis for many tasks of computational linguistics. Most current approaches use statistically driven methods of morphological analysis, that provide just POS-tags. While this is sufficient for some applications, a rule-based full morphological analysis also yielding lemmatization and segmentation is needed for many others. This work thus aims at 〔1〕 introducing a rule-based Korean morphological analyzer called Kormoran based on the principle of linearity that prohibits any combination of left-to-right or right-to-left analysis or backtracking and then at 〔2〕 showing how it on be used as a POS-tagger by adopting an ordinary technique of preprocessing and also by filtering out irrelevant morpho-syntactic information in analyzed feature structures. It is shown that, besides providing a basis for subsequent syntactic or semantic processing, full morphological analyzers like Kormoran have the greater power of resolving ambiguities than simple POS-taggers. The focus of our present analysis is on Korean text.

  • PDF

SGML 한글문서의 논리적 구조에 근거한 색인기법에 관한 연구 (A Study of Automatic Indexing Technique based on Logical Structure of SGML Hangul Document)

  • 유석종
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.85-101
    • /
    • 1995
  • 기존 색인 시스템은 전자문서에 대하여 전문색인 (full-text indexing) 방법만을 지원하며, 문서의 논리적 구조를 검색 방법으로 적절하게 활용하지 못하고 있다. 대부분의 전자문서는 특정 시스템에 의존적인 형식으로 되어 있으며, 문서의 물리적 형태만을 나타내고 논리적 구조에 대한 정보는 포함하고 있지 않다. 이에 반해 1986년에 ISO에서 문서교환에 대한 표준방식으로 제정한 SGML (Standard Generalized Markup Language)은 문서의 논리적 구조에 대한 정보를 포함하고 있다. 본 논문에서는 기존의 전문색인 시스템의 단점을 보완하고 표준문서형식을 사용하기 위해 SGML 문서에서의 색인 시스템을 설계 구현하고자 한다. 기존 색인 시스템에서는 문서 전체에 대하여 색인이 이루어지는데 비하여 본 시스템에서는 SGML 문서의 구성요소인 엘리먼트에 기반하여 색인 영역을 지정할 수 있게 하엿다. 따라서 문서의 논리적 구조를 반영한 다양한 검색기법에 응용될 수 있다. 또한 본 시스템에서는 SGML 한글문서에 대하여 자동색인이 가능하다.

  • PDF

텍스트의 상부구조를 이용한 전문탐색 기법의 타당성 고찰 (A Study on Feasibility of Full-text Search Using Super-structure of Text)

  • 이병기
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1996년도 제3회 학술대회 논문집
    • /
    • pp.19-22
    • /
    • 1996
  • 본 연구는 전문 D/B의 본문 필드를 텍스트 언어학적 상부구조로 분할하고 태그를 부여함으로써 이용자의 목적이나 상황에 따라서 필요한 부분만을 검색할 수 있는 전문탐색기법의 타당성을 고찰하였다. 한 문헌은 다수의 텍스트 단위로 구성되며, 이 텍스트는 의사소통이나 인지과정의 기본 단위로써 문헌 전체를 통괄하는 상부구조에 의해 연결된다. 상부구조는 텍스트의 생성과 이해에 중요한 매개체 역할을 하며, 정보요구의 상황이나 목적과 밀접하게 관련되어 있음을 밝히고 정보검색시스템의 주요 대상인 학술문헌의 상부구조를 고찰하였다.

  • PDF

원문정보공개서비스를 위한 전자기록구성요소에 관한 연구 (A Study on the Electronic Records Element for Full Text Opening Information Service)

  • 허준석;홍덕용
    • 기록학연구
    • /
    • 제50호
    • /
    • pp.351-388
    • /
    • 2016
  • 정부 3.0의 원문정보공개서비스의 대상인 전자기록물이 기록학적인 관점에서 체계적이고 효율적으로 활용되고 있는지를 파악하고자 공공기관의 정보공개담당자들을 대상으로 관련 설문을 조사 분석하였다. 이를 위해 InterPARES의 전자기록물 구성요소에 대하여 기록물의 4대 원칙인 진본성, 신뢰성, 무결성, 이용가능성을 지표로 하는 전자기록물의 구성요소를 분석하였다. 이러한 분석을 통하여 원문정보공개서비스에서 전자기록구성요소에 따라 관리하며 향상시킬 수 있는 요인을 찾아 개선해야 할 점을 밝혔다. 그 결과를 바탕으로 원문정보공개서비스 시 전자기록물의 요소들의 개선과 기능보완, 특성에 맞는 서비스 등을 제시하였다.

인터넷을 기반으로 한 DVI 포맷의 복합문서 전송 및 전문 데이터베이스 구축 사례 연구 (Manipulation of Complex Documents of DVI Format in the Internet Environment and Construction of Full-Text Database)

  • 윤화묵;김진숙;이기호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.153-155
    • /
    • 1999
  • 1990년대 중반부터 인터넷의 활성화와 다양하고 강력한 문서편집기의 보편화에 따라 복잡한 문서들이 대량으로 생산됨에 따라 인터넷을 통한 효율적인 문서교환의 필요성이 늘어나고 있다. 그러나 생산된 방대한 양의 전자형태 복합문서들은 ?글, MS-Word, LaTex 등 다양한 문서편집기로 작성되었고 문서형식의 표준화가 이루어지지 않아, 효율적으로 활용되지 못하고 특히 문서교환에 있어 많은 문제점을 야기하고 있는 실정이다. 본 논문에서는 다양한 형태로 존재하는 복합문서들을 하나의 통일된 중간포맷으로 변환하고, 변환된 복합문서들을 전문데이터베이스(full-text database)화하여 이를 인터넷을 통해 효율적으로 검색할 수 있는 전문검색시스템 모델을 제시한다.

  • PDF