• Title/Summary/Keyword: 문서변환

Search Result 696, Processing Time 0.027 seconds

Word Sense Disambiguation in Query Translation of CLTR (교차 언어 문서 검색에서 질의어의 중의성 해소 방법)

  • Kang, In-Su;Lee, Jong-Hyeok;Lee, Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.52-58
    • /
    • 1997
  • 정보 검색에서는 질의문과 문서를 동일한 표현으로 변환시켜 관련성을 비교하게 된다. 특히 질의문과 문서의 언어가 서로 다른 교차 언어 문서 검색 (CLTR : Cross-Language Text Retrieval) 에서 이러한 변환 과정은 언어 변환을 수반하게 된다. 교차 언어 문서 검색의 기존 연구에는 사전, 말뭉치, 기계 번역 등을 이용한 방법들이 있다. 일반적으로 언어간 변환에는 필연적으로 의미의 중의성이 발생되며 사전에 기반한 기존 연구에서는 다의어의 중의성 의미해소를 고려치 않고 있다. 본 연구에서는 질의어의 언어 변환시 한-일 대역어 사전 및 카도가와 시소러스 (각천(角川) 시소러스) 에 기반한 질의어 중의성 해소 방법과 공기하는 대역어를 갖는 문서에 가중치를 부여하는 방법을 제안한다. 제안된 방법들은 일본어 특허 문서를 대상으로 실험하였으며 5 %의 정확도 향상을 얻을 수 있었다.

  • PDF

Development of A Tool for Transforming XML Document for E-commerce (E-commerce를 위한 XML 문서 변환 도구 개발)

  • 최정익;정재우;하상호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.472-476
    • /
    • 2001
  • 현재 전자상거래에서 정보전달에 쓰이고 있는 HTML이나 EDI는 정보의 전달과 효율방면에는 별로 유용하지가 않다. 그 대처 방안으로 정보전달에 매우 유용하고 효율적인 XML이 대두되고 있다. 그러나 XML 문서는 정보제공자 마다 그 구성과 태그이름이 다르다. 이러한 타 XML 문서를 사용하기 위해서는 정보제공자와 같은 구조의 XML을 사용하거나 XML문서의 변환이 불가피하다. XML은 XSL을 사용하여 변환이 가능하지만 구조와 요소이름이 파악되지 않은 XML문서의 변환은 그 문서를 분석뿐만 아니라 변환시킬 수 있는 XSL을 직접 제작 해줘야 한다. 이와 같은 작업은 전자 상거래에서 저해요인이 될 뿐 아니라 시간적으로도 크나큰 손실이다. 본 논문에서는 Java를 기반으로 사용자의 편의적인 GUI(Graphical Use Interface)에 입각한 XSL문서 제작 도구의 구현 및 향후 개발 방향을 제시하였다.

  • PDF

Automatic Generation of XML Documents Using Rule-Based Document Classifier (규칙기반 문서 분류기를 이용한 XML 문서 의 자동생성)

  • 김효정;민미경
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.125-128
    • /
    • 2000
  • 인터넷 중심의 정보화 사회가 되면서 기존의 문서는 대부분 전자 문서로 대치되어 가고 있다. 전자 문서간의 호환과 표준화를 위하여 XML(eXtensible Markup Language)이 웹 문서의 표준으로 지정되었으나, 현재까지 사용되고 있는 문서들이 XML 형태의 문서가 아니므로 이를 수동으로 변환해야 하는 어려움이 있다. 본 논문에서는 규칙기반 분서 분류기(Rule-Based Document Classifier)를 설계하여 다양한 형태의 문서를 자동으로 분류하고 그룹화한다. 그룹화된 문서를 이용하여 자동으로 DTD(Document Type Definition)를 생성하고, 자동 생성된 DTD를 이용하여 XML 형태의 문서로 자동 변환할 수 있는 자동 XML 변환기를 제시한다. 이러한 방법은 문서들을 자동으로 분류하고, 문서의 행태에 변화가 있을 때에도 유사한 문서로 분류할수 있을 뿐만 아니라 문서를 재분류할 때 DTD의 중복 생성을 줄일 수 있는 등의 장점을 갖는다.

  • PDF

Skeleton Code Generation for Transforming an XML Document with DTD using Metadata Interface (메타데이터 인터페이스를 이용한 DTD 기반 XML 문서 변환기의 골격 원시 코드 생성)

  • Choe Gui-Ja;Nam Young-Kwang
    • The KIPS Transactions:PartD
    • /
    • v.13D no.4 s.107
    • /
    • pp.549-556
    • /
    • 2006
  • In this paper, we propose a system for generating skeleton programs for directly transforming an XML document to another document, whose structure is defined in the target DTD with GUI environment. With the generated code, the users can easily update or insert their own codes into the program so that they can convert the document as the way that they want and can be connected with other classes or library files. Since most of the currently available code generation systems or methods for transforming XML documents use XSLT or XQuery, it is very difficult or impossible for users to manipulate the source code for further updates or refinements. As the generated code in this paper reveals the code along the XPaths of the target DTD, the result code is quite readable. The code generating procedure is simple; once the user maps the related elements represented as trees in the GUI interface, the source document is transformed into the target document and its corresponding Java source program is generated, where DTD is given or extracted from XML documents automatically by parsing it. The mapping is classified 1:1, 1:N, and N:1, according to the structure and semantics of elements of the DTD. The functions for changing the structure of elements designated by the user are amalgamated into the metadata interface. A real world example of transforming articles written in XML file into a bibliographical XML document is shown with the transformed result and its code.

EDI processing system for port logistics system design (항만 물류 시스템을 위한 EDI 전자문서 처리 시스템 설계)

  • Chin, Sung-Geun;Ham, Jong-Wan;Park, Jong-Il;Kim, Jeong-Sig;Jung, Hoe-Kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2010.10a
    • /
    • pp.462-464
    • /
    • 2010
  • Logistic of port to use electronic document handling and trade electronic document EDI is used. Thus, EDI electronic documents system is electronic document processing system can handle. and the user wants to convert document formats, or extract the desired information the user should be able to use. Conversion of existing EDI documents and document conversion systems used in mapping the complexity of the grammar of the script, and it is difficult to use the operator. In this paper, efficient processing of EDI documents to electronic mapping of the existing operators in the grammar syntax to create an easy to use, more efficiency, increase operational management of EDI electronic document processing system is designed.

  • PDF

A Study on the Transformation of SGML Documents based on DSSSL (DSSSL 에 기반한 SGML 문서의 변환에 관한 연구)

  • 백승욱;장은영;변창원;고승규;이경호;최윤철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.189-191
    • /
    • 1998
  • SGML은 이 기종간에 호환이 가능하고 논리적인 구조 정보를 포함한다는 장점 때문에 문서처리의 다양한 분야에서 표준 포맷으로 자리를 잡았다. 그러나 SGML 은 문서의 스타일이나 변환등의 처리 정보를 기술할 수 있는 방법을 제공하지 않는다. 이에 ISO는 SGML 문서의 다양한 처리 정보를 기술할 수 있는 표준으로 DSSSL을 제안하였다. 따라서 본 논문에서는 SGML 문서의 내용 및 구조를 수정할 수 있는 DSSSL 기반의 문서 변환기를 개발하였다. 이를 위하여 SGML 문서와 DSSSL 문서간의 표준적인 인터페이스를 지원하는 Grove 생성기를 개발하였으며 DSSSL 의 변환 언어를 지원하는 처리 모듈을 개발하였다.

  • PDF

A Disambiguation and Weighting Method using Mutual Information for Query Translation in Korean-to-English Cross-Language IR (한-영 교차언어 정보검색에서 상호정보를 이용한 질의 변환 모호성 해소 및 가중치 부여 방법)

  • Jang, Myung-Gil;Myaeng, Sung-Hyon;Park, Se-Young
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.55-62
    • /
    • 1999
  • 교차언어 문서검색에서는 단일언어 문서 상황을 만들기 위하여 질의나 문서를 다른 언어로 변환하게 되는데, 일반적으로 간단하면서도 실용적인 질의 변환의 방법을 주로 사용하고 있다. 하지만 단순한 대역 사전을 사용한 질의 변환의 경우에 변환 모호성 때문에 40% 이상의 검색 효과의 감소를 가져온다. 본 논문에서는 이러한 변환 모호성을 해결하기 위하여 대역 코퍼스로부터 추출한 상호 정보를 이용하는 단순하지만 효과적인 사전 기반 질의 변환 방법을 제안한다. 본 연구에서는 변환 모호성으로 발생한 다수의 후보들에서 가장 좋은 후보를 선택하는 모호성 해소 뿐 아니라 후보 단어들에 적절히 가중치를 부여하는 방법을 사용한다. 본 질의 변환 방법은 단순히 가장 큰 상호 정보의 단어를 선택하여 모호성 해소만을 적용하는 방법과 Krushall의 최소 스패닝 트리 구성과 유사한 방법으로 상호 정보가 큰 순서대로 간선들을 연결하여 모호성 해소와 가중치 부여를 적용하는 방법들과 질의 변환의 검색 효과를 비교한다. 본 질의 변환 방법은 TREC-6 교차언어 문서검색 환경의 실험에서 단일 언어 문서검색의 경우의 85%, 수작업 모호성 해소의 경우의 96%에 도달하는 성능을 얻었다.

  • PDF

FromTo-$Web/EK^{TM}$: English-to-Korean Machine Translation System for HTML Documents (에서로-웹/$EK^{TM}$: 영한 웹 문서 번역 시스템)

  • Sim, Chul-Min;Yuh, Sang-Wha;Jung, Han-Min;Kim, Tae-Wan;Park, Dong-In;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.277-282
    • /
    • 1997
  • 최근 들어 웹 상의 문서를 번역해 주는 번역 시스템이 상용화되고 있다. 일반 문서와 달리 웹 문서는 HTML 태그를 포함하고 있어 번역 시스템에서 문장 단위로 분리하는데 어려움이 있다. 또한 그 대상 영역이 제한되지 않으므로 미등록어 및 구문 분석 실패에 대한 대처 기능이 필요하다. 따라서 웹 문서의 번역 품질이 일반 문서 번역에 비해 현저히 떨어지게 된다. 이 논문에서는 HTML 태그를 보유한 영어 웹 문서를 대상으로 하는 번역 시스템인 "에서로-웹/EK"에 대해 기술한다. 에서로-웹/EK는 HTML 문서의 특성을 고려하여 태그를 분리, 복원하는 태그 관리자를 별도로 가진다. 또한 태그를 유지하면서 영어에서 한국어로 변환되는 과정에서 발생하는 어휘 분리, 어휘 통합, 어순 변환 둥의 다양한 변환 현상을 처리한다. 이 시스템은 변환 방식에 기반한 번역 시스템으로서 영어 해석, 영한 변환, 한국어 생성의 단계를 거친다. 구현된 시스템은 Netscape와 DDE(Dynamic Data Exchange) 방식으로 연동하여 HTML 문서를 번역한다.

  • PDF

A Study on HTMLtoVoiceXML Converter (HTMLtoVoiceXML 변환기에 관한 연구)

  • 최훈일;장영건
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10c
    • /
    • pp.373-375
    • /
    • 2001
  • 음성 기술의 발달과 VoiceXML 1.0의 제정으로 인해 표준화된 방식으로 이동 단말기와 전화를 통해 음성으로 웹 컨텐츠에 접근할 수 있게 되였다. 거의 모든 웹 컨텐츠들은 HTML로 작성되어 있으며, 기존의 HTML로 작성된 수많은 웹 컨텐츠에 음성으로 접근하기 위해서는 HTML 문서들을 VoiceXML 문서로 변환하여야 한다. 이를 수동으로 변환하기 위해서는 많은 시간과 비용이 필요하게 된다. 본 논문에서는 이 문제를 해결하기 위해여 HTML 문서률 VoiceXML 문서로 자동 변환하는 HTMLtoVoiceXML변환기의 설계 방안을 제시하였다.

  • PDF

An Automated Transformation of XML Documents (XML 문서의 자동변환)

  • 이준승;신동훈;이경호
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.822-826
    • /
    • 2004
  • XML 문서가 인터넷을 비롯한 다양한 분야에서 정보 교환을 위한 표준으로 널리 사용되면서 XML 문서의 변환에 대한 필요성이 증가하고 있단 본 논문에서는 XML 문서의 자동 변환 방법을 제안한다. 제안된 방법은 스키마 매칭과 XSLT 스크립트 생성의 두 단계로 구성된다. 특히, 제안된 방법은 정교한 수준의 스키마 매칭을 위해서 동의어 사전, 축약어 사전, 도메인 온톨로지 등의 부가정보를 활용한다. 또한 기존 연구와 비교하여 보다 빠른 변환 속도를 지원하는 XSLT 스크립트를 생성한다.

  • PDF