• Title/Summary/Keyword: Document Translation

검색결과 62건 처리시간 0.032초

XML기반의 EDI 문서교환을 위한 미들웨어 설계 및 구현 (Design and Implementation of Middleware supporting translation of EDI using XML)

  • 최광미;박수영;정채영
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.845-852
    • /
    • 2002
  • EDI를 이용한 전자문서 처리는 별도의 전용 소프트웨어와 부가가치망을 이용해 문서를 교환하게 되는데, 전용 소프트웨어의 사용은 새로운 문서에 대한 변경이 필요하며, 부가가치망의 사용은 문서교환과 유지보수에 많은 비용이 소요된다. 이러한 문제점 때문에 VAN 기반의 기존 EDI가 웹기반의 EDI로 옮겨지고 있다. 본 논문에서는 JDBC 브리지를 이용하여 두개의 관계형 데이터베이스에 존재하는 EDI 메시지를 XML로 변환하는 기법을 제안한다. 변환된 XML 파일을 사용하여 스키마를 그대고 복구하는 동시에 정의된 테이블에 원래 레코드를 그대로 삽입하는 방범을 제시하였다. 이는 동일한 데이터베이스 관리시스템을 사용해야 한다는 전제조건을 필요로 했던 기존방식을 탈피했으며, 전자문서 교환시 환경에 따라 정상적으로 동작하지 않았던 경우의 문제점을 극복했다.

웹 기반하의 국어의 로마자 전사 표기 자동 변환 시스템 (Automatic translation system for hangul's romanization Based on the World Wide Web)

  • 김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.108-114
    • /
    • 2002
  • 국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 국어의 로마자 표기 자동변환이 가능하게 설계 및 구현하였다. 특히, 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 테이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 유니코드(Unicode)와 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(')등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.

  • PDF

웹 기반하의 국어의 로마자 표기 자동 변환 시스템 설계 (Design of automatic translation system for hangul's romanization Based on the World Wide Web)

  • 김홍섭
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권4호
    • /
    • pp.6-11
    • /
    • 2001
  • 국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 자동변환이 가능하게 설계하였다. 특히 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 레이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(´)등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.

  • PDF

XML 뷰 트리 기반의 XML 질의 처리 모델 (An XML Query Processing Model based on XML View Tree)

  • 정채영;김현주
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권5호
    • /
    • pp.19-27
    • /
    • 2006
  • 본 논문에서는 XML 뷰 트리 기반 랩퍼의 질의 처리 모델을 제시한다. 질의 처리과정은 뷰 합성, 지역 정보원에 대한 질의 변환, 그리고 결과 문서 생성으로 이루어지며, 이를 위해 XML 뷰와 XNL 질의어를 XML 뷰 트리로 표현하는 XML 뷰 트리 기반의 질의 처리 모델을 제시한다. XML 뷰 트리는 가상의 XML 문서의 구조를 그대로 반영하기 때문에 경로식의 탐색이 쉽고, XML 뷰에 대응되는 XML 스키마 생성과 질의 결과 문서 생성을 위한 템플릿으로 사용될 수 있다. 또한, XML 뷰와 XML 질의의 XML 뷰 트리를 통한 개념적 통일은 다단계 XML 뷰 정의와 합성을 쉽게 지원한다.

  • PDF

한국어-영어/일본어-영어 교차언어정보검색에서 클러스터 분석을 통한 성능 향상 (Performance Improvement by Cluster Analysis in Korean-English and Japanese-English Cross-Language Information Retrieval)

  • 이경순
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.233-240
    • /
    • 2004
  • 본 논문에서는 교차언어정보검색에서 점진적 클러스터링을 통해서 모호성을 묵시적으로 해소하는 방법을 제안한다. 연구 목적은 질의 번역에서 모호성이 크게 증가된 상태에서 문서 클러스터가 문서 문맥 역할과 모호성 해소 역할을 하는지를 보고자 하는 것이다. 제안하는 방법은 한국어/일본어 질의를 사전을 이용하여 영어로 번역을 하고, 번역된 영어 질의에 대해서 벡터공간검색모델이나 확률검색모델에 의해서 문서를 검색한다 검색된 문서의 순위대로 점진적 클러스터를 동적으로 생성하고, 이 클러스터 정보를 질의에 반영해서 문서의 순위를 다시 결정하는 것이다. TREC 테스트컬렉션을 이용한 실험에서 모호성 해소를 하지 않은 질의에 대해서, 제안한 방법은 한국어-영어 교차언어정보검색에서는 벡터공간검색모델에서 39.41%의 성능향상, 확률검색모델에서 36.79%의 성능향상을 보였다. 일-영 교차언어정보검색에서는 각각 17.59%와 30.46%의 성능향상을 보였다. 적합성 피드백 방법과의 비교에서는 모호성 해소를 하지 않은 경우 확률검색모델에서 12.30%의 성능향상을 보였다. 이를 통해, 클러스터 분석은 질의 모호성 해소에 도움을 주어서 검색성능 향상에 기여하였음을 알 수 있다.

Deep-Learning Approach for Text Detection Using Fully Convolutional Networks

  • Tung, Trieu Son;Lee, Gueesang
    • International Journal of Contents
    • /
    • 제14권1호
    • /
    • pp.1-6
    • /
    • 2018
  • Text, as one of the most influential inventions of humanity, has played an important role in human life since ancient times. The rich and precise information embodied in text is very useful in a wide range of vision-based applications such as the text data extracted from images that can provide information for automatic annotation, indexing, language translation, and the assistance systems for impaired persons. Therefore, natural-scene text detection with active research topics regarding computer vision and document analysis is very important. Previous methods have poor performances due to numerous false-positive and true-negative regions. In this paper, a fully-convolutional-network (FCN)-based method that uses supervised architecture is used to localize textual regions. The model was trained directly using images wherein pixel values were used as inputs and binary ground truth was used as label. The method was evaluated using ICDAR-2013 dataset and proved to be comparable to other feature-based methods. It could expedite research on text detection using deep-learning based approach in the future.

open-japanese-mesh: assigning MeSH UIDs to Japanese medical terms via open Japanese-English glossaries

  • Yamada, Ryota;Tatieisi, Yuka
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.22.1-22.3
    • /
    • 2020
  • The Medical Subject Headings (MeSH) thesaurus is a controlled vocabulary for indexing biomedical documents that is used for document retrieval and other natural language processing purposes. However, although the oariginal English MeSH is freely available, its Japanese translation has a restricted license. We attempted to create an open alternative, and for this purpose we made a script for assigning MeSH UIDs to Japanese medical terms using Japanese-English glossaries. From the MeSpEn glossary and MEDUTX dictionary, we generated a 12,457-word Japanese-MeSH dictionary.

ebXML Collabration Model of Single Window for Marine Transport

  • Lee, Young-Chan;Ahn, Kyeong-Rim
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제31권3호
    • /
    • pp.301-309
    • /
    • 2007
  • Netherlands had suggested a uniform system to standardize and simplify EDI systems relating to the Arrival/Departure, stay, and clearance of ships, persons, and cargoes for the Facilitation of International Maritime Transport to the International Maritime Organization(IMO). Republic of Korea proposed the Framework of XML-based Single Window System for the simplified clearance of ships to the 32nd session of Facilitation Committee of the IMO. Accordingly the authors studied that the XML Infrastructure for Single Window efficiently supports the Single Window service and the business collaboration between business entities of logistics. The proposed XML Infrastructure designs to support the various document format translation and to easily manage. Therefore business entity using the proposed system has the effect of downing the resource and costs on using Single Window.

e-카탈로그를 위한 .NET 기반의 XML-WML 문서 변환 시스템 (XML-WML Document Translation System for e-Catalog based on .NET)

  • 이주표;이만형;황대훈
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.974-979
    • /
    • 2003
  • 오늘날 인터넷 및 정보통신의 발달로 인하여 전자상거래가 활성화되고 있으며 기업들은 웹에서의 전자상거래를 위하여 e-카탈로그를 제작하여 사용하고 있다. e-카탈로그는 종이 카탈로그에 비하여 제작 비용이 적게 들고 발송 비용이 들지 않으며, 카탈로그를 필요로 하는 업체나 개인이 신속하게 카탈로그를 받아볼 수 있는 등 여러 가지 장점을 가지고 있다. e-카탈로기는 현재 웹 표준으로 자리잡아가고 있는 XML로 제작되고 있는 추세이다. 또한 최근에는 유선 인터넷 뿐만 아니라 무선 인터넷에 대한 요구 및 수요가 증가하면서 유선 인터넷에서 사용하던 문서를 무선 인터넷에서 사용하고자 하는 요구가 늘고 있다. 이에 본 논문에서는 .NET에 기반한 XML-WML 문서 변환 시스템을 제안함으로써 플랫폼이나 OS의 영향을 받지 않고 사용할 수 있으며, 다른 응용프로그램과의 유연성 있는 통합도 가능하도록 설계되었다.

  • PDF

기업간 정보 통신의 신기술 (New Techology of Intercompany Information Communication: Development of EDI System)

  • 최창원;김태윤
    • 경영과학
    • /
    • 제10권1호
    • /
    • pp.59-80
    • /
    • 1993
  • Electronic data interchange (EDI) is a new technology of information communication which can make offices paperless. This study develop an EDI system to communicate informations among companies using computer systems. The system consists of five modules-document I/O, translation, system management, communication, and additional modules. The database of EDI documentation standards has been constructed by the table-driven method. The communication module provides three communication modes-RS232C, MODEM, and message handling system (MHS). The system performance has been improved by the method of data compression and data encryption which prevent the communication delay and illegal users. This EDI system can be used as a front-end, back-end, or stand-alone mode.

  • PDF