• 제목/요약/키워드: automatic machine translation

검색결과 38건 처리시간 0.028초

PC를 이용한 일$\cdot$한 번역 시스템 ATOM의 개발에 관한 연구 ( I ) - 구문해석과 생성과 사전 구성과 형태소 해석을 중심으로 - (Development of Japanese to Korean Machine Translation System ATOM Using Personal Computer I - Dictionary Construction and Morphological Analysis -)

  • 김영섬;김한우;최병욱
    • 대한전자공학회논문지
    • /
    • 제25권10호
    • /
    • pp.1183-1192
    • /
    • 1988
  • 정확한 형태소 해석과정의 구현을 위해 heuristic 정보를 부가한 형태소 사전과 접속정보 테이블을 구성하고 문절수최소법을 근간으로 하여 자동 띄어쓰기 과정을 구현한다. 또한 독립적인 활용어 테이블을 구성하고, 접속정보 테이블과 상호 연계시켜 적용합으로 해서 접속정보와 활용어 정보의 구성을 간단하게 하였으며, 시스템의 검증과 확장 효율을 제고하였다. 번역 사전은 해석 사전과 생성 사전으로 구성하며, 해석과정의 효율과 보다 자연스런 역어의 생성을 위해 통계적으로 추출한 고빈도의 종결구를 관용어로 기술하고, 사전상에 직접 프로시쥬어를 기술하여 시스템의 적응성을 증대시켰다.

  • PDF

The Parallel Corpus Approach to Building the Syntactic Tree Transfer Set in the English-to- Vietnamese Machine Translation

  • Dien Dinh;Ngan Thuy;Quang Xuan;Nam Chi
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2004년도 ICEIC The International Conference on Electronics Informations and Communications
    • /
    • pp.382-386
    • /
    • 2004
  • Recently, with the machine learning trend, most of the machine translation systems on over the world use two syntax tree sets of two relevant languages to learn syntactic tree transfer rules. However, for the English-Vietnamese language pair, this approach is impossible because until now we have not had a Vietnamese syntactic tree set which is correspondent to English one. Building of a very large correspondent Vietnamese syntactic tree set (thousands of trees) requires so much work and take the investment of specialists in linguistics. To take advantage from our available English-Vietnamese Corpus (EVC) which was tagged in word alignment, we choose the SITG (Stochastic Inversion Transduction Grammar) model to construct English- Vietnamese syntactic tree sets automatically. This model is used to parse two languages at the same time and then carry out the syntactic tree transfer. This English-Vietnamese bilingual syntactic tree set is the basic training data to carry out transferring automatically from English syntactic trees to Vietnamese ones by machine learning models. We tested the syntax analysis by comparing over 10,000 sentences in the amount of 500,000 sentences of our English-Vietnamese bilingual corpus and first stage got encouraging result $(analyzed\;about\;80\%)[5].$ We have made use the TBL algorithm (Transformation Based Learning) to carry out automatic transformations from English syntactic trees to Vietnamese ones based on that parallel syntactic tree transfer set[6].

  • PDF

LNG 탱크의 주름진 내벽박판용 자동용접시스템의 개발에 관한 연구 (A study on development of automatic welding system for corrugated membranes of the LNG tank)

  • 유제용;유원상;나석주;강계형;한용섭
    • Journal of Welding and Joining
    • /
    • 제14권1호
    • /
    • pp.99-106
    • /
    • 1996
  • Development of an automatic TIG welding system incorporating a vision sensor and torch control mechanism leads to an improved welding quality and greater production efficiency. The automatic welding system should be greatly restricted in its size and weight for the LNG(Liquefied Natural Gas) storage tank and also provide a unique torch rotating mechanism which keeps the torch tip in the constant position while the angle is changed continuously to maintain the welding torch substantially perpendicular to the weld line. The developed system is driven by two translation axes X, Z and one rotational axis. A moving line window method is adopted to the image recognition of the corrugated membranes with specular reflection. This method decides original laser stripe patterns in image which is affected by multi-reflection. A self-teaching algorithm, which guides the automatic welding machine with the information provided by the CCD camera without any previous learning of a reference trajectory, was developed for tracking the corrugated membrane of the LNG tank along the weld line.

  • PDF

Glossary에 기초한 시스템에서의 적형태 영어문장 생성을 위한 한영 대역에 전자사전구축 (Constructing A Korean-English Bilingual Dictionary For Well-formed English Sentence Generations In A Glossary-based System)

  • 신효필
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.1-13
    • /
    • 2003
  • 본 논문은 자연언어처리 (Natural Language Processing), 특히 한영 기계번역에서 필수적 인 한영 대역어 사전을 구축함에 있어 영어 생성시 정확한 문장형태를 도출하기 위한 방법에 대해 논의한다. 기간의 연구는 주로 한국어와 영어의 의미적 모호성이 해결된 정확한 번역을 위한 대역어 내지 변환사전 구조에 초점이 맞추어져 왔고 상대적으로 형태적 또는 구문적으로 정확한 영어문장을 생성하는 것은 간과되어져 왔다. 기존 자원의 황용이라는 측면에서는 텍스트화된 한영사전을 그대로 이용한다고 하면 그 기술방식과 영어표현은 다양한 형태로 나타나기 때문에 정확한 의미의 대역어 뿐만 아니라 적격한 영어문장의 생성을 위해서는 어떠한 정보들이 대역어 사전에 기술되어야 하는지 고려해 볼 필요가 있다 따라서 본 논의에서는 기존의 인쇄된 한영사전을 구조분석하여 자동으로 변환하여 최소한의 인간의 간섭으로 정확한 영어생성에 필요한 형태적 정보를 자질로 부여하는 방법을 기술한다. 기본적으로 이 방법은 단어 대 단어 번역시스템 둥 glossary에 기초한 얕은 층위의 번역이 필요한 시스템을 위한 사전을 구축에서 시작하며 더 나아가 대규모의 전자사전 구축작업에서 어떻게 응용될 수 있는지 논의한다.

  • PDF

지동통역에서의 대화체 기계번역을 위한 문맥의 구축과 이용 (Contet Construction and Tt's Using for Dialogue Machine Translation in Automatic Interpreting Telephony)

  • 이재원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.80-85
    • /
    • 1994
  • 자동통역에서의 대화체 기계번역은 일반적인 문어체 문장 번여고가는 다른 몇가지 특징을 고려하여야 한다. 첫째, 자동통역에서의 기계번역은 음성인식의 결과를 번역하는 부분으로, 하나의 문장이 아닌 다중 입력을 받아 이 중 가장 올바른 문장을 번역하여야 한다. 둘째, 대화체 문장에서는 일반적으로 생략을 포함하는 단편적인 발화나 대용어의 사용빈도가 많다. 그러나, 이러한 현상은 언어마다 다소 다르게 사용되기 때문에 이들에 대한 올바른 해석을 한 후 번역하는 것이 필요하다. 대화체 기계번역이 이러한 문제점들을 해결하기 위해서는 문맥정보를 필요로 한다. 대화는 상호간 밀접한 관련성을 가지고 진행되기 때문이다. 이에 본 논문에서는 담화분석을 통해 올바르게 구축하고, 이 정보를 이용하여 앞에서 언급한 문제점들을 해결하기 위한 방법론에 대해 논하고자 한다.

  • PDF

한국어에서 실용적 언어분석 단위의 인식과 평가 (Recognition and Evaluation of Efficient Language Analysis Unit for Korean)

  • 박인철
    • 한국컴퓨터산업학회논문지
    • /
    • 제5권1호
    • /
    • pp.65-76
    • /
    • 2004
  • 본 논문에서는 인터넷에서 대부분 정보의 표현 형태인 언어의 자동화된 분석을 위한 접근 방법으로 언어학적 접근과 전산학적 처리의 관점을 살펴본다. 또한, 대용량의 자료에 대한 실용적인 정보 색인과 검색, 정보추출, 기계번역 등을 위해 형태소분석, 구문분석 및 의미분석의 각 단계에서 실용적인 분석의 단위를 살펴보고, 언어학에 기반한 형태론적 단위보다 구문적 최장 분석 단위를 제안한다. 그리고 대량의 문서에 대한 실험을 통해, 제안하는 언어분석의 단위가 언어처리 과정에서 발생하는 모호성을 축소하는 제약으로도 사용될 수 있음을 보인다.

  • PDF

Data Avaliability Scheduling for Synthesis Beyond Basic Block Scope

  • Kim, Jongsoo
    • Journal of Electrical Engineering and information Science
    • /
    • 제3권1호
    • /
    • pp.1-7
    • /
    • 1998
  • High-Level synthesis of digital circuits calls for automatic translation of a behavioral description to a structural design entity represented in terms of components and connection. One of the critical steps in high-level synthesis is to determine a particular scheduling algorithm that will assign behavioral operations to control states. A new scheduling algorithm called Data Availability Scheduling (DAS) for high-level synthesis is presented. It can determine an appropriate scheduling algorithm and minimize the number of states required using data availability and dependency conditions extracted from the behavioral code, taking into account of states required using data availability and dependency conditions extracted from the behavioral code, taking into account resource constraint in each control state. The DAS algorithm is efficient because data availability conditions, and conditional and wait statements break the behavioral code into manageable pieces which are analyzed independently. The output is the number of states in a finite state machine and shows better results than those of previous algorithms.

  • PDF

Seq2SPARQL: 신경망 기계 번역을 사용한 지식 베이스 질의 언어 자동 생성 (Seq2SPARQL: Automatic Generation of Knowledge base Query Language using Neural Machine Translation)

  • 홍동균;심홍매;김광민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.898-900
    • /
    • 2019
  • SPARQL(SPARQL Protocol and RDF Query Language)은 지식 베이스를 위한 표준 시맨틱 질의 언어이다. 최근 인공지능 분야에서 지식 베이스는 질의 응답 시스템, 시맨틱 검색 등 그 활용성이 커지고 있다. 그러나 SPARQL 과 같은 질의 언어를 사용하기 위해서는 질의 언어의 문법을 이해하기 때문에, 일반 사용자의 경우에는 그 활용성이 제한될 수밖에 없다. 이에 본 논문은 신경망 기반 기계 번역 기술을 활용하여 자연어 질의로부터 SPARQL 을 생성하는 방법을 제안한다. 우리는 제안하는 방법을 대규모 공개 지식 베이스인 Wikidata 를 사용해 검증하였다. 우리는 실험에서 사용할 Wikidata 에 존재하는 영화 지식을 묻는 자연어 질의-SPARQL 질의 쌍 20,000 건을 생성하였고, 여러 sequence-to-sequence 모델을 비교한 실험에서 합성곱 신경망 기반의 모델이 BLEU 96.8%의 가장 좋은 결과를 얻음을 보였다.

인공지능의 역사, 분류 그리고 발전 방향에 관한 연구 (A Study on the History, Classification and Development Direction of Artificial Intelligence)

  • 조민호
    • 한국전자통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.307-312
    • /
    • 2021
  • 인공지능은 오랜 역사가 있으며, 이미지 인식이나 자동번역 분야를 포함한 여러 분야에서 활용되고 있다. 그래서 처음 인공지능을 접하는 경우에 많은 용어와 개념, 기술 때문에 연구의 방향 설정이나 수행에 어려움을 겪는 경우가 많다. 이번 연구는 이러한 어려움을 겪는 연구자들에게 도움이 될 수 있도록 인공지능에 관련된 중요 개념을 정리하고, 지난 60년의 발전 과정을 요약한다. 이를 통하여 방대한 인공지능 기술 활용의 기초를 확립하고 올바른 연구의 방향성을 수립할 수 있다.

영한 기계번역을 위한 영어 복합명사 자동 수집 (Automatic Collection of English Composition Nouns for English-Korean Machine Translation)

  • 조재호;김성동
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.407-410
    • /
    • 2011
  • 영한 기계번역에서 복합명사는 어휘분석, 구문분석을 복잡하게 하고 사전에 의미가 등록되어 있지 않을 경우에는 올바르게 번역하기 어렵다. 또한 복합명사는 계속하여 새로 나타나고 있어, 정확하고 자연스러운 번역을 위해서는 복합명사를 독립적으로 처리하는 모듈이 필요하다. 본 논문에서는 복합명사를 구성하지 못하는 불용어를 파악하고 빈도수를 이용하여 복합명사를 자동으로 수집하는 방법을 제안한다. 문서를 번역하기 전에 복합명사를 파악하면, 복합명사에 대한 정보를 활용하여 어휘분석과 구문분석의 복잡도를 줄이고 복합명사를 포함한 문장을 보다 자연스럽게 번역할 수 있어 영한 기계번역 시스템의 성능 개선에 기여할 것이다.