• Title/Summary/Keyword: Semantic Translation

검색결과 107건 처리시간 0.028초

Hindi Correspondence of Bengali Nominal Suffixes

  • Chatterji, Sanjay
    • Journal of Multimedia Information System
    • /
    • 제8권4호
    • /
    • pp.221-232
    • /
    • 2021
  • One bottleneck of Bengali to Hindi transfer based machine translation system is the translation of suffixes of noun. The appropriate translation of a nominal suffix often depends on the semantic role of the corresponding noun chunk in the sentence. With the availability of a high performance Bengali morphological analyzer and a basic Bengali parser it is possible to identify the role of each noun chunk. This information may be used for building rules for translating the ambiguous nominal suffixes. As there are some similarities between the uses of Bengali and Hindi nominal suffixes we find that the rules may be identified by linguistically analyzing corpus data. In this paper, we identify rules for the ambiguous four Bengali nominal suffixes from corpus data and evaluate their performances. This set of rules is able to resolve a majority of the nominal suffix ambiguities in Bengali to Hindi transfer based machine translation system. Using the rules, we are able to translate 98.17% Bengali nouns correctly which is much better than the baseline ILMT system's accuracy of 62.8%.

Representing Topic-Comment Structures in Chinese

  • Pan, Haihua;Hu, Jianhua
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.382-390
    • /
    • 2002
  • Shi (2000) claims that topics must be related to a syntactic position in the comment, thus denying the existence of dangling topics in Chinese. Under Shi's analysis, the dangling topic sentences in Chinese are not topic-comment but subject-predicate sentences. However, Shi's arguments are not without problems. In this paper we argue that topics in Chinese can be licensed not only by a syntactic gap but also by a semantic gap/variable without syntactic realization. Under our analysis, all the dangling topics discussed in Shi (2000) are, in fact, not subjects but topics licensed by a semantic gap/variable that can turn the relevant comment into an open predicate, thus licensing dangling topics and deriving well-formed topic-comment constructions. Our analysis fares better than Shi's in not only unifying the licensing mechanism of a topic to an open predicate without considering how the open predicate is derived, but also unifying the treatment of normal and dangling topics in Chinese,

  • PDF

표현 패턴에 의한 한국어-영어 기계 번역을 위한 개념 구성 (A Conceptual Framework for Korean-English Machine Translation using Expression Patterns)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.236-241
    • /
    • 2008
  • 본 논문은 표현 패턴(expression patterns)을 이용한 한국어-영어 기계 번역 방법에 대하여 논의한다. 표현 패턴은 한국어-영어 기계 번역을 위하여 의미적이고 표현적인 관점에서 한국어 표현에 적합한 영어 표현을 대응하여 정의하였다. 그리고 새로운 한국어 파싱 방법을 개발할 것을 제안하였다. 한국어 파싱 방법은 한국어의 교착어로서의 특징, 표현 패턴 개념, 문장 분할 개념, 그리고 파싱 과정에 의미 구조를 포함하는 개념 등을 포함하여 개발할 것을 주장하였다. 논문의 마지막 부분에는 간단한 한국어 문법을 정의하여 새로운 한국어 구문 분석 방법의 가능성을 제시하였다.

  • PDF

안전성이 요구되는 응용분야에 사용하는 프로그램 가능한 전자시스템 (A Programmable Electronic Systems Dedicated to Safety Related Applications)

  • 정순기
    • 한국정보처리학회논문지
    • /
    • 제1권4호
    • /
    • pp.438-451
    • /
    • 1994
  • 프로그램 가능한 논리제어기(PLC : Programmable Logic Controller)의 활용을 위 한 낮은 복잡성과 결함탐색 기능을 갖는 컴퓨터 구조를 설계하였다. PLC의 반복적인 운영모드와 명세단계, 응용분야에 따라 표준화한 소프트웨어 기능모듈들의 상호연결 을 기본으로 하는 그래픽 프로그래밍 패러다임(paradigm)이 구조적으로 지원된다. 그러므로 설계과정에서 프로그래밍 단계와 가장 단순하면서도 엄격한 Diverse Back Translation 방법에 의해 응용소프트웨어의 안전성 인증을 가능케하는 컴퓨터 실행 (machine execution) 단계 사이의 의미상 격차(semantic gap)가 제거된다.

  • PDF

Resolving Multi-Translatable Verbs Japanese-TO-Korean Machine Translation

  • Kim Jung-In;Lee Kang-Hyuk
    • 한국멀티미디어학회논문지
    • /
    • 제8권6호
    • /
    • pp.790-797
    • /
    • 2005
  • It is well-known that there are many similarities between Japanese and Korean language. For example, the order of words and the nature of the grammatical conjugation of both languages are almost the same. Another similarity is the frequent omission of the subject from a sentence. Moreover, both languages have honorific expressions and the identical concept for expressing nouns in terms of Chinese characters. Using these similarities, we have developed a word-to-word translation system which does away with any deep level analysis of syntactic and semantic structures of the two languages. If we use these similarities, the direct translation method is superior to the internal language translation method or transfer-based translation method. Although the MT system based on the direct translation method is more easily developed than the ones based on other methods, it may have a lot of difficulties when it tries to select the appropriate target word from ambiguous source verbs. In this paper, we propose a new algorithm to extract the meaning of substantives and to make use of the order of the extracted meaning. We could select $86.5\%$ appropriate verbs in the sample sentences from IPAL-verb-dictionary. $13.5\%$ indicates the cases in which we could not distinguish the meaning of substantives. We are convinced, however, that the succeeding rate can be increased by getting rid of the meaning of verbs thatare not used so often.

  • PDF

클래스 기반의 의미수행코드 명세를 이용한 시각언어 컴파일러 자동 생성 (Automatic Compiler Generator for Visual Languages using Semantic Actions based on Classes)

  • 김경아
    • 한국멀티미디어학회논문지
    • /
    • 제6권6호
    • /
    • pp.1088-1099
    • /
    • 2003
  • 의미 수행 코드를 이용한 문법-지시적 변환 방법은 컴파일러 설계자가 원시 언어의 구문 구조에 따라 직접 컴파일러의 후단부를 표현할 수 있는 효과적인 방법으로 텍스트 프로그래밍 언어에서는 컴파일러 구축 방법으로 널리 사용되고 있다. 그럼에도 불구하고 시각언어의 경우에는 통합된 파스 트리 노드 표현 방법의 부족과 구문 구조의 모델링 방법의 결여로 인하여, 의미 수행 코드를 이용한 문법 지시적 변환 방법에 기반을 둔 컴파일러 구축에 어려움이 있다. 본 연구에서 는 Pictorial Class Grammar의 시각언어 구문 정의를 캡슐화 하는 방법과 And-Or-Waiting Graph를 이용한 구문 분석 방법을 기반으로 하여, 구문 요소를 하나의 클래스형태로 구성함으로써, 구문 요소의 표현에 사용되는 의미와 구문의 미 (syntax-semantics)를 분리 할 수 있는 방법을 제시한다. 이 방법에 기초하여 기존 연구들의 문법-지시적 시각언어 컴파일러 구축의 문제점을 극복하고, 구문 명세와 분리된 의미 수행 코드 명세 방법을 제시하여, 유지보수성을 보다 향상시킨 문법-지시적 변환 방법을 이용한 시각언어 컴파일러 자동 생성 방법을 제공한다.

  • PDF

다중언어 RDD 레지스트리의 설계 및 구현 (A Design and Implementation of the Multilingual RDD Registry)

  • 정상원;오원근;윤기송
    • 방송공학회논문지
    • /
    • 제8권4호
    • /
    • pp.381-391
    • /
    • 2003
  • This paper deals nth the Multilingual Registry for the Rights Data Dictionary (RDD), which will be used for the semantic representation of rights on digital contents in MPEG-21 framework. The translation of RDD terms owing to different language populations often lacks the desirable precision. The purpose of this paper Is to demonstrate the Multilingual RDD Registry concept to achieve a more precise and interoperable translation of RDD terms among different DRM systems.

An Analysis of Semantic Errors in Machine-Translated English Compositions by Korean EFL College Students

  • Baek, Ji-Yeon
    • International Journal of Advanced Culture Technology
    • /
    • 제10권3호
    • /
    • pp.71-76
    • /
    • 2022
  • The purpose of this research is to investigate the types of semantic errors made by MT in translating EFL college students' original drafts written in Korean into English. Specifically, this study attempts to find out 1) what types of semantic errors are most frequently committed by MT? and 2) how students feel about the quality of the MT-produced output? The findings from this study indicated that MT produced the errors related to accuracy (47%) the most, followed by the errors related to fluency and ambiguity (14.6% respectively). Students were well aware of the errors with accuracy and fluency but had limited ability to check the errors with ambiguity. Based on the findings, this study suggests pedagogical implications which can be implemented in L2 writing classrooms.

SemFilter: 단순하며 효율적인 시맨틱 XML 메시지 필터링 (SemFilter: A Simple and Efficient Semantic XML Message Filtering)

  • 김재훈;박석
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.680-693
    • /
    • 2008
  • XML 메시지 필터링에 관한 최근의 연구들은 모든 출판되는 데이타 소스들이 필터링 시스템에 정의된 유일한 전역 스키마를 따르는 것을 가정한다. 하지만 이러한 가정을 넘어서, 데이타 제공자들이 그들 자신의 스키마를 자유롭게 사용할 수 있는 서비스를 고려할 수 있다. 즉, 데이타 소스들이 이질적인 환경이다. 하지만 XML 필터링 시스템에서 데이타 소스는 다수이며, 또한 출판되는 데이타들은 수시로 생성되고, 갱신되며, 사라진다. 즉, 매우 다이내믹한 환경이다. 본 논문에서는 그러한 다이내믹한 환경을 고려하여 고안된 단순하며 효율적인 의미적 XPath 질의 번역 구현을 소개한다. 특별히 제안되는 질의 번역 기법은 어떤 비주얼한 데이타 가이드가 제공되지 않는 환경에서 사용자가 자신의 지식과 경험에만 의존하여 작성한 질의를 번역하는 것에 초점을 맞춘다. 이러한 환경에서, 사용자는 다수의 이질적인 데이타를 질의하기 때문에, 사용자의 기억상의 스키마에 의존하여 작성된 질의는 실제 스키마와 불일치할 수 있다. 본 연구에서는 제안하는 의미적 XPath 질의 기법이 이러한 문제를 고려하도록 설계한다. 몇 가지 실험 결과는 제안된 질의 번역 기법이 수용할 만한 질의 번역시간을 제공하며, 기존의 방법과 비교하여 실제적임을 보여 준다.

한영 기계번역에서 결정 트리 학습에 의한 한국어 부사격 조사의 의미 중의성 해소 (Decision Tree based Disambiguation of Semantic Roles for Korean Adverbial Postpositions in Korean-English Machine Translation)

  • 박성배;장병탁;김영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.668-677
    • /
    • 2000
  • 한국어는 격조사에 의해 구문 역할이 결정되고 하나의 조사가 여러 개의 의미를 가지는 특징이 있다. 특히, 부사격 조사는 그 의미의 다양성으로 인해서 한영 기계 번역에서의 조사 번역을 어렵게 만든다. 본 논문에서는 부사격 조사가 가질 수 있는 의미격을 24개의 클래스로 분류한 후, 50만 어절 크기의 말뭉치에서 추출한 학습 예제와 결정 트리 추론(decision tree induction)을 통해 부사격 조사의 의미격 결정 규칙을 학습하였다. 결정 트리 추론 시 나타날 수 있는 학습 예제의 부족 문제는 단어 클래스를 사용함으로써 해결하였다. 실험 결과, 6개의 부사격 조사에 대해서 평균적으로 76.2%의 정확도를 보였으며, 이는 가장 많이 나타나는 의미격을 부사격 조사의 의미격으로 결정하는 방법에 비해 26.0%의 정확도 향상을 의미한다.

  • PDF