• 제목/요약/키워드: semantic translation

검색결과 107건 처리시간 0.031초

영한 번역 시스템에 관한 연구 (A Study on English-Korean Translation System)

  • 김영섬;김한우;최병욱
    • 대한전자공학회논문지
    • /
    • 제23권6호
    • /
    • pp.908-915
    • /
    • 1986
  • In this paper, an English-Korean machine translation system which consists of a syntax analyzer, a semartic analyzer and a sentence generatodr is proposed. The intermediate language in the syntax analysis is described by a lambda categorial grammar that is based on Montague Grammar, and the augmented context free grammar is introduced in the description of object language. Much difficulty in constructing general rules and semantic representations of an object language in the parser can be avoided by using the knowledge from the user interface utility that can modify the contents of dictionary and grammar rules.

  • PDF

영한 기계번역의 자연어 생성 연구 (A Study on the Natural Language Generation by Machine Translation)

  • 홍성룡
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권1호
    • /
    • pp.89-94
    • /
    • 2005
  • 기계번역에서 자연어 생성의 목적은 입력언어의 어구 분석을 이용하여 그 문장의 의미를 변환해주는 목적 언어를 생성하는 것이다. 그것은 언어적 구조 낱말 전사. 대화체 언어, 어휘적 정보 등을 포함해야 한다. 본 연구에서는 대화체 자동 기계번역 시스템 구현계획의 일부인 음성, 음운 분야에서 담당하게 될 음성인식과 음성합성 알고리듬을 확립하기 위한 한국어 특질에 대한 기초조사를 하고자 한다. 또한 기계번역의 단계를 분석하여 형태소 분석 단계와 구문 분석 단계, 의미 분석 단계로 구분한다. 형태소 분석은 입력 문장을 받아 분리된 형태소를 사전 내에서 검색하여·품사 정보를 얻고 이웃하는 단어와의 접속 관계가 문법적으로 올바르게 되었는지를 점검한다. 본 연구의 결과가 대화체 기계번역 시스템 구현계획의 종합적 입장에서는 단순한 기초조사일 수 있지만, 한국어의 교육 및 기계번역 이해의 측면에서는 그 자체로 가치를 지닌다고 할 수 있겠다. 따라서 교육적 측면에서의 직접적 활용을 여러 측면에서 고려할 수 있을 것이다.

  • PDF

의미 분석을 위한 말뭉치 기반의 온톨로지 학습 (Corpus-Based Ontology Learning for Semantic Analysis)

  • 강신재
    • 한국산업정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.17-23
    • /
    • 2004
  • 본 논문은 한국어정보처리에서 단어의 의미를 결정하기 위한 말뭉치 기반의 온톨로지 학습 방법을 제시하고 있다. 먼저 이미 확보된 전자사전의 정보를 이용하여 단어의 확실한 의미를 우선 결정한 후, 아직 결정하지 못한 단어의 의미는 온톨로지를 이용하여 최종 결정하는 절차를 거친다. 온톨로지를 단어 의미 중의성 해소를 위한 지식베이스로 사용하기 위해서는, 온톨로지 내 개념들간의 상호정보가 말뭉치의 통계 정보에 근거하여 미리 계산된다. 계산된 상호정보 값을 가중치로 간주하면 온톨로지는 가중치 그래프로 생각할 수 있으므로, 개념간 최소 경로를 통하여 개념간 연관도를 알아 볼 수 있다. 실제 기계번역 시스템에서 본 방법은 온톨로지를 사용하지 않은 방법보다 9%의 성능 향상을 가져오는 결과를 얻을 수 있었다.

  • PDF

잠재의미구조 기반 단어 유사도에 의한 역어 선택 (Target Word Selection using Word Similarity based on Latent Semantic Structure in English-Korean Machine Translation)

  • 장정호;김유섭;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.502-504
    • /
    • 2002
  • 본 논문에서는 대량의 말뭉치에서 추출된 잠재의미에 기반하여 단어간 유사도를 측정하고 이를 영한 기계 번역에서의 역어선택에 적용한다. 잠재의미 추출을 위해서는 latent semantic analysis(LSA)와 probabilistic LSA(PLSA)를 이용한다. 주어진 단어의 역어 선택시 기본적으로 연어(collocation) 사전을 검색하고, 미등록 단어의 경우 등재된 단어 중 해당 단어와 유사도가 높은 항목의 정보를 활용하며 이 때 $textsc{k}$-최근접 이웃 방법이 이용된다. 단어들간의 유사도 계산은 잠재의미 공간상에서 이루어진다. 실험에서, 연어사전만 이용하였을 경우보다 최고 15%의 성능 향상을 보였으며, PLSA에 기반한 방법이 LSA에 의한 방법보다 역어선택 성능 면에서 약간 더 우수하였다.

  • PDF

CAD 데이터 모델들간의 의미거리 계산을 통한 파라메트릭 번역기의 체계적 개발 (Systematic Development of Parametric Translators by Measuring Semantic Distance between CAD Data Models)

  • 김준환;문두환
    • 한국CDE학회논문집
    • /
    • 제14권3호
    • /
    • pp.159-167
    • /
    • 2009
  • For the robust exchange of parametric CAD model data, it is very important to perform mapping rightly and accurately between different CAD models. However, data model mapping is usually performed on a case-by-case basis. This results in the problem that mapping quality fluctuates very widely depending on the abilities of developers. In order to solve this problem, the concept of symantic distance is adapted and applied to the translation of parametric CAD model data in order to measure the difference between different CAD models quantitatively in a computer-interpretable form and systematize the mapping process.

단순 RDF 메시지의 온톨로지 상호 운용성을 위한 변환 규칙들의 연쇄 조합 (Cascade Composition of Translation Rules for the Ontology Interoperability of Simple RDF Message)

  • 김재훈;박석
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.528-545
    • /
    • 2007
  • 최근 모바일과 유비쿼터스 컴퓨팅에서 보다 지능적인 다양한 서비스를 제공하고자 하는 비즈니스 전략과 함께 온톨로지 기술이 큰 관심이 되고 있다. 온톨로지를 이용하는 응용 도메인에서의 본질적 문제점은 모든 영역 구성원, 에이전트, 응용 프로그램이 온톨로지에서 정의된 동일 개념을 공유해야 하는 것이다. 하지만, 다양한 제조업자에 의해서 만들어지는 다양한 모바일 디바이스, 센싱 디바이스, 네트워크 구성요소, 다양한 통신 사업자, 다양한 서비스 제공업자 들이 모여 이루어지는 모바일과 유비쿼터스 컴퓨팅 환경에서는 서로 상이한 온톨로지가 공존할 가능성이 높다. 이러한 의미적 상호 운용성의 문제를 해결하고자 했던 다수의 연구가 있다. 이를 크게 분류하면, 맵핑, 합병, 변환에 의한 방법들이다. 본 연구에서는 이러한 방법들 중 OntoMorph와 같이 상이한 온톨로지 데이타들 간에 변환 규칙을 직접 작성하여 사용하는 방법에 초점을 맞춘다. 하지만 이러한 변환 규칙을 수작업으로 직접 작성하는 방법은, 그 자체도 어려울뿐더러 N개의 온톨로지가 존재할 경우 최악의 경우 $O(N^2)$의 변환 규칙 작성 복잡도를 갖는다. 따라서 본 논문에서는 이러한 복잡도를 개선하기 위한, 웹의 개방성에 근거한 연쇄 조합 변환 규칙 생성의 개념을 소개한다. 연구 성과는 변환 규칙의 변환의 신속성, 변환의 적합성, 변환 규칙 작성의 용이성 등의 중요한 평가 요소를 도출할 수 있었으며, 몇 가지 실험 및 기존 연구와의 비교 분석을 통하여 제안된 방법이 신속성과 정확성을 보장하면서 보다 높은 용이성을 가짐을 확인할 수 있었다.

대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축 (Rule Construction for Determination of Thematic Roles by Using Large Corpora and Computational Dictionaries)

  • 강신재;박정혜
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.219-228
    • /
    • 2003
  • 본 논문은 한국어정보처리 과정에서 구문 관계를 의미역으로 사상시키기 위한 규칙을 효과적으로 구축하는 방법을 제시하고 있다. 의미역의 결정은 의미 분석의 핵심 작업 중 하나이며 자연어처리에서 해결해야 하는 매우 중요한 문제 중 하나이다. 일반적인 언어학 지식과 경험만 가지고 의미역 결정 규칙을 기술하는 것은 작업자의 주관에 따라 결과가 많이 달라질 수 있으며, 또 모든 경우를 다룰 수 있는 규칙의 구축은 불가능하다. 하지만 본 논문에서 제시하는 방법은 대량의 원시 말뭉치를 분석하여 실제 언어의 다양한 사용례를 반영하며, 또 수십 명의 한국어 학자들이 심도 있게 구축하고 있는 세종전자사전의 격틀 정보도 함께 고려하기 때문에 보다 객관적이고 효율적인 방법이라 할 수 있다. 의미역을 보다 정확하게 결정하기 위해 구문관계, 의미부류, 형태소 정보, 이중주어의 위치정보 등의 자질 정보를 사용하였으며, 특히 의미부류의 사용으로 인해 규칙의 적용률이 향상되는 효과를 가져올 수 있었다.

이중언어의 어휘접근과 범주 특수적 의미체계 (Lexical Access in the Bilinguals and the Category-specific Semantic System)

  • 이승복;정효선;조성우
    • 인지과학
    • /
    • 제21권4호
    • /
    • pp.505-534
    • /
    • 2010
  • 한국어-영어 후기 이중언어자에서 두 언어에 따른 의미체계에 대한 어휘접근 방식을 비교해보고자, 단어-그림 일치판단과제를 실시하였다. 자연물과 인공물에 속하는 두 가지 범주에 속하는 기본수준 범주의 단어 제시 후, 해당 그림을 제시하여 일치하는지 판단하도록 하였다. 단어-그림의 제시간격(SOA)을 실험 1에서는 650ms로 하였고, 실험 2에서는 200ms로 설정하여 과제수행에서의 번역효과를 통제하였다. 실험 1, 2 모두에서 한국어가 제시되었을 때가 영어로 제시되었을 때 보다 반응시간이 빨랐다. 또한 두 언어에 따라 반응시간 양상에 차이가 났는데, L1(한국어)에서는 자연물에서, L2(영어)에서는 인공물에서 하위범주 간 차이를 보였다. 이러한 차이를 공유된 의미체계에 대한 어휘접근 방식의 차이로 논의하였다.

  • PDF

An Artificial Intelligence Approach for Word Semantic Similarity Measure of Hindi Language

  • Younas, Farah;Nadir, Jumana;Usman, Muhammad;Khan, Muhammad Attique;Khan, Sajid Ali;Kadry, Seifedine;Nam, Yunyoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.2049-2068
    • /
    • 2021
  • AI combined with NLP techniques has promoted the use of Virtual Assistants and have made people rely on them for many diverse uses. Conversational Agents are the most promising technique that assists computer users through their operation. An important challenge in developing Conversational Agents globally is transferring the groundbreaking expertise obtained in English to other languages. AI is making it possible to transfer this learning. There is a dire need to develop systems that understand secular languages. One such difficult language is Hindi, which is the fourth most spoken language in the world. Semantic similarity is an important part of Natural Language Processing, which involves applications such as ontology learning and information extraction, for developing conversational agents. Most of the research is concentrated on English and other European languages. This paper presents a Corpus-based word semantic similarity measure for Hindi. An experiment involving the translation of the English benchmark dataset to Hindi is performed, investigating the incorporation of the corpus, with human and machine similarity ratings. A significant correlation to the human intuition and the algorithm ratings has been calculated for analyzing the accuracy of the proposed similarity measures. The method can be adapted in various applications of word semantic similarity or module for any other language.

작용식 2.0 기반 파이썬에 대한 형식 의미론 (Formal Semantics Based on Action Equation 2.0 for Python)

  • 한정란
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권6호
    • /
    • pp.163-172
    • /
    • 2021
  • 프로그래밍 언어의 형식적인 의미를 적절하게 표현하면 언어를 표준화하고 최적화하여 번역하는 과정에서 중요한 역할을 수행한다. 파이썬은 주목받는 강력한 언어이고, 파이썬에 대한 형식적인 의미 구조를 정의하고 표현하는 것은 향후 유사한 언어를 설계할 때 참고할 수 있고 표준화하는 과정이나 최적화된 번역기를 구현하는 과정에서도 필요하다. 본 연구에서는 파이썬에 대한 의미 구조를 표현하기 위해 기존의 작용식을 수정하고 업그레이드해서 파이썬의 정적이고 동적인 의미 구조를 표현하는 작용식 2.0을 새롭게 제시한다. 작용식 2.0에 명세된 의미구조를 자바로 구현해 파이썬 프로그램들에 대한 실행시간을 측정하고 시뮬레이션을 통해 작용식 2.0이 구현 가능한 실제적인 의미 구조임을 입증하고, 판독성(Readability), 모듈성(Modularity), 확장성(Extensibility), 융통성(Flexibility)의 네 영역에서 명세된 작용식 2.0을 기존의 대표적인 의미 표현법과 비교하여 본 작용식 2.0의 우월성을 확인하고자 한다.