• 제목/요약/키워드: Machine translation

검색결과 385건 처리시간 0.024초

규칙에 기반한 한국어 부분 구문분석기의 구현 (Implementing Korean Partial Parser based on Rules)

  • 이공주;김재훈
    • 정보처리학회논문지B
    • /
    • 제10B권4호
    • /
    • pp.389-396
    • /
    • 2003
  • 본 논문에서는 문법검사기나 기계번역과 같은 실제 응용 시스템을 위한 한국어 부분 구문분석의 처리 대상을 정의하고, 규칙에 기반한 한국어 부분 구문분석기의 구현에 대해서 논의한다. 부분 구문분석기는 기본적으로 여러 개의 형태소나 단어가 구문적으로 하나의 구조에 속한 경우 이를 하나의 덩어리로 묶어주는 역할을 수행하며, 동시에 부가적인 작업을 수행할 수 있다. 또한 부분 구문분석기는 다양한 형태로 표현된 부분 구조를 표준 형태소 구조로 바꾸어 줌으로써, 상위 모듈의 처리에서 그 결과를 용이하게 사용할 수 있도록 한다. 본 논문에서는 한국어 부분 구문분석을 위해서 수동으로 작성된 140여 개의 규칙을 이용하였으며, 각 규칙은 일반적인 규칙과 마찬가지로 조건부와 행위부로 구성되었다. 부분 구문분석의 효율성을 관찰하기 위해서 일반적인 구문분석과 부분 구문분석을 포함한 구문분석을 비교하였다. 실험을 통해서 전자가 후자에 비해 약 두 배의 레코드 수가 요구됨을 알 수 있었다.

머신비젼을 이용한 Cross Coil Movement 자동검사 시스템에 관한 연구 (A Study on Auto Inspection System of Cross Coil Movement Using Machine Vision)

  • 이철헌;설성욱;주재흠;이상찬;남기곤
    • 전자공학회논문지S
    • /
    • 제36S권11호
    • /
    • pp.79-88
    • /
    • 1999
  • 본 논문은 움직이는 물체가 존재하는 영상열에서 특정 물체만을 계속 추적하고자 하는 방법을 제안하였다. 밝기값과 동작(motion)경계점에 기반을 둔 윤곽선(contour) 추적 알고리즘을 이용하였다. 영상에서 움직이는 물체의 윤곽선의 동작은 이동, 회전, 크기변화를 나타내는 아핀 동작 모델에 의해 잘 묘사되어짐을 가정한다. 움직이는 물체의 윤곽선은 영상열을 따라 추정되는 B-스플라인에 의해 위치와 동작이 표현된다. 패턴인식을 이용하여 추적하고자하는 물체인지를 판별한다. 선형 칼만 필터를 사용하기 위해 아핀 동작 매개변수와 움직이는 물체의 윤곽선 모양(shape)의 두 필터로 추정과정을 나누었다. 차량계기판을 대상으로 한 실험영상에서 이 방법을 이용하여 방해물체가 존재하는 경우에도 안정된 동작의 추정과 추적된 궤적의 획득이 가능함을 보였다.

  • PDF

문장 내 영 조응어 해석을 위한 영대명사의 조응성 결정 (Anaphoricity Determination of Zero Pronouns for Intra-sentential Zero Anaphora Resolution)

  • 김계성;박성배;박세영;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.928-935
    • /
    • 2010
  • 문서에서 생략된 요소가 지시하는 대상을 식별해 내는 작업은 기계 번역, 정보추출 등과 같은 자연언어처리 분야의 다양한 응용들을 위해 필요하다. 문장에서 생략된 요소들은 영조응사, 영대명사 등으로 불리며, 지시(reference)의 한 유형으로 간주되고 있지만, 모든 영형이 문서에서 명확하게 언급된 지시 대상을 지시하지는 않는다. 이에 영형의 조응성을 결정하려는 연구가 최근 진행되고 있으며, 본 논문에서는 한국어에서 가장 빈번하게 나타나는 영형 주어(subject zero pronouns)의 문장 내 조응성 결정에 초점을 맞춘다. 주어진 영형과 선행사 후보들 간의 쌍대 비교(pairwise comparison)에 기반한 기존 연구와 달리, 본 논문은 비조응적 혹은 문장 간에서 해결 가능한 영형이 나타난 절의 구조를 직접 학습함으로써 영형의 문장 내 조응성을 결정한다. 실험에서 제안한 방법은 베이스라인보다 나은 성능을 보였으며, 영형의 조응성 결정은 향후 영형 조응어 해석에 긍정적인 영향을 줄 수 있을 것으로 기대된다.

대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축 (Rule Construction for Determination of Thematic Roles by Using Large Corpora and Computational Dictionaries)

  • 강신재;박정혜
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.219-228
    • /
    • 2003
  • 본 논문은 한국어정보처리 과정에서 구문 관계를 의미역으로 사상시키기 위한 규칙을 효과적으로 구축하는 방법을 제시하고 있다. 의미역의 결정은 의미 분석의 핵심 작업 중 하나이며 자연어처리에서 해결해야 하는 매우 중요한 문제 중 하나이다. 일반적인 언어학 지식과 경험만 가지고 의미역 결정 규칙을 기술하는 것은 작업자의 주관에 따라 결과가 많이 달라질 수 있으며, 또 모든 경우를 다룰 수 있는 규칙의 구축은 불가능하다. 하지만 본 논문에서 제시하는 방법은 대량의 원시 말뭉치를 분석하여 실제 언어의 다양한 사용례를 반영하며, 또 수십 명의 한국어 학자들이 심도 있게 구축하고 있는 세종전자사전의 격틀 정보도 함께 고려하기 때문에 보다 객관적이고 효율적인 방법이라 할 수 있다. 의미역을 보다 정확하게 결정하기 위해 구문관계, 의미부류, 형태소 정보, 이중주어의 위치정보 등의 자질 정보를 사용하였으며, 특히 의미부류의 사용으로 인해 규칙의 적용률이 향상되는 효과를 가져올 수 있었다.

한국어 제목 개체명 인식 및 사전 구축: 도서, 영화, 음악, TV프로그램 (Named Entity Recognition and Dictionary Construction for Korean Title: Books, Movies, Music and TV Programs)

  • 박용민;이재성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권7호
    • /
    • pp.285-292
    • /
    • 2014
  • 개체명 인식은 정보검색 시스템, 질의응답 시스템, 기계번역 시스템 등의 성능을 향상시키기 위하여 사용된다. 개체명 인식은 일반적으로 PLOs(인명, 지명, 기관명)을 대상으로 하며, 주로 미등록어와 고유명사로 이루어져 있기 때문에 고유명사나 미등록어는 중요한 개체명 후보로 쓰일 수 있다. 하지만 도서명, 영화명, 음악명, TV프로그램명과 같은 제목 개체명은 PLO와는 달리 단어부터 문장까지 매우 다양한 형태를 지니고 있어서 개체명 인식이 쉽지 않다. 본 논문에서는 뉴스 기사문을 이용하여 제목 개체명을 빠르게 인식하고 자동으로 사전을 구축하는 방법을 제안한다. 먼저 특수기호로 묶인 어절을 추출하고, 주변 문맥 단어 및 단어 거리를 이용하여 SVM으로 제목 후보들을 추출하였다. 이렇게 추출된 제목 후보들은 상호 정보량을 가중치로 SVM을 이용해 제목 유형을 분류하였다.

회절 격자 표식을 이용한 6자유도 측정 시스템의 광학적 오차 해석 및 보상 (Optical Error Analysis and Compensation of Six Degrees of Freedom Measurement System Using a Diffraction Grating Target)

  • 김종안;배의원;김수현;곽윤근
    • 한국정밀공학회지
    • /
    • 제18권2호
    • /
    • pp.152-160
    • /
    • 2001
  • Six degrees of freedom measurement systems are required in many fields: Precision machine control. precision assembly, vibration analysis, and so on. This paper presents a new six degrees of freedom measurement system utilizing typical features of a diffraction grating. It is composed of a laser source, three position sensitive detectors, a diffraction grating target, and several optical components. Six degrees of freedom displacement is calculated kinematically from the coordinates of diffracted rays on the detectors. Optical measurement error was caused by the fact that a laser source had a Gaussian intensity distribution. This error was analyzed and compensated using simple equations. The performance of the compensation equation was verified in the experiment. The experimental results showed that the compensation equation could reduce the optical measurement error remarkably and the error in six degrees of freedom measurement less than $\pm$10$\mu$m for translation and $\pm$0.012$^{\circ}$for rotation.

  • PDF

IOMMU Para-Virtualization for Efficient and Secure DMA in Virtual Machines

  • Tang, Hongwei;Li, Qiang;Feng, Shengzhong;Zhao, Xiaofang;Jin, Yan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권12호
    • /
    • pp.5375-5400
    • /
    • 2016
  • IOMMU is a hardware unit that is indispensable for DMA. Besides address translation and remapping, it also provides I/O virtual address space isolation among devices and memory access control on DMA transactions. However, currently commodity virtualization platforms lack of IOMMU virtualization, so that the virtual machines are vulnerable to DMA security threats. Previous works focus only on DMA security problem of directly assigned devices. Moreover, these solutions either introduce significant overhead or require modifications on the guest OS to optimize performance, and none can achieve high I/O efficiency and good compatibility with the guest OS simultaneously, which are both necessary for production environments. However, for simulated virtual devices the DMA security problem also exists, and previous works cannot solve this problem. The reason behind that is IOMMU circuits on the host do not work for this kind of devices as DMA operations of which are simulated by memory copy of CPU. Motivated by the above observations, we propose an IOMMU para-virtualization solution called PVIOMMU, which provides general functionalities especially DMA security guarantees for both directly assigned devices and simulated devices. The prototype of PVIOMMU is implemented in Qemu/KVM based on the virtio framework and can be dynamically loaded into guest kernel as a module, As a result, modifying and rebuilding guest kernel are not required. In addition, the device model of Qemu is revised to implement DMA access control by separating the device simulator from the address space of the guest virtual machine. Experimental evaluations on three kinds of network devices including Intel I210 (1Gbps), simulated E1000 (1Gbps) and IB ConnectX-3 (40Gbps) show that, PVIOMMU introduces little overhead on DMA transactions, and in general the network I/O performance is close to that in the native KVM implementation without IOMMU virtualization.

영-한 기계번역에서 문형에 의한 조사 및 대역어 선택 (Selection of Postpositions and Translated Words by Sentence Pattern in the English-Korean Machine Translation)

  • 박영진;김남수;이지선;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.105-109
    • /
    • 1999
  • 영-한 기계번역 중 변환 단계에서 한국어 문장을 생성하기 위해서는 구구조 변환 후 조사 및 대역어 선택으로 이루어진다. 그러나 하나의 영어 단어는 여러 개의 한국어 의미들을 가지고 있기 때문에 문장에서 사용된 영어의 정확한 의미에 해당하는 한국어 대역어를 선택하는 것은 번역의 질을 높이고 시스템의 성능에 매우 중요한 역할을 한다. 특히 용언 및 체언의 대역어 선택은 문장에서 서로 간의 의미적인 관계를 고려하여야 올바른 대역어를 선택할 수 있다. 기존에는 전자 사전에 용언과 체언간의 연어 정보(collocation information)를 구축하여 대역어 선택의 문제를 해결하려고 하였으나 연어 정보가 사전에 존재하지 않을 때 올바른 대역어를 선택할 수 없었다. 또한 용언과 체언의 관계를 나타내는 조사를 선택하기 위하여 격(case)을 세분화하여 사전을 구축하였으나 격의 분류 및 사전을 구축할 경우 격을 선택하는 어려움이 있었다. 이에 따라 본 논문에서는 문형(sentence pattern)에 의한 방법으로 용언의 대역어 및 용언이 갖는 필수격 체언의 조사와 대역어 선택방법을 제안한다. 문형의 구조적인 정보에는 용언과 체언의 의미적 역할(thematic role)을 하는 조사 및 용언이 갖는 필수격 체언의 의미 자질(semantic feature)을 갖고 있다. 이러한 의미 자질을 wordnet과 한/영 및 영/한 사전을 이용하여 의미 지표(semantic marker)를 갖는 문형 사전을 구축한다. 또한 의미 지표를 갖는 문형 사전을 기반으로 조사 및 대역어 선택 알고리즘을 개발한다.

  • PDF

문틀기반 영한 자동번역 시스템 (Sentence-Frame based English-to-Korean Machine Translation)

  • 최승권;서광준;김영길;서영애;노윤형;이현근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.323-328
    • /
    • 2000
  • 국내에서 영한 자동번역 시스템을 1985 년부터 개발한 지 벌써 15년이 흐르고 있다. 15 년의 영한 자동번역 기술개발에도 불구하고 아직도 영한 자동번역 시스템의 번역품질은 40%를 넘지 못하고 있다. 이렇게 번역품질이 낮은 이유는 다음과 같이 요약할 수 있을 것이다. o 입력문에 대해 파싱할 때 오른쪽 경계를 잘못 인식함으로써 구조적 모호성의 발생문제: 예를 들어 등위 접속절에서 오른쪽 등위절이 등위 접속절에 포함되는 지의 모호성. o 번역 단위로써 전체 문장을 대상으로 한 번역패턴이 아닌 구나 절과 같은 부분적인 번역패턴으로 인한 문장 전체의 잘못된 번역 결과 발생. o 점차 증가하는 대용량 번역지식의 구축과 관련해 새로 구축되는 번역 지식과 기구축된 대용량 번역지식들 간의 상호 충돌로 인한 번역 품질의 저하. 이러한 심각한 원인들을 극복하기 위해 본 논문에서는 문틀에 기반한 새로운 영한 자동번역 방법론을 소개하고자 한다. 이 문틀에 기반한 영한 자동번역 방법론은 현재 CNN뉴스 방송 자막을 대상으로 한 영한 자동번역 시스템에서 실제 활용되고 있다. 이 방법론은 기본적으로 data-driven 방법론에 속하다. 문틀 기반 자동번역 방법론은 규칙기반 자동번역 방법론보다는 낮은 단계에서 예제 기반 자동번역 방법론보다는 높은 단계에서 번역을 하는 번역방법론이다. 이 방법론은 영한 자동번역에 뿐만 아니라 다른 언어쌍에서의 번역에도 적용할 수 있을 것이다.

  • PDF

자바를 이용한 3차원 웹 그래픽 라이브러리의 개발 (Development of 3-D Web Graphic Library Using Java)

  • 정갑중
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1709-1715
    • /
    • 2005
  • 본 논문은 3차원 웹 그래픽 라이브러리의 개발에 관한 논문이다. 본 3차원 웹 그래픽 라이브러리는 웹 응용 서비스에서 사용자에게 2차원 웹 응용 서비스 또는 기존의 3차된 점 서비스에서 시야각이 한정된 그래픽 제공의 경우 보다 다양한 동적 입체감을 제공함으로써 더욱 사용자의 흥미를 유발할 수 있는 웹 응용서비스를 개발하는데 이용 가능한 3차원 웹 그래픽 라이브러리이며 다양한 3차원 웹 객체 및 현실감 있는 드로잉 기법의 적용으로 더욱 복합적이고 동적인 3차원 웹 서비스를 제공하기 위한 3차원 웹 응용 서비스의 개발에 응용이 가능하다. 특히, 3차원 웹 게임이나 웹을 이용한 동적 광고 매체 제작에 효과적으로 이용 가능하다. 본 3-D 웹 그래픽 라이브러리는 자바 언어를 이용하여 작성되었으며 자바 가상 머신과 연동하는 웹 브라우저를 통해 웹 상에서 수행되는 응용 소프트웨어의 개발에 적용 가능하다.