• 제목/요약/키워드: 번역기

검색결과 320건 처리시간 0.027초

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족 문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

전문용어 탐지와 해석 모델: 한국어 의학용어 중심으로 (Detecting and Interpreting Terms: Focusing Korean Medical Terms)

  • 염하람;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.407-411
    • /
    • 2022
  • 최근 COVID-19로 인해 대중의 의학 분야 관심이 증가하고 있다. 대부분의 의학문서는 전문용어인 의학용어로 구성되어 있어 대중이 이를 보고 이해하기에 어려움이 있다. 의학용어를 쉬운 뜻으로 풀이하는 모델을 이용한다면 대중이 의학 문서를 쉽게 이해할 수 있을 것이다. 이런 문제를 완화하기 위해서 본 논문에서는 Transformer 기반 번역 모델을 이용한 의학용어 탐지 및 해석 모델을 제안한다. 번역 모델에 적용하기 위해 병렬말뭉치가 필요하다. 본 논문에서는 다음과 같은 방법으로 병렬말뭉치를 구축한다: 1) 의학용어 사전을 구축한다. 2) 의학 드라마의 자막으로부터 의학용어를 찾아서 그 뜻풀이로 대체한다. 3) 원자막과 뜻풀이가 포함된 자막을 나란히 배열한다. 구축된 병렬말뭉치를 이용해서 Transformer 번역모델에 적용하여 전문용어를 찾아서 해석하는 모델을 구축한다. 각 문장은 음절 단위로 나뉘어 사전학습 된 KoCharELECTRA를 이용해서 임베딩한다. 제안된 모델은 약 69.3%의 어절단위 BLEU 점수를 보였다. 제안된 의학용어 해석기를 통해 대중이 의학문서를 좀 더 쉽게 접근할 수 있을 것이다.

  • PDF

모바일 게임을 위한 번역 기법 (Translation Techniques for Mobile Games)

  • 박지우;오세만
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권9호
    • /
    • pp.936-947
    • /
    • 2010
  • 하나의 콘텐트를 다양한 플랫폼에서 서비스하는 것은 모바일 게임 시장에서 매우 중요한 사항이다. 서로 다른 플랫폼에서 서비스하기 위해서는 기존의 콘텐츠를 특정한 플랫폼에 적합한 형태로 재개발해야하는 추가 비용이 발생한다. 더욱이, 새로운 플랫폼이 등장하는 경우에 다수의 콘텐츠를 단기간에 개발하는 것은 많은 노력과 비용을 요구한다. 따라서 기존의 콘텐츠를 새로운 플랫폼에서 실행될 수 있도록 변환하는 기법에 관한 연구가 필요하다. 본 논문에서는 모바일 콘텐츠를 새로운 플랫폼에서 실행 가능한 형태로 변환하는 모바일 게임을 위한 번역 기법을 제안하고 이를 적용하여 안드로이드 플랫폼에 대한 소스 레벨 콘텐츠 변환기를 설계하고 구현한다. 컴파일러 이론을 적용하여 개발하였으며, 서로 다른 프로그래밍 언어 간의 변환 문제를 부분적으로 해결하였다. 또한 언어 간의 번역뿐만 아니라 커널 이식, 라이브러리 매핑 등 체계적으로 소스 레벨 콘텐츠 변환도구를 구현하였다. 이러한 연구는 기존 모바일 게임에 대한 활용도를 증대시키고 모바일 콘텐츠 산업 활성화에 기여할 수 있을 것으로 기대된다.

예비교사의 무리수의 개념과 표현에 대한 이해 (Pre-Service Teachers' Understanding of the Concept and Representations of Irrational Numbers)

  • 최은아;강향임
    • 대한수학교육학회지:학교수학
    • /
    • 제18권3호
    • /
    • pp.647-666
    • /
    • 2016
  • 본 연구는 수학적 표현이 개념적 이해를 형성하는 수단이라는 관점을 토대로 예비교사들의 무리수 개념과 표현 방식에 대한 이해 정도를 조사하여 무리수 개념 지도를 위한 교수학적 시사점을 도출하고자 하였다. 이에 무리수 개념과 표현, 다양한 표현, 표현간 번역 항목을 조사하는 검사도구를 예비교사 48명을 대상으로 적용하였다. 체계적인 분석을 위해 무리수 표현을 비(非)분수, 소수, 기호, 기하, 수직선, 함숫값 표현으로 범주화하여 활용하였다. 분석 결과, 예비교사들은 무리수 정의의 비(非)분수 표현에 내포된 통약불가능성을 명확하게 인식하지 못하였으며, 무리수의 다양한 표현 중에서 기호 표현에 집중 경향을 나타냈고, 다른 표현들을 상대적으로 간과하는 현상을 나타내었다. 특히 규칙성이 있는 비순환 무한소수에 대한 제한된 이해와 무한소수에 대한 일관성 있는 이해의 결여를 확인할 수 있었다. 또한 기호 표현 $\sqrt{5}$에 비해 ${\pi}$를 다른 표현으로 번역하는데 더 큰 어려움을 나타냈으며, ${\pi}$를 번역하는 과정에서 가무한의 관점이 드러나기도 하였다. 이상의 연구결과를 종합하여 무리수 개념 지도는 무리수 정의와 표현의 관계, 다양한 무리수 표현의 이해, 무리수 표현간의 번역에 중점을 두어 지도되어야 함을 주장하였다.

디지털 시스템의 데이터 및 상태표 생성기 구현 (An Implementation of Data and State Table Generator for Digital System)

  • 조성국;이명호
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.19-27
    • /
    • 1998
  • 디지털 시스템은 제어부 시스템(control subsystem)과 데이터 부시스템(data subsystem)으로 구성된다. 본 논문에서는 하드웨어 기술언어(hardware description language)와 그에 대한 하드웨어 컴파일러(hardware compiler)를 정의한 후 레지스터 전송알고리즘(register transfer algorithm)을 이용하여 제어부의 상태표와 데이터부의 데이터 표를 생성하는 하드웨어 설계용 번역기(translator)를 구현하였다. 본 연구에서 사용한 개발툴은 Unix의 C, Lex, YACC이다.

  • PDF

영-한 기계 번역에서 조건 단일화 기반 변환 문법 해석기 (Transfer Grammar Compiler Based on Conditional Unification for English-Korean Machine Translation)

  • 김남수;전현경;박영진;이용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.198-200
    • /
    • 1998
  • 영-한 기계번역에 있어서 변환(Transfer)은 상이한 두 언어의 어순을 생성될 언어의 어순으로 결정하기 위한 변환 규칙에 의해서 영어의 구문 분석된 트리를 생성될 한국어의 구조에 맞게 재구성한다. 이러한 변환은 개발 단계 중 또는 그 후에 언어의 다양한 차이를 수용하기 위해 프로그램 수준에서 잦은 수정을 하게 된다. 이를 극복하기 위해서, 본 논문에서는 변환 문법을 이용하여 좀더 체계적이고 확장이 쉬운 문법을 이용하여 변환을 수행하고자 한다. 이를 위해 영어의 구구조 자질들을 쉽게 검사 및 탐색하면서 조건에 맞는 자질들을 나누어주는 기능을 하는 조건 단일화 연산자를 기반으로 일반적인 문맥자유문법(Context Free Grammar)을 이용한 변환 문법을 제안한다. 또한 변환 문법은 변환 문법 해석기에 의해 변환 프로그램으로 컴파일 됨을 보인다. 이러한 변환 방법은 영-한 변환에 있어서 문법 수준에서 변환 처리를 할 수 있어 변환 프로그램의 개발 및 유지보수에 많은 도움을 준다.

  • PDF

프로그래밍 교육을 위한 순서도 생성기 구현 (Implementation of A Flow Chart Generator for Teaching Programming)

  • 최성권;류시혁;신승철
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2002년도 춘계학술대회 논문집
    • /
    • pp.185-189
    • /
    • 2002
  • 프로그래밍 교육을 할 때 작성된 프로그램에 대하여 순서도를 자동 생성하여 보여줄 수 있다면 매우 유용할 것이다. 본 논문은 간단한 명령형 언어 While의 프로그램을 입력받아 순서도를 작성해 주는 방법을 제안한다. While프로그램을 순서도 작성에 적합한 언어인 Flow Chart언어 프로그램으로 전환하는 번역기를 생성한다. 이렇게 생성된 FCL을 가지고 그래픽 라이브러리를 이용하여 순서도를 자동으로 생성하는 방법을 제시한다. 본 연구의 결과를 이용하면 프로그램의 초보자들도 쉽게 프로그램의 흐름을 이해할 수 있다.

  • PDF

이종 IoT 플랫폼 디바이스 식별체계 상호연동에 대한 연구 (A Study on Interoperability of Heterogeneous IoT Platform Device Identification)

  • 구자훈;김영갑
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.1279-1282
    • /
    • 2017
  • 현재 사물인터넷(Internet of Things; IoT) 기술을 이용한 스마트홈 환경을 구축하기 위해서는 같은 식별체계를 사용하는 플랫폼 디바이스를 사용해야 한다. 그러나 주요 IoT 플랫폼들은 각각 다른 식별체계를 사용하고 있기 때문에 이종 플랫폼 간 디바이스 식별이 어려운 상황이다. 이종 플랫폼 간 디바이스 식별체계 상호연동에 대한 연구는 진행 중이며 아직까지 해결책은 제시되지 않았다. 따라서 본 논문에서는 주요 IoT 플랫폼인 oneM2M, GS1 Oliot, IBM Watson IoT, OCF IoTivity의 디바이스 식별체계를 분석하고 비교하여 서로 다른 플랫폼 간 디바이스 식별체계에 대한 번역기 또는 해석기의 필요성과 개념모델을 제시한다.

일본 견문기(Ⅴ)

  • 이종수
    • 과학과기술
    • /
    • 제30권3호통권334호
    • /
    • pp.90-91
    • /
    • 1997
  • 일본인들의 새로운 용어를 만들어내는 재능과 번역어를 이끌어내는 재주는 보통을 훨씬 웃돈다. 우리의 자연과학 뿐만 아니라 학문의 근간을 이루는 용어들이 거의 일본인에 의해서 만들어졌다는 사실을 알 필요가 있다.

  • PDF

초읽기에 들어간 일렉트릭 커머스(EC)

  • 한국정보통신산업협회
    • 정보화사회
    • /
    • 통권100호
    • /
    • pp.29-36
    • /
    • 1996
  • 이글은 미국에서 지난 95년 하반기에 개최된 '95국제 CALS엑스포의 중소기업포럼에서 미국인터라이너 테크놀러지사의 제임스 조지가 발표한 것을 요약, 번역한 것이다.

  • PDF