• 제목/요약/키워드: NMT

검색결과 52건 처리시간 0.02초

한-X 신경기계번역시스템에서 동형이의어 분별에 따른 변역질 평가 (An Evaluation of Translation Quality by Homograph Disambiguation in Korean-X Neural Machine Translation Systems)

  • 원광복;신준철;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.504-509
    • /
    • 2018
  • Neural machine translation (NMT) has recently achieved the state-of-the-art performance. However, it is reported failing in the word sense disambiguation (WSD) for several popular language pairs. In this paper, we explore the extent to which NMT systems are able to disambiguate the Korean homographs. Homographs, words with different meanings but the same written form, cause the word choice problems for NMT systems. Consistent with the popular language pairs, we discover that NMT systems fail to translate Korean homographs correctly. We provide a Korean word sense disambiguation tool-UTagger to use for improvement of NMT's translation quality. We conducted translation experiments using Korean-English and Korean-Vietnamese language pairs. The experimental results show that UTagger can significantly improve the translation quality of NMT in terms of the BLEU, TER, and DLRATIO evaluation metrics.

  • PDF

전문번역사들의 기계번역 수용에 관한 연구 (Study on Translators' Acceptance of Machine Translation)

  • 천종성
    • 한국융합학회논문지
    • /
    • 제11권6호
    • /
    • pp.281-288
    • /
    • 2020
  • 본 연구는 구글 번역과 파파고와 같은 신경망 기계번역(NMT)에 대한 수용성을 탐구한다. 기계번역의 도입으로 훈련받은 번역사들이 위협을 느끼리라는 것과 기계와의 협력을 모색해야 한다는 논의가 상충하고 있는 시점에서, 오랫동안 기술수용을 예측해 온 TAM을 적용하여 전문번역사들의 기계번역 수용에 관한 의사결정 과정을 살펴보았다. 결론적으로 번역사들이 기계번역에 대해 위협을 느낄 것이라는 기존의 규범적 논의와 달리 본 연구의 경험적 결과는 번역사들이 자신의 업무의 효율을 높여주는 유용한 도구로 인식하고 있음이 밝혀졌다. 특히 같이 작업하는 동료들의 조언과 사회적 분위기가 우호적일 경우 이러한 경향은 더욱 강해졌다.

실어증 환자에서 선다형 이름 맞추기 검사의 유용성 (The Usefulness of Multiple-Choice Name Matching Test in Aphasic Patients)

  • 민용;고명환;서정환
    • 말소리와 음성과학
    • /
    • 제4권3호
    • /
    • pp.137-142
    • /
    • 2012
  • The aim of this study is to investigate the usefulness of the multiple-choice name matching test (MC-NMT) in adults with aphasia by comparing the Korean version of the Boston Naming Test (K-BNT) and subsets of the Korean version of the Western Aphasia Battery (K-WAB). Thirty-nine patients who suffer from aphasia participated in the study. All patients were examined by the K-BNT, MC-NMT and K-WAB. The MC-NMT consisted of the 30 original BNT object stimuli which were presented with four response choices (written words) with similar frequency, including one correct and three incorrect responses. Cards containing the drawings were presented to the patient one at time. An item was passed if the patient chose the correct response within 10 seconds. We subdivided two groups into a total group and a low K-BNT group (at and below 15 points). We evaluated the correlation between the K-BNT, MC-NMT score and production, naming, repetition, comprehension, reading and writing scores in subsets of the K-WAB. There was a highly positive correlation between the K-BNT score and naming score of the K-WAB in total patients. However, the MC-NMT was highly correlated with reading scores in the K-WAB. In low score K-BNT patients, the K-BNT strongly correlated with production, naming and repetition scores of the K-WAB. These findings mean that K-BNT reflects motor language function. However, the MC-NMT was strong correlated comprehension, reading and writing of the K-WAB. This finding reflects sensory language function. We suggest that the combination of K-BNT and newly developed MC-NMT will be useful to evaluate speech functions in aphasic patients.

문자 단위의 Neural Machine Translation (Character-Level Neural Machine Translation)

  • 이창기;김준석;이형규;이재송
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.115-118
    • /
    • 2015
  • Neural Machine Translation (NMT) 모델은 단일 신경망 구조만을 사용하는 End-to-end 방식의 기계번역 모델로, 기존의 Statistical Machine Translation (SMT) 모델에 비해서 높은 성능을 보이고, Feature Engineering이 필요 없으며, 번역 모델 및 언어 모델의 역할을 단일 신경망에서 수행하여 디코더의 구조가 간단하다는 장점이 있다. 그러나 NMT 모델은 출력 언어 사전(Target Vocabulary)의 크기에 비례해서 학습 및 디코딩의 속도가 느려지기 때문에 출력 언어 사전의 크기에 제한을 갖는다는 단점이 있다. 본 논문에서는 NMT 모델의 출력 언어 사전의 크기 제한 문제를 해결하기 위해서, 입력 언어는 단어 단위로 읽고(Encoding) 출력 언어를 문자(Character) 단위로 생성(Decoding)하는 방법을 제안한다. 출력 언어를 문자 단위로 생성하게 되면 NMT 모델의 출력 언어 사전에 모든 문자를 포함할 수 있게 되어 출력 언어의 Out-of-vocabulary(OOV) 문제가 사라지고 출력 언어의 사전 크기가 줄어들어 학습 및 디코딩 속도가 빨라지게 된다. 실험 결과, 본 논문에서 제안한 방법이 영어-일본어 및 한국어-일본어 기계번역에서 기존의 단어 단위의 NMT 모델보다 우수한 성능을 보였다.

  • PDF

Application of Norwegian Method of Tunnelling (NMT) Principles to bypass landslides in mountainous terrain

  • Bhasin, Rajinder;Aarset, Arnstein
    • 자연, 터널 그리고 지하공간
    • /
    • 제22권1호
    • /
    • pp.26-35
    • /
    • 2020
  • Tunnelling to bypass major landslide areas is considered as a good and long-term environmentally friendly solution to reduce an existing hazard. In Norway, hundreds of kilometres of tunnels have been constructed in areas prone to landslides and snow avalanches. Although tunnelling is considered as an expensive mitigation strategy for bypassing landslides, analysis indicate that in some cases the cost of building a tunnel can be repaid by savings in driving costs (fuel) alone over a period of 5-10 years due to reduced driving distances. The other benefits of constructing tunnels in landslide areas include savings in time and increased safety. The Norwegian Method of Tunnelling (NMT) is considered safe, efficient and cost effective compared to other tunnelling techniques. Some aspects of NMT, which are considered safe and cost efficient, are presented. The application of updated rock support techniques, including reinforced ribs of shotctrete (RRS), which is a key component of the Norwegian Method of Tunnelling (NMT), is highlighted.

OpenNMT를 활용한 한글 존댓말 변환기의 구현 (Implementation of Korean Honorific Converter Using OpenNMT)

  • 정준녕;김상영;김성태;이정재;정유철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.141-142
    • /
    • 2021
  • 최근 발전한 인공신경망 기반 기계 번역은 번역 시 더 자연스러운 번역을 제공한다. 본 논문에서는 기계번역기법을 이용하여 반말 표현을 존댓말 표현으로 변환하는 기법을 제안한다. 특히, 이를 위해 DCInside의 게시판을 크롤링하고 AI-HUB 데이터와 합쳐 약 20,000개의 자체 데이터 셋을 구축하였으며, 한글 전처리를 위한 4가지 기법 및 OpenNMT 프레임웍의 LSTM 및 Transformer 모듈을 활용하여 실험을 진행하였다. 이를 통해, 반말 표현을 높임 표현으로 변환하는 최적조합을 확인하였으며, 검증시 BLUE점수로 최대 66.53를 획득하였다.

  • PDF

한-영 관용구 기계번역을 위한 NMT 학습 방법 (NMT Training Method for Korean-English Idiom Machine Translation)

  • 최민주;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-356
    • /
    • 2020
  • 관용구는 둘 이상의 단어가 결합하여 특정한 뜻을 생성한 어구로 기계번역 시 종종 오역이 발생한다. 이는 관용구가 지닌 함축적인 의미를 정확하게 번역할 수 없는 기계번역의 한계를 드러낸다. 따라서 신경망 기계 번역(Neural Machine Translation)에서 관용구를 효과적으로 학습하려면 관용구에 특화된 번역 쌍 데이터셋과 학습 방법이 필요하다. 본 논문에서는 한-영 관용구 기계번역에 특화된 데이터셋을 이용하여 신경망 기계번역 모델에 관용구를 효과적으로 학습시키기 위해 특정 토큰을 삽입하여 문장에 포함된 관용구의 위치를 나타내는 방법을 제안한다. 실험 결과, 제안한 방법을 이용하여 학습하였을 때 대부분의 신경망 기계 번역 모델에서 관용구 번역 품질의 향상이 있음을 보였다.

  • PDF

심볼릭 지식 정보를 결합한 뉴럴기계번역 모델 설계 (Design Neural Machine Translation Model Combining External Symbolic Knowledge)

  • 어수경;박찬준;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.529-534
    • /
    • 2020
  • 인공신경망 기반 기계번역(Neural Machine Translation, NMT)이란 딥러닝(Deep learning)을 이용하여 출발 언어의 문장을 도착 언어 문장으로 번역해주는 시스템을 일컫는다. NMT는 종단간 학습(end-to-end learning)을 이용하여 기존 기계번역 방법론의 성능을 앞지르며 기계번역의 주요 방법론으로 자리잡게 됐다. 이러한 발전에도 불구하고 여전히 개체(entity), 또는 전문 용어(terminological expressions)의 번역은 미해결 과제로 남아있다. 개체나 전문 용어는 대부분 명사로 구성되는데 문장 내 명사는 주체, 객체 등의 역할을 하는 중요한 요소이므로 이들의 정확한 번역이 문장 전체의 번역 성능 향상으로 이어질 수 있다. 따라서 본 논문에서는 지식그래프(Knowledge Graph)를 이용하여 심볼릭 지식을 NMT와 결합한 뉴럴심볼릭 방법론을 제안한다. 또한 지식그래프를 활용하여 NMT의 성능을 높인 선행 연구 방법론을 한영 기계번역에 이용할 수 있도록 구조를 설계한다.

  • PDF

MIMO 다운링크 채널에서 다중사용자 공간다중화를 위한 알고리즘 (Triangulation Algorithm for Multi-user Spatial Multiplexing in MIMO Downlink Channels)

  • 이흔철;;이인규
    • 한국통신학회논문지
    • /
    • 제35권1C호
    • /
    • pp.45-54
    • /
    • 2010
  • 이 논문에서는 다중사용자 (multi-user) 다중안테나 (multiple-in multiple-out : MIMO) 시스템을 위한 전송기법을 제안한다. Costa가 증명한 더티페이퍼코딩 (dirty-paper coding: DPC)이론에 따르면 송신기가 수신기의 가우시안 분포를 갖는 간섭 신호를 알고 있는 경우 간섭 신호에 상관 없이 채널 캐패시티를 얻을 수 있음이 알려져 있다. 단독사용자 채널의 경우 간단하며 효율적인 DPC기법들이 알려져 있으나 다중사용자 환경에는 실제 구현하는데 있어 복잡도와 관련해 많은 문제를 가지고 있다. 이 논문에서 우리는 다중사용자 환경에서 송신기에 알려진 갑선신호를 효율적으로 제어할 수 있는 네트워크 채널 행렬 삼각화 (network channel matrix triangulation: NMT)기법을 제안하고자 한다. 제안하는 NMT 알고리즘은 다중사용자 MIMO 채널을 서로 독립된 병렬의 Single-input Single-output (SISO) 채널들로 변환하여 단독사용자 환경을 위해 제안되어 있는 기존 DPC기법들을 다중사용자 환경에서도 사용 가능케 한다. 시뮬레이션 결과를 통해 제안된 알고리즘이 다중사용자 환경의 채널 캐패시티에 거의 접근함을 보일 것이다.