• 제목/요약/키워드: Translation model

검색결과 471건 처리시간 0.022초

일영 통계기계번역에서 의존문법 문장 구조와 품사 정보를 사용한 클러스터링 기법 (A Clustering Method using Dependency Structure and Part-Of-Speech(POS) for Japanese-English Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.993-997
    • /
    • 2009
  • 클러스터링 기법은 다양한 분야에서 이용되어 왔으며, 통계 기반 기계번역에서도 익히 사용된 기법이다. 그러나 기존의 연구에서는 깊이 있는 문법적인 분석 없이 기계학습 기법을 사용하거나, 문장구조의 정보를 사용하더라도 정규식을 이용하여 판별하는 선에서 그치는 경우가 많았다. 본 논문에서는 각 문장의 의존관계 문법에 따른 구조와 조사 등의 품사 정보를 사용하여 문장구조를 파악하고 유형별로 분류하여 각각에 특화된 언어모델을 획득하는 방법과, 이를 구 기반 통계기계번역에 추가적인 정보로 사용하여 번역성능을 향상하는 데 이용하는 방법을 제안한다.

Nonparametric Test for Multivariate Location Translation Alternatives

  • Na, Jong-Hwa
    • Communications for Statistical Applications and Methods
    • /
    • 제7권3호
    • /
    • pp.799-809
    • /
    • 2000
  • In this paper we propose a nonparametric one sided test for location parameters in p-variate(p$\geq$2) location translation model. The exact null distributions of test statistics are calculated by permutation principle in the case of relatively small sample sizes and the asymptotic distributions are also considered. The powers of various tests are compared through computer simulation and thep-values with real data are also suggested through example.

  • PDF

"난경(難經)" 맥진조(脈診條)중 십육난(十六難)~ 이십이난(二十二難)의 영역(英譯) 연구(硏究) (An English Translation Study on the Sixteenth to Twenty-second Issue concerning Pulse Diagnosis of "Classic of Difficult Issues(難經)")

  • 강혜원;김재균;백진웅
    • 대한한의학원전학회지
    • /
    • 제24권1호
    • /
    • pp.57-71
    • /
    • 2011
  • Although there have been many endeavors aimed at the standardization and globalization of Korean medicine over a long period of time, the access to information on Oriental medical classics has been relatively poor due to the lack of appropriate translation methodology and standard terminology. In order to overcome existing barriers, continuous effort towards precise translation adopting a standard terminology should be maintained. As a part of this procedure, we planned to publish a part of "Classic of difficult issues(難經)" in three sections, and the first two studies have already been published. Based on the methodology and approaches of previous studies, this third study aims to translate parts of "Classic of difficult issues(難經)" into English, beginning with "The Sixteenth Question", and adopting "WHO-IST" terminology. The outcomes of this study are presented as follows: First, based on the result of existing translation studies and the outcome of "WHO-IST", English translation of "Classic of difficult issues(難經)" from "the Sixteenth Question" to "The Twenty-second Question" is offered, hoping to set a model of translation study which can be communicated universally. Second, in order to pave the way for future success in establishing translation studies, it is natural to verify the effectiveness and practicality of standard terminologies including the outcome of "WHO-IST". Continuous translation studies will be required in order to obtain constant feedback and adopt more suitable guidelines during the standardization process. Taking this into consideration, further translation studies of Oriental medical classics including "Classic of difficult issues(難經)" should be continued.

The Health Belief Model - Is it relevant to Korea?

  • Lee, Mi-Kyung;Colin William Binns;Kim, Kong-Hyun
    • Korean Journal of Health Education and Promotion
    • /
    • 제2권1호
    • /
    • pp.1-19
    • /
    • 2000
  • With rapid economic development, the emphasis of the public health movement in Korea has shifted towards addressing the burden of chronic disease. With this shift in direction comes a greater focus on health behaviour and the need for planning models to assist in lifestyle modification programs. The Health Belief Model (HBM), which originated in the US, has generated more research than any other theoretical approach to describe and predict the health behaviour of individuals. In recent years it has been applied in many different cultures and modifications have been suggested to accommodate different cultures. Given the centrality of language and culture, any attempts to use models of health behaviour developed in a different culture, must be studied and tested for local applicability. The paper reviews the applicability and suitability of the HBM in Korea, in the context of the Korean language and culture. The HBM has been used in Korea for almost three decades. The predictability of the HBM has varied in Korean studies as in other cultures. Overall, this literature review indicates that the HBM has been found applicable in predicting health and illness behaviours by Korean people. However if the HBM is used in a Korean context, the acquisition of health knowledge is an important consideration. Most new knowledge in the health sciences is originally published in English and less frequently in another foreign language. Most health knowledge in Korea is acquired through the media or from health professionals and its acquisition often involves translation from the original. The selection of articles for translation and the accuracy of translation into language acceptable in the Korean culture become important determinants of health knowledge. As such translation becomes an important part of the context of the HBM. In this paper modifications to the HBM are suggested to accommodate the issues of language and knowledge in Korea.

  • PDF

병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구 (Filter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering)

  • 문현석;박찬준;어수경;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-7
    • /
    • 2021
  • 최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다.

최신 기계번역 사후 교정 연구 (Recent Automatic Post Editing Research)

  • 문현석;박찬준;어수경;서재형;임희석
    • 디지털융복합연구
    • /
    • 제19권7호
    • /
    • pp.199-208
    • /
    • 2021
  • 기계번역 사후교정이란, 기계번역 문장에 포함된 오류를 자동으로 교정하기 위해 제안된 연구 분야이다. 이는 번역 시스템과 관계없이 번역문의 품질을 높이는 오류 교정 모델을 생성하는 목적을 가진 연구로, 훈련을 위해 소스문장, 번역문, 그리고 이를 사람이 직접 교정한 문장이 활용된다. 특히, 최신 기계번역 사후교정 연구에서는 사후교정 데이터를 통한 학습을 진행하기 이전에, 사전학습된 다국어 언어모델을 활용하는 방법이 적용되고 있다. 이에 본 논문은 최신 연구들에서 활용되고 있는 다국어 사전학습 언어모델들과 함께, 해당 모델을 도입한 각 연구에서의 구체적인 적용방법을 소개한다. 나아가 이를 기반으로, 번역 모델과 mBART모델을 활용하는 향후 연구 방향을 제안한다.

객체모델에 대한 형식명세로의 변환 방법 (The Translation Method to formal specification of Object Model)

  • 임근;권영만
    • 한국컴퓨터정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.21-27
    • /
    • 2003
  • 본 논문에서는 정확한 분석 모델을 제시하기 위해서 객체 모델을 정의하고, 이 모델을 정형화와 표준화에 필요한 형식명세로 변환하는 방법을 제안한다. VDM 형식으로 변환된 모델은 정확성, 일관성, 완전성을 제공할 수 있다. 증명의 대상인 VDM 명세에서 오류가 발생한다면 초기 객체 모델 단계에 적용하여 객체 모델의 검증이 가능하다. 검증된 객체 모델을 설계 단계의 기반 명세로 사용하므로 추후 개발 단계의 비용과 노력을 최소화하고 객체 모델 선택의 정확성을 높일 수 있다.

  • PDF

영문 브랜드네임의 중문 브랜드네임 전환 방식에 대한 중화권 소비자들의 브랜드 평가에 관한 연구 -브랜드컨셉의 조절효과를 중심으로- (Evaluations of Chinese Brand Name by Different Translation Types: Focusing on The Moderating Role of Brand Concept)

  • 이지은;전주언
    • Asia Marketing Journal
    • /
    • 제12권4호
    • /
    • pp.1-25
    • /
    • 2011
  • 중화권 시장의 지속적인 성장으로 글로벌 브랜드들은 중화권 시장에 성공적으로 진입하기 위해서 다양한 노력을 기울이고 있다. 중화권 시장에 속한 국가들은 중국어를 공통적으로 사용하기 때문에 이 시장에 진출하려는 기업들은 영문 브랜드네임을 중문 브랜드 네임으로 전환해야 한다. 중문 브랜드네임에 대한 기존 연구들을 살펴보면, 중화권 시장에 진출한 글로벌 브랜드네임에 대한 사례분석에 초점이 맞추어져 있을 뿐 브랜드가 제공하는 편익과 중문 브랜드네임 전환방식과의 관계를 실증적으로 검증한 연구는 부족한 실정이다. 따라서 본 연구는 영문 브랜드네임이 중문 브랜드네임으로 전환되는 방식에 대해 살펴보았으며, 브랜드컨셉에 따라 중문 브랜드네임 전환방식에 대해 중화권 소비자들은 다른 평가를 내릴 것이라 예측하고 이에 대해 실증적으로 검증하였다. 연구결과 중화권 소비자들은 기능적 브랜드 컨셉제품의 경우 음운과 의미가 반영된 음운어의론식 전환방식에 대해서 가장 호의적으로 평가하였으며, 다음으로 의미가 반영된 의차식 전환이 호의적인 평가를 받았다. 반면에 상징적 브랜드 컨셉제품의 경우는 음운어의론식 전환방식을 가장 호의적으로 평가하였으며, 다음으로 음운이 반영된 음차식 전환에 대해 호의적으로 평가하는 것으로 나타났다. 실증결과를 토대로 글로벌 브랜드를 담당하는 브랜드 매니저들에게 자사 브랜드가 중화권 소비자들에게 제공하는 목표 편익에 따라서 중문 브랜드네임 전환방식이 달라져야 함을 제안하였다.

  • PDF

영한 기계번역에서의 영어 품사결정 모델 (A Model of English Part-Of-Speech Determination for English-Korean Machine Translation)

  • 김성동;박성훈
    • 지능정보연구
    • /
    • 제15권3호
    • /
    • pp.53-65
    • /
    • 2009
  • 영한 기계번역에서 영어 단어의 품사결정은 번역할 문장에 사용된 어휘의 품사 모호성을 해소하기 위해 필요하다. 어휘의 품사 모호성은 구문 분석을 복잡하게 하고 정확한 번역을 생성하는 것을 어렵게 한다. 본 논문에서는 이러한 문제점을 해결하기 위해 어휘 분석 이후 구문 분석 이전에 품사 모호성을 해소하려 하였으며 품사 모호성을 해소하기 위한 CatAmRes 모델을 제안하고 다른 품사태깅 방법과 성능 비교를 하였다. CatAmRes는 Penn Treebank 말뭉치를 이용하여 Bayesian Network를 학습하여 얻은 확률 분포와 말뭉치에서 나타나는 통계 정보를 이용하여 영어 단어의 품사를 결정을 한다. 본 논문에서 제안한 영어 품사결정 모델 CatAmRes는 결정할 품사의 적정도 값을 계산하는 Calculator와 계산된 적정도 값에 근거하여 품사를 결정하는 POSDeterminer로 구성된다. 실험에서는 CatAmRes의 동작과 성능을 테스트 하기 위해 WSJ, Brown, IBM 영역의 말뭉치에서 추출한 테스트 데이터를 이용하여 품사결정의 정확도를 평가하였다.

  • PDF

최신 기계번역 품질 예측 연구 (Research on Recent Quality Estimation)

  • 어수경;박찬준;문현석;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.37-44
    • /
    • 2021
  • 기계번역 품질 예측(Quality Estimation, QE)은 정답 문장(Reference sentence) 없이도 기계번역 결과의 질을 평가할 수 있으며, 활용도가 높다는 점에서 그 필요성이 대두되고 있다. Conference on machine translation(WMT)에서 매년 이와 관련한 shared task가 열리고 있고 최근에는 대용량 데이터 기반 Pretrained language model(PLM)을 적용한 연구들이 주로 진행되고 있다. 본 논문에서는 기계번역 품질 예측 task에 대한 설명 및 연구 동향에 대한 전반적인 survey를 진행했고, 최근 자주 활용되는 PLM의 특징들에 대해 정리하였다. 더불어 아직 활용된 바가 없는 multilingual BART 모델을 이용하여 기존 연구들인 XLM, multilingual BERT, XLM-RoBERTa와 의 비교 실험 및 분석을 진행하였다. 실험 결과 어떤 사전 학습된 다중언어 모델이 QE에 적용했을 때 가장 효과적인지 확인하였을 뿐 아니라 multilingual BART 모델의 QE 태스크 적용 가능성을 확인했다.