• 제목/요약/키워드: Human Translation

검색결과 337건 처리시간 0.028초

이진 결합 중심의 한국어 Chart parser (A Chart Parser for Korean by Binary Association)

  • 박성숙;심영섭;한성국;최운천;지민제;이용주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.15-24
    • /
    • 1993
  • 한국어는 구문요소의 문법기능이 표면구조상에 명시되는 구문특성을 갖고 있다. 이러한 특성은 한국어의 문법체계가 feature중심으로 전개되고 있음을 의미한다. 한국어에서의 feature 특성과 이진 결합 관계를 중심으로 하는 chart parsing 알고리즘을 제시하고 한국어 chart parser을 구현하였다.

  • PDF

MASS를 이용한 영어-한국어 신경망 기계 번역 (English-Korean Neural Machine Translation using MASS)

  • 정영준;박천음;이창기;김준석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.236-238
    • /
    • 2019
  • 신경망 기계 번역(Neural Machine Translation)은 주로 지도 학습(Supervised learning)을 이용한 End-to-end 방식의 연구가 이루어지고 있다. 그러나 지도 학습 방법은 데이터가 부족한 경우에는 낮은 성능을 보이기 때문에 BERT와 같은 대량의 단일 언어 데이터로 사전학습(Pre-training)을 한 후에 미세조정(Finetuning)을 하는 Transfer learning 방법이 자연어 처리 분야에서 주로 연구되고 있다. 최근에 발표된 MASS 모델은 언어 생성 작업을 위한 사전학습 방법을 통해 기계 번역과 문서 요약에서 높은 성능을 보였다. 본 논문에서는 영어-한국어 기계 번역 성능 향상을 위해 MASS 모델을 신경망 기계 번역에 적용하였다. 실험 결과 MASS 모델을 이용한 영어-한국어 기계 번역 모델의 성능이 기존 모델들보다 좋은 성능을 보였다.

  • PDF

단어 정렬을 이용한 한국어-영어 비자기회귀 신경망 기계 번역 (Korean-English Non-Autoregressive Neural Machine Translation using Word Alignment)

  • 정영준;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.629-632
    • /
    • 2021
  • 기계 번역(machine translation)은 자연 언어로 된 텍스트를 다른 언어로 자동 번역 하는 기술로, 최근에는 주로 신경망 기계 번역(Neural Machine Translation) 모델에 대한 연구가 진행되었다. 신경망 기계 번역은 일반적으로 자기회귀(autoregressive) 모델을 이용하며 기계 번역에서 좋은 성능을 보이지만, 병렬화할 수 없어 디코딩 속도가 느린 문제가 있다. 비자기회귀(non-autoregressive) 모델은 단어를 독립적으로 생성하며 병렬 계산이 가능해 자기회귀 모델에 비해 디코딩 속도가 상당히 빠른 장점이 있지만, 멀티모달리티(multimodality) 문제가 발생할 수 있다. 본 논문에서는 단어 정렬(word alignment)을 이용한 비자기회귀 신경망 기계 번역 모델을 제안하고, 제안한 모델을 한국어-영어 기계 번역에 적용하여 단어 정렬 정보가 어순이 다른 언어 간의 번역 성능 개선과 멀티모달리티 문제를 완화하는 데 도움이 됨을 보인다.

  • PDF

구절 변환을 위한 한영 동사 사전 구성 (The Construction of Korean-to-English Verb Dictionary for Phrase-to-Phrase Translations)

  • 옥철영;김영택
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.44-57
    • /
    • 1991
  • 변환방식의 기계번역은 변환사전에서 제공하는 정보의 종류와 그의 정밀성에 따라서 변환과정의 복잡도와 번역의 질이 결정되어 진다. 사람에 의한 번역은 양국어 사전에서 제공하는 구절 중심의 번역정보를 이용함으로써, 그 번역의 결과는 정확하고 자연스럽다. 본 논문에서는 양국어 사전에서 제공하는 구절 중심의 여러가지 번역정보들을, 한영 기계번역시스템이 이용할 수 있는 형태의 동사 변환사전을 제안하였다. 제안된 변환사전에서는 첫째로, 구절 중심의 번역에서 동사의 역어가 선택되어지는 기준을 제공하여, 변환과정에서 추가적인 의미해석없이도 역어를 효과적으로 선택할 수 있도록 하였다. 둘째로 동사의 역어가 취하는 구체적인 구문구조를 제공하여, 여러 단계의 구조변환의 복잡도를 줄이면서도 두 언어간의 표현방식의 차이점을 해결할 수 있게 하였다.

  • PDF

Connectionism을 이용한 부분 구문 인식기의 구현 (An Implementation of Syntactic Constituent Recognizer Using Connectionism)

  • 정한민;여상화;김태완;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.479-483
    • /
    • 1996
  • 본 논문은 구운 분석의 검색 영역 축소를 통한 구문 분석기의 성능 향상을 목적으로 connectionism을 이용한 부분 구문 인식기의 설계와 구현을 기술한다. 본 부분 구문 인식기는 형태소 분석된 문장으로부터 명사-주어부와 술어부를 인식함으로써 전체 검색 영역을 여러 부분으로 나누어 구문 분석문제를 축소시키는 것을 목적으로 하고 있다. Connectionist 모델은 입력층과 출력층으로 구성된 개선된 퍼셉트론 구조이며, 입/출력층 사이의 노드들을, 입력층 사이의 노드들을 연결하는 연결 강도(weight)가 존재한다. 명사-주어부 및 술어부 구문 태그를 connectionist 모델에 적용하며, 학습 알고리즘으로는 개선된 백프로퍼게이션 학습 알고리즘을 사용한다. 부분 구문 인식 실험은 112개 문장의 학습 코퍼스와 46개 문장의 실험 코퍼스에 대하여 85.7%와 80.4%의 정확한 명사-주어부 및 술어부 인식을, 94.6%와 95.7%의 명사-주어부와 술어부 사이의 올바른 경계 인식을 보여준다.

  • PDF

지식확산에 의한 감염병 실험실의 자율적 생물안전관리 학습조직 설계 및 실행 (Design and Implementation of a Learning Organization for Autonomous Biosafety Management of Infectious Disease Laboratories by Knowledge Translation)

  • 신행섭;유민수
    • 한국환경보건학회지
    • /
    • 제41권2호
    • /
    • pp.102-115
    • /
    • 2015
  • Objectives: A learning organization was designed and implemented on the basis of the selection criteria and essential elements of knowledge translation theory. Methods: The learning organization was designed on the basis of biosafety harmonization criteria and risk management strategy and was implemented as the learning organization for biosafety management by the National Institute of Health, Korea Centers for Disease Control & Prevention. The effect of knowledge translation in the research institutions by evidence-based policy was verified. Results: The result of applying the knowledge translation theory involving all stakeholders showed a positive reaction in establishing and implementing biosafety management strategy and embodied risk assessment criteria and evoked sympathy with the necessity of learning and using of expert knowledge about risk assessment and risk management. All stakeholders initiated voluntarily action toward new human-network construction and communication between similar organizations. The learning organization's capability expanded the base of knowledge translation. Conclusion: These results showed that a learning organization could enhance the autonomous safety management system by diffusion of knowledge translation.

Choosing preferable labels for the Japanese translation of the Human Phenotype Ontology

  • Ninomiya, Kota;Takatsuki, Terue;Kushida, Tatsuya;Yamamoto, Yasunori;Ogishima, Soichi
    • Genomics & Informatics
    • /
    • 제18권2호
    • /
    • pp.23.1-23.6
    • /
    • 2020
  • The Human Phenotype Ontology (HPO) is the de facto standard ontology to describe human phenotypes in detail, and it is actively used, particularly in the field of rare disease diagnoses. For clinicians who are not fluent in English, the HPO has been translated into many languages, and there have been four initiatives to develop Japanese translations. At the Biomedical Linked Annotation Hackathon 6 (BLAH6), a rule-based approach was attempted to determine the preferable Japanese translation for each HPO term among the candidates developed by the four approaches. The relationship between the HPO and Mammalian Phenotype translations was also investigated, with the eventual goal of harmonizing the two translations to facilitate phenotype-based comparisons of species in Japanese through cross-species phenotype matching. In order to deal with the increase in the number of HPO terms and the need for manual curation, it would be useful to have a dictionary containing word-by-word correspondences and fixed translation phrases for English word order. These considerations seem applicable to HPO localization into other languages.

A Method for Identifying Splice Sites and Translation Start Sites in Human Genomic Sequences

  • Kim, Ki-Bong;Park, Kie-Jung;Kong, Eun-Bae
    • BMB Reports
    • /
    • 제35권5호
    • /
    • pp.513-517
    • /
    • 2002
  • We describe a new method for identifying the sequences that signal the start of translation, and the boundaries between exons and introns (donor and acceptor sites) in human mRNA. According to the mandatory keyword, ORGANISM, and feature key, CDS, a large set of standard data for each signal site was extracted from the ASCII flat file, gbpri.seq, in the GenBank release 108.0. This was used to generate the scoring matrices, which summarize the sequence information for each signal site. The scoring matrices take into account the independent nucleotide frequencies between adjacent bases in each position within the signal site regions, and the relative weight on each nucleotide in proportion to their probabilities in the known signal sites. Using a scoring scheme that is based on the nucleotide scoring matrices, the method has great sensitivity and specificity when used to locate signals in uncharacterized human genomic DNA. These matrices are especially effective at distinguishing true and false sites.

Communicating clinical research to reduce cancer risk through diet: Walnuts as a case example

  • Toner, Cheryl D.
    • Nutrition Research and Practice
    • /
    • 제8권4호
    • /
    • pp.347-351
    • /
    • 2014
  • Inflammation is one mechanism through which cancer is initiated and progresses, and is implicated in the etiology of other conditions that affect cancer risk and prognosis, such as type 2 diabetes, cardiovascular disease, and visceral obesity. Emerging human evidence, primarily epidemiological, suggests that walnuts impact risk of these chronic diseases via inflammation. The published literature documents associations between walnut consumption and reduced risk of cancer, and mortality from cancer, diabetes, and cardiovascular disease, particularly within the context of the Mediterranean Diet. While encouraging, follow-up in human intervention trials is needed to better elucidate any potential cancer prevention effect of walnuts, per se. In humans, the far-reaching positive effects of a plant-based diet that includes walnuts may be the most critical message for the public. Indeed, appropriate translation of nutrition research is essential for facilitating healthful consumer dietary behavior. This paper will explore the translation and application of human evidence regarding connections with cancer and biomarkers of inflammation to the development of dietary guidance for the public and individualized dietary advice. Strategies for encouraging dietary patterns that may reduce cancer risk will be explored.

병렬 말뭉치 필터링을 적용한 Filter-mBART기반 기계번역 연구 (Filter-mBART Based Neural Machine Translation Using Parallel Corpus Filtering)

  • 문현석;박찬준;어수경;박정배;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-7
    • /
    • 2021
  • 최신 기계번역 연구 동향을 살펴보면 대용량의 단일말뭉치를 통해 모델의 사전학습을 거친 후 병렬 말뭉치로 미세조정을 진행한다. 많은 연구에서 사전학습 단계에 이용되는 데이터의 양을 늘리는 추세이나, 기계번역 성능 향상을 위해 반드시 데이터의 양을 늘려야 한다고는 보기 어렵다. 본 연구에서는 병렬 말뭉치 필터링을 활용한 mBART 모델 기반의 실험을 통해, 더 적은 양의 데이터라도 고품질의 데이터라면 더 좋은 기계번역 성능을 낼 수 있음을 보인다. 실험결과 병렬 말뭉치 필터링을 거친 사전학습모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 본 실험결과를 통해 데이터의 양보다 데이터의 질을 고려하는 것이 중요함을 보이고, 해당 프로세스를 통해 추후 말뭉치 구축에 있어 하나의 가이드라인으로 활용될 수 있음을 보였다.