• 제목/요약/키워드: language translation

검색결과 561건 처리시간 0.031초

Optimized Chinese Pronunciation Prediction by Component-Based Statistical Machine Translation

  • Zhu, Shunle
    • Journal of Information Processing Systems
    • /
    • 제17권1호
    • /
    • pp.203-212
    • /
    • 2021
  • To eliminate ambiguities in the existing methods to simplify Chinese pronunciation learning, we propose a model that can predict the pronunciation of Chinese characters automatically. The proposed model relies on a statistical machine translation (SMT) framework. In particular, we consider the components of Chinese characters as the basic unit and consider the pronunciation prediction as a machine translation procedure (the component sequence as a source sentence, the pronunciation, pinyin, as a target sentence). In addition to traditional features such as the bidirectional word translation and the n-gram language model, we also implement a component similarity feature to overcome some typos during practical use. We incorporate these features into a log-linear model. The experimental results show that our approach significantly outperforms other baseline models.

한글문장-수화 번역기를 위한 사전구성 (A construction of dictionary for Korean Text to Sign Language Translation)

  • 권경혁;민홍기
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 추계종합학술대회 논문집
    • /
    • pp.841-844
    • /
    • 1998
  • Korean Text to Sign Language Traslator could be applied to learn letters for both the deaf and hard-of-hearing people, and to have a conversation with normal people. This paper describes some useful dictionaries for developing korean text to sign language translator; Base sign language dictionary, Compound sign language dictionary, and Resemble sign language dictionary. As korean sign language is composed entirely of about 6,000 words, the additional dictionaries are required for matching them to korean written language. We design base sign language dictionary which was composed of basic symbols and moving picture of korean sign language, and propose the definition of compound isng language dictionary which was composed of symbols of base sing language. In addition, resemble sign language dictionary offer sign symbols and letters which is used same meaning in conversation. By using these methods, we could search quickly sign language during korean text to sign language translating process, and save storage space. We could also solve the lack of sign language words by using them, which are appeared on translating process.

  • PDF

Syntactic Verifier as a Filter to Compound Unit Recognizer

  • Jung, Han- Min;Yuh, Sang-Hwa;Kim, Tae-Wan;Park, Dong-In
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 1998년도 Language, Information and Computation = Selected Papers from the 12th Pacific Asia Conference on Language, Information and Computation, Singapore
    • /
    • pp.303-309
    • /
    • 1998
  • PDF

실시간 영/한 번역을 위한 트랜스퍼 어휘 사전 (A Design of Transfer Lexicon Dictionary For English to Korean Translation)

  • 이대진
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.11-27
    • /
    • 1991
  • 본 연구는 자연어의 실시간 기체 번역의 설계에 관한 것으로 반도체 메모리에 트랜스퍼 방식의 어휘 사전을 구성하고 어휘 정보 문법을 기본으로한다.

  • PDF

키넥트의 모션 인식 기능을 이용한 수화번역 시스템 개발 (Development of Sign Language Translation System using Motion Recognition of Kinect)

  • 이현석;김승필;정완영
    • 융합신호처리학회논문지
    • /
    • 제14권4호
    • /
    • pp.235-242
    • /
    • 2013
  • 청각, 언어장애인과 수화를 모르는 일반인과의 대화를 위해, 키넥트를 이용한 모션 인식을 통해 수화를 번역하여 주는 시스템을 개발하였다. 키넥트의 주요기능을 이용하여 수화를 번역하는 알고리즘들을 설계하고, 다양한 수화자에 대한 수화번역의 정확도를 높이기 위한 방법으로서 길이정규화와 팔꿈치정규화의 두 가지 정규화 방법을 사용하였다. 그리고 이러한 정규화 방법이 효과적인지 알아보기 위해서 실제 수화데이터를 차트로 비교하였다. 또한 10개의 데이터베이스를 입력하여 간단한 수화부터 복잡한 수화까지 직접 실시하고, 이를 키넥트로 인식하여 번역을 해봄으로서 프로그램의 정확도를 검증하였다. 추가적으로 다양한 체형의 수화자를 인식시켜 프로그램을 실행 시켜봄으로서 체형에 따른 오차 값의 보완을 완료하여 수화번역에 대한 신뢰도를 높였다.

영어 교실의 문학 텍스트 -영어교육의 통합적 접근 (Literary Texts in the English Classroom: An Integrated Approach to English Instruction)

  • 강규한
    • 영어영문학
    • /
    • 제55권1호
    • /
    • pp.107-128
    • /
    • 2009
  • Literature had been at center-stage in the traditional grammar-translation-focused English classrooms up to the mid-twentieth century. As the Audiolingual Method and the Communicative Language Teaching have gained popularity in the English classrooms, however, literature has receded into the background of English education. The main reasons for using literary texts in the English classrooms for communication-focused English instruction need to be examined. First of all, students can come in touch with the subtle and varied uses of language through literature-based teaching. They also feel close to certain characters in the literary work and share the emotional reponses with them. They get personally involved in the plot of the story. Universal human experience and cultural enrichment are two other merits which can be conferred on students by literary texts. Such linguistic and literary experiences can be significantly integrated into the literature-based instruction. More significantly, the four language skills (reading, writing, listening and speaking) can be combined with one another and integrated into a literature-focused curriculum for English education. The value of literary texts in the English classrooms can be clearly demonstrated by effective ways of using such texts as Charlotte's Web for integrated instruction. The full array of benefits that literature can bring to English instruction, however, has yet to be fully realized. These potentials need to be materialized into classroom practice.

Anglicisms in the Field of Information Technology: Analysis of Linguistic Features

  • Antonina, Plechko;Tetiana, Chukhno;Tetiana, Nikolaieva;Liliia, Apolonova;Tetiana, Leleka
    • International Journal of Computer Science & Network Security
    • /
    • 제22권4호
    • /
    • pp.183-192
    • /
    • 2022
  • The role that English currently plays is undeniable. It has become the most common means of communication among native speakers of several languages around the world. English penetrates into all areas of people's daily lives. In the field of Information Technology (IT), English has taken a dominant position, as many of the terms used on a daily basis are written in English. The purpose of the article is to analyze the linguistic features of anglicisms in the field of Information Technology. Methods. The research is based on systematic and comparative analysis, dialectical method, as well as methods of classification and generalization. Results. This study presents the results of compiling a multilingual glossary with anglicisms used in the GitHub and 3D Slicer fields. Despite the limited number of terms included in the glossary, the article provides a lot of evidence for the influence of the English language in the areas of Information Technology, GitHub and 3D Slicer under consideration. The types of anglicisms used in the 3D Slicer area seem to be more diverse than in the GitHub area. This study found that five European languages use language strategies to solve any communication problem. The multilingual glossary showed that in some cases there is a coexistence between Anglicism and the native term. In other cases, the English term is the only one used in different languages. There are cases when only the native language is used. Conclusions. This study is a useful tool that helps to improve the efficiency of communication between engineers and technicians who speak different native languages. The ultimate goal of this research will be to create a multilingual glossary that is still under development and is likely to cover other IT areas such as Python and VTK.

한영 기계번역에서의 효율적인 구문분석과 번역을 위한 유한상태 변환기 기반 전처리기의 설계 및 구현 (Design and Implementation of Finite-State-Transducer Preprocessor for an Efficient Parsing and Translation in Korean-to-English Machine Translation)

  • 박준식;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.128-134
    • /
    • 1999
  • 기계번역이나 정보검색 등에 적용되는 자연언어처리기술에 있어서 구문분석은 매우 중요한 위치를 차지한다. 하지만, 문장의 길이가 증가함에 따라 구문분석의 복잡도는 크게 증가하게 된다. 이를 해결하기 위한 많은 노력 중에서 전처리기의 지원을 통해 구문분석기의 부담을 줄이려는 방법이 있다. 본 논문에서는 구문분석의 애매성과 복잡성을 감소시키기 위해 유한상태 변환기 (Finite-State-Transducer FSI)를 이용한 전처리기를 제안한다. 유한상태 변환기는 사전표현, 단어분할, 품사태깅 등에 널리 사용되어 왔는데, 본 논문에서는 유한상태 변환기를 이용하여 형태소 분석된 문장에서 시간표현 등의 제한된 표현들을 구문요소화하는 전처리기를 설계 및 구현하였다. 본 논문에서는 기계번역기에서의 구문분석기 뿐만 아니라 변환지식의 모듈화를 지원하기 위해 유한상태 변환기를 이용하여 시간표현 등의 부분적인 표현들을 번역하는 방법을 제안한다. 또한 유한상태 변환기의 편리한 작성을 위하여 유한상태 변환기 작성 지원도구를 구현하였다. 본 논문에서는 전처리기의 적용을 통해 구문분석기의 부담을 덜어 주며 기계번역기의 변환부분의 일부를 성공적으로 담당할 수 있음을 보여 준다.

  • PDF

가상세계 속에 보인 일본어의 가족 간의 문말 표현에 대해 - 교수매체로서의 문말의 정중체와 종조사 사용에 대해 (The Expression of Ending Sentence in Family Conversations in the Virtual Language - Focusing on Politeness and Sentence-final Particle with Instructional Media -)

  • 양정순
    • 비교문화연구
    • /
    • 제39권
    • /
    • pp.433-460
    • /
    • 2015
  • This paper was analyzed the politeness and the expression of ending sentence in family conversations in the virtual language of cartoon characters. Younger speakers have a tendency to unite sentence-final particle to the polite form, older speakers have a tendency to unite it to the plain form in the historical genre. But younger speakers and older speakers unite sentence-final particle to the plain form in other fiction genres. Using terms of respect is determined by circumstances and charactonym. Comparing the translation of conversations with the original, there were the different aspects of translated works. When Japanese instructors are used to study Japanese as the instructional media, they give a supplementary explanation to students. 'WA' 'KASIRA' that a female speaker usually uses are used by a male speaker, 'ZO' 'ZE' that a male speaker usually uses are used by a female speaker in the virtual language of cartoons. In the field of the translation, it is translated 'KANA' 'KASIRA' into 'KA?', 'WA' 'ZO' 'ZE' into 'A(EO)?', 'WAYO' 'ZEYO' into AYO(EOYO)'. When we use sentence-final particle in the virtual language of cartoon, we need to supply supplementary explanations and further examinations.

다시점 수어 데이터 획득 및 저장 시스템 설계 및 구현 (Design and Implementation of Data Acquisition and Storage Systems for Multi-view Points Sign Language)

  • 김근모;김봉재
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.63-68
    • /
    • 2022
  • 한국장애인개발원의 2021 장애통계연보 자료에 따르면 대한민국에 청각 장애를 가지고 있는 사람은 395,789명이 있다. 이러한 사람들이 청각 장애를 통해 많은 불편을 겪고 있고, 이를 해결하기 위해 수어 인식 및 번역에 관련된 많은 연구가 진행되고 있다. 수어 인식 및 번역 연구에서는 수어 데이터를 수집하는 것이 중요한 부분을 차지하고 있지만 한국어 수어 데이터는 전문적으로 수어를 사용하는 사람의 수가 많지 않아 많은 어려움이 있다. 또한 구축된 기존의 데이터들도 발화자의 정면에서 촬영된 수어 데이터가 대부분이다. 이와 같은 문제점을 해결하기 위해 본 연구에서는 하나의 시점이 아닌 다시점에서 수어 데이터를 실시간으로 수집하고 보다 활용 편의성이 높게 저장 및 관리할 수 있는 저장 시스템을 설계하고 구현하였다.