• 제목/요약/키워드: language translation

검색결과 561건 처리시간 0.025초

대한민국 정부의 코로나 19 브리핑을 기반으로 구축된 수어 데이터셋 연구 (Sign Language Dataset Built from S. Korean Government Briefing on COVID-19)

  • 심호현;성호렬;이승재;조현중
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권8호
    • /
    • pp.325-330
    • /
    • 2022
  • 본 논문은 한국 수어에 대하여 수어 인식, 수어 번역, 수어 영상 시분할과 같은 수어에 관한 딥러닝 연구를 위한 데이터셋의 수집 및 실험을 진행하였다. 수어 연구를 위한 어려움은 2가지로 볼 수 있다. 첫째, 손의 움직임과 손의 방향, 표정 등의 종합적인 정보를 가지는 수어의 특성에 따른 인식의 어려움이 있다. 둘째, 딥러닝 연구를 진행하기 위한 학습데이터의 절대적 부재이다. 현재 알려진 문장 단위의 한국 수어 데이터셋은 KETI 데이터셋이 유일하다. 해외의 수어 딥러닝 연구를 위한 데이터셋은 Isolated 수어와 Continuous 수어 두 가지로 분류되어 수집되며 시간이 지날수록 더 많은 양의 수어 데이터가 수집되고 있다. 하지만 이러한 해외의 수어 데이터셋도 방대한 데이터셋을 필요로 하는 딥러닝 연구를 위해서는 부족한 상황이다. 본 연구에서는 한국 수어 딥러닝 연구를 진행하기 위한 대규모의 한국어-수어 데이터셋을 수집을 시도하였으며 베이스라인 모델을 이용하여 수어 번역 모델의 성능 평가 실험을 진행하였다. 본 논문을 위해 수집된 데이터셋은 총 11,402개의 영상과 텍스트로 구성되었다. 이를 이용하여 학습을 진행할 베이스라인 모델로는 수어 번역 분야에서 SOTA의 성능을 가지고 있는 TSPNet 모델을 이용하였다. 본 논문의 실험에서 수집된 데이터셋에 대한 특성을 정량적으로 보이고, 베이스라인 모델의 실험 결과로는 BLEU-4 score 3.63을 보였다. 또한, 향후 연구에서 보다 정확하게 데이터셋을 수집할 수 있도록, 한국어-수어 데이터셋 수집에 있어서 고려할 점을 평가 결과에 대한 고찰로 제시한다.

한국어판 Balance Evaluation Systems Test의 번역 적합성 연구 (A Study of Translation Conformity on Korean Version of a Balance Evaluation Systems Test)

  • 전용진;김경모
    • 한국전문물리치료학회지
    • /
    • 제25권1호
    • /
    • pp.53-61
    • /
    • 2018
  • Background: The process of language translation, adaptation, and cross-cultural validation of tools for use in multiple countries requires the adoption of well-established, comprehensive, and rigorous methodological approaches. Back translation, which is the most recommended method, permits the detection of errors in the translation and the identification of words or phrases that cannot be accurately or literally translated. Objects: The aim of this study was to verify the content validity of a Korean version of a Balance Evaluation Systems test (BESTest) by using a back-translation method. Methods: This research was conducted in six steps: 1) translation of the BESTest into Korean, 2) evaluation of the translation conformity of Korean-translated BESTest, 3) evaluation of the degree of translation comprehension, 4) back translation of Korean BESTest, 5) evaluation of the technical and conceptual equivalence, and 6) completion of the Korean version of BESTest by the translation verification committee. Results: In this study, Korean version of the BESTest achieved a rating of more than 3 (moderate) for translation comprehension, and technical equivalence and conceptual equivalence of back translation were evaluated as 3 (moderate) or more. Conclusion: The Korean version of the BESTest has proven content validity and is an appropriate tool to measure balance function.

더 좋은 인코더 표현을 위한 뇌 동기화 모방 이중 번역 (Dual Translation Imitating Brain-To-Brain Coupling for Better Encoder Representations)

  • 최규현;김선훈;장헌석;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-338
    • /
    • 2019
  • 인코더-디코더(Encoder-decoder)는 현대 기계 번역(Machine translation)의 가장 기본이 되는 모델이다. 인코딩은 마치 인간의 뇌가 출발어(Source language) 문장을 읽고 이해를 하는 과정과 유사하고, 디코딩은 뇌가 이해한 의미를 상응하는 도착어(Target language) 문장으로 재구성하는 행위와 비슷하다. 그렇다면 벡터로 된 인코더 표현은 문장을 읽고 이해함으로써 변화된 뇌의 상태에 해당한다고 볼 수 있다. 사람이 어떤 문장을 잘 번역하기 위해서는 그 문장에 대한 이해가 뒷받침되어야 하는 것처럼, 기계 역시 원 문장이 가진 의미를 제대로 인코딩해야 향상된 성능의 번역이 가능할 것이다. 본 논문에서는 뇌과학에서 뇌 동기화(Brain-to-brain coupling)라 일컫는 현상을 모방해, 출발어와 도착어의 공통된 의미를 인코딩하여 기계 번역 성능 향상에 도움을 줄 수 있는 이중 번역 기법을 소개한다.

  • PDF

비디오 캡셔닝을 적용한 수어 번역 및 행동 인식을 적용한 수어 인식 (Sign language translation using video captioning and sign language recognition using action recognition)

  • 김기덕;이근후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.317-319
    • /
    • 2024
  • 본 논문에서는 비디오 캡셔닝 알고리즘을 적용한 수어 번역 및 행동 인식 알고리즘을 적용한 수어 인식 알고리즘을 제안한다. 본 논문에 사용된 비디오 캡셔닝 알고리즘으로 40개의 연속된 입력 데이터 프레임을 CNN 네트워크를 통해 임베딩 하고 트랜스포머의 입력으로 하여 문장을 출력하였다. 행동 인식 알고리즘은 랜덤 샘플링을 하여 한 영상에 40개의 인덱스에서 40개의 연속된 데이터에 CNN 네트워크를 통해 임베딩하고 GRU, 트랜스포머를 결합한 RNN 모델을 통해 인식 결과를 출력하였다. 수어 번역에서 BLEU-4의 경우 7.85, CIDEr는 53.12를 얻었고 수어 인식으로 96.26%의 인식 정확도를 얻었다.

  • PDF

프로그램 재사용을 통한 한/영 기계번역시스템의 구현에 관한 연구 (On Implementation of Korean-English Machine Translation System through Program Reuse)

  • 김형근;양기철;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.559-570
    • /
    • 1993
  • 본 논문에서는 범용 영어 생성기인 펜맨을 이용한 한/영 번역기에 대해 소개한다. 펜맨은 영어문장 생성기로서 그 입력 언어는 문장생성을 위해 특별히 고안된 문장계획언어이다. 문장계획언어는 문장을 생성하기 위한 다양한 구문적, 의미적인 사양들을 포함하고 있다. 본 연구에서 우리는 한국어 분석을 위해서 의존문법에 기반한 한국어 분석기를 사용하고, 영어의 생성을 위해서 펜맨을 사용한다. 그리고 한국어 해석의 결과인 문장의 의존구조를 펜맨의 입력인 문장계획언어로 변환하는 모듈을 작성하였다.

  • PDF

머신러닝과 립 모션을 활용한 지화 번역 시스템 구현에 관한 연구 (A Study on Finger Language Translation System using Machine Learning and Leap Motion)

  • 손다은;고형민;신행용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.552-554
    • /
    • 2019
  • 농아는 청각장애인과 언어장애인을 말하며 청각장애인과 언어장애인은 음성으로 의사소통하는 것에 어려움이 있기 때문에 수화나 구화 등을 이용하여 의사소통을 한다. 그러나 수화는 모든 사람들이 사용하는 통신 수단이 아니기 때문에 수화를 알지 못하는 사람과의 의사소통하는 데 있어 한계가 생길 수밖에 없다. 본 논문에서는 장애인과 비장애인이 어려움 없이 의사소통할 수 있는 수단으로 지화 번역 시스템을 제안하고 설계 및 구현하였다. 립 모션으로 지화를 인식하였고 인식률을 높이기 위해 머신 러닝 기술을 이용하여 지화 데이터를 스스로 학습시켰다. 구현 및 실험 결과를 통해 제안한 알고리즘 적용으로 인식률 개선이 이뤄졌음을 확인하였다.

Underspecified Japanese Semantics in a Machine Translation System

  • Gamback, Bjorn;Lieske, Christian;Mori, Yoshiki
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 1996년도 Language, Information and Computation = Selected Papers from the 11th Pacific Asia Conference on Language, Information and Computation, Seoul
    • /
    • pp.53-62
    • /
    • 1996
  • PDF