• 제목/요약/키워드: 유사언어 활용 훈련

검색결과 11건 처리시간 0.018초

유사언어 활용 훈련이 오디오북 텍스트 형상화에 미치는 영향 연구 - 교수자의 우호적 행동을 매개변수로 - (The Effects of Paralanguage Utilization Training for Audiobook Text Shaping - Professor's Friendly Behavior as a Parameters -)

  • 조예신
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권2호
    • /
    • pp.141-153
    • /
    • 2020
  • 본 연구의 목적은 발음, 강세, 목소리의 톤, 속도, 휴지(Pause), 감정표현 등 유사언어 활용 훈련이 오디오북 텍스트 형상화에 영향을 미치는 과정에서 교수자의 우호적 행동의 매개역할 관계를 알아보고자 함에 있다. 본 연구결과는 오디오북 텍스트의 동적(動的)형상화를 위한 유사언어 활용 훈련과 매개변수인 교수자의 우호적 행동에 대한 필요성과 영향력을 인식하는 참고자료가 될 것이다. 연구의 결과는 다음과 같다. 첫째, 유사언어 활용 훈련은 오디오북 텍스트 형상화에 긍정적인 영향을 미치는 것으로 나타났으며 텍스트 본래의 의미를 전달하는 핵심 요인으로 작용하였다. 이에 따라 유사언어 활용 훈련의 의의와 내용을 살펴보고 유사언어 활용 훈련을 지속한다면 오디오북 텍스트 형상화에 도움이 될 것이다. 둘째, 교수자의 우호적 행동은 유사언어의 활용 훈련과 오디오북 텍스트 형상화 간에 부분 매개역할을 하였다. 교수자의 우호적 행동은 훈련생에게 호의와 신뢰를 갖게 하여 유사언어 활용 훈련에 도움을 주었으며 오디오북 텍스트 형상화에 대한 완성도를 높일 것이다. 따라서 유사언어 활용 훈련은 교수자의 우호적 행동과 함께 이루어질 때 오디오북 텍스트 형상화에 보다 효과적이라는 결과를 도출할 수 있었다.

오디오북 텍스트 형상화를 위한 공감각적 음성 훈련 연구 - 유사언어를 활용하여 - (Audiobook Text Shaping for Synesthesia Voice Training - Focusing on Paralanguages -)

  • 조예신;최재오
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권8호
    • /
    • pp.167-180
    • /
    • 2019
  • 본 연구는 오디오북 텍스트 형상화를 위해 유사언어를 활용하여 공감각적 음성 훈련 성과를 알아보려는 것에 그 목적이 있다. 훈련을 위한 오디오북 텍스트는 톨스토이의 <사람은 무엇으로 사는가> 작품을 이용하였고 음색, 톤, 포즈, 속도, 억양, 강세, 감정표현의 유사언어를 활용하였으며, H 도서관 시각장애인 교육생 10명을 연구 참여자로 선정해 질적 분석을 하였다. 본 연구에서 제기한 연구문제를 토대로 연구한 결과는 다음과 같다. 첫째, 오디오 북 텍스트 형상화를 위한 음성훈련에서 오감의 두 개 감각 이상이 동시에 작용하는 공감각적 음성 훈련은 화자에게 텍스트가 갖고 있는 본래의 목적과 의미, 배경 등의 시각화를 형상화하면서 결과물을 창출하였다. 둘째, 유사언어의 활용은 오디오북 텍스트 형상화를 위한 문장과 대사의 의미 전달을 표현하는 전 과정에서 도움이 되었다. 또한 연구대상자마다 조금의 차이는 있었지만 톤, 포즈, 억양이 중요하다고 생각하는 공통점을 발견할 수 있었다. 셋째, 시각장애인은 감각적인 면과 기억력이 발달되어 있어 훈련과정에서 대사 습득과 전달 수용정도가 빨랐다. 또한 훈련과정에서 교사의 우호적 행동이 매우 중요한 핵심적 매개 작용을 하면서 이들의 적극적인 참여로 많은 발전을 하여 훌륭한 결과를 도출하였다.

복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크 (Controllable data augmentation framework based on multiple large-scale language models)

  • 강현석;남궁혁;정지수;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

언어적 특징을 반영한 한국어 프레임넷 확장 및 개선 (Expansion and Improvement of Korean FrameNet utilizing linguistic features)

  • 김정욱;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

유사도 기반 이미지 캡션을 이용한 시각질의응답 연구 (Using similarity based image caption to aid visual question answering)

  • 강준서;임창원
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.191-204
    • /
    • 2021
  • 시각질의응답과 이미지 캡셔닝은 이미지의 특징과 문장의 언어적인 특징을 이해하는 것을 요구하는 작업이다. 따라서 두 가지 작업 모두 이미지와 텍스트를 연결해 줄 수 있는 공동 어텐션이 핵심이라고 할 수 있다. 본 논문에서는 MSCOCO 데이터 셋에 대하여 사전 훈련된 transformer 모델을 이용 하여 캡션을 생성한 후 이를 활용해 시각질의응답의 성능을 높이는 모델을 제안하고자 한다. 이때 질 문과 관계없는 캡션은 오히려 시각질의응답에서 답을 맞히는데 방해가 될 수 있기 때문에 질문과의 유사도를 기반으로 질문과 유사한 일부의 캡션을 활용하도록 하였다. 또한 캡션에서 불용어는 답을 맞히는데 영향을 주지 못하거나 방해가 될 수 있기 때문에 제거한 후에 실험을 진행하였다. 기존 시 각질의응답에서 이미지와 텍스트간의 공동 어텐션을 활용하여 좋은 성능을 보였던 deep modular co-attention network (MCAN)과 유사도 기반의 선별된 캡션을 사용하여 VQA-v2 데이터에 대하여 실험을 진행하였다. 그 결과 기존의 MCAN모델과 비교하여 유사도 기반으로 선별된 캡션을 활용했을 때 성능 향상을 확인하였다.

SERADE : 섹션 표현 기반 문서 임베딩 모델을 활용한 긴 문서 검색 성능 개선 (SERADE: Section Representation Aggregation Retrieval for Long Document Ranking)

  • 정혜인;전현규;김지윤;이찬형;김봉수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.135-140
    • /
    • 2022
  • 최근 Document Retrieval을 비롯한 대부분의 자연어처리 분야에서는 BERT와 같이 self-attention을 기반으로 한 사전훈련 모델을 활용하여 SOTA(state-of-the-art)를 이루고 있다. 그러나 self-attention 메커니즘은 입력 텍스트 길이의 제곱에 비례하여 계산 복잡도가 증가하기 때문에, 해당 모델들은 선천적으로 입력 텍스트의 길이가 제한되는 한계점을 지닌다. Document Retrieval 분야에서는, 문서를 특정 토큰 길이 단위의 문단으로 나누어 각 문단의 유사 점수 또는 표현 벡터를 추출한 후 집계함으로서 길이 제한 문제를 해결하는 방법론이 하나의 주류를 이루고 있다. 그러나 논문, 특허와 같이 섹션 형식(초록, 결론 등)을 갖는 문서의 경우, 섹션 유형에 따라 고유한 정보 특성을 지닌다. 따라서 문서를 단순히 특정 길이의 문단으로 나누어 학습하는 PARADE와 같은 기존 방법론은 각 섹션이 지닌 특성을 반영하지 못한다는 한계점을 지닌다. 본 논문에서는 섹션 유형에 대한 정보를 포함하는 문단 표현을 학습한 후, 트랜스포머 인코더를 사용하여 집계함으로서, 결과적으로 섹션의 특징과 상호 정보를 학습할 수 있도록 하는 SERADE 모델을 제안하고자 한다. 실험 결과, PARADE-Transformer 모델과 비교하여 평균 3.8%의 성능 향상을 기록하였다.

  • PDF

유도무기체계 RAM분석을 위한 ILS M&S 설계 (Design of ILS M&S for RAM Analysis in Guided Weapon System)

  • 이용빈;이동욱;이주형;엄천섭;박장원
    • 한국시뮬레이션학회논문지
    • /
    • 제24권2호
    • /
    • pp.19-29
    • /
    • 2015
  • 국방분야에서 M&S 기법은 분석, 훈련, 획득 등 다양한 목적으로 활용되고 있으며 그 중요성은 더욱 증가하고 있다. 무기체계의 종합군수지원(ILS)요소 개발을 위한 RAM분석 시 M&S 기법을 활용하면 수리적인 기법만으로는 분석하기 어려운 시스템의 다양한 변수와 제약사항을 고려한 분석이 가능하다. 무기체계의 RAM분석을 위한 ILS M&S도구를 설계하기 위해서는 M&S의 목적 설정, 무기체계의 특성 및 유사 M&S Tool 기능 분석 등의 활동이 선행되어야 하며 이를 바탕으로 실제 현실을 프로그램으로 구현하기 용이한 형태의 수학적, 논리적 언어로 모델링해야 한다. 본 논문에서는 'OO유도무기체계'의 배치부터 폐기 시까지 발생하는 운용, 저장, 점검, 고장발생, 정비 등 제반 군수지원활동을 모의하여 유도무기체계의 수명주기 동안의 RAM 특성을 예측, 분석할 수 있는 M&S 도구의 모델링 과정을 제시하고자 하며 이는 유사 M&S 도구의 개발 시 참고자료로도 활용 가능할 것이다.

자연어 처리 모델을 활용한 블록 코드 생성 및 추천 모델 개발 (Development of Block-based Code Generation and Recommendation Model Using Natural Language Processing Model)

  • 전인성;송기상
    • 정보교육학회논문지
    • /
    • 제26권3호
    • /
    • pp.197-207
    • /
    • 2022
  • 본 논문에서는 코딩 학습 중 학습자의 인지 부하 감소를 목적으로 자연어 처리 모델을 이용하여 전이학습 및 미세조정을 통해 블록 프로그래밍 환경에서 이미 이루어진 학습자의 블록을 학습하여 학습자에게 다음 단계에서 선택 가능한 블록을 생성하고 추천해 주는 머신러닝 기반 블록 코드 생성 및 추천 모델을 개발하였다. 모델 개발을 위해 훈련용 데이터셋은 블록 프로그래밍 언어인 '엔트리' 사이트의 인기 프로젝트 50개의 블록 코드를 전처리하여 제작하였으며, 훈련 데이터셋과 검증 데이터셋 및 테스트 데이터셋으로 나누어 LSTM, Seq2Seq, GPT-2 모델을 기반으로 블록 코드를 생성하는 모델을 개발하였다. 개발된 모델의 성능 평가 결과, GPT-2가 LSTM과 Seq2Seq 모델보다 문장의 유사도를 측정하는 BLEU와 ROUGE 지표에서 더 높은 성능을 보였다. GPT-2 모델을 통해 실제 생성된 데이터를 확인한 결과 블록의 개수가 1개 또는 17개인 경우를 제외하면 BLEU와 ROUGE 점수에서 비교적 유사한 성능을 내는 것을 알 수 있었다.

GPU를 이용한 야간 보행자 검출과 추적 시스템 구현 (Implementation of Pedestrian Detection and Tracking with GPU at Night-time)

  • 최범준;윤병우;송종관;박장식
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.421-429
    • /
    • 2015
  • 이 논문은 적외선 영상을 이용하여 보행자를 검출하고 추적하는 방법에 관한 것이다. 영상기반 보행 검출 및 추적 처리 속도를 개선하기 위하여 병렬처리언어인 CUDA(Computer Unified Device Architecture)를 활용한다. 보행자 검출은 하르 유사 특징을 기반으로 Adaboost 알고리즘을 적용한다. Adaboost 분류는 적외선 영상으로 제작한 데이터셋을 이용하여 훈련한다. Adaboost 분류기로 보행자를 검출한 후, HSV 히스토그램을 특징점으로 파티클 필터를 이용하여 보행자를 추적하는 방법을 제안한다. 제안하는 검출 및 추적 방법을 Linux 환경에서 소프트웨어를 개발할 수 있는 NVIDIA의 Jetson TK1 개발보드 상에 구현하였다. 이 논문에서는 보행자 검출 및 추적을 CUDA 개발환경인 GPU를 이용하여 병렬처리한 결과를 나타내었다. GPU를 이용한 보행자 검출과 추적 처리 속도가 CPU 처리속도에 비하여 약 6 배 빠른 것을 확인할 수 있다.