• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.03초

CNN Sequence-to-Sequence를 이용한 대화 시스템 생성 (A Dialogue System using CNN Sequence-to-Sequence)

  • 성수진;신창욱;박성재;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.151-154
    • /
    • 2018
  • 본 논문에서는 CNN Seq2Seq 구조를 이용해 한국어 대화 시스템을 개발하였다. 기존 Seq2Seq는 RNN 혹은 그 변형 네트워크에 데이터를 입력하고, 입력이 완료된 후의 은닉 층의 embedding에 기반해 출력열을 생성한다. 우리는 CNN Seq2Seq로 입력된 발화에 대해 출력 발화를 생성하는 대화 모델을 학습하였고, 그 성능을 측정하였다. CNN에 대해서는 약 12만 발화 쌍을 이용하여 학습하고 1만 발화 쌍으로 실험하였다. 평가 결과 제안 모델이 기존의 RNN 기반 모델에 비해 우수한 결과를 보였다.

  • PDF

시퀀스 다이어그램으로부터 테스트 케이스 자동 생성을 위한 M2M(Model-to-Model) 변환 규칙 (M2M Transformation Rules for Automatic Test Case Generation from Sequence Diagram)

  • 김진아;김수지;서용진;천은영;김현수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권1호
    • /
    • pp.32-37
    • /
    • 2016
  • 시퀀스 다이어그램에 대한 모델 기반 테스트를 수행하기 위하여 시퀀스 다이어그램으로부터 테스트 케이스를 자동으로 생성해야 한다. 이를 위해서는 시퀀스 다이어그램이 나타내는 시나리오를 파악하고 테스트 커버리지를 만족하는 경로를 추출하여 테스트 정보를 생성해야 한다. 하지만 시퀀스 다이어그램은 결합 조각을 사용하여 반복 및 조건, 대안 정보를 나타내므로 시퀀스 다이어그램으로부터 테스트 케이스를 자동으로 생성하는 것은 복잡하다. 이러한 문제를 해결하기 위하여 본 논문에서는 시퀀스 다이어그램으로부터 액티비티 다이어그램으로 변환을 수행하는 모델 변환 프로세스를 정의하고, 이를 통해 시퀀스 다이어그램의 시나리오를 제어 흐름 형태로 표현하고 여기에 테스트 커버리지를 적용하여 테스트 케이스를 생성하는 과정을 정의한다. 마지막으로, 사례 연구를 통하여 시퀀스 다이어그램으로부터 테스트 케이스를 생성하는 과정을 보인다.

고음질 디지털 오디오 워터마킹을 위한 효율적인 PN 시퀸스 삽입 및 검출 방법 (An Efficient PN Sequence Embedding and Detection Method for High Quality Digital Audio Watermarking)

  • 김현욱;오현오;김연정;윤대희
    • 방송공학회논문지
    • /
    • 제6권1호
    • /
    • pp.21-31
    • /
    • 2001
  • PN 시퀸스를 삽입하는 오디오 워터마킹은 들리지 않으면서도 강인한 워터마크를 만들기 위해 심리음향모델을 사용하여 PN 시퀸스를 변형시킨다. 하지만 워터마크를 삽입하는 모든 프레임에 대해 심리음향모델을 계산하기 위해서는 부호화 과정이 매우 복잡해지는 문제가 있다 부호화기에서 심리음향모델의 역할을 대신 하도록 만든 고정필터로 PN 시퀸스를 변형하면 훨씬 간단하 면서도 효율적인 워터마킹 시스템이 가능해진다. 본 논문에서는 고정된 지각필터를 도입한 효율적인 워터마킹 시스템을 제안한다. 심리음향모델을 대체하는 고정필터를 사용함으로써 PN 시퀸스를 들리지 않게 만들어주고 따라서 강인한 워터마크를 삽입할 수가 있다. 이와 함께 복호화기에서는 PN 시퀸스를 매칭시켜 상관도를 높여주는 보상필터 구조를 제안하여 원신호를 사용하지 않는 복호화기의 복호화 성능을 향상시켰다.

  • PDF

Error Correction for Korean Speech Recognition using a LSTM-based Sequence-to-Sequence Model

  • Jin, Hye-won;Lee, A-Hyeon;Chae, Ye-Jin;Park, Su-Hyun;Kang, Yu-Jin;Lee, Soowon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.1-7
    • /
    • 2021
  • 현재 대부분의 음성인식 오류 교정에 관한 연구는 영어를 기준으로 연구되어 한국어 음성인식에 대한 연구는 미비한 실정이다. 하지만 영어 음성인식에 비해 한국어 음성인식은 한국어의 언어적인 특성으로 인해 된소리, 연음 등의 발음이 있어, 비교적 많은 오류를 보이므로 한국어 음성인식에 대한 연구가 필요하다. 또한, 기존의 한국어 음성인식 연구는 주로 편집 거리 알고리즘과 음절 복원 규칙을 사용하기 때문에, 된소리와 연음의 오류 유형을 교정하기 어렵다. 본 연구에서는 된소리, 연음 등 발음으로 인한 한국어 음성인식 오류를 교정하기 위하여 LSTM을 기반으로 한 인공 신경망 모델 Sequence-to-Sequence와 Bahdanau Attention을 결합하는 문맥 기반 음성인식 후처리 모델을 제안한다. 실험 결과, 해당 모델을 사용함으로써 음성인식 성능은 된소리의 경우 64%에서 77%, 연음의 경우 74%에서 90%, 평균 69%에서 84%로 인식률이 향상되었다. 이를 바탕으로 음성인식을 기반으로 한 실제 응용 프로그램에도 본 연구에서 제안한 모델을 적용할 수 있다고 사료된다.

Attention 기법을 적용한 LSTM-s2s 모델 기반 댐유입량 예측 연구 (Prediction of dam inflow based on LSTM-s2s model using luong attention)

  • 이종혁;최수연;김연주
    • 한국수자원학회논문집
    • /
    • 제55권7호
    • /
    • pp.495-504
    • /
    • 2022
  • 최근 인공지능의 발전으로 시계열 자료 분석에 효과적인 Long Short-Term Memory (LSTM) 모델이 댐유입량 예측의 정확도를 높이는 데 활용되고 있다. 본 연구에서는 그 중 LSTM의 성능을 더욱 향상할 수 있는 Sequence-to-Sequence (s2s) 구조에 Attention 기법을 LSTM 모델에 첨가하여 소양강댐 유역의 유입량을 예측하였다. 분석 데이터는 2013년부터 2020년까지의 유입량 시자료와 종관기상관측기온 및 강수량 자료를 학습, 검증, 평가로 나누어 훈련한 후, 모델의 성능 평가를 진행하였다. 분석 결과, LSTM-s2s 모델보다 attention까지 첨가한 모델이 일반적으로 더 좋은 성능을 보였으며, attention 첨가 모델이 첨두값도 더 잘 예측하는 모습을 보였다. 그리고 두 모델 모두 첨두값 발생 동안 유량 패턴을 잘 반영하였지만 세밀한 시간 단위 변화량에는 어려움이 있었다. 이를 통해 시간 단위 예측의 어려움에도 불구하고, LSTM-s2s에 attention까지 첨가한 모델이 기존 LSTM-s2s의 예측 성능을 향상할 수 있음을 알 수 있었다.

Copy Mechanism과 Input Feeding을 이용한 End-to-End 한국어 문서요약 (End-to-end Document Summarization using Copy Mechanism and Input Feeding)

  • 최경호;이창기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.56-61
    • /
    • 2016
  • 본 논문에서는 Sequence-to-sequence 모델을 생성요약의 방법으로 한국어 문서요약에 적용하였으며, copy mechanism과 input feeding을 적용한 RNN search 모델을 사용하여 시스템의 성능을 높였다. 인터넷 신문기사를 수집하여 구축한 한국어 문서요약 데이터 셋(train set 30291 문서, development set 3786 문서, test set 3705문서)으로 실험한 결과, input feeding과 copy mechanism을 포함한 모델이 형태소 기준으로 ROUGE-1 35.92, ROUGE-2 15.37, ROUGE-L 29.45로 가장 높은 성능을 보였다.

  • PDF

자연어 처리 모델을 활용한 퍼징 시드 생성 기법 (A Fuzzing Seed Generation Technique Using Natural Language Processing Model)

  • 김동영;전상훈;류민수;김휘강
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.417-437
    • /
    • 2022
  • Fuzzing에서 seed corpus의 품질은 취약점을 보다 빠르게 찾기 위해서 중요한 요소 중 하나라고 할 수 있다. 이에 dynamic taint analysis와 symbolic execution 기법 등을 활용하여 효율적인 seed corpus를 생성하는 연구들이 진행되어왔으나, 높은 전문 지식이 요구되고, 낮은 coverage로 인해 광범위한 활용에 제약이 있었다. 이에 본 논문에서는 자연어 처리 모델인 Sequence-to-Sequence 모델을 기반으로 seed corpus를 생성하는 DDRFuzz 시스템을 제안한다. 본 논문에서 제안하는 시스템은 멀티미디어 파일을 입력값으로 하는 5개의 오픈소스 프로젝트를 대상으로 관련 연구들과 비교하여 효과를 검증하였다. 실험 결과, DDRFuzz가 coverage와 crash count 측면에서 가장 뛰어난 성능을 나타냄을 확인할 수 있었고, 또한 신규 취약점을 포함하여 총 3개의 취약점을 탐지하였다.

시나리오 기반 명세 모델로부터 반응형 시스템 모델 개발 (Developing a Reactive System Model from a Scenario-Based Specification Model)

  • 권령구;권기현
    • 인터넷정보학회논문지
    • /
    • 제13권1호
    • /
    • pp.99-106
    • /
    • 2012
  • 다수의 오브젝트로 구성된 반응형 시스템을 모델링 하거나 디자인하기 위해 외부의 입력 및 오브젝트들간의 상호작용을 분석하는 것은 중요하고 어려운 문제이다. 또한, 반응형 시스템이 요구 사항들을 모든 가능한 환경 하에서 올바르게 만족하는지를 확인하는 것은 많은 노력이 필요하다. 본 논문에서는 요구 사항들을 기존에 다양한 분야에서 사용되는 시나리오 명세 언어인 MSC(Message Sequence Chart)에 대해 구문 및 의미를 확장한 LSC(Live Sequence Chart)를 이용하여 반응형 시스템에 적합한 시나리오 기반 명세 모델을 만든다. 그리고 LTL Synthesis를 통해 각 오브젝트에 대하여 모든 요구 사항을 올바르게 만족하는 반응형 시스템 모델을 자동으로 생성한다. 마지막으로 생성된 반응형 시스템 모델로부터 의미적으로 동일한 코드로 변환하는 과정을 반복함으로써 전체 반응형 시스템을 개발하는 방법을 제안한다.

무선 네트워크에서 시퀀스-투-시퀀스 기반 모바일 궤적 예측 모델 (Sequence-to-Sequence based Mobile Trajectory Prediction Model in Wireless Network)

  • ;양희규;;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.517-519
    • /
    • 2022
  • In 5G network environment, proactive mobility management is essential as 5G mobile networks provide new services with ultra-low latency through dense deployment of small cells. The importance of a system that actively controls device handover is emerging and it is essential to predict mobile trajectory during handover. Sequence-to-sequence model is a kind of deep learning model where it converts sequences from one domain to sequences in another domain, and mainly used in natural language processing. In this paper, we developed a system for predicting mobile trajectory in a wireless network environment using sequence-to-sequence model. Handover speed can be increased by utilize our sequence-to-sequence model in actual mobile network environment.

Sequence dicriminative training 기법을 사용한 트랜스포머 기반 음향 모델 성능 향상 (Improving transformer-based acoustic model performance using sequence discriminative training)

  • 이채원;장준혁
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.335-341
    • /
    • 2022
  • 본 논문에서는 기존 자연어 처리 분야에서 뛰어난 성능을 보이는 트랜스포머를 하이브리드 음성인식에서의 음향모델로 사용하였다. 트랜스포머 음향모델은 attention 구조를 사용하여 시계열 데이터를 처리하며 연산량이 낮으면서 높은 성능을 보인다. 본 논문은 이러한 트랜스포머 AM에 기존 DNN-HMM 모델에서 사용하는 가중 유한 상태 전이기(weighted Finite-State Transducer, wFST) 기반 학습인 시퀀스 분류 학습의 네 가지 알고리즘을 각각 적용하여 성능을 높이는 방법을 제안한다. 또한 기존 Cross Entropy(CE)를 사용한 학습방식과 비교하여 5 %의 상대적 word error rate(WER) 감소율을 보였다.