• 제목/요약/키워드: Sequence-to-sequence learning

검색결과 426건 처리시간 0.025초

Sequence dicriminative training 기법을 사용한 트랜스포머 기반 음향 모델 성능 향상 (Improving transformer-based acoustic model performance using sequence discriminative training)

  • 이채원;장준혁
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.335-341
    • /
    • 2022
  • 본 논문에서는 기존 자연어 처리 분야에서 뛰어난 성능을 보이는 트랜스포머를 하이브리드 음성인식에서의 음향모델로 사용하였다. 트랜스포머 음향모델은 attention 구조를 사용하여 시계열 데이터를 처리하며 연산량이 낮으면서 높은 성능을 보인다. 본 논문은 이러한 트랜스포머 AM에 기존 DNN-HMM 모델에서 사용하는 가중 유한 상태 전이기(weighted Finite-State Transducer, wFST) 기반 학습인 시퀀스 분류 학습의 네 가지 알고리즘을 각각 적용하여 성능을 높이는 방법을 제안한다. 또한 기존 Cross Entropy(CE)를 사용한 학습방식과 비교하여 5 %의 상대적 word error rate(WER) 감소율을 보였다.

혼합 시퀀스 커널을 이용한 조종사의 비동적 행위 모델링 (A Non-Kinetic Behavior Modeling for Pilots Using a Hybrid Sequence Kernel)

  • 최예림;전승욱;지철규;박종헌;신동민
    • 한국군사과학기술학회지
    • /
    • 제17권6호
    • /
    • pp.773-785
    • /
    • 2014
  • For decades, modeling of pilots has been intensively studied due to its advantages in reducing costs for training and enhancing safety of pilots. In particular, research for modeling of pilots' non-kinetic behaviors which refer to the decisions made by pilots is beneficial as the expertise of pilots can be inherent in the models. With the recent growth in the amount of combat logs accumulated, employing statistical learning methods for the modeling becomes possible. However, the combat logs consist of heterogeneous data that are not only continuous or discrete but also sequence independent or dependent, making it difficult to directly applying the learning methods without modifications. Therefore, in this paper, we present a kernel function named hybrid sequence kernel which addresses the problem by using multiple kernel learning methods. Based on the empirical experiments by using combat logs obtained from a simulator, the proposed kernel showed satisfactory results.

비지도 학습을 이용한 생체 모방 동작 인지 기반의 동작 순서 인식 (Bio-mimetic Recognition of Action Sequence using Unsupervised Learning)

  • 김진옥
    • 인터넷정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.9-20
    • /
    • 2014
  • 대상의 동작을 잘 예측하는 것은 사회적 상호작용과 의사결정 컨텍스트 이해의 핵심이다. 본 연구는 동작 인식 과정에서 인간 뇌 시각인지 과정을 모방한 방법으로 관절 동작의 동작 순서 패턴을 학습하는 컴퓨팅 모델을 제안하였다. 제안 방법의 핵심은 뇌에서 동작 인지 자극을 처리하는 신경생리학적 IT, MT, STS의 피질 기능과 특정 시각 신경 회로 네트워크 기능을 모방하여 비지도 방법으로 동작 순서를 학습한 후 동작을 예측, 인식하는 것이다. 실험을 통해 제안 모델이 어떻게 연속적으로 입력되는 비디오에서 의미있는 동작 스냅샷 뿐 아니라 중요한 동작 패턴을 자동으로 선택하는 지를 제시하였다. 이 핵심 움직임은 학습 네트워크가 정적 시점에서 정지 영상에 함축된 동작을 인식하는지를 증명하는데 이용하는 관절 자세이다. 또한 STS 피질 영역에서 어떻게 정지와 움직임 입력을 통합하는지를 모방하여 학습하고, 학습한 피드백 연결이 차후 동작의 입력 순서를 어떻게 예측하는지를 제시하였다. 네트워크 시뮬레이션을 통해 동작 인식에 대한 제안 모델의 우수성을 입증하였다.

평가의 시간 순서를 고려한 강화 학습 기반 협력적 여과 (A Reinforcement Learning Approach to Collaborative Filtering Considering Time-sequence of Ratings)

  • 이정규;오병화;양지훈
    • 정보처리학회논문지B
    • /
    • 제19B권1호
    • /
    • pp.31-36
    • /
    • 2012
  • 최근 사용자의 흥미에 맞는 아이템이나 서비스를 추천해 주는 추천 시스템에 대한 관심이 높아지고 있다. 최근 종료된 Netflix 경연대회(Netflix Prize)가 이 분야에 대한 연구자들의 연구 의욕을 고취시켰고, 특히 협력적 여과(Collaborative Filtering) 방법은 아이템의 종류에 상관없이 적용 가능한 범용성 때문에 활발히 연구되고 있다. 본 논문은 강화 학습을 이용해서 추천 시스템의 협력적 여과 문제를 푸는 방법을 제안한다. 강화 학습을 통해, 영화 평점 데이터에서 각 사용자가 평점을 매긴 순서에 따른 평점 간의 연관 관계를 학습하고자 하였다. 이를 위해 협력적 여과문제를 마르코프 결정 과정(Markov Decision Process)로 수학적으로 모델링하였고, 강화 학습의 가장 대표적인 알고리즘인 Q-learning을 사용해서 평가의 순서의 연관 관계를 학습하였다. 그리고 실제로 평가의 순서가 평가에 미치는 영향이 있음을 실험을 통해서 검증하였다.

Gated Recurrent Unit Architecture for Context-Aware Recommendations with improved Similarity Measures

  • Kala, K.U.;Nandhini, M.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.538-561
    • /
    • 2020
  • Recommender Systems (RecSys) have a major role in e-commerce for recommending products, which they may like for every user and thus improve their business aspects. Although many types of RecSyss are there in the research field, the state of the art RecSys has focused on finding the user similarity based on sequence (e.g. purchase history, movie-watching history) analyzing and prediction techniques like Recurrent Neural Network in Deep learning. That is RecSys has considered as a sequence prediction problem. However, evaluation of similarities among the customers is challenging while considering temporal aspects, context and multi-component ratings of the item-records in the customer sequences. For addressing this issue, we are proposing a Deep Learning based model which learns customer similarity directly from the sequence to sequence similarity as well as item to item similarity by considering all features of the item, contexts, and rating components using Dynamic Temporal Warping(DTW) distance measure for dynamic temporal matching and 2D-GRU (Two Dimensional-Gated Recurrent Unit) architecture. This will overcome the limitation of non-linearity in the time dimension while measuring the similarity, and the find patterns more accurately and speedily from temporal and spatial contexts. Experiment on the real world movie data set LDOS-CoMoDa demonstrates the efficacy and promising utility of the proposed personalized RecSys architecture.

Multiple Behavior s Learning and Prediction in Unknown Environment

  • Song, Wei;Cho, Kyung-Eun;Um, Ky-Hyun
    • 한국멀티미디어학회논문지
    • /
    • 제13권12호
    • /
    • pp.1820-1831
    • /
    • 2010
  • When interacting with unknown environments, an autonomous agent needs to decide which action or action order can result in a good state and determine the transition probability based on the current state and the action taken. The traditional multiple sequential learning model requires predefined probability of the states' transition. This paper proposes a multiple sequential learning and prediction system with definition of autonomous states to enhance the automatic performance of existing AI algorithms. In sequence learning process, the sensed states are classified into several group by a set of proposed motivation filters to reduce the learning computation. In prediction process, the learning agent makes a decision based on the estimation of each state's cost to get a high payoff from the given environment. The proposed learning and prediction algorithms heightens the automatic planning of the autonomous agent for interacting with the dynamic unknown environment. This model was tested in a virtual library.

생명의 연속성 개념에서 학습위계에 따른 수업효과에 관한 연구 (A Study on the Teaching Effect Based on the Learning Hierarchy in the "Life Continuity")

  • 김영신;정완호
    • 한국과학교육학회지
    • /
    • 제15권2호
    • /
    • pp.233-240
    • /
    • 1995
  • The purpose of the study is to certify the validity and effectiveness of the learning hierarchy and to define the effective teaching order in life continuity. To achieve this purpose, two experimental groups which were instructed varying the sequence of the instructional units. Teaching order based on the learning hierarchy was given to experimental group and descriptive order of current text was given to control group. The findings of the study are as follows: 1. Learning Hierarchy before learning had differ with order of the textbook, but hierarchy of both group has showed similar to the sequence of textbook, after learning. 2. The effect of learning hierarchy represented no significant different between control and experimental group.

  • PDF

Sequence-to-Sequence Model을 이용한 영어 발음 기호 자동 변환 (Automatic Conversion of English Pronunciation Using Sequence-to-Sequence Model)

  • 이공주;최용석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권5호
    • /
    • pp.267-278
    • /
    • 2017
  • 영어는 동일 철자의 발음이 매우 다양한 언어이기 때문에 사전에 기술되어 있는 단어의 발음기호를 읽어야만 정확한 발음을 알 수 있다. 영어 사전마다 사용하는 발음기호(phonetic alphabet) 시스템이 다르며 같은 단어에 대해 기술하고 있는 발음 역시 다르다. 본 연구에서는 최근 딥 러닝 분야에서 널리 사용되고 있는 sequence-to-sequence (seq2seq) model을 이용하여 사전마다 다른 발음을 자동으로 변환해 보고자 한다. 4가지 다른 종류의 사전에서 추출한 발음 데이터를 이용하여 모두 12개의 seq2seq model을 구현하였으며, 발음 자동 변환 모듈의 정확 일치율은 74.5% ~ 89.6%의 성능을 보였다. 본 연구의 주요 목적은 다음의 두 가지이다. 첫째 영어 발음기호 시스템과 각 사전의 발음 데이터 특성을 살펴보는 것이고, 둘째, 발음 정보의 자동 변환과 오류 분석을 통해 seq2seq model의 특성을 살펴보는 것이다.

Deep Learning-based Delinquent Taxpayer Prediction: A Scientific Administrative Approach

  • YongHyun Lee;Eunchan Kim
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.30-45
    • /
    • 2024
  • This study introduces an effective method for predicting individual local tax delinquencies using prevalent machine learning and deep learning algorithms. The evaluation of credit risk holds great significance in the financial realm, impacting both companies and individuals. While credit risk prediction has been explored using statistical and machine learning techniques, their application to tax arrears prediction remains underexplored. We forecast individual local tax defaults in Republic of Korea using machine and deep learning algorithms, including convolutional neural networks (CNN), long short-term memory (LSTM), and sequence-to-sequence (seq2seq). Our model incorporates diverse credit and public information like loan history, delinquency records, credit card usage, and public taxation data, offering richer insights than prior studies. The results highlight the superior predictive accuracy of the CNN model. Anticipating local tax arrears more effectively could lead to efficient allocation of administrative resources. By leveraging advanced machine learning, this research offers a promising avenue for refining tax collection strategies and resource management.

예비교사들을 대상으로 한 증명활동과 반례생성 수행결과 분석 : 수열의 극한을 중심으로 (Preservice Teachers' Writing Performance Producing Proofs and Counterexamples about Limit of Sequence)

  • 이정곤;류희찬
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제21권4호
    • /
    • pp.379-398
    • /
    • 2011
  • 수학교육에서 증명과 반박은 명제가 왜 참인지 혹은 거짓인지를 판별하게 해주고 거짓으로 판명된 명제를 참인 명제로 정교화하는 과정에서 중요한 요소가 된다. 그렇기에 증명활동과 반례생성 두 가지를 함께 학습하는 것은 수학을 배우는 학생들에게 주어진 명제에 내포되어 있고 함축되어 있는 의미에 대한 깊은 통찰력과 명확한 이해를 제공해 줄 수 있다. 최근 많은 논문을 통해 학생들이 수학적 증명에 어려움을 겪고 있다는 증거가 나타나고 있다. 그러나 해당 연구의 대부분은 예비교사들이 수열의 극한 부분에 대하여 증명과 반례를 생산해 내는 능력에만 초점을 맞추고 있다. 따라서 본 연구에서는 예비교사들을 대상으로 하여 수열의 극한 부분에 대한 수행결과 분석을 통하여 증명활동과 반례생성에 대한 능력정도와 접근 방법 등을 알아보고자 한다. 본 연구의 목적은 예비교사들이 반례와 증명을 생성하는 것에 대한 조사에 공헌하는 것이며 예비교사들의 증명과 반례생성 능력 그리고 수학 개념들에 대한 이해의 정도를 식별하고 확인하는 것이다. 또한, 연구를 통하여 참가자들이 주어진 명제들에 대한 답을 작성하는 것에 어려움을 겪는다는 것을 알게 되었고 이를 바탕으로 증명과 반례를 가르치고 배우는 것에 더욱 노력을 기울여야만 한다는 것을 알 수 있었다. 덧붙여, 이 연구의 분석을 통하여 현행 커리큘럼과 교육 방법에 대하여 통찰력을 제공하게 될 수 있을 것이고 예비교사들의 수학과정 학습을 향상시킬 수 있는 방향을 제시한다는 교육적 시사점을 얻을 수 있을 것이다.

  • PDF