• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.026초

시계열 데이터베이스에서 복수의 모델을 지원하는 모양 기반 서브시퀀스 검색 (Shape-Based Subsequence Retrieval Supporting Multiple Models in Time-Series Databases)

  • 원정임;윤지희;김상욱;박상현
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.577-590
    • /
    • 2003
  • 모양 기반 검색이란 실제 요소 값과 관계없이 질의 시퀀스와 유사한 모양을 갖는 시퀀스(서브시퀀스)를 데이터베이스 내에서 검색하여 내는 연산이다. 본 논문에서는 시계열 데이터베이스에서의 모양 기반 검색을 위한 유연성 있는 새로운 유사 모델을 정의하고, 이 유사 모델을 지원하기 위한 인덱싱 및 질의 처리 방안을 제시한다. 제안된 유사 모델에서는 정규화, 이동 평균, 타임 워핑 등 다양한 변환을 지원한다. 특히 최종 유사 정도를 계산하기 위하여 사용되는$L_p$거리 함수론 사용자가 임의로 지정하도록 함으로써 응용에서 선호하는 유사 모델을 반영할 수 있다. 또한 이러한 모양 기반 검색을 효과적으로 지원하기 위한 압축된 서브시퀀스 트리 구조를 제안하고, 이를 기반으로 하는 효율적인 질의 처리 기법을 제시한다. 실험 결과에 의하면 제안된 기법은 진의 시퀀스와 모양이 유사한 서브시퀀스들을 사용자에 의하여 선택된 거리 함수를 사용하여 성공적으로 검색할 뿐 아니라, 순차 검색과 비교하여 거리 함수 선택에 따라 수 십배에서 수 백배까지의 성능 개선 효과를 갖는 것으로 나타났다.

능동학습법을 이용한 한국어 대화체 문장의 효율적 의미 구조 분석 (Efficient Semantic Structure Analysis of Korean Dialogue Sentences using an Active Learning Method)

  • 김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권5호
    • /
    • pp.306-312
    • /
    • 2008
  • 목적 지향성 대화에서 화자의 의도는 화행과 개념열 쌍으로 구성되는 의미 구조로 근사화될 수 있다. 그러므로 지능형 대화 시스템을 구현하기 위해서는 의미 구조를 올바르게 파악하는 것이 매우 중요하다. 본 논문에서는 능동학습(active learning) 방법을 이용하여 효율적으로 의미 구조를 분석하는 모델을 제안한다. 제안 모델은 언어 분석에 따른 부담을 덜기위하여 형태소 자질들과 이전 의미 구조만을 입력 자질로 사용한다. 그리고 정확률 향상을 위하여 자연어 처리 분야에서 높은 성능을 보이고 있는 CRFs(Conditional Random Fields)를 기본 통계 모델로 사용한다. 일정 관리 영역에서 제안 모델을 실험한 결과는 기존 모델들과 비교하여 1/3 정도의 훈련데이타를 사용하고도 비슷한 정확률(화행 92.4%, 개념열 89.8%)을 나타내고 있음을 알 수 있었다.

언어 정보가 반영된 문장 점수를 활용하는 삭제 기반 문장 압축 (Deletion-Based Sentence Compression Using Sentence Scoring Reflecting Linguistic Information)

  • 이준범;김소언;박성배
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2022
  • 문장 압축은 원본 문장의 중요한 의미는 유지하면서 길이가 축소된 압축 문장을 생성하는 자연어처리 태스크이다. 문법적으로 적절한 문장 압축을 위해, 초기 연구들은 사람이 정의한 언어 규칙을 활용하였다. 또한 시퀀스-투-시퀀스 모델이 기계 번역과 같은 다양한 자연어처리 태스크에서 좋은 성능을 보이면서, 이를 문장 압축에 활용하고자 하는 연구들도 존재했다. 하지만 언어 규칙을 활용하는 연구의 경우 모든 언어 규칙을 정의하는 데에 큰 비용이 들고, 시퀀스-투-시퀀스 모델 기반 연구의 경우 학습을 위해 대량의 데이터셋이 필요하다는 문제점이 존재한다. 이를 해결할 수 있는 방법으로 사전 학습된 언어 모델인 BERT를 활용하는 문장 압축 모델인 Deleter가 제안되었다. Deleter는 BERT를 통해 계산된 perplexity를 활용하여 문장을 압축하기 때문에 문장 압축 규칙과 모델 학습을 위한 데이터셋이 필요하지 않다는 장점이 있다. 하지만 Deleter는 perplexity만을 고려하여 문장을 압축하기 때문에, 문장에 속한 단어들의 언어 정보를 반영하여 문장을 압축하지 못한다. 또한, perplexity 측정을 위한 BERT의 사전 학습에 사용된 데이터가 압축 문장과 거리가 있어, 이를 통해 측정된 perplexity가 잘못된 문장 압축을 유도할 수 있다는 문제점이 있다. 이를 해결하기 위해 본 논문은 언어 정보의 중요도를 수치화하여 perplexity 기반의 문장 점수 계산에 반영하는 방법을 제안한다. 또한 고유명사가 자주 포함되어 있으며, 불필요한 수식어가 생략되는 경우가 많은 뉴스 기사 말뭉치로 BERT를 fine-tuning하여 문장 압축에 적절한 perplexity를 측정할 수 있도록 하였다. 영어 및 한국어 데이터에 대한 성능 평가를 위해 본 논문에서 제안하는 LI-Deleter와 비교 모델의 문장 압축 성능을 비교 실험을 진행하였고, 높은 문장 압축 성능을 보임을 확인하였다.

비연속 시스템 제어를 위한 확장된 safe petri net 모델과 실시간제어를 위한 scanning algorithm의 개발 (Development of extended safe petri net model for discrete system control and scanning algorithm for real time control)

  • 황창선;서정일;이재만
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1988년도 한국자동제어학술회의논문집(국내학술편); 한국전력공사연수원, 서울; 21-22 Oct. 1988
    • /
    • pp.338-342
    • /
    • 1988
  • Recently, in sequence control systems, high flexibility and maintenance of control software are required. This is because product life cycles become shorter and control specification must be changed frequently. The authors extend the concept of Safe Petri Net to develop the design and analysis tool for sequence control systems taking the safeness and notation of input/output functions into consideration. Extended Safe Petri Net (S-Net) is proposed as such a new graph model and real time scanning algorithm based on S-Net is developed.

  • PDF

IPM모터의 턴쇼트 고장모델에 관한 연구 (Development of Inter Turn Short Fault Model of IPM Motor)

  • 구본관
    • 전력전자학회논문지
    • /
    • 제20권4호
    • /
    • pp.305-312
    • /
    • 2015
  • In this study, inter-turn short fault models of interior permanent magnet synchronous motors (IPMSM) are developed by adding saliency modeling to surface-mounted permanent magnet motor models. The saliency model is obtained using the deformed flux models based on both fault-winding flux information and inductance variations caused by cross-flux linkages that depend on the distribution of the same phase windings. By assuming the balanced three-phase current injection, we obtain the positive and negative sequence voltages and the fault current in the positive and the negative synchronous reference frames. The output torque model is developed by adding the magnet and the reluctance torque, which are derived from the developed models. To verify the proposed IPMSM model with an inter-turn short fault, finite element method-based simulation and experimental measurement results are presented.

쿠멘 생산 공정의 경제성 최적화를 위한 샘플링 및 추정법의 비교 (Comparison of Sampling and Estimation Methods for Economic Optimization of Cumene Production Process)

  • 백종배;이기백
    • Korean Chemical Engineering Research
    • /
    • 제52권5호
    • /
    • pp.564-573
    • /
    • 2014
  • 이 연구는 벤젠과 프로필렌의 기상반응을 통해 쿠멘을 생산하는 쿠멘 생산 공정의 경제성 최적화에 대한 것이다. 최적화의 목적함수는 제품 판매 이득에서 자본비용, 유틸리티 비용, 원료 비용을 뺀 연간 조업이득이고, 설계변수는 6개이다. 설계변수의 변화에 따른 조업이득의 계산을 위해 Unisim Design과 Matlab을 연동하였다. 최적화는 3단계로 수행되었다. 설계변수를 샘플링한 후 조업이득 데이터를 얻고, 이 데이터로부터 설계변수와 조업이득의 관계를 추정 모델로 표현하고, 이 모델을 이용하여 최적화하였다. 추정모델로는 반응표면법에서 사용되는 2차 회귀 다항식과 비선형 모델인 support vector regression을 비교하였다. 설계변수의 샘플링 방법으로는 중심합성계획과 Hammersley 순차 추출법을 비교하였다. 각각 얻어진 모델을 이용한 최적화 결과, 추정방법으로는 SVR이, 샘플링 방법은 Hammersley 순차추출법이 더 정확하였다. 최적화된 조업이득은 연간 17.96 MM$로, 기준 조건에서의 연간 16.04 MM$에 비해 12% 증가하였다.

모드 순서 전환된 2자유도계 압전 진동 에너지 수확 장치의 수학적 모델 (Mathematical Model for a Mode-sequence Reversed Two-degrees-of-freedom Piezoelectric Vibration Energy Harvester)

  • 이소원;김윤영;김재은
    • 한국소음진동공학회논문집
    • /
    • 제23권6호
    • /
    • pp.546-552
    • /
    • 2013
  • A cantilevered piezoelectric energy harvester(PEH) and an auxiliary mass-spring unit can be integrated into a novel two-degrees-of-freedom PEH where its lowest eigenmode is not an in-phase modes but an out-of-phase mode. This typical behavior was shown to enhance output power considerably compared with its stand-alone counterpart. The objective of this study is to newly develop a continuum-based mathematical model suitable for efficient analysis of the mode-sequence reversed PEH. Once such a mathematical model is available, various physical behaviors can be analytically investigated for better designs. After a new mathematical model is developed, its validity is checked by using ANSYS results, in terms of resonant frequency, open-circuit voltage, and output power with a specified external resistance.

순서 정보 기반 악성코드 분류 가능성 (Malware Classification Possibility based on Sequence Information)

  • 윤태욱;박찬수;황태규;김성권
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1125-1129
    • /
    • 2017
  • LSTM(Long Short-term Memory)은 이전 상태의 정보를 기억하여 현재 상태에 반영해 학습하는 순환신경망(Recurrent Neural Network) 모델이다. 악성코드에서 선형적 순서 정보는 각 시점에서 호출되는 함수로서 정의 가능하다. 본 논문에서는 LSTM 모델의 이전 상태를 기억하는 특성을 이용하며, 시간 순서에 따른 악성코드의 함수 호출 정보를 입력으로 사용한다. 그리고 실험으로서 우리가 제시한 방법이 악성코드 분류가 가능함을 보이고 순서 정보의 길이 변화에 따른 정확률을 측정한다.

복사 메커니즘과 강화 학습을 적용한 BERT 기반의 문서 요약 모델 (BERT-based Document Summarization model using Copying-Mechanism and Reinforcement Learning)

  • 황현선;이창기;고우영;윤한준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.167-171
    • /
    • 2020
  • 문서 요약은 길이가 긴 원본 문서에서 의미를 유지한 채 짧은 문서나 문장을 얻어내는 작업을 의미한다. 딥러닝을 이용한 자연어처리 기술들이 연구됨에 따라 end-to-end 방식의 자연어 생성 모델인 sequence-to-sequence 모델을 문서 요약 생성에 적용하는 방법들이 연구되었다. 본 논문에서는 여러 자연어처리 분야에서 높은 성능을 보이고 있는 BERT 모델을 이용한 자연어 생성 모델에 복사 메커니즘과 강화 학습을 추가한 문서 요약 모델을 제안한다. 복사 메커니즘은 입력 문장의 단어들을 출력 문장에 복사하는 기술로 학습데이터에서 학습되기 힘든 고유 명사 등의 단어들에 대한 성능을 높이는 방법이다. 강화 학습은 정답 단어의 확률을 높이기 위해 학습하는 지도 학습 방법과는 달리 연속적인 단어 생성으로 얻어진 전체 문장의 보상 점수를 높이는 방향으로 학습하여 생성되는 단어 자체보다는 최종 생성된 문장이 더 중요한 자연어 생성 문제에 효과적일 수 있다. 실험결과 기존의 BERT 생성 모델 보다 복사 메커니즘과 강화 학습을 적용한 모델의 Rouge score가 더 높음을 확인 하였다.

  • PDF

선형 계획법을 이용한 Timing Diagram의 테스트 입력 시퀀스 자동 생성 전략 (Test Input Sequence Generation Strategy for Timing Diagram using Linear Programming)

  • 이홍석;정기현;최경희
    • 정보처리학회논문지D
    • /
    • 제17D권5호
    • /
    • pp.337-346
    • /
    • 2010
  • Timing diagram은 시간에 따른 시스템의 행동을 표현하기 용이하고 표현된 행동을 쉽게 인식할 수 있는다는 장점 때문에 널리 사용되고 있다. Timing diagram으로 기술된 시스템을 테스트 하기 위해서는 여러 기술이 필요하다. 그 중의 하나는 테스트 케이스 목표들이 존재할 때, 시스템 모델이 원하는 상태에 도달하도록 하기 위해 입력 값들의 시퀀스를 생성하는 기술이다. 본 논문은 Timing diagram모델에 대한 테스트 케이스 목표로부터 테스트 입력 시퀀스를 자동으로 생성하는 방법을 제안한다. Timing diagram에서 테스트 입력 시퀀스를 자동으로 생성하기 위해서는 입력 waveform과 시간 제약으로 이루어진 시점의 전이 조건을 만족시키는 적절한 입력 집합을 필요로 한다. 이와 같은 문제를 해결하기 위해, 본 논문에서는 선형 계획법을 이용한 접근 방식을 택하였는데, 해결과정은 다음과 같다. 1) Timing diagram 모델을 입력으로 받아 이를 선형 계획 문제로 변형한다. 2)변형된 선형 계획 문제를 선형 문제 해결 도구를 사용하여 해결한다. 3) 선형 계획 문제의 해답으로부터 Timing diagram모델의 테스트 입력 시퀀스를 생성한다. 본 논문에서는 임의의 Timing diagram 모델에 대해 이를 선형 계획법으로 모델링 하는 방법을 형식적으로 기술하였고, 증명을 통해 본 논문의 접근 방법의 타당성을 보였으며, 또한 도구를 구현하여 Timing diagram 예제 모델로부터 테스트 입력 시퀀스를 생성함으로써 본 논문의 유용성을 입증하였다.