• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.028초

광류와 표정 HMM에 의한 동영상으로부터의 실시간 얼굴표정 인식 (Realtime Facial Expression Recognition from Video Sequences Using Optical Flow and Expression HMM)

  • 전준철;신기한
    • 인터넷정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.55-70
    • /
    • 2009
  • 비전기반 인간컴퓨터 상호작용은 컴퓨터와 인간의 상호소통을 자연스럽게 제공하는 측면에서 과학과 산업분야에서 주목받는 연구 분야이다. 그러한 측면에서 얼굴표정인식에 의한 인간의 심리적 상태를 추론하는 기술은 중요한 이슈이다. 본 연구에서는 감성인식 HMM 모델과 광류에 기반한 얼굴 움직임 추적 방법을 이용하여 동영상으로부터 얼굴표정을 인식하는 새로운 방법을 제시하였다. 특히, 기존의 감성상태 변환을 설명하는 HMM 모델은 특정 표정상태 간의 전환 시 항상 중립 상태를 거치도록 설계되어 있다. 그러나 본 연구에서는 기존의 표정상태 전환 모델에 중간상태를 거치는 과정 없이 특정 표정 상태간의 변환이 가능한 확장된 HMM 모델을 제시한다. 동영상으로부터 얼굴의 특성정보를 추출하기 위하여 탬플릿 매칭과 광류방법을 적용하였다. 광류에 의해 추적된 얼굴의 표정특성 정보는 얼굴표정인식을 위한 HMM의 매개변수 정보로 사용된다. 실험을 통하여 제안된 얼굴표정인식 방법이 실시간 얼굴 표정인식에 효과적임을 입증하였다.

  • PDF

문장대문장 학습을 이용한 음차변환 모델과 한글 음차변환어의 발음 유사도 기반 부분매칭 방법론 (A Transliteration Model based on the Seq2seq Learning and Methods for Phonetically-Aware Partial Match for Transliterated Terms in Korean)

  • 박주희;박원준;서희철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.443-448
    • /
    • 2018
  • 웹검색 결과의 품질 향상을 위해서는 질의의 정확한 매칭 뿐만이 아니라, 서로 같은 대상을 지칭하는 한글 문자열과 영문 문자열(예: 네이버-naver)의 매칭과 같은 유연한 매칭 또한 중요하다. 본 논문에서는 문장대문장 학습을 통해 영문 문자열을 한글 문자열로 음차변환하는 방법론을 제시한다. 또한 음차변환 결과로 얻어진 한글 문자열을 동일 영문 문자열의 다양한 음차변환 결과와 매칭시킬 수 있는 발음 유사성 기반 부분 매칭 방법론을 제시하고, 위키피디아의 리다이렉트 키워드를 활용하여 이들의 성능을 정량적으로 평가하였다. 이를 통해 본 논문은 문장대문장 학습 기반의 음차 변환 결과가 복잡한 문맥을 고려할 수 있으며, Damerau-Levenshtein 거리의 계산에 자모 유사도를 활용하여 기존에 비해 효과적으로 한글 키워드들 간의 부분매칭이 가능함을 보였다.

  • PDF

Linear Eddy Model을 이용한 스칼라의 혼합특성 해석 (Analysis for Scalar Mixing Characteristics using Linear Eddy Model)

  • 김후중;류연숙;김용모
    • 한국분무공학회지
    • /
    • 제11권1호
    • /
    • pp.1-6
    • /
    • 2006
  • The present study is focused on the small scale turbulent mixing processes in the scalar Held. In order to deal with molecular mixing in turbulent flow, the linear eddy model is addressed. In each realization, the molecular mixing term is implemented deterministically, and turbulent stirring is represented by a sequence of instantaneous, statistically independent rearrangement event called by triplet map. The LEM approach is applied with relatively simple conditions. The characteristics of scalar mixing and PDF profiles are addressed in detail.

  • PDF

진동신호 양자화에 의한 거동반응을 이용한 베어링 고장진단 (Bearing Fault Diagnosis Using Automaton through Quantization of Vibration Signals)

  • 김도현;최연선
    • 한국소음진동공학회논문집
    • /
    • 제16권5호
    • /
    • pp.495-502
    • /
    • 2006
  • A fault diagnosis method is developed in this study using automaton through quantization of vibration signals for normal and faulty conditions, respectively. Automaton is a kind of qualitative model which describes the system behaviour at the level of abstraction. The system behavior was extracted from the probability of the output sequence of vibration signals. The sequence was made as vibration levels by reconstructing the originally measured vibration signals. As an example, a fault diagnosis for the bearing of ATM machine was done, which detected the bearing fault with confident level compared to any other existing methods of kurtosis or spectrum analysis.

Small CNN-RNN Engraft Model Study for Sequence Pattern Extraction in Protein Function Prediction Problems

  • Lee, Jeung Min;Lee, Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.49-59
    • /
    • 2022
  • 본 논문에서는 2020년 기준 단백질 서열을 이용한 기능과 구조 예측 분야에서 가장 많이 사용되고 있는 딥러닝 모델인 CNN과 LSTM/GRU 모델을 동일한 조건 하에 비교 평가한 연구를 토대로 새로운 효소 기능 예측 모델인 PSCREM을 설계하였다. CNN 합성곱 시 누락되는 세부 패턴을 보존하기 위하여 서열 진화정보를 이용하였으며 중첩 RNN을 통해 기능적으로 중요한 의미를 가지는 아미노산 간의 관계 정보를 추출하고 특징 맵 제작에 참조하였다. 사용된 RNN 계열의 알고리즘은 LSTM과 GRU로 보통 stacked RNN 기법으로 100 units 이상 2~3회 쌓는 것이 일반적이나 본 논문에서는 10, 20 unit으로 구성한 뒤 중첩시켜서 특징 맵 제작에 사용하였다. 모델에 들어가는 데이터는 단백질 서열 데이터로 PSSM profile로 가공한 뒤 사용되었다. 실험 결과 효소 번호 첫 번째 자리를 예측하는 문제에 대해 86.4%의 정확도를 나타냄을 입증하였고, 효소 번호 3번째 자리까지 예측 정확도 84.4%의 성능을 내는 것을 확인하였다. PSCREM은 Overlapped RNN을 통해 단백질 기능에 관련된 고유 패턴을 더 잘 파악하며 Overlapped RNN은 단백질 기능 및 구조 예측 추출 분야에 새로운 방법론으로서 제안된다.

CRM을 위한 은닉 마코프 모델과 유사도 검색을 사용한 시계열 데이터 예측 (Time-Series Data Prediction using Hidden Markov Model and Similarity Search for CRM)

  • 조영희;전진호;이계성
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.19-28
    • /
    • 2009
  • 시계열의 예측에 대한 문제는 오랫동안 많은 연구자들의 연구의 대상이었으며 예측을 위한 많은 방법이 제안되었다. 본 논문에서는 은닉 마코프 모델(Hidden Markov Model)과 우도(likelihood)를 사용한 유사도 검색을 통하여 향후 시계열 데이터의 운행 방향을 예측하는 방법을 제안한다. 이전에 기록된 시계열 데이터에서 질의 시퀸스(sequence)와 유사한 부분을 검색하고 유사 부분의 서브 시퀸스를 사용하여 시계열을 예측하는 방법이다. 먼저 주어진 질의 시퀸스에 대한 은닉 마코프 모델을 작성한다. 그리고 시계열 데이터에서 순차적으로 일정 길이의 서브 시퀸스를 추출하고 추출된 서브 시퀸스와 작성된 은닉 마코프 모델과의 우도를 계산한다. 시계열 데이터로부터 추출된 서브 시퀸스 중에서 우도가 가장 높은 시퀸스를 유사 시퀸스로 결정하고 결정된 부분 이후의 값을 추출하여 질의 시퀸스 이후의 예측 값을 추정한다. 실험 결과 예측 값과 실제 값이 상당한 유사성을 나타내었다. 제안된 방법의 유효성은 코스피(KOSPI) 종합주가지수를 대상으로 실험하여 검증한다.

산업플랜트 건설 프로젝트의 주요 공정 시퀀스 분석을 통한 리스크 평가 (Project Risk Assessment Through Construction Sequence Analyses for Industrial Plant Construction Projects)

  • 이규성;최재현
    • 한국건설관리학회논문집
    • /
    • 제14권4호
    • /
    • pp.140-151
    • /
    • 2013
  • 2011년과 2012년 국내건설기업의 해외건설시장 공종별 수주구조는 플랜트분야가 약 645억 달러(전체의 73%)로 타 건설분야에 비해 압도적이며 수주금액 또한 역대 최고액을 기록하였다. 이러한 플랜트 건설시장의 비중과 수주율은 당분간 지속될 전망이다. 하지만 국내 기업이 보유한 플랜트 건설기술은 상세설계와 건설시공 분야에서 비교적 높은 경쟁력을 보이나, 엔지니어링의 원천기술 및 기본설계 분야와 사업관리 분야는 기술 선진국의 60%~70% 내외이다. 국내 기업의 사업관리 경쟁력을 향상시키기 위해 플랜트 건설 공정관리 기술의 고도화와 프로젝트 수행과정에서 발생하는 리스크의 체계적인 평가 방안을 마련하는 것이 시급하다. 본 연구에서는 산업플랜트 건설프로젝트의 주요 공정 시퀀스 모델을 개발하여 프로젝트 초기에 공정계획 수립의 주요 항목설정과 공사의 흐름 및 공정 간의 연관관계 등을 명확하게 정립할 수 있도록 하였다. 특히 공종별 주요 액티비티 분석을 통해 주요 공정 시퀀스를 도출하였고, 퍼지이론을 활용하여 프로젝트 수행 단계별 위험도 평가 방안의 개발 및 중점 관리 공정 프로세스를 제시함으로써 산업플랜트 건설 프로젝트 공정개발과정과 주공정 수행과정의 리스크 분석에 용이성을 향상할 수 하도록 하였다.

장면 전환에서의 물체 추적을 통한 모델기반추적 방법 연구 (The Model based Tracking using the Object Tracking method in the Sequence Scene)

  • 김세훈;황중원;김기상;최형일
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.775-778
    • /
    • 2008
  • 증강현실은 가상현실의 한 분야로 실제 환경에 가장 사물을 합성하여 원래의 환경에 존재하는 사물처럼 보이도록 하는 컴퓨터 그래픽 기법이다. 증강현실은 가상의 공간과 사물만을 대상으로 하는 기존의 가상현실과 달리 현실세계 기반위에 가상의 사물을 합성하여 현실세계 만으로는 얻기 어려운 부가적인 정보를 보강해 제공할 수 있는 특징을 가지고 있다. 실세계 기반위에 가상의 사물의 합성을 구현하는데 있어 중요하게 여겨지는 기반 기술인 레지스트레이션 방법이 있다. 레지스트레이션 방법은 실사영상과 3차원 그래픽 객체의 위치와 방향을 결정하는 방법으로서, 모델기반추적과 Move-Matching방법이 사용되고 있다. 본 논문에서는 모델기반추적방법에 대하여 물체 추적을 통한 물체의 정보와 색상 분포를 이용하여 각 장면간의 물체 추적을 통하여 전환되는 장면에서의 모델을 통해 상대적 좌표계를 생성하는 방법에 대하여 연구하였다.

  • PDF

다양한 형식의 얼굴정보와 준원근 카메라 모델해석을 이용한 얼굴 특징점 및 움직임 복원 (Facial Features and Motion Recovery using multi-modal information and Paraperspective Camera Model)

  • 김상훈
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.563-570
    • /
    • 2002
  • 본 논문은 MPEG4 SNHC의 얼굴 모델 인코딩을 구현하기 위하여 연속된 2차원 영상으로부터 얼굴영역을 검출하고, 얼굴의 특징데이터들을 추출한 후, 얼굴의 3차원 모양 및 움직임 정보를 복원하는 알고리즘과 결과를 제시한다. 얼굴 영역 검출을 위해서 영상의 거리, 피부색상, 움직임 색상정보등을 융합시킨 멀티모달합성의 방법이 사용되었다. 결정된 얼굴영역에서는 MPEG4의 FDP(Face Definition Parameter) 에서 제시된 특징점 위치중 23개의 주요 얼굴 특징점을 추출하며 추출성능을 향상시키기 위하여 GSCD(Generalized Skin Color Distribution), BWCD(Black and White Color Distribution)등의 움직임색상 변환기법과 형태연산 방법이 제시되었다. 추출된 2차원 얼팔 특징점들로부터 얼굴의 3차원 모양, 움직임 정보를 복원하기 위하여 준원근 카메라 모델을 적용하여 SVD(Singular Value Decomposition)에 의한 인수분해연산을 수행하였다. 본 논문에서 제시된 방법들의 성능을 객관적으로 평가하기 위하여 크기와 위치가 알려진 3차원 물체에 대해 실험을 행하였으며, 복원된 얼굴의 움직임 정보는 MPEG4 FAP(Face Animation Parameter)로 변환된 후, 인터넷상에서 확인이 가능한 가상얼굴모델에 인코딩되어 실제 얼굴파 일치하는 모습을 확인하였다.

BackTranScription (BTS)기반 제주어 음성인식 후처리기 연구 (BackTranScription (BTS)-based Jeju Automatic Speech Recognition Post-processor Research)

  • 박찬준;서재형;이설화;문현석;어수경;장윤나;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.178-185
    • /
    • 2021
  • Sequence to sequence(S2S) 기반 음성인식 후처리기를 훈련하기 위한 학습 데이터 구축을 위해 (음성인식 결과(speech recognition sentence), 전사자(phonetic transcriptor)가 수정한 문장(Human post edit sentence))의 병렬 말뭉치가 필요하며 이를 위해 많은 노동력(human-labor)이 소요된다. BackTranScription (BTS)이란 기존 S2S기반 음성인식 후처리기의 한계점을 완화하기 위해 제안된 데이터 구축 방법론이며 Text-To-Speech(TTS)와 Speech-To-Text(STT) 기술을 결합하여 pseudo 병렬 말뭉치를 생성하는 기술을 의미한다. 해당 방법론은 전사자의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축 할 수 있다. 본 논문은 BTS를 바탕으로 제주어 도메인에 특화된 음성인식 후처리기의 성능을 향상시키기 위하여 모델 수정(model modification)을 통해 성능을 향상시키는 모델 중심 접근(model-centric) 방법론과 모델 수정 없이 데이터의 양과 질을 고려하여 성능을 향상시키는 데이터 중심 접근(data-centric) 방법론에 대한 비교 분석을 진행하였다. 실험결과 모델 교정없이 데이터 중심 접근 방법론을 적용하는 것이 성능 향상에 더 도움이 됨을 알 수 있었으며 모델 중심 접근 방법론의 부정적 측면 (negative result)에 대해서 분석을 진행하였다.

  • PDF