• 제목/요약/키워드: sequence-to-sequence 모델

검색결과 695건 처리시간 0.026초

휴먼 보행 동작 구조 분석을 위한 통계적 모델링 방법 (Statistical Modeling Methods for Analyzing Human Gait Structure)

  • 신봉기
    • 스마트미디어저널
    • /
    • 제1권2호
    • /
    • pp.12-22
    • /
    • 2012
  • 최근 비디오 감시, 로봇 시각 휴대폰 등 무수히 많은 카메라가 생활 속에 파고들면서 휴먼 동작 인식은 컴퓨터 시각 분야의 새로운 붐을 일으키고 있다. 자체로 그다지 흥미 있는 동작은 아니지만 걸음걸이 또는 보행은 가장 보편적으로 많이 관찰되는, 의심할 여지없이 사람의 대표적인 동작이다. 그리 오래되지 않은 과거에 보행자 인식의 관점에서 반짝 연구가 있었지만 관심의 길이가 짧은 만큼 보행 동작에 관한 체계적인 분석과 이해 없이 이루어졌었다. 본 연구에서는 일련의 점진적인 모델을 이용하여 보행 동작의 구조를 체계적으로 분석하고자 한다. 입력 영상 신호의 다양한 변형과 불완전성을 극복할 수 있는 동적 베이스망 기반의 보행자 모델과 보행 모델을 제시한다. 그리고 이변량 폰 미제스 분포의 조건부 밀도 함수를 기반으로 마르코프 체인의 이산 상태 공간을 연속 공간으로 확장하는 방법을 제안한다. 제안된 모형화 프레임워크를 이용한 일련의 시험, 분석에서 보행자를 91.67% 인식하며 보행 동작을 보행 방향과 보행 자세의 두 가지 독립적인 성분으로 분리 해석할 수 있었다.

  • PDF

어텐션 기반 엔드투엔드 음성인식 시각화 분석 (Visual analysis of attention-based end-to-end speech recognition)

  • 임성민;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.41-49
    • /
    • 2019
  • 전통적인 음성인식 모델은 주로 음향 모델과 언어 모델을 사용하여 구현된다. 이때 음향 모델을 학습시키기 위해서는 음성 데이터에 대한 정답 텍스트뿐만 아니라 음성인식에 사용되는 단어의 발음사전과 프레임 단위의 음소 정답 데이터가 필요하다. 이 때문에 모델을 훈련하기 위해서는 먼저 프레임 단위의 정답을 생성하는 등의 여러 과정이 필요하다. 그리고 음향 모델과 별도의 텍스트 데이터로 훈련한 언어 모델을 적용하여야 한다. 이러한 불편함을 해결하기 위하여 최근에는 하나의 통합 신경망 모델로 이루어진 종단간(end-to-end) 음성인식 모델이 연구되고 있다. 이 모델은 훈련에 여러 과정이 필요없고 모델의 구조를 이해하기 쉽다는 장점이 있다. 하지만 인식이 내부적으로 어떤 과정을 거쳐 이루어지는지 알기 어렵다는 문제가 있다. 본 논문에서는 어텐션 기반 종단간 모델을 시각화 분석하여 내부적인 작동 원리를 이해하고자 하였다. 이를 위하여 BLSTM-HMM 하이브리드 음성인식 모델의 음향 모델과 종단간 음성인식 모델의 인코더를 비교하고, 신경망 레이어 별로 어떠한 차이가 있는지 분석하기 위해 t-SNE를 사용하여 시각화하였다. 그 결과로 음향모델과 종단간 모델 인코더의 차이점을 알 수 있었다. 또한 종단간 음성인식 모델의 디코더의 역할을 언어모델 관점에서 분석하고, 종단간 모델 디코더의 개선이 성능 향상을 위해 필수적임을 알 수 있었다.

마이크로 블로깅 서비스를 지원하기 위한 컨텍스트 모델 기반 자동 블로깅 시스템 (An Auto-blogging System based Context Model for Micro-blogging Service)

  • 박재민;이상용
    • 디지털융복합연구
    • /
    • 제10권4호
    • /
    • pp.341-346
    • /
    • 2012
  • 소셜 네트워크 서비스의 가장 대표적인 마이크로 블로깅 서비스를 효과적으로 제공하기 위해 사용자가 자신의 현재 상황정보를 간편하게 기록하고 그 정보를 바탕으로 다른 사람들과 네트워크를 형성하고 유지하도록 하는 것이 중요하다. 하지만 모바일 환경에서 사용자가 자신의 정보를 매번 모바일 디바이스를 통해 직접 입력하는 것은 매우 번거로운 작업이다. 본 논문에서는 획득된 사용자 컨텍스트를 이용하여 사용자의 현재 행동과 다음 목적지를 추론한 후, 자동으로 문장을 생성하여 블로깅을 해주는 컨텍스트 모델 기반 자동 블로깅 시스템을 제안한다. 컨텍스트 모델을 생성하기 위해 사용자의 행동 추론은 나이브 베이즈 분류기를 이용하고, 이동중인 사용자의 다음 목적지 추론은 시퀀스 매칭을 이용하였다. 생성된 컨텍스트 모델을 기반으로 5W1H 구조를 이용하여 상황에 적합한 문장을 생성하여 자동으로 블로깅하였다. 제안한 방법의 정확도를 평가한 결과 평균 88.73%의 정확도를 보여 자동 블로깅 서비스가 가능함을 보여주었다.

은닉 마코브 모델을 이용한 인터넷 정보 추출 (Hidden Markov Model-based Extraction of Internet Information)

  • 박동철
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.8-14
    • /
    • 2009
  • 본 논문은 은닉 마코브 모델을 이용한 인터넷 정보 추출 방법을 제안하고, 인터넷상의 웹 사이트에서 상품가격을 효율적으로 추출하는 문제에 적용되었다. 제안된 방법에서 시스템으로 입력되는 데이터는 검색엔진의 인터페이스 URL 인데, 상품의 이름을 포함하며, 시스템의 출력은 추출된 각 상품의 상품명, 가격, 사진, 그리고 URL을 목록형태로 보여준다. 주어진 관찰 데이터를 이용해, 은닉 마코브 모델의 학습단계에서는 Maximum Likelihood 알고리듬과 Baum-Welch 알고리듬이 학습에 사용되었으며, 학습된 은닉 마코브 모델을 이용하여 시스템의 출력을 찾는 방법으로는 Viterbi 알고리듬이 사용되었다. 제안된 HMM기반의 정보 검출기는 실제상황에서 수집된 관찰데이터에 대해 실험이 수행되었는데, 기존의 PEWEB 알고리듬에 비해 검출도와 정확도에서 매우 향상된 결과를 보이고 있으며, 특히 정확도에서는 99%이상의 높은 결과를 보여주고 있다. 한편, 보다 충실한 학습을 위해 학습 데이터의 수를 800개 이상으로 증가시켰을 패 검출도 역시 약 93%로 향상된 성능을 보여주었다.

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

변동하중을 받는 강구조부재의 피로거동 해석 (The Fatigue Evaluation of Structural Steel Members under Variable-Amplitude Loading)

  • 장동일;곽종현;박용걸
    • 대한토목학회논문집
    • /
    • 제8권2호
    • /
    • pp.167-175
    • /
    • 1988
  • 본 연구의 목적은 변동하중을 받는 구조부재의 피로거동을 해석하는 것이다. 이 연구의 해석과정은 다음과 같다. (1) 도로교의 실동응력파측정 및 통계적해석 (2) 등가의 일정진폭하중과, 통계적해석에 의해 모형화된 변동하중하(下)의 피로시험 (3) 등가응력개념의 RMC 모델에 의한 변동하중하(下)의 피로해석 등가응력개념에 의한 변동하중하(下)의 피로해석은 대부분의 구조용강재의 균열성장속도회귀지수가 $m{\fallingdotseq}3$이므로 이론적으로 RMC 모델이 합당하다. 변동하중하(下)의 피로시험해석결과 RMC 모델이 기존의 RMC 모델보다 변동하중에 의한 피로거동치(da/dN-${\Delta}K$, $N_f$)에 더 가까웠다. 또 변동하중하(下)에서 응력범위의 변화로 인한 interaction효과나 응력범위적용순서(sequence)효과 등은 피로수명에 거의 영향을 미치지 않으며, 응력범위변화속도가 클수록 피로균열성장속도가 빨라짐을 알 수 있었다.

  • PDF

혼합모델조립라인의 생산성 제고를 위한 작업순서 결정 (A study on sequencing of Mixed Model Assembly Line for increasing productivity)

  • 최종열
    • 경영과학
    • /
    • 제13권2호
    • /
    • pp.25-48
    • /
    • 1996
  • Mixed Model Assembly Lines (MMALs) are increasingly used to produce differentiated products on a single assembly line without work-in-process storage, Usually, a typical MMAL consists of a number of (1) stations doing exactly the same operation on every job, (2) stations involving operations with different choices, and (3) stations offering operations that are not performed on every job, or that are performed on every job but with many options. For stations of the first type there is no sequencing problem at all. However, for the second type a set-up cost is incurred each time the operation switches from one choice to another. At the third type of stations, different models, requring different amounts and choices of assembly work, creates an uneven flow of work along the line and variations in the work load at these stations. When a subsequence of jobs requires more work load than the station can handle, it is necessary to help the operations at the station or to complete the work elsewhere. Therefore, a schedule which minimize the sum of set-up cost and utility work cost is desired. So this study has developed Fixed Random Ordering Rule (FROR), Fixed Ascending Ordering Rule (FAOR), Fixed Descending Ordering Rule, and Extended NHR (ENHR). ENHR is to choose optimal color ordering of each batch with NHR, and to decide job sequence of the batch with it, too. As the result of experiments, ENHR was the best heuristic algorithm. NHR is a new heuristic rule in which only the minimum addition of violations from both partial sequence and unassigned sequence at every branch could be considered. And this is a heuristic sequencing rule for the third type of stations at MMAL. This study developed one more heuristic algorithm to test the performance of NHR, which is named as Practical Heuristic Rule (PHR).

  • PDF

측방유동방식 신속 DNA 교잡 분석법의 개발 (Development of a Method for Rapid Analysis of DNA Hybridization)

  • 정동석;최의열
    • 미생물학회지
    • /
    • 제39권2호
    • /
    • pp.114-117
    • /
    • 2003
  • 유전자의 기능을 분석하는 과정에서 특정한 염기 서열의 존재여부를 확인하는 분석법은 필수적이다. 현재 사용되고 있는 Southern및 Northern blotting방법은 시간이 오래 걸리며, 온도 등과 같은 외부 조건을 엄격하게 조절하여야 한다. 본 연구에서는 측방유동방식을 이용한 크로마토그라피법을 응용하여 새로운 간편용 DNA분석법을 개발하였다. 이 측방유동형 DNA 분석 스트립은 시료가 적용되는 샘플패드, 이동하여 분리되고 교잡반응이 일어나는 전개용 막, 그리고 시료가 계속하여 이동하기 위한 흡수패드로 구성되어 있다. 모델 시스템으로 HIV와 HCV에 대한 포획 및 표적 DNA를 합성하고 스트립을 제조하였다. 시료를 샘플패드에 적하한 후 교잡반응체의 생성여부와 상대적인 양은 GSI형광 스캐너로 분석하였다. 교잡반응이 매우 빠르게 진행되고 세척과정이 없음에도 불구하고 비특이적인 교차 반응이 거의 관찰되지 않았다. 기존의 DNA 교잡방법과 비교하여 볼 때 이 새로운 방법으로 DNA/DNA 교잡 실험을 보다 더 쉽고, 간편하고, 그리고 빠르게 할 수가 있을 것으로 예상된다.

태스크 상호작용 테스팅을 위한 MSC 명세로부터의 전체 유한 상태 기계 생성 (Construction of Global Finite State Machine from Message Sequence Charts for Testing Task Interactions)

  • 이남희;김태효;차성덕;신석종;홍인표
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권9호
    • /
    • pp.634-648
    • /
    • 2001
  • MSC는 통산 소프트웨어에서의 병행 수행 테스크들 사이의 상호작용을 기술하기 위해서 많이 사용되어져 왔다. 요구사항 단계에서 검증된 MSC 명세는 상태 기반의 설계 모델을 합성하는데 사용될 수 있을 뿐만 아니라, 테스크 시퀀스 생성에 사용될 수도 있다. 지금까지는 MSC에 기술된 각 이벤트의 위치 정보만을 이용하여 전체 상태 그래프를 생성함으로써 검증을 수행하였다. 본 논문에서는 MSC의 조건문을 시나리오 활성화 조건과 상태 변경을 기술할 수 있도록 확장하고, 이를 이용하여 전체 상태 그래프를 생성함으로써 테스크 시퀀스 생성에 이용한다. 생성된 전체 상태 그래프인 GFSM은 시스템의 의미 있는 상태 정보와 가능한 메시지 시퀀스만을 가지게 된다. 생성된 GFSM에 기존인 FSM 기반의 테스팅 기법을 적용하여 테스크 시퀀스를 추출할 수 있다.

  • PDF

문학 텍스트를 활용한 머신러닝 언어모델 구현 (Machine Learning Language Model Implementation Using Literary Texts)

  • 전현구;정기철;권경아;이인성
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.427-436
    • /
    • 2021
  • 본 연구의 목적은 문학 텍스트를 학습한 머신 러닝 언어 모델을 구현하는데 있다. 문학 텍스트는 일상 대화문처럼 질문에 대한 답변이 분명하게 구분되지 않을 때가 많고 대명사와 비유적 표현, 지문, 독백 등으로 다양하게 구성되어 있다는 특징이 있다. 이런 점들이 알고리즘의 학습을 용이하지 않게 하여 문학 텍스트를 활용하는 기계 학습의 필요성을 저해시킨다. 문학 텍스트를 학습한 알고리즘이 일반 문장을 학습한 알고리즘에 비해 좀 더 인간 친화적인 상호작용을 보일 가능성이 높다. 본 논문은 '문학 텍스트를 학습한 머신 러닝 언어 모델 구현'에 관한 연구로서, 대화형 기계 학습에 문학 텍스트를 활용하는 연구에서 필수적으로 선행되어야 할 세 가지 텍스트 보정 작업을 제안한다: 대명사 처리, 대화쌍 늘리기, 데이터 증폭 등에 대한 내용으로 기계 학습이 용이하고 그 효과도 높다고 판단됩니다. 인공지능을 위한 학습용 데이터는 그 의미가 명료해야 기계 학습이 용이하고 그 효과도 높게 나타난다. 문학과 같은 특수한 장르의 텍스트를 자연어 처리 연구에 도입하는 것은 새로운 언어 학습 방식의 제안과 함께 머신 러닝의 학습 영역도 확장시켜 줄 것이다.