• 제목/요약/키워드: 심층신경망

검색결과 483건 처리시간 0.025초

주목 메커니즘 기반의 심층신경망을 이용한 음성 감정인식 (Speech emotion recognition using attention mechanism-based deep neural networks)

  • 고상선;조혜승;김형국
    • 한국음향학회지
    • /
    • 제36권6호
    • /
    • pp.407-412
    • /
    • 2017
  • 본 논문에서는 주목 메커니즘 기반의 심층 신경망을 사용한 음성 감정인식 방법을 제안한다. 제안하는 방식은 CNN(Convolution Neural Networks), GRU(Gated Recurrent Unit), DNN(Deep Neural Networks)의 결합으로 이루어진 심층 신경망 구조와 주목 메커니즘으로 구성된다. 음성의 스펙트로그램에는 감정에 따른 특징적인 패턴이 포함되어 있으므로 제안하는 방식에서는 일반적인 CNN에서 컨벌루션 필터를 tuned Gabor 필터로 사용하는 GCNN(Gabor CNN)을 사용하여 패턴을 효과적으로 모델링한다. 또한 CNN과 FC(Fully-Connected)레이어 기반의 주목 메커니즘을 적용하여 추출된 특징의 맥락 정보를 고려한 주목 가중치를 구해 감정인식에 사용한다. 본 논문에서 제안하는 방식의 검증을 위해 6가지 감정에 대해 인식 실험을 진행하였다. 실험 결과, 제안한 방식이 음성 감정인식에서 기존의 방식보다 더 높은 성능을 보였다.

딥러닝을 이용한 광학적 프린지 패턴의 생성 (Generation of optical fringe patterns using deep learning)

  • 강지원;김동욱;서영호
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1588-1594
    • /
    • 2020
  • 본 논문에서는 심층신경망(deep neural network, DNN)을 이용하여 디지털 홀로그램을 생성하는 신경망의 학습을 위한 데이터 균형 조정 방법에 대하여 논의 한다. 심층신경망은 딥러닝(deep learning, DL) 기술에 기반을 두고 있고, 생성형 적대적 네트워크(generative adversarial network, GAN)계열을 이용한다. 심층 신경망을 통하여 생성 하고자하는 홀로그램의 기본 단위인 프린지 패턴은 홀로그램 평면과 객체의 위치에 따라 데이터의 형태가 매우 다르다. 하지만 데이터의 분류 기준이 명확하지 않기 때문에 학습 데이터의 불균형이 생길 수 있다. 학습 데이터의 불균형은 곧 학습의 불안정 요소로 작용한다. 따라서 분류 기준이 명확하지 않은 데이터를 분류하고 균형을 맞추는 방법을 제시한다. 그리고 이를 통하여 학습이 안정화됨을 보인다.

심층 신경망 병렬 학습 방법 연구 동향 (A survey on parallel training algorithms for deep neural networks)

  • 육동석;이효원;유인철
    • 한국음향학회지
    • /
    • 제39권6호
    • /
    • pp.505-514
    • /
    • 2020
  • 심층 신경망(Deep Neural Network, DNN) 모델을 대량의 학습 데이터로 학습시키기 위해서는 많은 시간이 소요되기 때문에 병렬 학습 방법이 필요하다. DNN의 학습에는 일반적으로 Stochastic Gradient Descent(SGD) 방법이 사용되는데, SGD는 근본적으로 순차적인 처리가 필요하므로 병렬화하기 위해서는 다양한 근사(approximation) 방법을 적용하게 된다. 본 논문에서는 기존의 DNN 병렬 학습 알고리즘들을 소개하고 연산량, 통신량, 근사 방법 등을 분석한다.

뉴럴 네트워크를 이용한 Retinex 기반 반사 영상 생성 (Generating Retinex-based Reflectance Image Using Neural Network)

  • 김원회;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 추계학술대회
    • /
    • pp.108-109
    • /
    • 2018
  • 저조도 영상의 개선에 관한 연구는 대부분 대비 개선을 목적으로 한다. 저저도 영상에서 밝기 개선, 대조 개선, 및 조명 성분 감쇠 등의 다양한 연구가 진행됐다. 최근에 인공신경망으로 상기 방법들을 대체하는 연구가 진행 중이다. 본 논문에서는 Retinex 이론에 기반하여 조명 광원이 존재하는 저저도 영상으로부터 조명 성분을 감쇠하고, 반사 성분만을 생성하는 기법을 심층신경망으로 대체하는 방법을 제안한다.

  • PDF

단백질 이차 구조 예측을 위한 합성곱 신경망의 구조 (Architectures of Convolutional Neural Networks for the Prediction of Protein Secondary Structures)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.728-733
    • /
    • 2018
  • 단백질을 구성하는 아미노산의 서열 정보만으로 단백질 이차 구조를 예측하기 위하여 심층 학습이 활발히 연구되고 있다. 본 논문에서는 단백질 이차 구조를 예측하기 위하여 다양한 구조의 합성곱 신경망의 성능을 비교하였다. 단백질 이차 구조의 예측에 적합한 신경망의 층의 깊이를 알아내기 위하여 층의 개수에 따른 성능을 조사하였다. 또한 이미지 분류 분야의 많은 방법들이 기반 하는 GoogLeNet과 ResNet의 구조를 적용하였는데, 이러한 방법은 입력 자료에서 다양한 특성을 추출하거나, 깊은 층을 사용하여도 학습과정에서 그래디언트 전달을 원활하게 한다. 합성곱 신경망의 여러 구조를 단백질 자료의 특성에 적합하게 변경하여 성능을 향상시켰다.

심층학습을 이용한 영상정보 기반 호흡신호 분류 (Classification of Respiratory States based on Visual Information using Deep Learning)

  • 송주현;이덕우
    • 한국산학기술학회논문지
    • /
    • 제22권5호
    • /
    • pp.296-302
    • /
    • 2021
  • 본 논문에서는 영상정보에 기반한 호흡상태 분류 방법을 제안한다. 호흡신호는 초광대역 레이더 센서를 이용하여 획득하고 호흡신호의 값으로 이루어진 1차원 그래프 대신 그래프의 영상 정보가 담긴 2차원 정보 기반으로 호흡상태를 분류한다. 호흡상태의 분류는 심층신경망 모델을 사용하고, 심층신경망 모델은 호흡신호 그래프가 포함된 2차원 영상의 특징들을 학습하여 영상기반의 호흡상태 분류의 결과를 제공한다. 기존의 레이더 센서 기반 호흡신호의 상태 분류는 1차원 벡터의 구성요소 값 및 그 값들의 변화량을 이용하여 회귀, 심층학습 방법을 적용하였다. 그러나 1차원 그래프 기반의 호흡상태 분류는 다양한 형태의 정상호흡 상태에 대한 분류 성능에서 한계를 보였다. 본 논문에서는 호흡 신호로부터 얻은 그래프의 이미지 자체를 2차원 입력 신호로 사용하여 심층 신경망 모델을 적용하여 분류를 수행하였다. 본 논문에서 제안하는 영상정보 기반의 호흡상태 분류는 기존의 1차원 벡터 기반 호흡상태 분류 대비 호흡상태 분류의 정확도를 약 10% 향상 시켰다. 또한 기존의 두 가지 호흡상태 (정상 및 비정상) 분류에서 확장하여 세 가지 호흡상태 (정상1, 정상2, 비정상) 분류를 수행하였다.

심층 신경회로망 모델을 이용한 일별 주가 예측 (Daily Stock Price Forecasting Using Deep Neural Network Model)

  • 황희수
    • 한국융합학회논문지
    • /
    • 제9권6호
    • /
    • pp.39-44
    • /
    • 2018
  • 심층 신경회로망은 적합한 수학적 모델에 대한 어떠한 가정 없이 데이터로부터 유용한 정보를 추출해서 예측에 필요한 입출력 관계를 정의할 수 있기 때문에 최근 시계열 예측 분야에서 주목 받고 있다. 본 논문에서는 주가의 일별 종가를 예측하기 위한 심층 신경회로망 모델을 제안한다. 제안된 심층 신경회로망은 예측 정밀도를 높이기 위해 단일 층의 오토인코더와 4층의 신경회로망이 결합된 구조를 갖는다. 오토인코더 층은 주가 예측에 필요한 최적의 입력 특징을 추출하고 4층의 신경회로망은 추출된 특징을 사용해 주가 예측에 필요한 동특성을 반영하여 주가를 출력한다. 제안된 심층 신경회로망의 학습은 층별로 단계적으로 이뤄지며 최종 단계에서 전체 심층 신경회로망에 대해 한 번 더 학습이 실행된다. 본 논문에 제안된 방법으로 KOrea composite Stock Price Index (KOSPI) 일별 종가를 예측하는 심층 신경회로망을 구현하고 기존 방법과 예측 정확도를 비교, 평가한다.

공간 결합과 심층신경망을 활용한 관광지 다중 분류 추천 시스템 (Multiple classification recommendation system using spatial combination and deep learning)

  • 안현우;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.43-46
    • /
    • 2019
  • 관광지에 대한 관광객의 평가는 날씨, 계절, 관광객의 밀집 정도 등 다양한 환경적 요소에 따라 변화한다. 각 관광지는 객관적인 관점으로 최상의 관광을 경험하게 할 고유한 컨디션이 존재하며 이를 추출하기 위해선 관광에 영향을 주는 여러 환경들에 대한 다중 요인 분석이 가능할 만큼의 정보가 필요하다. 본 논문에서는 심층신경망을 기반으로 한 문장분석기술을 응용하여 관광지 리뷰에 적용, 평점이 포함되지 않은 리뷰에 평점을 추가하여 기상이나 계절, 휴무일 등의 다양한 분류가 가능할 수준의 데이터를 보충하고 축적/보충된 방대한 평점데이터를 토대로 맞춤 추천이 가능하도록 하는 시스템을 설명한다. 이에 본 논문은 학습 환경 구축, 리뷰와 기상 정보의 결합, 최종 추천 방법 등 전반적인 프로세스에 대한 내용을 설명한다.

임베디드 보드에서 실시간 의미론적 분할을 위한 심층 신경망 구조 (A Deep Neural Network Architecture for Real-Time Semantic Segmentation on Embedded Board)

  • 이준엽;이영완
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.94-98
    • /
    • 2018
  • 본 논문은 자율주행을 위한 실시간 의미론적 분할 방법으로 최적화된 심층 신경망 구조인 Wide Inception ResNet (WIR Net)을 제안한다. 신경망 구조는 Residual connection과 Inception module을 적용하여 특징을 추출하는 인코더와 Transposed convolution과 낮은 층의 특징 맵을 사용하여 해상도를 높이는 디코더로 구성하였고 ELU 활성화 함수를 적용함으로써 성능을 올렸다. 또한 신경망의 전체 층수를 줄이고 필터 수를 늘리는 방법을 통해 성능을 최적화하였다. 성능평가는 NVIDIA Geforce gtx 1080과 TX1 보드를 사용하여 주행환경의 Cityscapes 데이터에 대해 클래스와 카테고리별 IoU를 평가하였다. 실험 결과를 통해 클래스 IoU 53.4, 카테고리 IoU 81.8의 정확도와 TX1 보드에서 $640{\times}360$, $720{\times}480$ 해상도 영상처리에 17.8fps, 13.0fps의 실행속도를 보여주는 것을 확인하였다.

심층 신경망의 최적화를 통한 소규모 행동 분류 문제의 행동 인식 방법 (A Method of Activity Recognition in Small-Scale Activity Classification Problems via Optimization of Deep Neural Networks)

  • 김승현;김연호;김도연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권3호
    • /
    • pp.155-160
    • /
    • 2017
  • 최근 컴퓨터를 이용한 다양한 인식 문제를 해결하기 위해 딥 러닝을 적용하는 사례가 늘어나고 있다. 딥 러닝은 학습에 필요한 요소를 학습데이터를 통해 스스로 도출해내기 때문에, 수작업(hand-craft)을 통해 특징을 도출하던 기존의 기계학습 방법보다 더 많은 장점을 갖는다. 행동인식을 위한 기존의 심층 신경망은 비디오 데이터를 일정 프레임의 이미지로 분할한 후, 분할된 각 이미지 사이의 시간적 연계성 분석을 통해 행동을 분류한다. 그러나 이러한 신경망은 소규모 행동 클래스를 갖는 분류 문제에서 학습 데이터의 부족 문제 및 과적합(overfitting) 문제로 인해 이를 실제 문제에 적용하기 어려운 경우가 많다. 이에 본 논문에서는 5가지의 소규모 행동 클래스를 정의하고, 기존 행동 인식 신경망의 최적화를 통해 이를 분류하였다. 700개의 비디오데이터를 통해 행동 데이터베이스를 구성하였고, 약 74.00%의 분류 정확도를 얻을 수 있었다.