• 제목/요약/키워드: Deep-learning Neural Network

검색결과 1,701건 처리시간 0.028초

웨어러블 응용을 위한 CNN 기반 손 제스처 인식 (CNN-Based Hand Gesture Recognition for Wearable Applications)

  • 문현철;양안나;김재곤
    • 방송공학회논문지
    • /
    • 제23권2호
    • /
    • pp.246-252
    • /
    • 2018
  • 제스처는 스마트 글라스 등 웨어러블 기기의 NUI(Natural User Interface)로 주목받고 있다. 최근 MPEG에서는 IoT(Internet of Things) 및 웨어러블 환경에서의 효율적인 미디어 소비를 지원하기 위한 IoMT(Internet of Media Things) 표준화를 진행하고 있다. IoMT에서는 손 제스처 검출과 인식이 별도의 기기에서 수행되는 것을 가정하고 이들 모듈간의 인터페이스 규격을 제공하고 있다. 한편, 최근 인식률 개선을 위하여 딥러닝 기반의 손 제스처 인식 기법 또한 활발히 연구되고 있다. 본 논문에서는 IoMT의 유스 케이스(use case)의 하나인 웨어러블 기기에서의 미디어 소비 등 다양한 응용을 위하여 CNN(Convolutional Neural Network) 기반의 손 제스처 인식 기법을 제시한다. 제시된 기법은 스마트 글래스로 획득한 스테레오 비디오로부터 구한 깊이(depth) 정보와 색 정보를 이용하여 손 윤곽선을 검출하고, 검출된 손 윤곽선 영상을 데이터 셋으로 구성하여 CNN을 학습한 후, 이를 바탕으로 입력 손 윤곽선 영상의 제스처를 인식한다. 실험결과 제안기법은 95%의 손 제스처 인식율를 얻을 수 있음을 확인하였다.

GOCI를 이용한 동중국해 표층 염분 산출 알고리즘 개발 (A Development for Sea Surface Salinity Algorithm Using GOCI in the East China Sea)

  • 김대원;김소현;조영헌
    • 대한원격탐사학회지
    • /
    • 제37권5_2호
    • /
    • pp.1307-1315
    • /
    • 2021
  • 매년 여름철 양자강에서 유출되는 저염분수는 동중국해 뿐만 아니라 제주도 주변 해역의 염분 변화에 큰 영향을 미치며 때때로 그 영향은 한반도 연안에 국한되지 않고 대한해협을 통과하여 동해 외해 까지 확장되기도 한다. 한반도 주변으로 확장된 양자강 유출수는 해양 물리 및 생태학적으로 많은 영향을 끼치며 어업 및 양식업에 큰 피해를 유발하기도 한다. 그러나 현장조사의 한계점 때문에 동중국해에서 확산되는 저염분수를 지속적으로 관측하기에는 현실적으로 어려움이 있다. 이러한 이유로 양자강 유출수의 확산을 실시간으로 모니터링하기 위해 인공위성을 활용한 표층 염분 산출 연구가 많이 진행되어 왔다. 본 연구에서는 시간 및 공간 해상도가 상대적으로 좋은 GOCI(Geostationary Ocean Color Imager)를 활용한 동중국해 표층 염분 산출 알고리즘을 개발하였다. 알고리즘 개발을 위해 기계학습 기법 중 하나인 MPNN(Multilayer Perceptron Neural Network)을 이용하였으며, 출력층에는 SMAP(Soil Moisture Active Passive) 위성의 표층 염분 자료를 활용하였다. 이전 연구에서 2016년 자료를 이용한 표층 염분 산출 알고리즘이 개발되었으나 본 연구에서는 연구 기간을 2015년 부터 2020년까지로 확장하여 알고리즘 성능을 개선하였다. 2011년부터 2019년까지 동중국해에서 관측된 국립수산과학원의 정선조사자료를 이용하여 알고리즘 성능을 검증한 결과로 R2는 0.61과 RMSE는 1.08 psu로 나타났다. 본 연구는 GOCI를 이용한 동중국해 표층 염분 모니터링 알고리즘 개발을 위해 수행되었으며, 향후 GOCI-II의 표층 염분 산출 알고리즘 개발에 많은 기여를 할 것으로 기대된다.

연속파 레이다를 활용한 이진 신경망 기반 사람 식별 및 동작 분류 시스템 설계 및 구현 (Design and Implementation of BNN based Human Identification and Motion Classification System Using CW Radar)

  • 김경민;김성진;남궁호정;정윤호
    • 한국항행학회논문지
    • /
    • 제26권4호
    • /
    • pp.211-218
    • /
    • 2022
  • 연속파 레이다는 카메라나 라이다와 같은 센서에 비해서 안정성과 정확성이 보장된다는 장점이 있다. 또한 이진 신경망은 다른 딥러닝 기술에 비해서 메모리 사용량과 연산 복잡도를 크게 줄일 수 있는 특징이 있다. 따라서 본 논문에서는 연속파 레이다와 이진 신경망 기반 사람 식별 및 동작 분류 시스템을 제안한다. 연속파 레이다 센서를 통해 수신된 신호를 단시간 푸리에 변환함으로써 스펙트로그램을 생성한다. 이 스펙트로그램을 기반으로 레이다를 향해 사람이 다가오는지 감지하는 알고리즘을 제안한다. 더불어, 최적화된 이진 신경망 모델을 설계하여 사람 식별 90.0%, 동작 분류 98.3%의 우수한 정확도를 지원할 수 있음을 확인하였다. 이진 신경망 연산을 가속하기 위해 FPGA (field programmable gate array)를 이용하여 이진 신경망 연산에 대한 하드웨어 가속기를 설계하였다. 해당 가속기는 1,030개의 로직, 836개의 레지스터, 334.906 Kbit의 블록 메모리를 사용하여 구현되었고, 추론에서 결과 전송까지 총 연산 시간이 6 ms로 실시간 동작이 가능함을 확인하였다.

CAE 알고리즘을 이용한 레이더 강우 보정 평가 (Application of convolutional autoencoder for spatiotemporal bias-correction of radar precipitation)

  • 정성호;오성렬;이대업;레수안히엔;이기하
    • 한국수자원학회논문집
    • /
    • 제54권7호
    • /
    • pp.453-462
    • /
    • 2021
  • 최근 몇 년 동안 국지성 집중호우의 빈도가 증가함에 따라 고해상도 레이더 자료의 중요성 및 활용성이 증가하고 있다. 하지만 여전히 레이더 자료의 경우 시·공간적 편의가 존재하고 이를 보정하는 것이 매우 중요하며 많은 연구에서 레이더 강우의 편의 보정을 위해 다양한 통계적 기법이 시도되었다. 본 연구에서는 시·공간적으로 강우를 추정할 수 있는 이중편파레이더의 편의를 지점 강우와 비교하여 보정하는 것을 목표로 한다. 환경부의 수자원관리 및 홍수 예측에 사용되는 S-밴드 이중편파레이더의 편의 보정을 위하여 합성곱신경망(Convolutional Neural Network, CNN)기반의 Convolutional Autoencoder (CAE) 알고리즘을 구축하여 편의 보정을 수행하였다. CAE 모델의 입력자료는 환경부의 10분 단위 레이더 합성 강우자료와 같은 공간해상도로 보간된 지점 관측 강우자료를 사용하였으며, 자료의 기간은 미호천 유역에 홍수 경보가 발령된 2017년 7월 16일 00시부터 13시까지의 10분 단위 자료를 사용하였다. 그 결과로 지점 강우 대비 원시 레이더 강우의 편의가 줄어듦을 확인할 수 있으며 시·공간적으로 개선된 결과를 보여주고 있다. 따라서 각 인접한 격자 간의 공간 관계를 학습하는 CAE 모델은 레이더 및 위성에서 추정되는 격자형 기후 자료의 실시간 편의 보정에 사용할 수 있을 것으로 분석되었다.

CNN 기반 스펙트로그램을 이용한 자유발화 음성감정인식 (Spontaneous Speech Emotion Recognition Based On Spectrogram With Convolutional Neural Network)

  • 손귀영;권순일
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.284-290
    • /
    • 2024
  • 음성감정인식(Speech Emotion Recognition, SER)은 사용자의 목소리에서 나타나는 떨림, 어조, 크기 등의 음성 패턴 분석을 통하여 감정 상태를 판단하는 기술이다. 하지만, 기존의 음성 감정인식 연구는 구현된 시나리오를 이용하여 제한된 환경 내에서 숙련된 연기자를 대상으로 기록된 음성인 구현발화를 중심의 연구로 그 결과 또한 높은 성능을 얻을 수 있지만, 이에 반해 자유발화 감정인식은 일상생활에서 통제되지 않는 환경에서 이루어지기 때문에 기존 구현발화보다 현저히 낮은 성능을 보여주고 있다. 본 논문에서는 일상적 자유발화 음성을 활용하여 감정인식을 진행하고, 그 성능을 향상하고자 한다. 성능평가를 위하여 AI Hub에서 제공되는 한국인 자유발화 대화 음성데이터를 사용하였으며, 딥러닝 학습을 위하여 1차원의 음성신호를 시간-주파수가 포함된 2차원의 스펙트로그램(Spectrogram)로 이미지 변환을 진행하였다. 생성된 이미지는 CNN기반 전이학습 신경망 모델인 VGG (Visual Geometry Group) 로 학습하였고, 그 결과 7개 감정(기쁨, 사랑스러움, 화남, 두려움, 슬픔, 중립, 놀람)에 대해서 성인 83.5%, 청소년 73.0%의 감정인식 성능을 확인하였다. 본 연구를 통하여, 기존의 구현발화기반 감정인식 성능과 비교하면, 낮은 성능이지만, 자유발화 감정표현에 대한 정량화할 수 있는 음성적 특징을 규정하기 어려움에도 불구하고, 일상생활에서 이루어진 대화를 기반으로 감정인식을 진행한 점에서 의의를 두고자 한다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

인공 신경망 기반의 지문 영상 복원 알고리즘 (An Algorithm of Fingerprint Image Restoration Based on an Artificial Neural Network)

  • 장석우;이사무엘;김계영
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.530-536
    • /
    • 2020
  • 일반적인 지문 인식기에서 이용되는 미뉴셔 특징은 표현 공격에는 강건하지만 오 정합률이 상대적으로 높다는 약점이 있다. 따라서 미뉴셔 특징은 스켈리톤 영상과 함께 이용되는 경향이 있다. 보통 지문의 미뉴셔 특징에 대한 보안 취약성 연구는 많이 진행되어 있으나 스켈리톤에 대한 취약성 연구는 미약한 형편이므로 본 연구에서는 스켈리톤에 대한 표현 공격의 취약성을 분석하고자 한다. 이를 위해, 본 연구에서는 지문의 스켈리톤으로부터 학습 알고리즘을 사용해 원래의 지문을 복구하는 방법을 제시한다. 본 논문에서 제시된 방법은 기존의 Pix2Pix 모델에 잠재 벡터를 추가한 새로운 학습 모델인 Pix2Pix을 제안하여, 보다 자연스러운 지문을 생성한다. 본 논문의 실험 결과에서는 제시된 학습 알고리즘을 이용해 원래의 지문을 복원한 다음, 복원된 지문을 지문 인식기에 입력시켜 높은 인식률을 달성하였다. 그러므로 본 연구는 스켈리톤을 함께 이용하는 지문 인식기는 표현 공격에 취약함을 검증하였다. 본 논문에서 제시된 접근방법은 지문 인식 및 복원, 비디오 보안, 생체 인식 등과 연관된 많은 실제적인 응용 분야에서 유용하게 사용될 것으로 기대된다.

기계학습을 활용한 오리사 바닥재 수분 발생량 분석 (Estimation of Duck House Litter Evaporation Rate Using Machine Learning)

  • 김다인;이인복;여욱현;이상연;박세준;크리스티나;김준규;최영배;조정화;정효혁;강솔뫼
    • 한국농공학회논문집
    • /
    • 제63권6호
    • /
    • pp.77-88
    • /
    • 2021
  • Duck industry had a rapid growth in recent years. Nevertheless, researches to improve duck house environment are still not sufficient enough. Moisture generation of duck house litter is an important factor because it may cause severe illness and low productivity. However, the measuring process is difficult because it could be disturbed with animal excrements and other factors. Therefore, it has to be calculated according to the environmental data around the duck house litter. To cut through all these procedures, we built several machine learning regression model forecasting moisture generation of litter by measured environment data (air temperature, relative humidity, wind velocity and water contents). 5 models (Multi Linear Regression, k-Nearest Neighbors, Support Vector Regression, Random Forest and Deep Neural Network). have been selected for regression. By using R-Square, RMSE and MAE as evaluation metrics, the best accurate model was estimated according to the variables for each machine learning model. In addition, to address the small amount of data acquired through lab experiments, bootstrapping method, a technique utilized in statistics, was used. As a result, the most accurate model selected was Random Forest, with parameters of n-estimator 200 by bootstrapping the original data nine times.

CNN을 활용한 새싹삼의 품질 예측 모델 개발 (A Quality Prediction Model for Ginseng Sprouts based on CNN)

  • 이충구;정석봉
    • 한국시뮬레이션학회논문지
    • /
    • 제30권2호
    • /
    • pp.41-48
    • /
    • 2021
  • 농촌 인구의 감소와 고령화가 지속되면서 농업 생상성 향상의 중요성이 높아지고 있는 가운데, 농작물 품질에 대한 조기 예측은 농업 생산성 및 수익성 향상에 중요한 역할을 할 수 있다. 최근 CNN 기반의 딥러닝 기술 및 전이 학습을 활용하여 농작물의 질병을 분류하거나 수확량을 예측하는 연구가 활발하게 진행되고 있지만, 수확 후 농작물의 품질을 식재단계에서 조기에 예측하는 연구는 찾아보기 힘들다. 본 연구에서는 건강 기능성 식품으로 주목받고 있는 새싹삼을 대상으로, 수확 후 새싹삼의 품질을 식재단계에서 조기에 예측하는 모델을 제안한다. 이를 위하여 묘삼의 이미지를 촬영한 후 수경재배를 통해 새싹삼을 재배하였고, 수확 후 새싹삼의 품질을 분류하여 실험 데이터를 수집하였다. 다수의 CNN 기반의 사전 학습된 모델을 활용하여 새싹삼 조기 품질 예측 모델을 구축하고, 수집된 데이터를 이용하여 각 모델의 학습 및 예측 성능을 비교 분석하였다. 분석 결과 모든 예측 모델에서 80% 이상의 예측 정확도를 보였으며, 특히 ResNet152V2 기반의 예측 모델에서 가장 높은 정확도를 보였다. 본 연구를 통해 인력에 의존하던 기존의 묘삼 선별 작업을 자동화하여 새싹삼의 품질을 높이고 생산량을 증대시켜 농가의 수익창출에 기여할 수 있을 것으로 기대된다.

인공지능의 사회적 수용도에 따른 키워드 검색량 기반 주가예측모형 비교연구 (Comparison of Models for Stock Price Prediction Based on Keyword Search Volume According to the Social Acceptance of Artificial Intelligence)

  • 조유정;손권상;권오병
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.103-128
    • /
    • 2021
  • 최근 주식의 수익률과 거래량을 설명하는 주요 요인으로서 투자자의 관심도와 주식 관련 정보 전파의 영향력이 부각되고 있다. 또한 인공지능과 같은 혁신 신기술을 개발보급하거나 활용하려는 기업의 경우 거시환경 및 시장 불확실성 때문에 기업의 미래 주식 수익률과 주식 변동성을 예측하기 어렵다는 문제를 가지고 있다. 이는 인공지능 활성화의 장애요인으로 인식되고 있다. 따라서 본 연구의 목적은 인공지능 관련 기술 키워드의 인터넷 검색량을 투자자의 관심 척도로 사용하여, 기업의 주가 변동성을 예측하는 기계학습 모형을 제안하는 것이다. 이를 위해 심층신경망 LSTM(Long Short-Term Memory)과 벡터자기회귀(Vector Autoregression)를 통해 주식시장을 예측하고, 기술의 사회적 수용 단계에 따라 키워드 검색량을 활용한 주가예측 성능 비교를 통해 기업의 투자수익 예측이나 투자자들의 투자전략 의사결정을 지원하는 주가 예측 모형을 구축하였다. 또한 인공지능 기술의 세부 하위 기술에 대한 분석도 실시하여 기술 수용 단계에 따른 세부 기술 키워드 검색량의 변화를 살펴보고 세부기술에 대한 관심도가 주식시장 예측에 미치는 영향을 살펴보았다. 이를 위해 본 연구에서는 인공지능, 딥러닝, 머신러닝 키워드를 선정하여, 2015년 1월 1일부터 2019년 12월 31일까지 5년간의 인터넷 주별 검색량 데이터와 코스닥 상장 기업의 주가 및 거래량 데이터를 수집하여 분석에 활용하였다. 분석 결과 인공지능 기술에 대한 키워드 검색량은 사회적 수용 단계가 진행될수록 증가하는 것으로 나타났고, 기술 키워드를 기반으로 주가예측을 하였을 경우 인식(Awareness)단계에서 가장 높은 정확도를 보였으며, 키워드별로 가장 좋은 예측 성능을 보이는 수용 단계가 다르게 나타남을 확인하였다. 따라서 기술 키워드를 활용한 주가 예측 모델 구축을 위해서는 해당 기술의 하위 기술 분류를 고려할 필요가 있다. 본 연구의 결과는 혁신기술을 기반으로 기업의 투자수익률을 예측하기 위해서는 기술에 대한 대중의 관심이 급증하는 인식 단계를 포착하는 것이 중요하다는 점을 시사한다. 또한 최근 금융권에서 선보이고 있는 빅데이터 기반 로보어드바이저(Robo-advisor) 등 투자 의사 결정 지원 시스템 개발 시 기술의 사회적 수용도를 세분화하여 키워드 검색량 변화를 통해 예측 모델의 정확도를 개선할 수 있다는 점을 시사하고 있다.