• 제목/요약/키워드: Deep-learning Neural Network

검색결과 1,666건 처리시간 0.041초

라벨이 없는 데이터를 사용한 종단간 음성인식기의 준교사 방식 도메인 적응 (Semi-supervised domain adaptation using unlabeled data for end-to-end speech recognition)

  • 정현재;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제12권2호
    • /
    • pp.29-37
    • /
    • 2020
  • 최근 신경망 기반 심층학습 알고리즘의 적용으로 고전적인 Gaussian mixture model based hidden Markov model (GMM-HMM) 음성인식기에 비해 성능이 비약적으로 향상되었다. 또한 심층학습 기법의 장점을 더욱 잘 활용하는 방법으로 언어모델링 및 디코딩 과정을 통합처리 하는 종단간 음성인식 시스템에 대한 연구가 매우 활발히 진행되고 있다. 일반적으로 종단간 음성인식 시스템은 어텐션을 사용한 여러 층의 인코더-디코더 구조로 이루어져 있다. 때문에 종단간 음성인식 시스템이 충분히 좋은 성능을 내기 위해서는 많은 양의 음성과 문자열이 함께 있는 데이터가 필요하다. 음성-문자열 짝 데이터를 구하기 위해서는 사람의 노동력과 시간이 많이 필요하여 종단간 음성인식기를 구축하는 데 있어서 높은 장벽이 되고 있다. 그렇기에 비교적 적은 양의 음성-문자열 짝 데이터를 이용하여 종단간 음성인식기의 성능을 향상하는 선행연구들이 있으나, 음성 단일 데이터나 문자열 단일 데이터 한쪽만을 활용하여 진행된 연구가 대부분이다. 본 연구에서는 음성 또는 문자열 단일 데이터를 함께 이용하여 종단간 음성인식기가 다른 도메인의 말뭉치에서도 좋은 성능을 낼 수 있도록 하는 준교사 학습 방식을 제안했으며, 성격이 다른 도메인에 적응하여 제안된 방식이 효과적으로 동작하는지 확인하였다. 그 결과로 제안된 방식이 타깃 도메인에서 좋은 성능을 보임과 동시에 소스 도메인에서도 크게 열화되지 않는 성능을 보임을 알 수 있었다.

관절질환 관리를 위한 Mask R-CNN을 이용한 모션 모니터링 (Motion Monitoring using Mask R-CNN for Articulation Disease Management)

  • 박성수;백지원;조선문;정경용
    • 한국융합학회논문지
    • /
    • 제10권3호
    • /
    • pp.1-6
    • /
    • 2019
  • 현대사회는 생활과 개성이 중요시 되면서 개인화된 생활습관 및 패턴이 생기고 있으며, 잘못된 생활습관으로 인해 관절질환자가 증가하고 있다. 또한 1인 가구가 점점 증가하면서 응급상황이 발생할 경우 알맞은 시간에 응급처치를 받지 못하는 경우가 생긴다. 건강과 질병관리에 필요한 개인의 상태에 따른 정확한 분석을 통해 스스로 관리할 수 있는 정보와 응급상황에 맞는 케어가 필요하다. 딥러닝 중에서 CNN은 데이터의 분류 및 예측에 효율적으로 사용된다. CNN은 데이터 특징에 따라 정확도 및 처리 속도에 차이를 보인다. 따라서 실시간 헬스케어를 위해 처리속도 향상과 정확도 개선이 필요하다. 본 논문에서는 관절질환 관리를 위한 Mask R-CNN을 이용한 모션 모니터링을 제안한다. 제안하는 방법은 Mask R-CNN을 이용하여 CNN의 정확도와 처리 속도를 개선하는 방법이다. 사용자의 모션을 신경망에 학습시킨 후 사용자의 모션이 학습된 데이터와 차이가 있을 경우 사용자에게 관리법을 피드백 해주고 보호자에게 응급상황을 알릴 수 있으며 상황에 맞는 적절한 조치를 취할 수 있다.

토지피복지도와 KOMPSAT-3A위성영상을 활용한 환경성평가지도의 구축 (Construction Method of ECVAM using Land Cover Map and KOMPSAT-3A Image)

  • 권희성;송아람;정세정;이원희
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.367-380
    • /
    • 2022
  • 본 연구에서는 KOMPSAT-3A 위성영상과 세분류 토지피복지도를 이용한 환경가치등급 분류를 수행하여 국토환경성평가지도의 주기적인 갱신 및 제작 가능성을 제시하였다. 환경성평가지도(ECVAM: Environmental Conservation Value Assessment Map)는 62개의 법제적 평가항목과 8개의 환경·생태적 평가항목을 기준으로 국토의 환경적 가치를 5단계의 등급으로 평가한 지도이며, 1:25000과 1:5000의 두 가지 축척으로 제공되고 있다. 하지만 1:5000 축척의 환경성평가지도는 참조자료의 부재 및 상이한 제작년도 등 다양한 제약조건으로 인해 1년 단위의 느린 갱신주기로 제작되고 있다. 이에 본 연구에서는 KOMPSAT-3A 위성영상과 광학지수(SI: Spectral Indices) 그리고 세분류 토지피복지도를 활용하여 딥러닝 기법 중 하나인 CNN (Convolutional Neural Network)을 기반으로 정확하고 최신정보가 반영된 1:5000 환경성평가지도를 구축 가능성을 확인하고자 한다. 실험 결과, 본 연구에서 제시한 방법으로 제작한 환경성평가지도의 정확도는 각각 87.25%, 85.88%로 산출되었다. 연구의 결과를 통하여 위성영상, 광학지수 그리고 토지피복분류를 활용한 환경성평가지도의 구축 가능성을 확인할 수 있었다.

KOMPSAT 정사모자이크 영상으로부터 U-Net 모델을 활용한 농촌위해시설 분류 (Semantic Segmentation of Hazardous Facilities in Rural Area Using U-Net from KOMPSAT Ortho Mosaic Imagery)

  • 공성현;정형섭;이명진;이광재;오관영;장재영
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1693-1705
    • /
    • 2023
  • 국토 면적의 약 90%를 차지하는 농촌은 여러가지 공익적 기능을 수행하는 공간으로서 중요성과 가치가 증가하고 있지만 주거지 인근에 축사, 공장, 태양광패널 등 주민생활에 불편을 미치는 시설들이 무분별하게 들어서면서 농촌 환경과 경관이 훼손되고 주민 삶의 질이 낮아지고 있다. 농촌지역의 무질서한 개발을 방지하고 농촌 공간을 계획적으로 관리하기 위해서는 농촌지역 내 위해시설에 대한 탐지 및 모니터링이 필요하다. 주기적으로 취득 가능하고 전체 지역에 대한 정보를 얻을 수 있는 위성영상을 통해 데이터의 취득이 가능하고, 합성곱 신경망 기법을 통한 영상 기반 딥러닝 기술을 활용하여 효과적인 탐지가 가능하다. 따라서 본 연구에서는 의미적 분할(Semantic segmentation)에서 높은 성능을 보이는 U-Net 모델을 이용하여 농촌 지역에서 잠재적으로 위해시설이 될 수 있는 농촌시설을 분류하는 연구를 수행하였다. 본 연구에서는 2020년에 제작된 공간해상도 0.7 m의 KOMPSAT 정사모자이크 광학영상을 한국항공우주연구원으로부터 제공받아 사용하였으며 축사, 공장, 태양광 패널에 대한 AI 학습용 데이터를 직접 제작하여 학습 및 추론을 진행하였다. U-Net을 통해 학습시킨 결과 픽셀 정확도(pixel accuracy)는 0.9739, mean Intersection over Union (mIOU)은 0.7025의 값을 도출하였다. 본 연구 결과는 농촌 지역의 위험 시설물 모니터링에 활용될 수 있으며, 농촌계획 수립에 있어 기초 자료로 활용될 수 있을 것으로 기대된다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

온실의 환경요인을 이용한 인공신경망 기반 수경 재배 파프리카의 증산량 추정 (Transpiration Prediction of Sweet Peppers Hydroponically-grown in Soilless Culture via Artificial Neural Network Using Environmental Factors in Greenhouse)

  • 남두성;이준우;문태원;손정익
    • 생물환경조절학회지
    • /
    • 제26권4호
    • /
    • pp.411-417
    • /
    • 2017
  • 광도, 포차와 같은 환경요인과 엽면적 지수와 같은 생육요인은 증산 속도를 변화시키는 중요한 변수이다. 본 연구에서는 Penman-Monteith의 증산 모델과 인공신경망(ANN)에 학습에 의한 증산속도 추정값을 비교하는 것을 목표로 하였다. 파프리카(Capsicum annuum L. cv. Fiesta)의 증산속도 추정은 로드셀을 이용한 배지의 중량변화를 통해 계산하였다. 온도, 상대습도, 배지 중량 데이터는 1분 단위로 2개월간 수집하였다. 증산량은 일차식으로는 정확한 추정이 어렵기 때문에, 기존의 Penman-Monteith식에 보정 광도를 사용한 수정식 Shin 등(2014)을 사용하였다. 이와는 별개로 ANN을 사용하여 증산량을 추정 비교하였다. 이를 위하여 광도, 온도, 습도, 엽면적지수, 시간을 사용한 입력층과 5개의 은닉층으로 구성된 ANN을 구축하였다. 각 은닉층의 퍼셉트론 개수는 가장 정확성이 높은 512개로 하였다. 검증 결과, 보정된 Penman-Monteith 모델식의 $R^2=0.82$이었고, ANN의 $R^2=0.94$로 나타났다. 따라서 ANN은 일반적인 모델식에 비해 정확한 증산량 추정이 가능한 것으로 나타났고, 추후 수경재배의 효율적인 관수전략 수립에 있어 적용 가능할 것으로 판단되었다.

웨어러블 응용을 위한 CNN 기반 손 제스처 인식 (CNN-Based Hand Gesture Recognition for Wearable Applications)

  • 문현철;양안나;김재곤
    • 방송공학회논문지
    • /
    • 제23권2호
    • /
    • pp.246-252
    • /
    • 2018
  • 제스처는 스마트 글라스 등 웨어러블 기기의 NUI(Natural User Interface)로 주목받고 있다. 최근 MPEG에서는 IoT(Internet of Things) 및 웨어러블 환경에서의 효율적인 미디어 소비를 지원하기 위한 IoMT(Internet of Media Things) 표준화를 진행하고 있다. IoMT에서는 손 제스처 검출과 인식이 별도의 기기에서 수행되는 것을 가정하고 이들 모듈간의 인터페이스 규격을 제공하고 있다. 한편, 최근 인식률 개선을 위하여 딥러닝 기반의 손 제스처 인식 기법 또한 활발히 연구되고 있다. 본 논문에서는 IoMT의 유스 케이스(use case)의 하나인 웨어러블 기기에서의 미디어 소비 등 다양한 응용을 위하여 CNN(Convolutional Neural Network) 기반의 손 제스처 인식 기법을 제시한다. 제시된 기법은 스마트 글래스로 획득한 스테레오 비디오로부터 구한 깊이(depth) 정보와 색 정보를 이용하여 손 윤곽선을 검출하고, 검출된 손 윤곽선 영상을 데이터 셋으로 구성하여 CNN을 학습한 후, 이를 바탕으로 입력 손 윤곽선 영상의 제스처를 인식한다. 실험결과 제안기법은 95%의 손 제스처 인식율를 얻을 수 있음을 확인하였다.

GOCI를 이용한 동중국해 표층 염분 산출 알고리즘 개발 (A Development for Sea Surface Salinity Algorithm Using GOCI in the East China Sea)

  • 김대원;김소현;조영헌
    • 대한원격탐사학회지
    • /
    • 제37권5_2호
    • /
    • pp.1307-1315
    • /
    • 2021
  • 매년 여름철 양자강에서 유출되는 저염분수는 동중국해 뿐만 아니라 제주도 주변 해역의 염분 변화에 큰 영향을 미치며 때때로 그 영향은 한반도 연안에 국한되지 않고 대한해협을 통과하여 동해 외해 까지 확장되기도 한다. 한반도 주변으로 확장된 양자강 유출수는 해양 물리 및 생태학적으로 많은 영향을 끼치며 어업 및 양식업에 큰 피해를 유발하기도 한다. 그러나 현장조사의 한계점 때문에 동중국해에서 확산되는 저염분수를 지속적으로 관측하기에는 현실적으로 어려움이 있다. 이러한 이유로 양자강 유출수의 확산을 실시간으로 모니터링하기 위해 인공위성을 활용한 표층 염분 산출 연구가 많이 진행되어 왔다. 본 연구에서는 시간 및 공간 해상도가 상대적으로 좋은 GOCI(Geostationary Ocean Color Imager)를 활용한 동중국해 표층 염분 산출 알고리즘을 개발하였다. 알고리즘 개발을 위해 기계학습 기법 중 하나인 MPNN(Multilayer Perceptron Neural Network)을 이용하였으며, 출력층에는 SMAP(Soil Moisture Active Passive) 위성의 표층 염분 자료를 활용하였다. 이전 연구에서 2016년 자료를 이용한 표층 염분 산출 알고리즘이 개발되었으나 본 연구에서는 연구 기간을 2015년 부터 2020년까지로 확장하여 알고리즘 성능을 개선하였다. 2011년부터 2019년까지 동중국해에서 관측된 국립수산과학원의 정선조사자료를 이용하여 알고리즘 성능을 검증한 결과로 R2는 0.61과 RMSE는 1.08 psu로 나타났다. 본 연구는 GOCI를 이용한 동중국해 표층 염분 모니터링 알고리즘 개발을 위해 수행되었으며, 향후 GOCI-II의 표층 염분 산출 알고리즘 개발에 많은 기여를 할 것으로 기대된다.

연속파 레이다를 활용한 이진 신경망 기반 사람 식별 및 동작 분류 시스템 설계 및 구현 (Design and Implementation of BNN based Human Identification and Motion Classification System Using CW Radar)

  • 김경민;김성진;남궁호정;정윤호
    • 한국항행학회논문지
    • /
    • 제26권4호
    • /
    • pp.211-218
    • /
    • 2022
  • 연속파 레이다는 카메라나 라이다와 같은 센서에 비해서 안정성과 정확성이 보장된다는 장점이 있다. 또한 이진 신경망은 다른 딥러닝 기술에 비해서 메모리 사용량과 연산 복잡도를 크게 줄일 수 있는 특징이 있다. 따라서 본 논문에서는 연속파 레이다와 이진 신경망 기반 사람 식별 및 동작 분류 시스템을 제안한다. 연속파 레이다 센서를 통해 수신된 신호를 단시간 푸리에 변환함으로써 스펙트로그램을 생성한다. 이 스펙트로그램을 기반으로 레이다를 향해 사람이 다가오는지 감지하는 알고리즘을 제안한다. 더불어, 최적화된 이진 신경망 모델을 설계하여 사람 식별 90.0%, 동작 분류 98.3%의 우수한 정확도를 지원할 수 있음을 확인하였다. 이진 신경망 연산을 가속하기 위해 FPGA (field programmable gate array)를 이용하여 이진 신경망 연산에 대한 하드웨어 가속기를 설계하였다. 해당 가속기는 1,030개의 로직, 836개의 레지스터, 334.906 Kbit의 블록 메모리를 사용하여 구현되었고, 추론에서 결과 전송까지 총 연산 시간이 6 ms로 실시간 동작이 가능함을 확인하였다.

CAE 알고리즘을 이용한 레이더 강우 보정 평가 (Application of convolutional autoencoder for spatiotemporal bias-correction of radar precipitation)

  • 정성호;오성렬;이대업;레수안히엔;이기하
    • 한국수자원학회논문집
    • /
    • 제54권7호
    • /
    • pp.453-462
    • /
    • 2021
  • 최근 몇 년 동안 국지성 집중호우의 빈도가 증가함에 따라 고해상도 레이더 자료의 중요성 및 활용성이 증가하고 있다. 하지만 여전히 레이더 자료의 경우 시·공간적 편의가 존재하고 이를 보정하는 것이 매우 중요하며 많은 연구에서 레이더 강우의 편의 보정을 위해 다양한 통계적 기법이 시도되었다. 본 연구에서는 시·공간적으로 강우를 추정할 수 있는 이중편파레이더의 편의를 지점 강우와 비교하여 보정하는 것을 목표로 한다. 환경부의 수자원관리 및 홍수 예측에 사용되는 S-밴드 이중편파레이더의 편의 보정을 위하여 합성곱신경망(Convolutional Neural Network, CNN)기반의 Convolutional Autoencoder (CAE) 알고리즘을 구축하여 편의 보정을 수행하였다. CAE 모델의 입력자료는 환경부의 10분 단위 레이더 합성 강우자료와 같은 공간해상도로 보간된 지점 관측 강우자료를 사용하였으며, 자료의 기간은 미호천 유역에 홍수 경보가 발령된 2017년 7월 16일 00시부터 13시까지의 10분 단위 자료를 사용하였다. 그 결과로 지점 강우 대비 원시 레이더 강우의 편의가 줄어듦을 확인할 수 있으며 시·공간적으로 개선된 결과를 보여주고 있다. 따라서 각 인접한 격자 간의 공간 관계를 학습하는 CAE 모델은 레이더 및 위성에서 추정되는 격자형 기후 자료의 실시간 편의 보정에 사용할 수 있을 것으로 분석되었다.