• 제목/요약/키워드: deep neural networks

검색결과 855건 처리시간 0.022초

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

  • 조민수;권철홍
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.675-681
    • /
    • 2021
  • 최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.

비소세포폐암 환자의 재발 예측을 위한 흉부 CT 영상 패치 기반 CNN 분류 및 시각화 (Chest CT Image Patch-Based CNN Classification and Visualization for Predicting Recurrence of Non-Small Cell Lung Cancer Patients)

  • 마세리;안가희;홍헬렌
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권1호
    • /
    • pp.1-9
    • /
    • 2022
  • 비소세포폐암(NSCLC)은 전체 폐암 중 85%의 높은 비중을 차지하며 사망률(22.7%)이 다른 암에 비해 현저히 높은 암으로 비소세포폐암 환자의 수술 후 예후에 대한 예측은 매우 중요하다. 본 연구에서는 종양을 관심영역으로 갖는 비소세포폐암 환자의 수술 전 흉부 CT 영상 패치의 종류를 종양 관련 정보에 따라 총 다섯 가지로 다양화하고, 이를 입력데이터로 갖는 사전 학습 된 ResNet 과 EfficientNet CNN 네트워크를 사용하여 단일 모델과 간접 투표 방식을 이용한 앙상블 모델, 그리고 3 개의 입력 채널을 활용한 앙상블 모델에서의 실험 결과 및 성능을 오분류의 사례와 Grad-CAM 시각화를 통해 비교 분석한다. 실험 결과, 종양 주변부 패치를 학습한 ResNet152 단일 모델과 EfficientNet-b7 단일 모델은 각각 87.93%와 81.03%의 정확도를 보였다. 또한 ResNet152 에서 총 3 개의 입력 채널에 각각 영상 패치, 종양 주변부 패치, 형상 집중 종양 내부 패치를 넣어 앙상블 모델을 구성한 경우에는 정확도 87.93%를, EfficientNet-b7 에서 간접 투표 방식으로 영상 패치와 종양 주변부 패치 학습 모델을 앙상블 한 경우에는 정확도 84.48%를 도출하며 안정적인 성능을 보였다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

정지궤도 기상위성 및 수치예보모델 융합을 통한 Multi-task Learning 기반 태풍 강도 실시간 추정 및 예측 (Multi-task Learning Based Tropical Cyclone Intensity Monitoring and Forecasting through Fusion of Geostationary Satellite Data and Numerical Forecasting Model Output)

  • 이주현;유철희;임정호;신예지;조동진
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1037-1051
    • /
    • 2020
  • 최근 기후변화로 인해 강도가 높은 태풍의 빈도가 높아짐에 따라 태풍 예측의 중요성이 강조되고 있는 데, 태풍경로예측에 비해 태풍강도예측에 대한 연구는 미비한 상황이다. 이에 본 연구에서는 딥러닝 모델인 Multi-task learning (MTL) 기법을 활용하여 정지궤도기상위성을 활용한 관측자료와 수치예보모델을 융합한 실시간 추정 및 6시간, 12시간 후의 태풍강도예측 모델을 제안하고자 한다. 본 연구에서는 2011년에서 2016년까지 북서태평양에서 발생한 총 142개의 태풍을 대상으로 강도 예측 연구를 시행하였다. 한국 최초의 기상위성인 Communication, Ocean and Meteorological Satellite (COMS) Meteorological Imager (MI)를 활용하여 태풍의 관측영상을 추출하였고, National Center of Environmental Prediction (NCEP)에서 제공하는 Climate Forecast System version 2 (CFSv2)를 활용하여 6시간, 12시간 후의 태풍 주변 대기 및 해양 예측변수를 추출하였다. 본 연구에서는 각 입력자료의 활용성을 정량화 하기 위하여, 위성 기반 태풍관측영상만을 활용한 MTL 모델(Scheme 1)과 수치예보모델을 융합적으로 활용한 MTL 모델(Scheme 2)을 구축하고, 각 모델의 훈련 및 검증 성능을 정량적으로 비교하였다. 실시간 강도 추정의 결과 scheme 1과 scheme 2에서 비슷한 성능을 보이는 반면, 6시간, 12시간 후 태풍강도예측의 경우 scheme 2에서 각각 13%, 16% 개선된 결과를 보였다. 태풍 단계별 예측성능에 대한 분석을 시행한 결과, 저강도 태풍일수록 낮은 평균제곱근오차를 보인 반면, 대부분의 강도 단계에서 평균제곱근편차비는 30% 미만의 값을 보이며 유의미한 검증 결과를 보였다. 이에 본 연구에서 제시한 두가지 모델을 기반으로 2014년 발생한 태풍 HALONG의 시계열검증을 시행하였다. 그 결과, scheme 1의 경우 태풍 초기발달단계에서 태풍의 강도를 약 20 kts가량 과대 추정하는 경향을 보이는데, 환경예측자료를 융합한 scheme 2에서는 오차가 약 5 kts가량으로 과대 추정 경향이 줄어들었다. 본 연구에서 제시하는 현재, 6시간, 12시간 후 강도를 동시에 추출하는 MTL 모델은 Single-tasking model 대비 약 300%의 시간 효율을 보이며, 향후 신속한 태풍 예보 정보 추출에 큰 기여를 할 수 있을 것으로 기대된다.

CE-QUAL-W2를 이용한 충주호의 기후변화에 따른 탁수 및 부영양화 영향평가 (Evaluation of Future Turbidity Water and Eutrophication in Chungju Lake by Climate Change Using CE-QUAL-W2)

  • 안소라;하림;윤성완;김성준
    • 한국수자원학회논문집
    • /
    • 제47권2호
    • /
    • pp.145-159
    • /
    • 2014
  • 본 연구에서는 충주댐을 대상으로 유역모델인 SWAT과 저수지모델인 CE-QUAL-W2를 연계 적용하여 기후변화에 따라 저수지로 유입되는 하천의 유량 및 탁수발생량을 모의하고, 저수지내의 탁수변화 및 부영양화 영향평가를 통한 저수지 수환경 변화를 전망하였다. 먼저 SWAT을 적용하여 강우시 저수지 유입하천의 유량 및 수질을 모의하여 모델의 재현성을 검토하였으며, 모형의 보정(2000~2005)과 검증(2006~2010) 결과 모델 예측값과 실측값이 적절하게 일치하는 것으로 나타났다. SWAT의 결과를 CE-QUAL-W2의 하천유량 및 유입수 수질경계조건 입력자료로 활용하고, 보정(2010년)과 검증(2008년)을 통하여 저수지 내 시간에 따른 물수지, 수온 변화, 부유물질(SS), T-N, T-P 및 부영양화(Chl-a) 양상 등을 분석하고 모델의 재현성을 검토하였다. 이후 기후변화 시나리오 적용에 따른 저수지 내수환경변화를 모의하기 위한 기후변화자료로 IPCC AR4 GCM(ECHO-G)을 고해상도지역 기후 시나리오로 개선시킨 RCM(MM5)의 A1B 시나리오를 다시 태풍사상을 고려한 인공신경망 기법에 의해 상세화하여 이용하였다. 기후변화 시나리오에 따른 기온증가의 영향으로 미래로 갈수록 상층수온은 증가하는 반면 심층수온은 감소하는 경향을 보였다. SS 최고유입농도는 평수년에 비해 풍수년에 17%, 갈수년에 0.2% 가량 증가하는 것으로 나타났다. 호소내 SS 10mg/L 이상 점유일수는 평수년에 비해 풍수년이 6일, 갈수년이 17일 증가하였고, 점유율 역시 풍수년에 24%, 갈수년에 26%가량 증가하는 것으로 분석되었다. 미래로 갈수록 기후변화가 충주댐 탁수장기화에 영향을 미치는 것으로 분석되었다. Chl-a의 최고농도는 평수년에 비해 풍수년에 19%, 갈수년에 3% 가량 조류의 농도가 증가되는 것으로 나타나 조류의 영향이 커지는 것을 알 수 있었다.