• 제목/요약/키워드: Deep-Learning

검색결과 5,580건 처리시간 0.037초

위성영상 이미지를 활용한 연구 동향 및 데이터셋 리뷰 (Research Trends and Datasets Review using Satellite Image)

  • 김세형;채정우;강주영
    • 스마트미디어저널
    • /
    • 제11권1호
    • /
    • pp.17-30
    • /
    • 2022
  • 기존 컴퓨터 비전의 연구 동향과 마찬가지로, 위성영상을 이용한 연구도 GPU 기반의 컴퓨터 연산능력과 이미지 처리와 관련된 딥러닝 방법론의 발전으로 많이 이루어지고 있다. 그로 인해 다양한 분야에 위성영상이 활용되고 있고, 위성 영상을 활용에 관한 연구도 증가하고 있다. 본 연구에서는 위성영상의 연구 활용 분야와 위성영상을 활용한 연구에 이용할 수 있는 데이터셋에 대해 소개하도록 한다. 먼저, 위성영상을 활용한 연구를 수집하여 연구 방법에 따라 분류하였다. 크게 분류 기반 연구와 회귀 기반 연구로 분류하였고, 그 이외의 방법으로 활용한 논문들을 정리하였다. 다음으로 위성영상을 활용한 연구들에서 이용한 데이터셋을 정리하였다. 본 연구에서는 데이터셋의 정보와 연구에서의 활용 방법에 대해 제안한다. 이와 함께 최근 AI hub에서 개방한 국내 위성영상 데이터셋의 정리와 활용 방안에 대해 소개한다. 마지막으로, 위성 이미지 관련 연구의 한계점과 앞으로의 동향을 간략하게 제시하였다.

d-vector를 이용한 한국어 다화자 TTS 시스템 (A Korean Multi-speaker Text-to-Speech System Using d-vector)

  • 김광현;권철홍
    • 문화기술의 융합
    • /
    • 제8권3호
    • /
    • pp.469-475
    • /
    • 2022
  • 딥러닝 기반 1인 화자 TTS 시스템의 모델을 학습하기 위해서 수십 시간 분량의 음성 DB와 많은 학습 시간이 요구된다. 이것은 다화자 또는 개인화 TTS 모델을 학습시키기 위해서는 시간과 비용 측면에서 비효율적 방법이다. 음색 복제 방법은 새로운 화자의 TTS 모델을 생성하기 위하여 화자 인코더 모델을 이용하는 방식이다. 학습된 화자 인코더 모델을 통해 학습에 사용되지 않은 새로운 화자의 적은 음성 파일로부터 이 화자의 음색을 대표하는 화자 임베딩 벡터를 만든다. 본 논문에서는 음색 복제 방식을 적용한 다화자 TTS 시스템을 제안한다. 제안한 TTS 시스템은 화자 인코더, synthesizer와 보코더로 구성되어 있는데, 화자 인코더는 화자인식 분야에서 사용하는 d-vector 기법을 적용한다. 학습된 화자 인코더에서 도출한 d-vector를 synthesizer에 입력으로 추가하여 새로운 화자의 음색을 표현한다. MOS와 음색 유사도 청취 방법으로 도출한 실험 결과로부터 제안한 TTS 시스템의 성능이 우수함을 알 수 있다.

코로나 확진자 수 예측을 위한 BI-LSTM과 GRU 알고리즘의 성능 비교 분석 (Comparative analysis of performance of BI-LSTM and GRU algorithm for predicting the number of Covid-19 confirmed cases)

  • 김재호;김장영
    • 한국정보통신학회논문지
    • /
    • 제26권2호
    • /
    • pp.187-192
    • /
    • 2022
  • 위드 코로나의 예정 발표일이 결정되었고, 위드 코로나에 가장 중요한 조건인 백신 접종을 아직 부작용 걱정 때문에 완료하지 않은 사람들이 있다. 또한 위드 코로나로 경제는 회복될 수 있지만 감염자 수는 급증할 수 있다. 본 논문은 위드 코로나에 앞서 코로나19에 대한 경각심을 깨우고자, 코로나19를 비선형 확률과정으로 예측한다. 여기서 딥러닝의 RNN중 양방향 LSTM인 BI-LSTM와 LSTM보다 gate수를 줄인 GRU를 사용하고 이것을 train set, test set, 손실함수, 잔차분석, 정규분포, 자기 상관을 통해서 비교 분석하여 어떠한 성능이 더 좋은지 비교하고 예측한다.

가려진 사람의 자세추정을 위한 의미론적 폐색현상 증강기법 (Semantic Occlusion Augmentation for Effective Human Pose Estimation)

  • 배현재;김진평;이지형
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.517-524
    • /
    • 2022
  • 사람의 자세추정(Human pose estimation)은 사람의 관절 키포인트를 추출하여 자세를 추정하는 방법이다. 폐색현상(Occlusion)이 발생하면, 사람의 관절이 가려지므로 관절 키포인트 추출 성능이 낮아진다. 폐색현상은 총 3가지로 행동할 때 스스로 가려짐, 다른 사물에 의해 가려짐과 배경에 의해 가려짐으로 크게 나뉜다. 본 논문에서는 폐색현상 증강기법을 활용하여 효과적인 자세추정방법을 제안한다. 자세추정방법이 지속적으로 연구되어왔지만, 자세추정방법의 가려짐 현상에 관한 연구는 상대적으로 부족한 상태이다. 이를 해결하기 위해 저자는 사람의 관절을 타겟팅하여 의도적으로 가리는 데이터 증강기법을 제안한다. 본 논문에서의 실험 결과는 의도적으로 폐색현상 증강기법을 활용하면 폐색현상에 강인하며 성능이 올라간 것을 보여준다.

Convolutional neural network 기법을 이용한 턱수염물범 신호 판별 (Classification of bearded seals signal based on convolutional neural network)

  • 김지섭;윤영글;한동균;나형술;최지웅
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.235-241
    • /
    • 2022
  • 수동 음향 관측을 통해 수집된 방대한 양의 데이터에서 해양포유류의 소리를 탐지하고 식별하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)을 활용한 연구가 많이 수행되고 있다. 본 연구는 2017년 8월부터 2018년 8월까지 동시베리아 해에서 수집된 수중음향 스펙트럼 이미지를 기반으로 CNN을 활용하여 턱수염물범 소리의 분류 자동화 가능성을 확인해 보았다. 학습 데이터로서 다른 소음이 거의 포함되지 않은 뚜렷한 턱수염물범 소리를 사용하였을 때, 암기로 인한 과적합이 발생하였다. 일부 데이터를 소음이 포함된 데이터로 교체하여 학습시켜 수집된 전체 데이터로 평가한 결과 정확도(0.9743), 정밀도(0.9783), 재현율(0.9520)으로 모델이 이전보다 일반화되어 과적합이 방지되는 것을 확인하였다. 본 연구를 통해 물범신호 분류는 학습 데이터에 소음이 포함되었을 때 성능이 증가하는 것으로 나타났다.

홀로그램 압축으로 인한 열화 보정을 위한 네트워크 설계 (Network design for correction of deterioration due to hologram compression)

  • 송준범;장준혁;황윤석;조인제
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.377-379
    • /
    • 2020
  • 홀로그램은 SLM(공간 광변조기)의 픽셀 피치와 빛의 파장에 대한 의존성이 있는 데이터이며 디지털 홀로그램의 품질은 단위 픽셀 피치와 전체 해상도에 비례하게 된다. 또한 각 픽셀마다 복소값을 가지므로 디지털 홀로그램의 데이터량 또한 기하급수적으로 증가하여 그 크기가 매우 클 수밖에 없다. 따라서 효율적으로 디지털 홀로그램 파일을 다루기 위해서는 코덱을 통해 파일 크기를 축소하여 저장하는 것이 필수적이며 최근에는 코덱으로 인해 손상된 화질을 복원하는 연구가 활발히 진행 중이다. 본 논문에서는 홀로그램 표준 데이터인 JPEG Pleno의 홀로그램 이미지를 사용하였으며 홀로그램 이미지를 JPEG2000, AVC, HEVC코덱을 통해 압축 및 복원했을 때 나타나는 화질손상을 딥러닝 네트워크로 복원하여 화질 개선이 이루어지는지 알아보고 원본 홀로그램과 비교하여 정량적으로 화질의 개선 정도를 알아본다.

  • PDF

딥러닝 기반 객체 인식과 최적 경로 탐색을 통한 멀티 재난 드론 시스템 설계 및 구현에 대한 연구 (A Study on the Design and Implementation of Multi-Disaster Drone System using Deep Learning-based Object Recognition and Optimal Path Planning)

  • 김진혁;이태희;박종현;정예림;장서현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.556-559
    • /
    • 2020
  • 최근 태풍, 지진, 산불, 산사태, 전쟁 등 다양한 재난 상황으로 인한 인명피해와 자금 손실이 꾸준히 발생하고 있고 현재 이를 예방하고 복구하기 위해 많은 인력과 자금이 소요되고 있는 실정이다. 이러한 여러 재난 상황을 미리 감시하고 재난 발생의 빠른 인지 및 대처를 위해 본 논문에서는 인공지능 기반의 재난 드론 시스템을 설계 및 개발하였다. 본 연구에서는 사람이 감시하기 힘든 지역에 여러 대의 재난 드론을 이용하며 딥러닝 기반의 최단 경로 알고리즘을 적용해 각각의 드론이 최적의 경로로 효율적 탐색을 실시한다. 또한 드론의 근본적 문제인 배터리 용량 부족에 대한 문제점을 해결하기 위해 Ant Colony Optimization (ACO) 기술을 이용하여 각 드론의 최적 경로를 결정하게 된다. 제안한 시스템 구현을 위해 여러 재난 상황 중 산불 상황에 적용하였으며 전송된 데이터를 기반으로 산불지도를 만들고, 빔프로젝터를 탑재한 드론이 출동한 소방관에게 산불지도를 시각적으로 보여주었다. 제안한 시스템에서는 여러 대의 드론이 최적 경로 탐색 및 객체인식을 동시에 수행함으로써 빠른 시간 내에 재난 상황을 인지할 수 있다. 본 연구를 바탕으로 재난 드론 인프라를 구축하고 조난자 탐색(바다, 산, 밀림), 드론을 이용한 자체적인 화재진압, 방범 드론 등에 활용할 수 있다.

과학영재학교 학생들의 정보요구 및 정보이용행태에 관한 연구 (Information Needs and Information Seeking Behaviors of Students in the Science School for Gifted)

  • 박해인;이지연
    • 정보관리학회지
    • /
    • 제40권2호
    • /
    • pp.33-57
    • /
    • 2023
  • 본 연구는 과학영재학교 재학생을 대상으로 심층면담을 실시하여 정보요구와 정보이용행태를 분석하는데 목적이 있다. 선행연구를 바탕으로 연구를 설계하고, 전국 8개의 과학영재학교 중 6개 학교에 재학 중인 10명의 학생들을 대상으로 반구조화된 면담을 진행하여 정보요구와 정보이용행태 전반을 탐색하였다. 과학영재학교 학생들의 정보요구를 교과 활동과 교과 외 활동 영역으로 확인할 수 있었고, 학생들의 주요 관심 주제인 수업 및 학습, 연구 활동에서의 정보이용행태를 ISP 모형 기반으로 살펴보았다. 정보 이용의 전 과정에서 선호정보원을 파악하고, 이를 종합하여 과학영재학교 학생들의 정보이용행태의 특이점과 시사점을 논의하였다. 본 연구는 영재학교 도서관 연구를 위한 기초자료로 사용되며, 과학 주제 분야에 심화적인 관심과 재능이 있는 학생들을 위한 서비스를 제공하기 위한 자료로도 활용할 수 있는 점에서 그 의의를 찾을 수 있다.

국내 외래객 출입국 데이터를 활용한 관광객 일별 수요 예측 인공지능 모델 연구 (A Study on Artificial Intelligence Model for Forecasting Daily Demand of Tourists Using Domestic Foreign Visitors Immigration Data)

  • 김동건;김동희;장승우;신성국;김광수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.35-37
    • /
    • 2021
  • 외래 관광객 수요를 분석하고 예측하는 것은 관광 정책을 수립하고 기획하는데 지대한 영향을 미치기 때문에 관광 산업 분야에서 매우 중요하다. 외래 관광객 데이터는 여러 외적 요인들에 의해 영향을 받기 때문에, 시간에 따른 미세한 변화가 많다는 특징을 갖는다. 따라서, 최근에는 관광객 입국자 수요를 예측하기 위해 경제 변수 등 여러 외적 요인들도 함께 반영하여 예측 모델을 설계하는 연구를 진행하고 있다. 그러나 기존의 시계열 예측에 주로 사용되는 회귀분석 모델과 순환신경망 모델은 여러 변수들을 반영하는 시계열 예측에 있어 좋은 성능을 보이지 못했다. 따라서 우리는 합성곱 신경망을 활용하여 이러한 한계점들을 보완한 외래 관광객 수요 예측 모델을 소개한다. 본 논문에서는 한국관광공사에서 제공한 과거 10개년 외래 관광객 데이터와 추가적으로 수집한 여러 외적 요인들을 입력 변수로 반영하는 1차원 합성곱 신경망을 설계하여 외래 관광객 수요를 예측하는 모델을 제시한다.

  • PDF

딥러닝 모형을 이용한 Sentinel SAR 기반 고해상도 토양수분 산정 (Estimation of High-Resolution Soil Moisture Using Sentinel-1A/B SAR and Deep Learning Regression Model)

  • 이태화;김상우;천범석;정영훈;신용철
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.114-114
    • /
    • 2021
  • 본 연구에서는 Sentinel-1 SAR 센서 기반 이미지자료와 딥러닝기법을 이용하여 고해상도 토양수분을 산정하였다. 입력자료는 지표특성(모래함량, 점토함량, 경사도), 인공위성 기반의 강우와 LANDSAT 기반의 이미지자료(NDVI, LST, 공간분포 토양수분)를 사용하였다. 강우자료의 경우 GPM(Global Precipitation Measurement) 일강우 자료를 사용하였으며, 관측일 기준으로 5일전까지의 강우자료와 5일평균강우를 구분하여 사용하였다. LANDSAT 기반의 토양수분 이미지자료와 지점관측 토양수분을 이용하여 검·보정 이후 딥러닝 모형의 입력자료로 사용하였다. 입력자료는 30m × 30m 해상도로 Resample 하여 딥러닝 모형의 학습을 진행하였으며, 학습에 사용된 모형을 이용하여 Sentinel-1 기반의 고해상도(10m × 10m) 토양수분이미지를 산정하였다. 검증지점은 거창군 거창읍, 계룡시 두마면, 장수군 장수읍 및 무주군 무주읍 토양수분 관측지점을 선정하였다. 거창군 거창읍의 산정결과, LANDSAT 기반의 토양수분 이미지와 DNN 기반의 토양수분 이미지가 매우 유사하게 나타났으며, 모의값(DNN 기반 토양수분)이 실측값(LANDSAT 기반의 토양수분)을 잘 반영한 것(R: 0.875 ; RMSE: 0.013)으로 나타났다. 또한 학습모형을 토지피복이 유사한 지역에 적용하여 토양수분을 산정한 결과 검증지점 계룡시(R: 0.897 ; RMSE: 0.014), 장수군(R: 0.770 ; RMSE: 0.024) 및 무주군(R: 0.909 ; RMSE: 0.012)의 모의값이 실측값과 매우 유사한 것으로 나타났다. 이를 바탕으로 Seninel-1 SAR센서 이미지자료와 딥러닝기법을 연계한 고해상도 토양수분자료가 농업, 수문, 환경 등 다양한 분야에서 활용될 수 있을 것으로 판단된다.

  • PDF