• 제목/요약/키워드: 깊은 신경망

검색결과 65건 처리시간 0.024초

CARDB를 이용한 반복적인 업-다운 샘플링 네트워크 기반의 단일 영상 초해상도 복원 (Single Image Super-Resolution Using CARDB Based on Iterative Up-Down Sampling Architecture)

  • 김인구;유송현;정제창
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.242-251
    • /
    • 2020
  • 최근 단일 영상 초해상도에 깊은 합성 곱 신경망을 적용한 알고리듬이 많이 연구되었다. 현존하는 딥러닝 기반 초해상도 기법들은 네트워크의 후반부에 해상도를 업샘플링 하는 구조를 가진다. 이러한 구조는 저해상도에서 고해상도로 한 번에 매핑을 하기에 많은 정보를 예측하는 높은 확대율에서 비효율적인 구조를 가진다. 본 논문에서는 반복적인 업-다운 샘플링 구조를 기반으로 하여 채널 집중 잔여 밀집 블록을 이용한 단일 영상 초해상도 기법을 제안한다. 제안한 알고리듬은 저해상도와 고해상도의 매핑 관계를 효율적으로 예측하여 높은 확대율에서 기존의 알고리듬에 비해 최대 0.14dB 성능 향상과 개선된 주관적 화질을 보여준다.

저자원 환경의 음성인식을 위한 자기 주의를 활용한 음향 모델 학습 (Acoustic model training using self-attention for low-resource speech recognition)

  • 박호성;김지환
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.483-489
    • /
    • 2020
  • 본 논문에서는 저자원 환경의 음성인식에서 음향 모델의 성능을 높이기 위한 음향 모델 학습 방법을 제안한다. 저자원 환경이란, 음향 모델에서 100시간 미만의 학습 자료를 사용한 환경을 말한다. 저자원 환경의 음성인식에서는 음향 모델이 유사한 발음들을 잘 구분하지 못하는 문제가 발생한다. 예를 들면, 파열음 /d/와 /t/, 파열음 /g/와 /k/, 파찰음 /z/와 /ch/ 등의 발음은 저자원 환경에서 잘 구분하지 못한다. 자기 주의 메커니즘은 깊은 신경망 모델로부터 출력된 벡터에 대해 가중치를 부여하며, 이를 통해 저자원 환경에서 발생할 수 있는 유사한 발음 오류 문제를 해결한다. 음향 모델에서 좋은 성능을 보이는 Time Delay Neural Network(TDNN)과 Output gate Projected Gated Recurrent Unit(OPGRU)의 혼합 모델에 자기 주의 기반 학습 방법을 적용했을 때, 51.6 h 분량의 학습 자료를 사용한 한국어 음향 모델에 대하여 단어 오류율 기준 5.98 %의 성능을 보여 기존 기술 대비 0.74 %의 절대적 성능 개선을 보였다.

Pavement Crack Detection and Segmentation Based on Deep Neural Network

  • Nguyen, Huy Toan;Yu, Gwang Hyun;Na, Seung You;Kim, Jin Young;Seo, Kyung Sik
    • 한국정보기술학회논문지
    • /
    • 제17권9호
    • /
    • pp.99-112
    • /
    • 2019
  • 도로 포장면의 크랙(crack)은 도로포장 구조의 열화를 입증하는 중요한 신호와 증상이다. 카메라 영상기반 도로포장 크랙 탐지는 강도 비균질성, 위상 복잡성, 낮은 대조도 및 노이즈성의 텍스처 배경 때문에 어려운 문제이다. 본 논문은 흑백영상에 대하여 깊은 신경망(DNN)에 기반하여 픽셀수준의 도로 크랙 탐지 및 분할 문제에 대해 다룬다. 변형된 U-net 네트워크와 고수준 특징 네트워크를 포함하는 새로운 DNN 구조를 제안한다. 본 연구의 중요 기여는 융합 층을 통해 공급되는 이들 네트워크의 결합 방법이다. 우리가 아는 한, 본 연구는 보도블럭 크랙 분할 및 탐지 문제를 결합을 소개한 최초의 논문이다. 크랙 탐지 및 분할의 시스템 성능은 새로운 구조를 사용하여 급격히 향상되었다. 제안된 시스템을 2개의 공개 데이터셋­크랙 포레스트 데이터셋(CFD)와 AigleRN 데이터셋­에 대하여 구현하고 평가하였다. 본 논문의 시스템은 여덟 가지의 최신 알고리즘과 같은 데이터셋으로 실험을 하였을 때, 가장 뛰어난 결과를 보여주었다.

RAPGAN와 RRDB를 이용한 Image-to-Image Translation의 성능 개선 (Performance Improvement of Image-to-Image Translation with RAPGAN and RRDB)

  • 윤동식;곽노윤
    • 사물인터넷융복합논문지
    • /
    • 제9권1호
    • /
    • pp.131-138
    • /
    • 2023
  • 본 논문은 RAPGAN(Relativistic Average Patch GAN)과 RRDB(Residual in Residual Dense Block)을 이용한 Image-to-Image 변환의 성능 개선에 관한 것이다. 본 논문은 Image-to-Image 변환의 일종인 기존의 pix2pix의 결점을 보완하기 위해 세 가지 측면의 기술적 개선을 통한 성능 향상을 도모함에 그 목적이 있다. 첫째, 기존의 pix2pix 생성자와 달리 입력 이미지를 인코딩하는 부분에서 RRDB를 이용함으로써 더욱 더 깊은 학습을 가능하게 한다. 둘째, RAPGAN 기반의 손실함수를 사용해 원본 이미지가 생성된 이미지에 비해 얼마나 진짜 같은지를 예측하기 때문에 이 두 이미지가 모두 적대적 생성 학습에 영향을 미치게 된다. 마지막으로, 생성자를 사전학습시켜 판별자가 조기에 학습되는 것을 억제하도록 조치한다. 제안된 방법에 따르면, FID 측면에서 기존의 pix2pix보다 평균 13% 이상의 우수한 이미지를 생성할 수 있었다.

건축물 안전등급 산출을 위한 외관 조사 상태 평가 데이터 기반 DNN 모델 구축 (Development of a Building Safety Grade Calculation DNN Model based on Exterior Inspection Status Evaluation Data)

  • 이재민;김상용;김승호
    • 한국건축시공학회지
    • /
    • 제21권6호
    • /
    • pp.665-676
    • /
    • 2021
  • 노후 건축물의 수가 증가함에 따라, 건물의 안전진단, 유지 보수에 대한 중요성이 증가하고 있다. 기존 외관 조사는 점검자의 주관적인 판단이 수반되어 평가 결과가 다르고 객관성과 신뢰성이 떨어진다. 따라서 본 연구는 기존 연구를 통해 기실시된 외관 조사 및 상태 평가 프로세스의 한계를 제시하였으며, UAV, Laser Scanner를 통해 3D Point Cloud 데이터를 수집하였다. 또한, Reverse Engineering 기술을 이용하여 3D 모델을 생성한 후 객관적인 상태평가 데이터를 취득하였다. 이후 기존의 정밀검사 데이터와 정밀 안전진단 데이터를 활용하여 DNN 구조를 생성하고, 고정밀도 측정 장치를 이용하여 얻은 상태평가 데이터를 적용하여 객관적인 건물안전등급을 산출하였다. 자동화된 프로세스는 20개의 노후된 건축물에 적용되며 동일 면적 건축물 기준 수작업으로 실시되는 안전진단의 시간에 비해 약 50% 감소하였다. 이후 본 연구에서는 안전등급 결과값과 기존값을 비교하여 안전등급 산출과정의 정확성을 검증하고 약 90%의 높은 정확도를 가진 DNN을 구축하였다. 이는 향후 노후 건물의 안전등급 산정의 신뢰성이 향상되고 비용과 시간을 절약해 경제성이 향상될 것으로 기대된다.

딥러닝 알고리즘을 이용한 저선량 디지털 유방 촬영 영상의 복원: 예비 연구 (Radiation Dose Reduction in Digital Mammography by Deep-Learning Algorithm Image Reconstruction: A Preliminary Study)

  • 하수민;김학희;강은희;서보경;최나미;김태희;구유진;예종철
    • 대한영상의학회지
    • /
    • 제83권2호
    • /
    • pp.344-359
    • /
    • 2022
  • 목적 깊은 컨볼루션 신경망 기법을 결합한 영상 잡음 제거 알고리즘을 개발하고 이를 응용하여 저선량 유방 촬영 영상으로 유방암을 진단하는 데 그 효능을 조사하고자 한다. 대상과 방법 6명의 유방 영상 전문의가 전향적 연구에 참여하였다. 모든 영상 전문의는 병변 감지를 위해 저선량 영상을 독립적으로 평가하고 정성적 척도를 사용하여 진단 품질을 평가하였다. 영상 잡음 제거 알고리즘을 적용한 후, 동일한 영상 전문의가 병변 감지 가능성과 영상 품질에 대한 평가를 하였다. 임상 적용을 위해 동일한 영상 전문의가 병변 유형과 위치에 대한 합의 결정 후, 저선량 영상, 재구성된 영상, 기존 선량 영상을 무작위 순서로 제시하여 평가하였다. 결과 전 절제 표본의 저선량 영상을 참조로 40% 재구성된 영상에서 병변이 더 잘 인식되었다. 임상 적용단계에서 40% 재구성된 영상과 비교하여, 기존 선량 영상이 해상도(p < 0.001), 석회에 대한 진단 품질(p < 0.001), 유방 종괴, 비대칭, 구조왜곡의 진단 품질(p = 0.037)에 대해 더 높은 평균값을 보였다. 40% 재구성된 영상은 100% 영상과 비교 시 전반적 화질(p = 0.547), 병변의 가시성(p = 0.120), 대조도(p = 0.083)에서 비슷한 성적을 보였으며 유의미한 차이도 보이지 않았다. 결론 깊은 컨볼루션 신경망 기법을 결합한 효과적인 잡음 제거 및 영상 재구성 처리 알고리즘은 유방 촬영의 상당한 선량 감소를 위한 길을 열어 유방암 진단을 가능하게 할 것이다.

Temporal Fusion Transformers와 심층 학습 방법을 사용한 다층 수평 시계열 데이터 분석 (Temporal Fusion Transformers and Deep Learning Methods for Multi-Horizon Time Series Forecasting)

  • 김인경;김대희;이재구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.81-86
    • /
    • 2022
  • 시계열 데이터는 주식, IoT, 공장 자동화와 같은 다양한 실생활에서 수집되고 활용되고 있으며, 정확한 시계열 예측은 해당 분야에서 운영 효율성을 높일 수 있어서 전통적으로 중요한 연구 주제이다. 전반적인 시계열 데이터의 향상된 특징을 추출할 수 있는 대표적인 시계열 데이터 분석 방법인 다층 수평 예측은 최근 부가적 정보를 포함하는 시계열 데이터에 내재한 이질성(heterogeneity)까지 포괄적으로 분석에 활용하여 향상된 시계열 예측한다. 하지만 대부분의 심층 학습 기반 시계열 분석 모델들은 시계열 데이터의 이질성을 반영하지 못했다. 따라서 우리는 잘 알려진 temporal fusion transformers 방법을 사용하여 실생활과 밀접한 실제 데이터를 이질성을 고려한 다층 수평 예측에 적용하였다. 결과적으로 주식, 미세먼지, 전기 소비량과 같은 실생활 시계열 데이터에 적용한 방법이 기존 예측 모델보다 향상된 정확도를 가짐을 확인할 수 있었다.

용담댐 유역의 강우-유출 예측을 위한 하이브리드 접근법 (A Hybrid Approach for Rainfall-Runoff Prediction in Yongdam Dam Basin in Korea)

  • 오영록;전경수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.70-70
    • /
    • 2023
  • 강우 발생 중 용담댐 상류로부터 용담댐으로 유입되는 유입량을 정확하게 예측하는 것은 하류 지역의 홍수 피해를 최소화하기 위한 댐의 적절한 운영에 필수적이다. 물리 기반 강우-유출 시뮬레이션 모형은 물리적 과정의 이해를 바탕으로 홍수 예측 분야에 광범위하게 사용되고 있다. 그러나 복잡한 물리 과정을 완벽히 이해하는 것은 거의 불가능하므로 다양한 가정 조건들을 이용해 복잡한 과정을 단순화하여 계산해야 하는 한계가 존재한다. 최근에는 방대한 데이터의 축적과 컴퓨터 능력의 향상으로 인해 데이터 기반 모형이 다양한 실무 문제를 해결하는 데 강력한 도구로 활용되고 있을 뿐 아니라 시뮬레이션 및 예측 등에도 다양하게 이용되고 있다. 그러나 예측 시간이 늘어날수록 입력자료로 이용되는 과거 자료와 출력자료로 이용되는 미래자료와의 상관관계가 줄어들어 모형의 성능이 저하된다. 따라서 본 연구에서는 용담댐의 시간당 유입량을 예측하기 위해 물리 기반 강우-유출 모형과 오차 보정 모형을 결합한 하이브리드 접근 방식을 제안한다. 물리 기반 강우-유출 모형으로는 HEC-HMS 모형을 사용하였으며, 오차 보정 모형에는 기계학습 모형인 인공신경망(Artificial Neural Network, ANN) 모형을 사용하였다. HEC-HMS 모형, ANN 및 하이브리드 모형(HEC-HMS + ANN)의 성능을 비교하기 위해 20 개의 홍수 사상을 모형 구축 및 검증에 사용하였다. 그 결과 하이브리드 모형은 예측 시간이 늘어날수록 HEC-HMS 및 ANN 모형보다 우수한 성능을 나타냈다. 물리모형에 기계학습을 이용한 오차 보정 절차를 통합한 경우 홍수 유출 예측의 정확성이 향상되었다. 다양한 모형의 비교 결과 본 연구에서 적용한 하이브리드 모형이 물리기반 강우-유출 모형 및 순수 기계학습 모형보다 우수한 성능을 보여줌으로써, 하이브리드 모형은 물리모형과 순수 기계학습 모형의 단점들을 보완하는데 이용할 수 있음을 나타낸다. 이 연구의 주요 목적은 강우-유출 시물레이션 모형의 오차 보정 기술에 대한 더 깊은 이해를 제공하는데 있다.

  • PDF

초해상화 모델의 활성함수 변경에 따른 성능 분석 (Performance Analysis of Various Activation Functions in Super Resolution Model)

  • 유영준;김대희;이재구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.504-507
    • /
    • 2020
  • ReLU(Rectified Linear Unit) 함수는 제안된 이후로 대부분의 깊은 인공신경망 모델들에서 표준 활성함수로써 지배적으로 사용되었다. 이후에 ReLU 를 대체하기 위해 Leaky ReLU, Swish, Mish 활성함수가 제시되었는데, 이들은 영상 분류 과업에서 기존 ReLU 함수 보다 향상된 성능을 보였다. 따라서 초해상화(Super Resolution) 과업에서도 ReLU 를 다른 활성함수들로 대체하여 성능 향상을 얻을 수 있는지 실험해볼 필요성을 느꼈다. 본 연구에서는 초해상화 과업에서 안정적인 성능을 보이는 EDSR(Enhanced Deep Super-Resolution Network) 모델의 활성함수들을 변경하면서 성능을 비교하였다. 결과적으로 EDSR 의 활성함수를 변경하면서 진행한 실험에서 해상도를 2 배로 변환하는 경우, 기존 활성함수인 ReLU 가 실험에 사용된 다른 활성함수들 보다 비슷하거나 높은 성능을 보였다. 하지만 해상도를 4 배로 변환하는 경우에서는 Leaky ReLU 와 Swish 함수가 기존 ReLU 함수대비 다소 향상된 성능을 보임을 확인하였다. 구체적으로 Leaky ReLU 를 사용했을 때 기존 ReLU 보다 영상의 품질을 정량적으로 평가할 수 있는 PSNR 과 SSIM 평가지표가 평균 0.06%, 0.05%, Swish 를 사용했을 때는 평균 0.06%, 0.03%의 성능 향상을 확인할 수 있었다. 4 배의 해상도를 높이는 초해상화의 경우, Leaky ReLU 와 Swish 가 ReLU 대비 향상된 성능을 보였기 때문에 향후 연구에서는 다른 초해상화 모델에서도 성능 향상을 위해 활성함수를 Leaky ReLU 나 Swish 로 대체하는 비교실험을 수행하는 것도 필요하다고 판단된다.

지능형 클라우드 환경에서 지각된 가치 및 행동의도를 적용한 딥러닝 기반의 관광추천시스템 설계 (Design of Deep Learning-based Tourism Recommendation System Based on Perceived Value and Behavior in Intelligent Cloud Environment)

  • 문석재;유경미
    • 한국응용과학기술학회지
    • /
    • 제37권3호
    • /
    • pp.473-483
    • /
    • 2020
  • 본 논문은 지각된 가치가 적용된 관광 행동의도 정보를 이용한 지능형 클라우드 환경에서의 관광추천시스템을 제안한다. 이 제안 시스템은 관광정보와 관광객의 지각적 가치가 행동의도에 반영되는 실증적 분석 정보를 와이드 앤 딥러닝 기술을 이용하여 관광추천시스템에 적용하였다. 본 제안 시스템은 다양하게 수집할 수 있는 관광 정보와 관광객이 평소에 지각하고 있던 가치와 사람의 행동에서 나타나는 의도를 수집 분석하여 관광 추천시스템에 적용하였다. 이는 기존에 활용되던 다양한 분야의 관광플랫폼에 관광 정보, 지각된 가치 및 행동의도에 대한 연관성을 분석하고 매핑하여, 실증적 정보를 제공한다. 그리고 관광정보와 관광객의 지각적 가치가 행동의도에 반영되는 실증적 분석 정보를 선형 모형 구성요소와 신경만 구성요소를 합께 학습하여 한 모형에서 암기 및 일반화 모두를 달성할 수 있는 와이드 앤 딥러닝 기술을 이용한 관광추천 시스템을 제시하였고, 파이프라인 동작 방법을 제시하였다. 본 논문에서 제시한 추천시스템은 와이드 앤 딥러닝 모형을 적용한 결과 관광관련 앱 스토어 방문 페이지 상의 앱 가입률이 대조군 대비 3.9% 향상했고, 다른 1% 그룹에 변수는 동일하고 신경망 구조의 깊은 쪽만 사용한 모형을 적용하여 결과 와이드 앤 딥러닝 모형은 깊은 쪽만 사용한 모형 대비해서 가입률을 1% 증가하였다. 또한, 데이터셋에 대해 수신자 조작 특성 곡선 아래 면적(AUC)을 측정하여, 오프라인 AUC 또한 와이드 앤 딥러닝 모형이 다소 높지만 온라인 트래픽에서 영향력이 더 강하다는 것을 도출하였다.