• 제목/요약/키워드: Improved deep learning

검색결과 548건 처리시간 0.034초

데이터 확장을 통한 토지피복분류 U-Net 모델의 성능 개선 (The Performance Improvement of U-Net Model for Landcover Semantic Segmentation through Data Augmentation)

  • 백원경;이명진;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1663-1676
    • /
    • 2022
  • 최근 딥러닝을 활용한 토지피복분류 기법 연구가 다수 수행되고 있다. 그런데 양질의 토지피복 학습데이터를 충분하게 구축되지 못하여 성능이 저하되는 양상이 확인되었다. 이에 따라 본 연구에서는 데이터 확장 기법의 적용을 통한 토지피복분류 성능의 향상을 확인하였다. 분류 모델로는 U-Net이 활용되었으며 AI Hub에서 제공하는 토지피복 위성 이미지 자료를 연구자료로 활용하였다. 원본 데이터로 학습한 모델과 데이터 확장 기법이 적용된 데이터로 학습한 모델의 픽셀 정확도는 각각 0.905와 0.923이었으며 평균 F1 스코어는 각각 0.720과 0.775로 데이터 확장 기법을 적용하였을 때가 보다 우수한 성능을 나타내는 사실을 확인할 수 있었다. 또한 원본 학습데이터를 활용하여 학습한 모델의 경우 건물, 도로, 논, 밭, 산림, 비대상 지역 클래스에 대한 F1 스코어가 0.770, 0.568, 0.733, 0.455, 0.964 그리고 0.830이었으며, 데이터 확장을 적용하였을 때에 각 클래스에 대한 F1 스코어는 각각 0.838, 0.660, 0.791, 0.530, 0.969 그리고 0.860으로 모든 클래스에 대해 데이터 확장이 성능향상에 유효하다는 사실을 확인하였다. 또한, 클래스 균형에 대한 고려없이 데이터 확장을 적용했음에도 불구하고 데이터 불균형에 의한 클래스별 성능 왜곡을 완화할 수 있다는 사실을 확인할 수 있었다. 이는 절대적인 학습데이터의 양이 증가했기 때문이라 판단된다. 본 연구 결과는 다양한 영상 처리 분야에서 데이터 확장 기법의 중요성과 효과를 증명하는 기반 자료의 역할을 수행할 것으로 기대한다.

형태학적 연산과 경계추출 학습이 강화된 U-Net을 활용한 Sentinel-1 영상 기반 수체탐지 (Water Segmentation Based on Morphologic and Edge-enhanced U-Net Using Sentinel-1 SAR Images)

  • 김휘송;김덕진;김준우
    • 대한원격탐사학회지
    • /
    • 제38권5_2호
    • /
    • pp.793-810
    • /
    • 2022
  • 실시간 범람 모니터링을 위해 인공위성 SAR영상을 활용하는 수체탐지에 대한 필요성이 대두되었다. 주야와 기상에 상관없이 주기적으로 촬영 가능한 인공위성 SAR 영상은 육지와 물의 영상학적 특징이 달라 수체탐지에 적합하나, 스페클 노이즈와 영상별 상이한 밝기 값 등의 한계를 내포하여 다양한 시기에 촬영된 영상에 일괄적으로 적용 가능한 수체탐지 알고리즘 개발이 쉽지 않다. 이를 위해 본 연구에서는 Convolutional Neural Networks (CNN)기반 모델인 U-Net 아키텍처에 레이어의 조합인 모듈을 추가하여 별도의 전처리 없이 수체탐지의 정확도 향상 방법을 제시하였다. 풀링 레이어의 조합을 활용하여 형태학적 연산처리 효과를 제공하는 Morphology Module과 전통적인 경계탐지 알고리즘의 가중치를 대입한 컨볼루션 레이어를 사용하여 경계 학습을 강화시키는 Edge-enhanced Module의 다양한 버전을 테스트하여, 최적의 모듈 구성을 도출하였다. 최적의 모듈 버전으로 판단된 min-pooling과 max-pooling이 연속으로 이어진 레이어와 min-pooling로 구성된 Morphology 모듈과 샤를(Scharr) 필터를 적용한 Edge-enhanced 모듈의 산출물을 U-Net 모델의 conv 9에 입력자료로 추가하였을 때, 정량적으로 9.81%의 F1-score 향상을 보여주었으며, 기존의 U-Net 모델이 탐지하지 못한 작은 수체와 경계선을 보다 세밀하게 탐지할 수 있는 성능을 정성적 평가를 통해 확인하였다.

CAE 알고리즘을 이용한 레이더 강우 보정 평가 (Application of convolutional autoencoder for spatiotemporal bias-correction of radar precipitation)

  • 정성호;오성렬;이대업;레수안히엔;이기하
    • 한국수자원학회논문집
    • /
    • 제54권7호
    • /
    • pp.453-462
    • /
    • 2021
  • 최근 몇 년 동안 국지성 집중호우의 빈도가 증가함에 따라 고해상도 레이더 자료의 중요성 및 활용성이 증가하고 있다. 하지만 여전히 레이더 자료의 경우 시·공간적 편의가 존재하고 이를 보정하는 것이 매우 중요하며 많은 연구에서 레이더 강우의 편의 보정을 위해 다양한 통계적 기법이 시도되었다. 본 연구에서는 시·공간적으로 강우를 추정할 수 있는 이중편파레이더의 편의를 지점 강우와 비교하여 보정하는 것을 목표로 한다. 환경부의 수자원관리 및 홍수 예측에 사용되는 S-밴드 이중편파레이더의 편의 보정을 위하여 합성곱신경망(Convolutional Neural Network, CNN)기반의 Convolutional Autoencoder (CAE) 알고리즘을 구축하여 편의 보정을 수행하였다. CAE 모델의 입력자료는 환경부의 10분 단위 레이더 합성 강우자료와 같은 공간해상도로 보간된 지점 관측 강우자료를 사용하였으며, 자료의 기간은 미호천 유역에 홍수 경보가 발령된 2017년 7월 16일 00시부터 13시까지의 10분 단위 자료를 사용하였다. 그 결과로 지점 강우 대비 원시 레이더 강우의 편의가 줄어듦을 확인할 수 있으며 시·공간적으로 개선된 결과를 보여주고 있다. 따라서 각 인접한 격자 간의 공간 관계를 학습하는 CAE 모델은 레이더 및 위성에서 추정되는 격자형 기후 자료의 실시간 편의 보정에 사용할 수 있을 것으로 분석되었다.

Real-time Segmentation of Black Ice Region in Infrared Road Images

  • Li, Yu-Jie;Kang, Sun-Kyoung;Jung, Sung-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권2호
    • /
    • pp.33-42
    • /
    • 2022
  • 본 논문에서는 운전자한테 실시간으로 블랙 아이스 경고를 보내기 위해서 도로 영상에서 블랙 아이스 영역 분할을 위한 다중 척도 팽창 컨볼루션 특징 융합에 기반한 딥러닝 모델을 제안한다. 제안한 다중척도 팽창 컨볼루션 특징 융합 네트워크는 인코더 블록에 서로 다른 팽창 비율 컨볼루션을 병렬로 추가하고, 서로 다른 해상도 특징 맵에서 서로 다른 팽창 비율을 설정하고, 다중 단계 특징 정보가 함께 융합된다. 다중 척도 팽창 컨볼루션 특징 융합은 수용 영역을 확장함과 동시에 공간의 세부 정보를 잘 보존하고 팽창 컨볼루션의 효과성을 높임으로써 기존 모델보다 성능을 향상시킨다. 실험 결과를 통해 본 논문 제안한 네트워크 모델은 병렬 평창 컨볼루션 수가 증가함에 따라 성능이 향상되는 것을 알 수 있었다. 제안한 방법의 mIoU 값은 96.46%로 U-Net, FCN, PSPNet, ENet, LinkNet 등 기존 네트워크보다 높았다. 그리고 파라미터는 1,858K개로, 기존 LinkNet모델보다 6배로 축소하였다. Jetson Nano에서 실험 결과 보면, 제안한 방법의 FPS는 3.63로 실시간으로 블랙 아이스 영역을 실시간으로 분할 할 수 있었다.

BIM 모델 내 공간의 시멘틱 무결성 검증을 위한 그래프 기반 딥러닝 모델 구축에 관한 연구 (Development of Graph based Deep Learning methods for Enhancing the Semantic Integrity of Spaces in BIM Models)

  • 이원복;김시현;유영수;구본상
    • 한국건설관리학회논문집
    • /
    • 제23권3호
    • /
    • pp.45-55
    • /
    • 2022
  • BIM의 도입에 따라 공간이 개별 객체로 인식되면서 객체화된 공간의 속성정보는 법규검토, 에너지 분석, 피난 경로 분석 등을 위한 기반 데이터로 사용 가능하기에 BIM의 활용성을 넓힐 수 있는 발판을 마련하였다. 그러나 BIM 모델 내 개별 공간 속성의 오기입이나 누락이 없는 시멘틱 무결성(semantic integrity)이 보장되어야 하는데, 다수의 참여자에 의한 수작업으로 진행되는 BIM 모델링 과정 특성 상 설계 오류가 빈번히 발생한다는 문제점이 존재한다. 이를 해결하기 위해 BIM 모델의 공간 정합성 검증을 위한 연구가 다수 진행되었으나, 적용 범위가 한정적이거나 분류 정확도가 낮은 한계점이 존재하였다. 본 연구에서는 공간의 기하정보 뿐 아니라 BIM 모델 내 공간과 부재 간 연결 관계를 Graph Convolutional Networks (GCN) 학습과정에 활용하여 향상된 성능의 공간 자동 분류모델을 구축하고자 하였다. 구축된 GCN 기반 모델의 성능을 공간의 기하정보만으로 학습된 기계학습 모델인 Multi-Layer Perceptron (MLP)과 비교하여 공간 분류 시 연결 관계 적용의 효용성을 검증하고자 하였다. 이를 통해 관계정보 활용 시 약 8% 내외 수준으로 공간 분류 성능이 향상되는 것으로 확인되었다.

전산화단층영상 기반 뇌출혈 검출을 위한 YOLOv5s 성능 평가 (Performance Evaluation of YOLOv5s for Brain Hemorrhage Detection Using Computed Tomography Images)

  • 김성민;이승완
    • 한국방사선학회논문지
    • /
    • 제16권1호
    • /
    • pp.25-34
    • /
    • 2022
  • 뇌 전산화단층촬영은 비침습성, 3차원 영상 제공, 저방사선량 등의 장점 때문에 뇌출혈과 같은 질병 진단을 위해 시행된다. 하지만 뇌 전산화단층영상 판독을 위한 전문의의 인력 공급 부족 및 막대한 업무량으로 인해 수많은 판독 오류 및 오진이 발생하고 있다. 이와 같은 문제를 해결하기 위해 객체 검출을 위한 다양한 인공지능 기술이 개발되고 있다. 본 연구에서는 뇌 전산화단층영상으로부터 뇌출혈 검출을 위한 딥러닝 기반 YOLOv5s 모델의 적용 가능성을 확인하였다. 또한 YOLOv5s 모델 학습 시 초매개변수를 변화시켜 학습된 모델의 성능을 평가하였다. YOLOv5s 모델은 backbone, neck 및 output 모듈로 구성하였고, 입력 CT 영상 내 뇌출혈로 의심되는 부위를 검출하여 출력할 수 있도록 하였다. YOLOv5s 모델 학습 시 활성화함수, 최적화함수, 손실함수 및 학습 횟수를 변화시켰고, 학습된 모델의 뇌출혈 검출 정확도 및 학습 시간을 측정하였다. 연구결과 학습된 YOLOv5s 모델은 뇌출혈로 의심되는 부위에 대한 경계 박스 및 해당 경계박스에 대한 정확도를 출력할 수 있음을 확인하였다. Mish 활성화함수, stochastic gradient descent 최적화함수 및 completed intersection over union 손실함수 적용 시 YOLOv5s 모델의 뇌출혈 검출 정확도 향상 및 학습 시간이 단축되는 결과를 확인하였다. 또한 YOLOv5s 모델의 뇌출혈 검출 정확도 및 학습 시간은 학습 횟수에 비례하여 증가하는 결과를 확인하였다. 따라서 YOLOv5s 모델은 뇌 전산화단층영상을 이용한 뇌출혈 검출을 위해 활용할 수 있으며, 최적의 초매개변수 적용을 통해 성능을 향상 시킬 수 있다.

콘포머 기반 FastSpeech2를 이용한 한국어 음식 주문 문장 음성합성기 (A Korean menu-ordering sentence text-to-speech system using conformer-based FastSpeech2)

  • 최예린;장재후;구명완
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.359-366
    • /
    • 2022
  • 본 논문에서는 콘포머 기반 FastSpeech2를 이용한 한국어 메뉴 음성합성기를 제안한다. 콘포머는 본래 음성 인식 분야에서 제안된 것으로, 합성곱 신경망과 트랜스포머를 결합하여 광역과 지역 정보를 모두 잘 추출할 수 있도록 한 구조다. 이를 위해 순방향 신경망을 반으로 나누어 제일 처음과 마지막에 위치시켜 멀티 헤드 셀프 어텐션 모듈과 합성곱 신경망을 감싸는 마카론 구조를 구성했다. 본 연구에서는 한국어 음성인식에서 좋은 성능이 확인된 콘포머 구조를 한국어 음성합성에 도입하였다. 기존 음성합성 모델과의 비교를 위하여 트랜스포머 기반의 FastSpeech2와 콘포머 기반의 FastSpeech2를 학습하였다. 이때 데이터셋은 음소 분포를 고려한 자체 제작 데이터셋을 이용하였다. 특히 일반대화 뿐만 아니라, 음식 주문 문장 특화 코퍼스를 제작하고 이를 음성합성 훈련에 사용하였다. 이를 통해 외래어 발음에 대한 기존 음성합성 시스템의 문제점을 보완하였다. ParallelWave GAN을 이용하여 합성음을 생성하고 평가한 결과, 콘포머 기반의 FastSpeech2가 월등한 성능인 MOS 4.04을 달성했다. 본 연구를 통해 한국어 음성합성 모델에서, 동일한 구조를 트랜스포머에서 콘포머로 변경하였을 때 성능이 개선됨을 확인하였다.

인공지능과 증강현실 기술을 이용한 모래성 놀이 가이드 애플리케이션 설계 및 구현 (Design and Implementation of Sandcastle Play Guide Application using Artificial Intelligence and Augmented Reality)

  • 류지승;장승우;문유정;이정진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권3호
    • /
    • pp.79-89
    • /
    • 2022
  • 최근 스마트폰이 널리 보급되고 모바일 기기의 그래픽스 처리 성능이 발전함에 따라 아이들의 물리적인 활동을 돕는 다양한 모바일 애플리케이션들이 연구되고 있다. 본 논문에서는 인공지능과 증강현실 기술을 활용해 모래성 쌓기 놀이를 안내하는 모바일 애플리케이션 SandUp을 제안한다. 모래성을 쌓는 과정에서 아이는 모바일 증강현실 기술을 활용해 제시된 목표 모래성을 현실 세계에 증강하여 살펴볼 수 있다. 또한, SandUp은 모래성의 완성을 돕기 위해 단계적으로 필요한 모래 모양과 Task를 알려주고, 모바일 폰의 카메라와 딥러닝 인식모델을 이용해 실시간으로 현재 진행 상황을 인식하고 시각적, 청각적 피드백을 제공한다. 우리는 Flutter와 TensorFlow Lite를 이용해 SandUp 앱의 프로토타입을 구현하였다. 제안하는 SandUp 앱의 사용성과 효과를 평가하기 위해 성인을 대상으로 설문조사를 수행하고 앱이 목표로 한 4-7세 아이들을 모집하여 실험을 진행했다. 실험 결과와 학부모의 피드백을 분석하여 앱의 발전 가능성 및 개선점을 도출하고 향후 연구 방향을 제시한다.

음성위조 탐지에 있어서 데이터 증강 기법의 성능에 관한 비교 연구 (Comparative study of data augmentation methods for fake audio detection)

  • 박관열;곽일엽
    • 응용통계연구
    • /
    • 제36권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 데이터 증강 기법은 학습용 데이터셋을 다양한 관점에서 볼 수 있게 해주어 모형의 과적합 문제를 해결하는데 효과적으로 사용되고 있다. 이미지 데이터 증강기법으로 회전, 잘라내기, 좌우대칭, 상하대칭등의 증강 기법 외에도 occlusion 기반 데이터 증강 방법인 Cutmix, Cutout 등이 제안되었다. 음성 데이터에 기반한 모형들에 있어서도, 1D 음성 신호를 2D 스펙트로그램으로 변환한 후, occlusion 기반 데이터 기반 증강기법의 사용이 가능하다. 특히, SpecAugment는 음성 스펙트로그램을 위해 제안된 occlusion 기반 증강 기법이다. 본 연구에서는 위조 음성 탐지 문제에 있어서 사용될 수 있는 데이터 증강기법에 대해 비교 연구해보고자 한다. Fake audio를 탐지하기 위해 개최된 ASVspoof2017과 ASVspoof2019 데이터를 사용하여 음성을 2D 스펙트로그램으로 변경시켜 occlusion 기반 데이터 증강 방식인 Cutout, Cutmix, SpecAugment를 적용한 데이터셋을 훈련 데이터로 하여 CNN 모형을 경량화시킨 LCNN 모형을 훈련시켰다. Cutout, Cutmix, SpecAugment 세 증강 기법 모두 대체적으로 모형의 성능을 향상시켰으나 방법에 따라 오히려 성능을 저하시키거나 성능에 변화가 없을 수도 있었다. ASVspoof2017 에서는 Cutmix, ASVspoof2019 LA 에서는 Mixup, ASVspoof2019 PA 에서는 SpecAugment 가 가장 좋은 성능을 보였다. 또, SpecAugment는 mask의 개수를 늘리는 것이 성능 향상에 도움이 된다. 결론적으로, 상황과 데이터에 따라 적합한 augmentation 기법이 다른 것으로 파악된다.

3D 공간정보를 활용한 터널 설계 자동화 기술 개발 및 적용 사례 : 남해 서면-여수 신덕 국도 건설공사 BIM기반 설계를 중심으로 (Development and Application of Tunnel Design Automation Technology Using 3D Spatial Information : BIM-Based Design for Namhae Seomyeon - Yeosu Shindeok National Highway Construction)

  • 조은지;김우진;김광염;정재호;방상혁
    • 터널과지하공간
    • /
    • 제33권4호
    • /
    • pp.209-227
    • /
    • 2023
  • 정부는 건설산업의 생산성 혁신을 위해 BIM 기반 스마트 건설기술 활성화방안을 지속적으로 발표하고 있다. 설계단계에서는 BIM 데이터와 다른 첨단기술을 융합하여 설계 자동화와 최적화 수행을 목표로 한다. 국내 해저터널 사업인 남해 서면-여수 신덕 국도 건설공사 기본설계에서는 터널설계 프로세스에 따라 3D 공간정보를 이용한 터널설계 자동화 기술을 개발하여 BIM 기반의 설계를 수행하였다. 터널의 선형설계에 제너레이티브 디자인 기법을 사용하여 만 여건 이상의 케이스를 36시간 내에 도출하고, 설계자가 정의한 목적함수의 정량적 평가를 수행하여 설계자가 요구하는 조건의 최적 선형을 도출했다. AI 기반의 지반분류와 3D Geo Model을 구축하여 최적 선형의 경제성 및 안정성을 평가하였다. AI 기반의 지반분류는 시추 코어 1공당 약 30종의 지반분류를 수행하여 그 정밀도를 향상시켰고, 3D Geo Model의 경우 시공 중 추가되는 지반 데이터를 누적할 수 있다는 점에서 그 활용도를 기대할 수 있다. 3D 발파설계의 경우 Dynamo 상에서 노선상의 모든 보안물건을 검토하여 최적 장약량을 5분 만에 도출하고, 직관적이고 편리한 시공관리를 위해 3D 공간상에 설계 결과를 시각화함으로서 시공 중에 직접 활용할 수 있도록 했다.