• 제목/요약/키워드: Deep-Learning

검색결과 5,447건 처리시간 0.047초

햇빛 아래에서 향상된 시인성을 위한 Piece-wise Linear Enhancement Curves 기반 영상 개선 (Image Enhancement based on Piece-wise Linear Enhancement Curves for Improved Visibility under Sunlight)

  • 이준민;송병철
    • 방송공학회논문지
    • /
    • 제27권5호
    • /
    • pp.812-815
    • /
    • 2022
  • 햇빛 아래에서 디지털 기기에 표시되는 영상은 일반적으로 원본 영상보다 어둡게 인식되어 시인성이 저하된다. 더 나은 시인성을 위해서, 주변광에 적응적인 전역 휘도 보상 혹은 톤 매핑이 필요하다. 하지만 기존의 기법들은 색차 보상에 한계가 존재하고, 무거운 계산 비용 때문에 실제 환경에서 활용하는데 어려움이 존재한다. 이를 해결하기 위해 본 논문에서는 휘도와 색차를 모두 보상하는 Piece-wise Linear Enhancement Curves (PLECs) 기반 영상 개선 기법을 제안한다. 이때, PLECs은 딥러닝을 통해 회귀 되며, lookup table 형식으로 구현되어 실시간 동작이 가능하다. 실험 결과 제안 방법이 낮은 계산 비용으로 원본 영상 대비 더 나은 시인성을 가짐을 보인다

SpaceNet 건물 데이터셋과 Context-based ResU-Net을 이용한 건물 자동 추출 (Automatic Building Extraction Using SpaceNet Building Dataset and Context-based ResU-Net)

  • 유수홍;김철환;권영목;최원준;손홍규
    • 대한원격탐사학회지
    • /
    • 제38권5_2호
    • /
    • pp.685-694
    • /
    • 2022
  • 건물 정보는 다양한 도시 공간 분석에 활용되는 필수 정보 중 하나이기에 지속적인 모니터링이 필요하지만 현실적으로 어려움이 존재하고 있다. 이를 위해 광범위한 지역에 대해서도 지속적인 관찰이 가능한 위성영상으로부터 건물을 추출하기 위한 연구가 진행되고 있으며, 최근에는 딥러닝 기반의 시맨틱 세그멘테이션 기법들이 활용되고 있다. 본 연구에서는 SpaceNet의 건물 v2 무료 오픈 데이터를 이용하여 30 cm 급 Worldview-3 RGB 영상으로부터 건물을 자동으로 추출하기 위해, context-based ResU-Net의 일부 구조를 변경하여 학습을 진행하였다. 분류 정확도 평가 결과, f1-score가 2회차 SpaceNet 대회 수상작의 분류 정확도보다 높은 것으로 나타났다. 앞으로 지속적으로 Worldview-3 위성 영상을 확보할 수 있다면 본 연구의 성과를 활용하여 전세계 건물 자동 추출 모델을 제작하는 것도 가능할 것으로 판단된다.

컨볼루션 신경망(CNN)을 이용한 폭발물 성분 용량별 분류 성능 평가에 관한 연구 (A Study on the Evaluation of Classification Performance by Capacity of Explosive Components using Convolution Neural Network (CNN))

  • 이창현;조성윤;권기원;임태호
    • 인터넷정보학회논문지
    • /
    • 제23권4호
    • /
    • pp.11-19
    • /
    • 2022
  • 본 논문은 컨볼루션 신경망(CNN)을 이용하여 폭발물 성분의 용량별로 분류할 때의 성능을 평가하는 연구이다. 기존의 폭발물 분류 방식 중에 IMS 증기 탐지기 방식은 폭발물의 농도가 사용자가 장비에서 설정한 임계치를 넘어야만 폭발물의 존재 여부를 판단한다. IMS 증기 탐지기는 폭발물이 존재하더라도 임계치를 넘지 않는 양이면 폭발물이 존재하지 않는다고 판단하는 문제가 있다. 따라서 폭발물 성분의 농도가 임계치를 넘지 않는 양일 때에도 폭발물 성분을 검출하는 방안이 필요하다. 이에 따라 본 논문에서는 폭발물 시계열 데이터를 Gramian Angular Field(GAF) 알고리즘으로 이미지화를 진행한 후 이미지와 영상처리뿐만 아니라 시계열 데이터 처리에도 뛰어난 성능을 보이는 딥러닝 모델인 컨볼루션 신경망(CNN)으로 직접 label을 설정해서 지도학습을 진행한 결과 폭발물 성분의 농도가 임계치를 넘지 않는 양일 때에도 폭발물 성분이 존재한다고 판단함과 동시에 폭발물 성분의 종류와 폭발물 성분의 농도의 양을 같이 판단할 수 있는지 성능평가를 진행했다.

영농형 태양광 발전소에서 순환신경망 기반 발전량 예측 시스템 (Recurrent Neural Network based Prediction System of Agricultural Photovoltaic Power Generation)

  • 정설령;고진광;이성근
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.825-832
    • /
    • 2022
  • 본 논문은 영농형 태양광 발전 시스템의 전력 생산량을 수집·저장하여 지능적인 예측 모델을 구현하기 위한 예측 및 진단 모델의 설계와 구현에 대해 논한다. 제안된 모델은 시계열 데이터에 특화된 순환신경망 기법인 RNN, LSTM, GRU 모델을 이용하여 태양광 발전량을 예측하고 각 모델의 하이퍼 파라미터를 다르게 주어 비교 분석하고, 성능을 평가했다. 그 결과 세 모델 모두 MSE, RMSE 지표는 0에 매우 가까우며, R2 지표는 1에 가까운 성능을 보였다. 이를 통해 제안하는 예측 모델은 태양광 발전량을 예측하기에 적합한 모델임을 알 수 있고, 이러한 예측을 이용하여 영농형 태양광 시스템에서 지능적인 운영관리 기능에 적용될 수 있음을 보였다.

미소 픽셀을 갖는 비행 객체 인식을 위한 데이터베이스 구축 및 관리시스템 연구 (Database Generation and Management System for Small-pixelized Airborne Target Recognition)

  • 이호섭;신희민;심현철;조성욱
    • 항공우주시스템공학회지
    • /
    • 제16권5호
    • /
    • pp.70-77
    • /
    • 2022
  • 본 논문에서, 데이터베이스 생성 및 관리 시스템은 미소 픽셀 공중 표적 인식을 위해 제안된다. 제안된 시스템은 1)비행 테스트 비디오 프레임에 의한 직접 이미지 추출, 2) 자동 이미지 보관, 3) 이미지 데이터 레이블링 및 메타 데이터 주석, 4) 컬러 채널 변환, 5) HOG/LBP 기반 소화소 대상 증강 이미지 데이터 생성의 다섯가지 주요 기능으로 구성된다. 제안하는 프로그램은 파이썬 기반의 PyQt5와 OpenCV를 이용하여 구성하였고 공중 표적 인식을 위한 이미지 데이터셋은 제안한 시스템을 이용해 생성했으며 비행 실험으로 부터 수집된 영상을 입력영상으로 사용하였다.

A Novel Approach to COVID-19 Diagnosis Based on Mel Spectrogram Features and Artificial Intelligence Techniques

  • Alfaidi, Aseel;Alshahrani, Abdullah;Aljohani, Maha
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.195-207
    • /
    • 2022
  • COVID-19 has remained one of the most serious health crises in recent history, resulting in the tragic loss of lives and significant economic impacts on the entire world. The difficulty of controlling COVID-19 poses a threat to the global health sector. Considering that Artificial Intelligence (AI) has contributed to improving research methods and solving problems facing diverse fields of study, AI algorithms have also proven effective in disease detection and early diagnosis. Specifically, acoustic features offer a promising prospect for the early detection of respiratory diseases. Motivated by these observations, this study conceptualized a speech-based diagnostic model to aid in COVID-19 diagnosis. The proposed methodology uses speech signals from confirmed positive and negative cases of COVID-19 to extract features through the pre-trained Visual Geometry Group (VGG-16) model based on Mel spectrogram images. This is used in addition to the K-means algorithm that determines effective features, followed by a Genetic Algorithm-Support Vector Machine (GA-SVM) classifier to classify cases. The experimental findings indicate the proposed methodology's capability to classify COVID-19 and NOT COVID-19 of varying ages and speaking different languages, as demonstrated in the simulations. The proposed methodology depends on deep features, followed by the dimension reduction technique for features to detect COVID-19. As a result, it produces better and more consistent performance than handcrafted features used in previous studies.

Multiple Binarization Quadtree Framework for Optimizing Deep Learning-Based Smoke Synthesis Method

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.47-53
    • /
    • 2021
  • 본 논문에서는 초해상도(Super-Resolution, SR)을 계산하는데 필요한 물리 기반 시뮬레이션 데이터를 효율적으로 분류하고 분할하여 빠르게 SR연산을 가능하게 하는 쿼드트리 기반 최적화 기법을 제안한다. 제안하는 방법은 입력 데이터로 사용하는 연기 시뮬레이션 데이터를 다운스케일링(Downscaling)하여 쿼드트리 연산 소요 시간을 대폭 감소시킨다. 이 과정에서 연기의 밀도를 이진화함으로써, 다운스케일링 과정에서 밀도가 수치 손실되는 문제를 완화하며 쿼드트리를 구축한다. 학습에 사용된 데이터는 COCO 2017 데이터 셋이며, 인공신경망은 VGG19 기반 네트워크를 사용한다. 컨볼루션 계층을 거칠 때 데이터의 손실을 막기 위해 잔차(Residual) 보완 방식과 유사하게 이전 계층의 출력 값을 더해주며 학습을 진행한다. 실험결과가 연기의 경우 제안된 방법은 이전 접근법에 비해 약 15~18배 정도의 속도향상을 얻었다.

CNN 잡음감쇠기에서 필터 수의 최적화 (Optimization of the Number of Filter in CNN Noise Attenuator)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.625-632
    • /
    • 2021
  • 본 논문은 잡음감쇠기에서 CNN(Convolutional Neural Network) 계층의 필터 수가 성능에 미치는 영향을 연구하였다 이 시스템은 적응필터 대신 신경망 예측필터를 이용하며 심층학습방법으로 잡음을 감쇠한다. 64-뉴런, 16-커널 CNN 필터와 오차 역전파 알고리즘을 이용하여 잡음이 포함된 음성신호로부터 음성을 추정한다. 본 연구에서 필터 수에 대한 잡음감쇠기의 성능을 검증하기 위하여 Keras 라이브러리를 사용한 프로그램을 작성하고 시뮬레이션을 실시하였다. 시뮬레이션 결과, 본 시스템은 필터 수가 16일 때 MSE(Mean Squared Error) 및 MAE(Mean Absolute Error) 값이 가장 작은 것으로 나타났으며 필터가 4개 일 때 성능이 가장 낮은 것을 볼 수 있다. 그리고 필터가 8개 이상이 되면 필터 수에 따라 MSE 및 MAE 값이 크게 차이나지 않는 것을 보여주었다. 이러한 결과로부터 음성신호의 주요 특징을 표현하기 위해서는 약 8개 이상의 필터를 사용해야 한다는 것을 알 수 있다.

3D 얼굴 모델 기반의 GAN을 이용한 게임 캐릭터 회전 기법 (A GAN-based face rotation technique using 3D face model for game characters)

  • 김한동;한종대;양희경;민경하
    • 한국게임학회 논문지
    • /
    • 제21권3호
    • /
    • pp.13-24
    • /
    • 2021
  • 본 논문은 게임 캐릭터 얼굴 일러스트레이션에 적용할 수 있는 안면 회전 기술(Face rotation) 기술을 제안한다. 기존의 진행된 연구들은 실제 사람의 얼굴 데이터에 대해서로 데이터를 한정하였으며 방대한 양의 데이터를 필요로 하였고 합성된 결과물이 좋지 못한 문제가 있었다. 본 논문에서는 기존 연구들의 존재하는 문제를 해결하기 위해 다음과 같은 방법을 도입하였다. 첫째, 입력 이미지가 갖고 있는 특징을 입힌 3D 모델을 회전시키고 다시 2D 이미지로 렌더링하여 학습 및 평가에 필요한 데이터 셋을 구축하였다. 둘째, 3D 모델을 통해 구축된 데이터에서 다양한 각도의 특징을 학습할 수 있는 적대적 생성 모델(Generative Adversarial Networks)을 설계하여 입력된 이미지를 원하는 각도로 합성할 수 있다. 논문에서는 실제 게임 캐릭터 얼굴 일러스트레이션 합성 결과를 제시한다. 합성 결과를 통해 논문에서 제안하는 방법이 잘 동작함을 확인할 수 있다.

실시간 거시지표 예측과 증시뉴스 마이닝을 통한 주가 예측시스템 모델연구 (Research model on stock price prediction system through real-time Macroeconomics index and stock news mining analysis)

  • 홍성혁
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.31-36
    • /
    • 2021
  • 중국 우한발 코로나 19 바이러스로 인하여 세계 경제가 침체하여, 미국연방준비제도를 비롯한 대부분 국가에서는 통화량을 늘려 경기를 부양하는 정책을 내놓았다. 주식 투자자들 대부분은 기업에 대한 재무제표 분석이 없이 유명 유튜버의 추천종목이나 지인의 말만 듣고 투자하는 경향이 있어서 주식투자의 손실 가능성이 크다. 따라서, 본 연구에서는 기존 자동매매 조건에서 발전된 인공지능 딥러닝 기법을 이용하여 주가에 영향을 미치는 거시지표를 분석하고 예측하여 주가에 미치는 상관관계를 통한 개별주가예측에 가중치를 부여하고 주가를 예측한다. 또한, 주가는 실시간 증시뉴스에 민감하게 반응하기 때문에 증시뉴스 텍스트 마이닝을 통하여 인공지능으로 예측된 주가에 가중치를 반영하여 더 정확한 주가 예측을 하여 주식 투자자에게 매매의 판단 근거를 제공하여 건전한 주식투자가 되도록 이바지하였다.