• 제목/요약/키워드: CNN structure

Search Result 178, Processing Time 0.032 seconds

Deep Convolutional Neural Network with Bottleneck Structure using Raw Seismic Waveform for Earthquake Classification

  • Ku, Bon-Hwa;Kim, Gwan-Tae;Min, Jeong-Ki;Ko, Hanseok
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.33-39
    • /
    • 2019
  • In this paper, we propose deep convolutional neural network(CNN) with bottleneck structure which improves the performance of earthquake classification. In order to address all possible forms of earthquakes including micro-earthquakes and artificial-earthquakes as well as large earthquakes, we need a representation and classifier that can effectively discriminate seismic waveforms in adverse conditions. In particular, to robustly classify seismic waveforms even in low snr, a deep CNN with 1x1 convolution bottleneck structure is proposed in raw seismic waveforms. The representative experimental results show that the proposed method is effective for noisy seismic waveforms and outperforms the previous state-of-the art methods on domestic earthquake database.

PNCC와 robust Mel-log filter bank 특징을 결합한 조류 울음소리 분류 (Bird sounds classification by combining PNCC and robust Mel-log filter bank features)

  • 알자흐라 바디;고경득;고한석
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.39-46
    • /
    • 2019
  • 본 논문에서는 합성곱 신경망(Convolutional Neural Network, CNN) 구조를 이용하여 잡음 환경에서 음향신호를 분류할 때, 인식률을 높이는 결합 특징을 제안한다. 반면, Wiener filter를 이용한 강인한 log Mel-filter bank와 PNCCs(Power Normalized Cepstral Coefficients)는 CNN 구조의 입력으로 사용되는 2차원 특징을 형성하기 위해 추출됐다. 자연환경에서 43종의 조류 울음소리를 포함한 ebird 데이터베이스는 분류 실험을 위해 사용됐다. 잡음 환경에서 결합 특징의 성능을 평가하기 위해 ebird 데이터베이스를 3종류의 잡음을 이용하여 4개의 다른 SNR (Signal to Noise Ratio)(20 dB, 10 dB, 5 dB, 0 dB)로 합성했다. 결합 특징은 Wiener filter를 적용한 log-Mel filter bank, 적용하지 않은 log-Mel filter bank, 그리고 PNCC와 성능을 비교했다. 결합 특징은 잡음이 없는 환경에서 1.34 % 인식률 향상으로 다른 특징에 비해 높은 성능을 보였다. 추가적으로, 4단계 SNR의 잡음 환경에서 인식률은 shop 잡음 환경과 schoolyard 잡음 환경에서 각각 1.06 %, 0.65 % 향상했다.

콘크리트 구조체 균열 탐지에 대한 Mask R-CNN 알고리즘 적용성 평가 (Application of Mask R-CNN Algorithm to Detect Cracks in Concrete Structure)

  • 배병규;최용진;윤강호;안재훈
    • 한국지반공학회논문집
    • /
    • 제40권3호
    • /
    • pp.33-39
    • /
    • 2024
  • 구조물의 상태를 파악하기 위한 균열조사는 정밀안전 진단에 필수적인 검사 항목이다. 그러나 육안으로 이루어지는 균열조사 방식은 현장 상황의 변화에 따라 주관적으로 수행될 수 있다. 이러한 육안검사의 한계를 극복하기 위해 본 연구에서는, ResNet, FPN, Mask R-CNN을 백본(Backbone), 넥(Neck), 헤드(head)로 구성한 합성곱 신경망을 바탕으로, 이미지 데이터에서의 콘크리트 균열 탐지를 자동화하고. 그 성능을 IoU 값을 바탕으로 분석하였다. 해석에 사용된 데이터는 총 1,203개의 이미지 데이터로 구성하였으며, 이 중 70%를 훈련(Training)에, 20%를 검증(Validation)에, 그리고 10%의 데이터를 시험(Testing)에 사용하였다. 시험 결과의 평균 IoU값은 95.83%로 산정되었고, 또한 이미지 내 균열이 전혀 탐지되지 않는 경우는 존재하지 않아, 본 연구에 가정한 모델이 콘크리트의 균열 탐지를 성공적으로 수행하는 것을 확인하였다.

Sentienl-1 SAR 영상을 활용한 유류 분포특성과 CNN 구조에 따른 유류오염 탐지모델 성능 평가 (Evaluation of Oil Spill Detection Models by Oil Spill Distribution Characteristics and CNN Architectures Using Sentinel-1 SAR data)

  • 박소연;안명환;이성뢰;김준우;전현균;김덕진
    • 대한원격탐사학회지
    • /
    • 제37권5_3호
    • /
    • pp.1475-1490
    • /
    • 2021
  • SAR 이미지의 통계적 특징을 이용하여 유류오염영역을 특정하는 방법은 분류규칙이 복잡하고 이상값에 의한 영향을 많이 받는다는 한계가 있어, 최근 인공신경망을 기반으로 유류오염영역을 특정하는 연구가 활발히 이루어지고 있다. 하지만, 다양한 유류오염 사례에 대해 모델의 탐지 성능 및 특성을 평가한 연구는 부족하였다. 따라서, 본 연구에서는 기본적인 구조의 CNN인 Simple CNN과 픽셀 단위의 영상 분할이 가능한 U-net을 이용하여, CNN의 구조와, 유류오염의 분포특성에 따른 모델의 탐지성능차이가 존재하는지 분석하였다. 연구결과, 축소경로만 존재하는Simple CNN과 축소경로와 확장경로가 모두 존재하는U-net의 F1 score는 86.24%와 91.44%로 나타나, 두 모델 모두 비교적 높은 탐지 정확도를 보여주었지만, U-net의 탐지성능이 더 높은 것으로 나타났다. 또한 다양한 유류오염 사례에 따른 모델의 성능 비교를 위해, 유류오염의 공간적 분포특성(유류오염 주변의 육지의 분포)과 선명도(유출된 기름과 해수의 경계면이 뚜렷한 정도)를 기준으로, 유류오염 발생사례를 4가지 유형으로 구분하여 탐지 정확도를 평가하였다. Simple CNN은 각각의 유형에 대해 F1 score가 85.71%, 87.43%, 86.50%, 85.86% 로 유형별 최대 편차가 1.71%인 것으로 나타났으며, U-net은 동일한 지표에 대해 89.77%, 92.27%, 92.59%, 92.66%의 F1 score를 보여 최대 편차가 2.90% 로 두 CNN모델 모두 유류오염 분포특성에 따른 수치상 탐지성능의 차이는 크지 않은 것으로 나타났다. 하지만 모든 유류오염 유형에서 Simple CNN은 오염영역을 과대탐지 하는 경향을, U-net은 과소탐지 하는 경향을 보여, 모델의 구조와 유류오염의 유형에 따라 서로 다른 탐지 특성을 가진다는 것을 확인하였고, 이러한 특성은 유류오염과 해수의 경계면이 뚜렷하지 않은 경우 더 두드러지게 나타났다.

자율주행차 조향제어를 위한 CNN의 적용 (Application of CNN for steering control of autonomous vehicle)

  • 박성찬;황광복;박희문;최영규;박진현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.468-469
    • /
    • 2018
  • 본 연구는 자동차 조향제어 시스템에 적용 가능한 CNN(Convolutional Neural Network)을 설계하고자 한다. CNN은 현재 많은 분야에서 폭넓게 사용되고 있으며, 특히 영상 분류(image classification) 작업에 있어 매우 뛰어난 성능을 나타내고 있다. 그러나 이러한 CNN이 함수를 근사하는 회귀(regression) 문제에서는 많이 적용되지 못하고 있다. 이는 CNN의 입력으로 이미지 데이터와 같은 다차원적인 데이터 구조로 되어 있어 일반적인 제어 시스템의 적용이 쉽지 않기 때문이다. 최근 들어 자율주행차에 관해 연구가 활발히 진행되고 있으며, 자율주행차를 구현하기 위해 많은 기술이 요구된다. 이를 위해 차량에 장착된 블랙박스의 영상 이미지를 사용하여 차선을 검출하고 검출된 차선에 따라 소실점 등을 검출하여 자율주행차를 제어하는 연구가 많이 진행되었다. 그러나 소실점 검출에 있어 영상 이미지의 외부 환경, 순간적인 차선의 소실 그리고 반대편 차선의 검출 등 여러 요인으로 인하여 안정적인 소실점 검출에 어려움이 있다. 본 연구에서는 자동차에서 촬영된 블랙박스 영상 이미지를 입력받아 자율주행차의 조향제어를 위해 CNN을 적용해 보고자 한다.

  • PDF

전투기용 레이다 기반 SAR 영상 자동표적분류 기능 구조 및 CNN 앙상블 모델을 이용한 표적분류 정확도 향상 방안 연구 (Study on the Functional Architecture and Improvement Accuracy for Auto Target Classification on the SAR Image by using CNN Ensemble Model based on the Radar System for the Fighter)

  • 임동주;송세리;박범
    • 시스템엔지니어링학술지
    • /
    • 제16권1호
    • /
    • pp.51-57
    • /
    • 2020
  • The fighter pilot uses radar mounted on the fighter to obtain high-resolution SAR (Synthetic Aperture Radar) images for a specific area of distance, and then the pilot visually classifies targets within the image. However, the target configuration captured in the SAR image is relatively small in size, and distortion of that type occurs depending on the depression angle, making it difficult for pilot to classify the type of target. Also, being present with various types of clutters, there should be errors in target classification and pilots should be even worse if tasks such as navigation and situational awareness are carried out simultaneously. In this paper, the concept of operation and functional structure of radar system for fighter jets were presented to transfer the SAR image target classification task of fighter pilots to radar system, and the method of target classification with high accuracy was studied using the CNN ensemble model to archive higher classification accuracy than single CNN model.

압축 영상 화질 개선을 위한 딥 러닝 연구에 대한 분석 (Comparative Analysis of Deep Learning Researches for Compressed Video Quality Improvement)

  • 이영운;김병규
    • 방송공학회논문지
    • /
    • 제24권3호
    • /
    • pp.420-429
    • /
    • 2019
  • 최근 CNN (Convolutional Neural Network) 기반의 화질 개선 기술이 H.265/HEVC와 같은 블록 기반 영상 압축 표준을 사용하여 압축된 영상의 화질을 향상시키는 데 적극적으로 사용되어 왔다. 이 논문은 이러한 영상 압축 기술을 위한 화질 개선 연구의 추세를 요약하고 분석하는 것을 목표로 한다. 먼저, 화질 개선을 위한 CNN의 구성 요소를 살펴보고 이미지 도메인에서의 사전 연구를 요약한다. 다음으로 네트워크 구조, 데이터셋 및 학습 방법의 세 가지 측면에서 관련 연구들을 정리하고 성능 비교를 위한 구현 및 실험결과를 제시하고자 한다.

Faster R-CNN 기반의 관심영역 유사도를 이용한 후방 접근차량 검출 연구 (Rear-Approaching Vehicle Detection Research using Region of Interesting based on Faster R-CNN)

  • 이영학;김중수;심재창
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.235-241
    • /
    • 2019
  • 본 논문에서는 농업 기계 시스템에서 사용하기 위한 딥러닝 알고리즘 기반의 프레임 내의 관심 영역 유사성을 이용한 새로운 후방 접근 차량 검출 알고리즘을 제안한다. 농업 기계 시스템은 후방에서 접근하는 차량만 검출해야 한다. 지나가는 자동차가 검출되면 혼란을 야기할 수 있다. 논문에서는 차량 검출을 위해 딥러닝에서 뛰어난 검출률을 나타내는 Faster R-CNN 모델을 사용하였다. 딥러닝은 뒤에서 접근하는 차량뿐만 아니라 지나가는 차량도 검출하므로 긍정오류 차량을 배제해야 한다. 본 논문에서 이를 해결하기 위해 검출된 프레임에서 관심 영역에 대한 유사성과 평균 에러를 피라미드 형태로 이용하여 접근하는 자동차만 검출하는 알고리즘을 제안하였다. 실험을 통하여 제안된 방법이 평균 98.8%의 높은 검출률을 나타내었다.

CNN 기반 MS Office 악성 문서 탐지 (MS Office Malicious Document Detection Based on CNN)

  • 박현수;강아름
    • 정보보호학회논문지
    • /
    • 제32권2호
    • /
    • pp.439-446
    • /
    • 2022
  • 웹사이트나 메일의 첨부 파일을 이용해 문서형 악성코드의 유포가 활발하게 이루어지고 있다. 문서형 악성코드는 실행 파일이 직접 실행되는 것이 아니므로 보안 프로그램의 우회가 비교적 쉽다. 따라서 문서형 악성코드는 사전에 탐지하고 예방해야 한다. 이를 탐지하기 위해 문서의 구조를 파악하고 악성으로 의심되는 키워드를 선정하였다. 문서 내의 스트림 데이터를 아스키코드값으로 변환하여 데이터셋을 만들었다. CNN 알고리즘을 이용하여 문서의 스트림 데이터 내에 존재하는 악성 키워드의 위치를 확인하고 인접 정보를 활용하여 이를 악성으로 분류했다. 파일 내의 스트림 단위로 악성코드를 탐지한 결과 0.97의 정확도를 보였고, 파일 단위로 악성코드를 탐지한 결과 0.92의 정확도를 보였다.

A Hierarchical deep model for food classification from photographs

  • Yang, Heekyung;Kang, Sungyong;Park, Chanung;Lee, JeongWook;Yu, Kyungmin;Min, Kyungha
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권4호
    • /
    • pp.1704-1720
    • /
    • 2020
  • Recognizing food from photographs presents many applications for machine learning, computer vision and dietetics, etc. Recent progress of deep learning techniques accelerates the recognition of food in a great scale. We build a hierarchical structure composed of deep CNN to recognize and classify food from photographs. We build a dataset for Korean food of 18 classes, which are further categorized in 4 major classes. Our hierarchical recognizer classifies foods into four major classes in the first step. Each food in the major classes is further classified into the exact class in the second step. We employ DenseNet structure for the baseline of our recognizer. The hierarchical structure provides higher accuracy and F1 score than those from the single-structured recognizer.