• 제목/요약/키워드: residual learning

검색결과 198건 처리시간 0.318초

심층학습 알고리즘을 이용한 보청기의 음향궤환 및 잡음 제거 (Acoustic Feedback and Noise Cancellation of Hearing Aids by Deep Learning Algorithm)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.1249-1256
    • /
    • 2019
  • 본 논문에서는 보청기의 음향궤환 및 잡음을 제거하기 위한 새로운 알고리즘을 제안한다. 이 알고리즘은 기존의 FIR 구조를 이용하는 대신 신경망 적응예측필터를 이용한 심층학습 알고리즘으로 궤환 및 잡음제거 성능을 향상시킨다. 먼저 궤환제거기가 마이크 신호에서 궤환신호를 제거하고, 이어서 Wiener 필터기법을 이용하여 잡음을 제거한다. 잡음 제거는 음성신호가 가진 주기적 성질에 따라 선형예측모델을 이용하여 잡음이 포함된 음성신호로부터 음성을 추정해내는 것이다. 한 루프 안에 포함된 두 적응 시스템의 안정적 수렴을 보장하기 위해 궤환제거기 및 잡음제거기의 계수 업데이트를 분리하여 실시하며 제거 후 생성된 잔차신호를 이용하여 수렴시키는 과정을 진행한다. 본 연구에서 제안한 궤환 및 잡음제거기의 성능을 검증하기 위하여 시뮬레이션 프로그램을 작성하고 모의실험을 수행하였다. 실험 결과, 제안한 심층학습 알고리즘을 사용하면 기존의 FIR 구조를 사용하는 경우보다 궤환제거기에서 약 10 dB의 SFR(: Signal to Feedback Ratio), 잡음제거기에서 약 3 dB의 SNRE(: Signal to Noise Ratio Enhancement) 개선효과를 얻을 수 있는 것으로 확인되었다.

정보 증류 및 재귀적인 방식을 이용한 심층 학습법 기반 경량화된 초해상도 네트워크 (Lightweight Super-Resolution Network Based on Deep Learning using Information Distillation and Recursive Methods)

  • 우희조;심지우;김응태
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.378-390
    • /
    • 2022
  • 최근 심층 합성 곱 신경망 학습의 발전에 따라 단일 영상 초해상도에 적용되는 심층 학습 기법들을 좋은 성과를 보여주고 있으며 깊은 네트워크의 강한 표현 능력으로 저해상도 영상과 고해상도 영상 사이의 복잡한 비선형 매핑이 가능해졌다. 하지만 과도한 합성곱 신경망의 사용으로 인해 증가하는 파라미터와 연산량으로 실시간 또는 저전력 장치에 적용하는데 제한이 있다. 본 논문은 정보 증류 방식을 이용하여 계층적인 특징을 조금씩 추출해내는 블록을 재귀적인 방식으로 사용하며 고주파수 잔여 정제 블록을 통해 더 정확한 고주파수 성분을 만들어 성능을 향상시키는 경량화된 네트워크인 Recursive Distillation Super Resolution Network (RDSRN) 를 제안한다. 제안하는 네트워크는 RDN과 비교했을 때 비슷한 화질의 영상을 복원하며 약 32배 적은 파라미터와 약 10배 적은 연산량을 가지고 약 3.5배 더 빠르게 영상을 복원하며 기존 경량화 네트워크 CARN과 비교했을 때 약 2.2배 적은 파라미터와 약 1.8배 빠른 처리시간으로 평균 0.16dB 더 좋은 성능을 만들어 냄을 확인 하였다.

MobileNetV2 기반의 개선된 Lightweight 모델을 이용한 열화도로 영상에서의 블랙 아이스 인식 (A Black Ice Recognition in Infrared Road Images Using Improved Lightweight Model Based on MobileNetV2)

  • 이옥걸;강선경
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1835-1845
    • /
    • 2021
  • 본 논문에서는 블랙 아이스를 정확하게 인식하고 도로 노면 정보를 운전자에게 미리 알려줘서 속도를 제어하고 예방 조치를 취할 수 있도록 하기 위해 열화 도로 영상을 기반으로 블랙 아이스 검출하기 위해 lightweight 네트워크를 제안한다. 전이학습을 이용하여 블랙 아이스 인식 실험을 하였고, 블랙 아이스 인식의 정확도 향상을 위해 MobileNetV2 기반의 개선된 lightweight 네트워크를 개발하였다. 계산량을 줄이기 위해 Linear Bottleneck 및 Inverted Residuals를 활용하여 4개의 Bottleneck 그룹을 사용하고 모델의 인식률 향상을 위해 각 Bottleneck 그룹에 3×3 컨볼루션 레이어를 연결하여 지역적 특징 추출을 강화하고 특징 맵의 수를 늘렸다. 마지막으로 구축된 블랙 아이스 데이터 세트 대상으로 블랙 아이스 인식 실험을 진행하였으며, 제안된 모델은 블랙 아이스에 대해 99.07%의 정확한 인식률을 나타내었다.

Land Use and Land Cover Mapping from Kompsat-5 X-band Co-polarized Data Using Conditional Generative Adversarial Network

  • Jang, Jae-Cheol;Park, Kyung-Ae
    • 대한원격탐사학회지
    • /
    • 제38권1호
    • /
    • pp.111-126
    • /
    • 2022
  • Land use and land cover (LULC) mapping is an important factor in geospatial analysis. Although highly precise ground-based LULC monitoring is possible, it is time consuming and costly. Conversely, because the synthetic aperture radar (SAR) sensor is an all-weather sensor with high resolution, it could replace field-based LULC monitoring systems with low cost and less time requirement. Thus, LULC is one of the major areas in SAR applications. We developed a LULC model using only KOMPSAT-5 single co-polarized data and digital elevation model (DEM) data. Twelve HH-polarized images and 18 VV-polarized images were collected, and two HH-polarized images and four VV-polarized images were selected for the model testing. To train the LULC model, we applied the conditional generative adversarial network (cGAN) method. We used U-Net combined with the residual unit (ResUNet) model to generate the cGAN method. When analyzing the training history at 1732 epochs, the ResUNet model showed a maximum overall accuracy (OA) of 93.89 and a Kappa coefficient of 0.91. The model exhibited high performance in the test datasets with an OA greater than 90. The model accurately distinguished water body areas and showed lower accuracy in wetlands than in the other LULC types. The effect of the DEM on the accuracy of LULC was analyzed. When assessing the accuracy with respect to the incidence angle, owing to the radar shadow caused by the side-looking system of the SAR sensor, the OA tended to decrease as the incidence angle increased. This study is the first to use only KOMPSAT-5 single co-polarized data and deep learning methods to demonstrate the possibility of high-performance LULC monitoring. This study contributes to Earth surface monitoring and the development of deep learning approaches using the KOMPSAT-5 data.

질감 대조 가중치를 이용한 단일 영상의 초해상도 기법 (Single Image Super Resolution Method based on Texture Contrast Weighting)

  • 한현호
    • 디지털정책학회지
    • /
    • 제3권1호
    • /
    • pp.27-32
    • /
    • 2024
  • 본 논문은 초해상도 결과의 품질을 향상시키기 위해 질감 특징을 세분화하여 각각을 대조하고, 그 결과를 가중치로 이용하는 초해상도 방법을 제안하였다. 초해상도에서 중요한 평가 기준인 품질의 향상을 위해서는 경계 영역과 같은 세부사항에서의 정확하고 명확한 복원 결과가 필요하며, 인공물과 같은 불필요한 잡음을 최소화하는 것이 중요하다. 제안하는 방법은 품질 향상을 위해 기존 CNN(Convolutional Neural Network) 기반의 초해상도 방법에서 특징 추정을 위해 다중 경로의 잔차 블록 구조와 skip-connection을 구성하였다. 추가적인 질감 분석을 위한 선명 및 흐림 이미지 결과를 추가로 학습하였다. 이를 활용하여 초해상도 수행 결과 또한 각각을 대조하여 가중치를 할당하는 방법을 이용해 영상의 세부사항 영역과 평활화 영역에 대해 개선된 품질을 얻을 수 있도록 하였다. 제안하는 방법의 실험 결과 평가 기준으로 활용되는 PSNR과 SSIM 값이 기존 알고리즘 대비 높은 결과 값을 얻어 품질이 개선됨을 확인할 수 있었다.

PM2.5 Estimation Based on Image Analysis

  • Li, Xiaoli;Zhang, Shan;Wang, Kang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권2호
    • /
    • pp.907-923
    • /
    • 2020
  • For the severe haze situation in the Beijing-Tianjin-Hebei region, conventional fine particulate matter (PM2.5) concentration prediction methods based on pollutant data face problems such as incomplete data, which may lead to poor prediction performance. Therefore, this paper proposes a method of predicting the PM2.5 concentration based on image analysis technology that combines image data, which can reflect the original weather conditions, with currently popular machine learning methods. First, based on local parameter estimation, autoregressive (AR) model analysis and local estimation of the increase in image blur, we extract features from the weather images using an approach inspired by free energy and a no-reference robust metric model. Next, we compare the coefficient energy and contrast difference of each pixel in the AR model and then use the percentages to calculate the image sharpness to derive the overall mass fraction. Furthermore, the results are compared. The relationship between residual value and PM2.5 concentration is fitted by generalized Gauss distribution (GGD) model. Finally, nonlinear mapping is performed via the wavelet neural network (WNN) method to obtain the PM2.5 concentration. Experimental results obtained on real data show that the proposed method offers an improved prediction accuracy and lower root mean square error (RMSE).

움직임 적응적인 무손실 영상 압축 알고리즘 (Motion Adaptive Lossless Image Compression Algorithm)

  • 김영로;박현상
    • 한국산학기술학회논문지
    • /
    • 제10권4호
    • /
    • pp.736-739
    • /
    • 2009
  • 영상 내의 움직임 적응적인 효과적인 무손실 영상 압축 알고리즘을 제안한다. 이 알고리즘은 비선형 예측기를 토대로 움직임에 적응하는 단계와, 예측기에 의한 차분 데이터를 압축하는 단계로 구성된다. 제안한 비선형 예측기는 과거의 예측 오차로부터 화면간 혹은 화면내 예측치를 선택하며, 움직임 적응 단계를 진행되면서 주변 화소들의 예측 오차를 고려하여, 현재 화소에 대한 예측 오차를 줄이는 능력을 가진다. 예측 오차는 기존의 문맥 적응적인 코딩 기법에 의해서 압축된다. 실험결과는 제안한 알고리즘이 FELICS, CALC, JPEG-LS와 같은 문맥 모델링에 기반을 둔 무손실 압축 기법보다 우수한 압축률을 보여준다.

Tensile strength prediction of corroded steel plates by using machine learning approach

  • Karina, Cindy N.N.;Chun, Pang-jo;Okubo, Kazuaki
    • Steel and Composite Structures
    • /
    • 제24권5호
    • /
    • pp.635-641
    • /
    • 2017
  • Safety service improvement and development of efficient maintenance strategies for corroded steel structures are undeniably essential. Therefore, understanding the influence of damage caused by corrosion on the remaining load-carrying capacities such as tensile strength is required. In this study, artificial neural network (ANN) approach is proposed in order to produce a simple, accurate, and inexpensive method developed by using tensile test results, material properties and finite element method (FEM) results to train the ANN model. Initially in reproducing corroded model process, FEM was used to obtain tensile strength of artificial corroded plates, for which surface is developed by a spatial autocorrelation model. By using the corroded surface data and material properties as input data, with tensile strength as the output data, the ANN model could be trained. The accuracy of the ANN result was then verified by using leave-one-out cross-validation (LOOCV). As a result, it was confirmed that the accuracy of the ANN approach and the final output equation was developed for predicting tensile strength without tensile test results and FEM in further work. Though previous studies have been conducted, the accuracy results are still lower than the proposed ANN approach. Hence, the proposed ANN model now enables us to have a simple, rapid, and inexpensive method to predict residual tensile strength more accurately due to corrosion in steel structures.

Three-stream network with context convolution module for human-object interaction detection

  • Siadari, Thomhert S.;Han, Mikyong;Yoon, Hyunjin
    • ETRI Journal
    • /
    • 제42권2호
    • /
    • pp.230-238
    • /
    • 2020
  • Human-object interaction (HOI) detection is a popular computer vision task that detects interactions between humans and objects. This task can be useful in many applications that require a deeper understanding of semantic scenes. Current HOI detection networks typically consist of a feature extractor followed by detection layers comprising small filters (eg, 1 × 1 or 3 × 3). Although small filters can capture local spatial features with a few parameters, they fail to capture larger context information relevant for recognizing interactions between humans and distant objects owing to their small receptive regions. Hence, we herein propose a three-stream HOI detection network that employs a context convolution module (CCM) in each stream branch. The CCM can capture larger contexts from input feature maps by adopting combinations of large separable convolution layers and residual-based convolution layers without increasing the number of parameters by using fewer large separable filters. We evaluate our HOI detection method using two benchmark datasets, V-COCO and HICO-DET, and demonstrate its state-of-the-art performance.

대량 데이터를 위한 제한거절 기반의 회귀부스팅 기법 (Boosted Regression Method based on Rejection Limits for Large-Scale Data)

  • 권혁호;김승욱;최동훈;이기천
    • 대한산업공학회지
    • /
    • 제42권4호
    • /
    • pp.263-269
    • /
    • 2016
  • The purpose of this study is to challenge a computational regression-type problem, that is handling large-size data, in which conventional metamodeling techniques often fail in a practical sense. To solve such problems, regression-type boosting, one of ensemble model techniques, together with bootstrapping-based re-sampling is a reasonable choice. This study suggests weight updates by the amount of the residual itself and a new error decision criterion which constructs an ensemble model of models selectively chosen by rejection limits. Through these ideas, we propose AdaBoost.RMU.R as a metamodeling technique suitable for handling large-size data. To assess the performance of the proposed method in comparison to some existing methods, we used 6 mathematical problems. For each problem, we computed the average and the standard deviation of residuals between real response values and predicted response values. Results revealed that the average and the standard deviation of AdaBoost.RMU.R were improved than those of other algorithms.