• 제목/요약/키워드: Improved deep learning

검색결과 548건 처리시간 0.036초

순환신경망 모델을 활용한 팔당호의 단기 수질 예측 (Short-Term Water Quality Prediction of the Paldang Reservoir Using Recurrent Neural Network Models)

  • 한지우;조용철;이소영;김상훈;강태구
    • 한국물환경학회지
    • /
    • 제39권1호
    • /
    • pp.46-60
    • /
    • 2023
  • Climate change causes fluctuations in water quality in the aquatic environment, which can cause changes in water circulation patterns and severe adverse effects on aquatic ecosystems in the future. Therefore, research is needed to predict and respond to water quality changes caused by climate change in advance. In this study, we tried to predict the dissolved oxygen (DO), chlorophyll-a, and turbidity of the Paldang reservoir for about two weeks using long short-term memory (LSTM) and gated recurrent units (GRU), which are deep learning algorithms based on recurrent neural networks. The model was built based on real-time water quality data and meteorological data. The observation period was set from July to September in the summer of 2021 (Period 1) and from March to May in the spring of 2022 (Period 2). We tried to select an algorithm with optimal predictive power for each water quality parameter. In addition, to improve the predictive power of the model, an important variable extraction technique using random forest was used to select only the important variables as input variables. In both Periods 1 and 2, the predictive power after extracting important variables was further improved. Except for DO in Period 2, GRU was selected as the best model in all water quality parameters. This methodology can be useful for preventive water quality management by identifying the variability of water quality in advance and predicting water quality in a short period.

Convolutional neural network 기법을 이용한 턱수염물범 신호 판별 (Classification of bearded seals signal based on convolutional neural network)

  • 김지섭;윤영글;한동균;나형술;최지웅
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.235-241
    • /
    • 2022
  • 수동 음향 관측을 통해 수집된 방대한 양의 데이터에서 해양포유류의 소리를 탐지하고 식별하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)을 활용한 연구가 많이 수행되고 있다. 본 연구는 2017년 8월부터 2018년 8월까지 동시베리아 해에서 수집된 수중음향 스펙트럼 이미지를 기반으로 CNN을 활용하여 턱수염물범 소리의 분류 자동화 가능성을 확인해 보았다. 학습 데이터로서 다른 소음이 거의 포함되지 않은 뚜렷한 턱수염물범 소리를 사용하였을 때, 암기로 인한 과적합이 발생하였다. 일부 데이터를 소음이 포함된 데이터로 교체하여 학습시켜 수집된 전체 데이터로 평가한 결과 정확도(0.9743), 정밀도(0.9783), 재현율(0.9520)으로 모델이 이전보다 일반화되어 과적합이 방지되는 것을 확인하였다. 본 연구를 통해 물범신호 분류는 학습 데이터에 소음이 포함되었을 때 성능이 증가하는 것으로 나타났다.

홀로그램 압축으로 인한 열화 보정을 위한 네트워크 설계 (Network design for correction of deterioration due to hologram compression)

  • 송준범;장준혁;황윤석;조인제
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.377-379
    • /
    • 2020
  • 홀로그램은 SLM(공간 광변조기)의 픽셀 피치와 빛의 파장에 대한 의존성이 있는 데이터이며 디지털 홀로그램의 품질은 단위 픽셀 피치와 전체 해상도에 비례하게 된다. 또한 각 픽셀마다 복소값을 가지므로 디지털 홀로그램의 데이터량 또한 기하급수적으로 증가하여 그 크기가 매우 클 수밖에 없다. 따라서 효율적으로 디지털 홀로그램 파일을 다루기 위해서는 코덱을 통해 파일 크기를 축소하여 저장하는 것이 필수적이며 최근에는 코덱으로 인해 손상된 화질을 복원하는 연구가 활발히 진행 중이다. 본 논문에서는 홀로그램 표준 데이터인 JPEG Pleno의 홀로그램 이미지를 사용하였으며 홀로그램 이미지를 JPEG2000, AVC, HEVC코덱을 통해 압축 및 복원했을 때 나타나는 화질손상을 딥러닝 네트워크로 복원하여 화질 개선이 이루어지는지 알아보고 원본 홀로그램과 비교하여 정량적으로 화질의 개선 정도를 알아본다.

  • PDF

발화 속도와 휴지 구간 길이를 사용한 방언 분류 (Dialect classification based on the speed and the pause of speech utterances)

  • 나종환;이보원
    • 말소리와 음성과학
    • /
    • 제15권2호
    • /
    • pp.43-51
    • /
    • 2023
  • 본 논문에서는 음성의 발화 속도와 휴지 구간의 길이 그리고 화자의 연령과 성별에 기반한 방언 분류 접근 방법을 제안한다. 방언 분류는 음성 분석을 위한 중요한 기술 중 하나이다. 예를 들어 정확한 방언 분류 모델은 화자 인식 또는 음성 인식의 성능을 향상시킬 수 있는 잠재력을 가질 수 있다. 선행 연구에 따르면, Mel-Frequency Cepstral Coefficients(MFCC) 특징을 사용한 딥러닝 기반의 연구가 주류를 이루었다. 우리는 지역 간의 음향적 차이에 주목하여 그 차이를 바탕으로 추출한 특징을 사용하여 방언 분류를 진행하였다. 본 논문에서는 음성의 발화 속도, 휴지 구간의 길이 특성을 추출하여 사용하며 이와 함께 화자의 연령과 성별과 같은 메타데이터를 추가로 사용하는 새로운 접근 방법을 제안한다. 실험 결과 제안된 접근 방법이 더 높은 정확도를 보이는 것을 확인하였으며 특히 음성의 발화 속도 특성을 사용하는 것이 기존 MFCC만을 사용하는 방법보다 향상된 성능을 보여준다는 것을 확인할 수 있었다. MFCC 특성만을 사용한 방법과 비교했을 때 본 논문에서 제안한 특성들을 모두 사용하였을 때의 정확도는 91.02%에서 97.02%로 향상되었다.

향상된 실내 이동 경로 생성을 위한 인접 클러스터의 정보 확장에 관한 연구 (A Study on Information Expansion of Neighboring Clusters for Creating Enhanced Indoor Movement Paths)

  • 윤창표;황치곤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.264-266
    • /
    • 2022
  • 전파 지문 기반의 실내 경로 생성 기술에 RNN 모델을 적용하기 위해서는 데이터 세트가 연속적이고 순차적이어야 한다. 그러나 Wi-Fi 전파 지문 데이터는 수집 시점의 특정 위치에 대한 특징 정보로서 연속성이 보장되지 않기 때문에 RNN 데이터로는 부적합하다. 따라서 순차적 위치의 연속성 정보를 부여해야한다. 이를 위해서는 신호 데이터를 기반으로 각 지역의 구분을 통해 클러스터링이 가능하다. 이때 클러스터 간의 연속성 정보에는 전파 신호의 한계로 이해 실제 이동이 가능한지의 정보를 담지 못한다. 따라서 인접 클러스터간의 이동이 가능한지에 대한 연관성 정보가 필요하다. 본 논문에서는 딥러닝 네트워크인 순환신경망(RNN) 모델을 사용해 이동 중인 객체의 경로 예측을 위한 기술로서 실내 환경에서 경로 생성을 위해 연속적인 위치 정보를 생성하여 객체의 경로 예측 시 발생할 수 있는 오류를 낮추고 예측 경로상의 이동이 불가능한 잘못된 경로 예측을 회피할 수 있는 향상된 이동 경로 생성을 위한 클러스터링 상호간의 연관성을 부여하는 기법을 제안한다.

  • PDF

Lightweight Attention-Guided Network with Frequency Domain Reconstruction for High Dynamic Range Image Fusion

  • 박재현;이근택;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.205-208
    • /
    • 2022
  • Multi-exposure high dynamic range (HDR) image reconstruction, the task of reconstructing an HDR image from multiple low dynamic range (LDR) images in a dynamic scene, often produces ghosting artifacts caused by camera motion and moving objects and also cannot deal with washed-out regions due to over or under-exposures. While there has been many deep-learning-based methods with motion estimation to alleviate these problems, they still have limitations for severely moving scenes. They also require large parameter counts, especially in the case of state-of-the-art methods that employ attention modules. To address these issues, we propose a frequency domain approach based on the idea that the transform domain coefficients inherently involve the global information from whole image pixels to cope with large motions. Specifically we adopt Residual Fast Fourier Transform (RFFT) blocks, which allows for global interactions of pixels. Moreover, we also employ Depthwise Overparametrized convolution (DO-conv) blocks, a convolution in which each input channel is convolved with its own 2D kernel, for faster convergence and performance gains. We call this LFFNet (Lightweight Frequency Fusion Network), and experiments on the benchmarks show reduced ghosting artifacts and improved performance up to 0.6dB tonemapped PSNR compared to recent state-of-the-art methods. Our architecture also requires fewer parameters and converges faster in training.

  • PDF

LiDAR 반사 강도 영상의 초해상화 신경망 모델 최적화를 위한 파라미터 분석 (Parameter Analysis for Super-Resolution Network Model Optimization of LiDAR Intensity Image)

  • 심승보
    • 한국ITS학회 논문지
    • /
    • 제22권5호
    • /
    • pp.137-147
    • /
    • 2023
  • LiDAR는 자율 주행뿐만 아니라 다양한 산업 현장에 적용되어 대상의 크기와 거리를 측정하는 데 사용되고 있다. 이에 더하여 이 센서는 반사된 빛의 양을 바탕으로 반사 강도 영상 또한 제공한다. 이는 측정 대상의 형상에 대한 정보를 제공하여 센서 데이터 처리에 긍정적인 효과를 일으킨다. LiDAR는 고해상도가 될수록 높은 성능을 보장하지만 이는 센서 비용의 증가를 야기하는데, 이 점은 반사 강도 영상에도 해당된다. 높은 해상도의 반사 강도 영상을 취득하기 위해서는 고가의 장비 사용이 필수적이다. 따라서 본 연구에서는 저해상도의 반사 강도 영상을 고해상도의 영상으로 개선하는 인공지능을 개발하였다. 이를 위해서 본 연구에서는 최적의 초해상화 신경망 모델을 위한 파라미터 분석을 수행하였다. 또한, 초해상화 알고리즘을 2,500여 장의 반사 강도 영상에 적용하여 훈련과 검증을 하였다. 결과적으로 반사 강도 영상의 해상도를 향상시켰다. 바라건대 본 연구의 결과가 향후 자율 주행 분야에 적용되어 주행환경 인식과 장애물 탐지 성능 향상에 기여할 수 있기를 기대하는 바이다.

도시 스트리트뷰 영상을 이용한 딥러닝 기반 보행환경 평가 요소 분석 (Analysis of Deep Learning-Based Pedestrian Environment Assessment Factors Using Urban Street View Images)

  • 황지연;최철웅;남광우;이창우
    • 한국산업정보학회논문지
    • /
    • 제28권6호
    • /
    • pp.45-52
    • /
    • 2023
  • 최근 일상생활 속 보행의 중요성이 강조되면서 보행권 보장 및 보행환경 조성을 위한 사업이 지역 곳곳에서 추진되고 있다. 선행 연구에서는 전주시 도로 이미지를 사용하여 보행환경 평가를 진행하고, 이미지 비교 쌍 데이터 세트를 구축하였다. 하지만 숫자로 표현된 데이터 세트는 보행환경 평가자들의 판단 기준을 일반화하거나 보행자가 선호하는 보행환경을 시각적으로 파악하기에 어려움이 존재한다. 따라서 본 연구는 웹 애플리케이션을 구축하여 데이터 시각화를 통해 보행환경 평가의 결과를 해석하는 방법을 제안한다. 의미론적 분할 결과를 활용하여 보행환경 평가자에게 영향을 미치는 보행환경 구성 요소를 분석한 결과, 보행자는 주로 'earth'와 'grass'가 많은 환경을 선호하지 않았고, 'signboard'와 'sidewalk'를 가진 환경을 선호하는 것으로 확인하였다. 제안된 연구는 향후 보행환경 평가의 참여자가 임의로 선택한 결과를 파악하고 분석할 수 있을 것으로 기대하며, 데이터에 대한 정제과정을 전처리로 수행함으로써 좀 더 향상된 정확도를 얻을 수 있을 것으로 판단한다.

대화문 재구조화를 통한 한국어 대화문 요약 (Summarization of Korean Dialogues through Dialogue Restructuring)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.77-85
    • /
    • 2023
  • COVID-19 이후 온라인을 통한 소통이 증가하여 다양한 플랫폼을 기반으로 소통을 위한 대화 텍스트 데이터가 대량으로 축적되고 있다. 텍스트 데이터로부터 유의미한 정보를 추출하기 위한 텍스트 요약에 대한 중요성이 더욱 증가함에 따라 딥러닝을 활용한 추상 요약 연구가 활발하게 이루어지고 있다. 그러나 대화 데이터는 뉴스 기사와 같은 정형화된 텍스트에 비해 누락 및 변형이 많아 대화 상황을 다양한 관점에서 고려해야 하는 특이성이 있다. 특히 어휘 생략과 동시에 내용과 관련 없는 표현 요소들이 대화의 내용을 요약하는 데 방해가 된다. 그러므로 본 연구에서는 한국어 대화 데이터의 특성을 고려하여 발화문을 재구조화하고 KoBART 기반의 사전학습된 텍스트 요약 모델을 파인 튜닝후, 요약문에서 중복 요소를 제거하는 정제 작업을 통해 대화 데이터 요약 성능을 향상시키고자 한다. 발화문을 재구조화하는 방법으로는 발화 순서에 따라 재구조화는 방법과 중심 발화자를 기준으로 재구조화하는 방법을 결합하였다. 대화문 재구조화 방법을 적용한 결과, Rouge-1 점수가 4 정도 향상되었다. 본 연구의 대화 특성을 고려한 재구조화 방법이 한국어 대화 요약 성능 향상에 유의미함을 입증하였다.

A high-density gamma white spots-Gaussian mixture noise removal method for neutron images denoising based on Swin Transformer UNet and Monte Carlo calculation

  • Di Zhang;Guomin Sun;Zihui Yang;Jie Yu
    • Nuclear Engineering and Technology
    • /
    • 제56권2호
    • /
    • pp.715-727
    • /
    • 2024
  • During fast neutron imaging, besides the dark current noise and readout noise of the CCD camera, the main noise in fast neutron imaging comes from high-energy gamma rays generated by neutron nuclear reactions in and around the experimental setup. These high-energy gamma rays result in the presence of high-density gamma white spots (GWS) in the fast neutron image. Due to the microscopic quantum characteristics of the neutron beam itself and environmental scattering effects, fast neutron images typically exhibit a mixture of Gaussian noise. Existing denoising methods in neutron images are difficult to handle when dealing with a mixture of GWS and Gaussian noise. Herein we put forward a deep learning approach based on the Swin Transformer UNet (SUNet) model to remove high-density GWS-Gaussian mixture noise from fast neutron images. The improved denoising model utilizes a customized loss function for training, which combines perceptual loss and mean squared error loss to avoid grid-like artifacts caused by using a single perceptual loss. To address the high cost of acquiring real fast neutron images, this study introduces Monte Carlo method to simulate noise data with GWS characteristics by computing the interaction between gamma rays and sensors based on the principle of GWS generation. Ultimately, the experimental scenarios involving simulated neutron noise images and real fast neutron images demonstrate that the proposed method not only improves the quality and signal-to-noise ratio of fast neutron images but also preserves the details of the original images during denoising.