• 제목/요약/키워드: Complex nested U-Net

검색결과 2건 처리시간 0.014초

이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델 (Complex nested U-Net-based speech enhancement model using a dual-branch decoder)

  • 황서림;박성욱;박영철
    • 한국음향학회지
    • /
    • 제43권2호
    • /
    • pp.253-259
    • /
    • 2024
  • 본 논문에서는 이중 분기 디코더를 갖는 복소 중첩 U-Net 기반의 새로운 음성 향상 모델을 제안하였다. 제안된 모델은 음성 신호의 크기와 위상 성분을 동시에 추정할 수 있도록 복소 중첩 U-Net으로 구성되며, 디코더는 스펙트럼 사상과 시간 주파수 마스킹을 각각의 분기에서 수행하는 이중 분기 디코더 구조를 갖는다. 이때, 이중 분기 디코더 구조는 단일 디코더 구조에 비하여, 음성 정보의 손실을 최소화하면서 잡음을 효과적으로 제거할 수 있도록 한다. 실험은 음성 향상 모델 학습을 위해 보편적으로 사용되는 VoiceBank + DEMAND 데이터베이스 상에서 이루어졌으며, 다양한 객관적 평가 지표를 통해 평가되었다. 실험 결과, 이중 분기 디코더를 사용하는 복소 중첩 U-Net 기반 음성 향상 모델은 기존의 베이스라인과 비교하여 Perceptual Evaluation of Speech Quality(PESQ) 점수가 0.13가량 증가하였으며, 최근 제안된 음성 향상 모델들보다도 높은 객관적 평가 점수를 보였다.

딥러닝 기반 균열 추출 기법을 통한 수압 파쇄 균열 형상 분석 (Morphological Analysis of Hydraulically Stimulated Fractures by Deep-Learning Segmentation Method)

  • 박지민;김광염;윤태섭
    • 한국지반공학회논문집
    • /
    • 제39권8호
    • /
    • pp.17-28
    • /
    • 2023
  • 본 연구에서는 화강암 시편을 대상으로 파쇄 유체의 점성과 주입 속도를 변화시키며 실내 수압 파쇄 실험을 수행하였고, 3D X-ray CT 촬영을 통해 파쇄 후 시편 내부를 관찰하였다. 이미지 처리에 탁월한 성능을 보이는 합성곱 신경망(Convolutional Neural Network, CNN) 기반 Nested U-Net 모델 구조를 활용하여 CT 이미지 내 수압 파쇄 균열 추출을 수행하였고, 복잡한 형상의 미세균열을 정교하게 추출할 수 있었다. CNN 기반 모델로 추출된 균열을 3차원으로 재구성하여 균열의 부피, 두께, 굴곡도, 균열면 거칠기를 분석하였다. 그 결과 파쇄 유체의 점성이 클수록 균열 부피와 두께가 증가하였고, 굴곡도와 균열면의 거칠기가 감소하는 경향을 보였다. 또한 균열면의 굴곡도와 거칠기 이방성이 존재함을 확인할 수 있었다. 본 연구는, CNN 기반의 균열 추출 모델을 활용해 전통적인 이미지 처리 방법보다 정교한 균열 추출을 수행하고, 이를 기반으로 수압 파쇄 균열의 정량 분석을 성공적으로 수행하였다.