• 제목/요약/키워드: feature enhancement

검색결과 258건 처리시간 0.033초

특징 맵 중요도 기반 어텐션을 적용한 복소 스펙트럼 기반 음성 향상에 관한 연구 (A study on speech enhancement using complex-valued spectrum employing Feature map Dependent attention gate)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권6호
    • /
    • pp.544-551
    • /
    • 2023
  • 잡음 음성의 지각적 품질과 명료도 향상을 위해 활용되는 음성 향상은 크기 스펙트럼을 이용한 방법에서 크기와 위상을 같이 향상시킬 수 있는 복소 스펙트럼을 이용한 방법으로 연구되어왔다. 본 논문에서는 잡음 음성의 명료도와 품질을 더욱 향상시키기 위해 복소 스펙트럼 기반 음성 향상 시스템에 어텐션 기법을 적용하는 방안에 관해 연구를 수행하였다. 어텐션 기법은 additive attention을 기반으로 수행하며 복소 스펙트럼의 특성을 고려하여 어텐션 가중치를 계산할 수 있도록 하였다. 또한 특징 맵의 중요도를 고려하기 위해 전역 평균 풀링 연산을 같이 사용하였다. 복소 스펙트럼 기반 음성 향상은 Deep Complex U-Net(DCUNET) 모델을 기반으로 수행하였으며, additive attention은 Attention U-Net 모델에서 제안된 방법을 기반으로 연구를 수행하였다. 거실 환경의 잡음 데이터에 대해 음성 향상을 수행한 결과, 제안한 방법이 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short Time Objective Intelligibility(STOI) 평가 지표에서 기준 모델보다 개선된 성능을 보였으며, 낮은 Signal-to-Noise Ratio(SNR) 조건의 다양한 배경 잡음 환경에 대해서도 일관된 성능 향상을 보였다. 이를 통해 제안한 음성 향상 시스템이 효과적으로 잡음 음성의 명료도와 품질을 향상시킬 수 있음을 보여주었다.

평탄도 측정을 이용한 GMM 얼굴인식기 구현 및 성능향상 (Implementation and Enhancement of GMM Face Recognition System using Flatness Measure)

  • 천영하;고대영;김진영;백성준
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2004-2007
    • /
    • 2003
  • This paper describes a method of performance enhancement using Flatness Mesure(FM) for the Gaussian Mixture Model(GMM) face recognition systems. Using this measure we discard the frames having low information before training and test. As the result, the performance increases about 9% in the lower mixtures and calculation burden is decreased. As well, the recognition error rate is decreased under the illumination change surroundings. We use the 2D DCT coefficients lot face feature vectors and experiments are carried out on the Olivetti Research Laboratory (ORL) face database.

  • PDF

특징창과 특징링크를 이용한 스테레오 특징점의 정합 성능 향상 (Enhancement of Stereo Feature Matching using Feature Windows and Feature Links)

  • 김창일;박순용
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.113-122
    • /
    • 2012
  • 스테레오 정합(stereo matching) 기술은 주어진 두 영상에서 동일한 물체의 영상점이 어떤 위치 관계를 가지고 있는지를 결정하는 기술이다. 본 논문에서는 영상 특징점에 대해 스테레오 위치관계를 결정하는 새로운 스테레오 특징점 정합(stereo feature matching) 방법을 제시한다. 제안하는 방법은 주어진 스테레오 영상에서 FAST 추출기를 이용하여 특징점을 추출하고, 특징점 벡터들의 정보들을 내부에 포함하는 특징창(feature window)이라는 공간을 정의하여 스테레오 정합의 성능을 향상한다. 제안하는 방법은 표준 영상에 추출된 특징점들에 대해 특징창을 생성하고, 참조 영상에서 표준 영상의 특징창과 가장 유사한 특징창을 탐색 및 결정한 다음, 결정된 두 개의 특징창 내부의 특징점들의 시차관계는 특징링크(feature link)를 생성하여 시차를 결정한다. 만약, 이 과정에서 시차가 결정되지 않은 특징점들이 있다면, 특징창 내의 결정된 시차 정보를 이용하여 시차 값을 보간한다. 마지막으로, 제안하는 방법의 성능을 검증하기 위해 결과 영상과 정답 영상의 시차를 비교하여 정합 정확성과 수행시간을 비교하였다. 또한, 기존의 특징점 기반 스테레오 정합 방법들과 제안하는 방법의 성능을 비교 및 분석하였다.

음성구간검출을 위한 비정상성 잡음에 강인한 특징 추출 (Robust Feature Extraction for Voice Activity Detection in Nonstationary Noisy Environments)

  • 홍정표;박상준;정상배;한민수
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.11-16
    • /
    • 2013
  • This paper proposes robust feature extraction for accurate voice activity detection (VAD). VAD is one of the principal modules for speech signal processing such as speech codec, speech enhancement, and speech recognition. Noisy environments contain nonstationary noises causing the accuracy of the VAD to drastically decline because the fluctuation of features in the noise intervals results in increased false alarm rates. In this paper, in order to improve the VAD performance, harmonic-weighted energy is proposed. This feature extraction method focuses on voiced speech intervals and weighted harmonic-to-noise ratios to determine the amount of the harmonicity to frame energy. For performance evaluation, the receiver operating characteristic curves and equal error rate are measured.

영상의 화질 개선을 위한 Multi-Scale Retinex 기반의 적응적 언샤프 마스킹 필터 설계 (Adaptive Unsharp Masking Filter Design Based on Multi-Scale Retinex for Image Enhancement)

  • 김주영;김진헌
    • 한국멀티미디어학회논문지
    • /
    • 제21권2호
    • /
    • pp.108-116
    • /
    • 2018
  • In this paper, we propose an image enhancement method based on Multi-Scale Retinex theory that designs Unsharp Masking Filter (UMF) and emphasizes the contrast ratio adaptively. Unsharp Masking (UM) technique emphasizes image sharpness and improves contrast ratio by adding high frequency component to the original image. The high frequency component is obtained by differentiating between original image and low frequency image. In this paper, we present how to design an UMF kernel and to adaptively apply it to increase the contrast ratio according to multi-scale retinex theory which resembles human visual system. Experimental results show that the proposed method has better quantitative performance indexes such as PSNR, ambe & SSIM and better qualitative feature like halo artifact suppression.

CT Image Analysis of Hepatic Lesions Using CAD ; Fractal Texture Analysis

  • Hwang, Kyung-Hoon;Cheong, Ji-Wook;Lee, Jung-Chul;Lee, Hyung-Ji;Choi, Duck-Joo;Choe, Won-Sick
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.326-327
    • /
    • 2007
  • We investigated whether the CT images of hepatic lesions could be analyzed by computer-aided diagnosis (CAD) tool. We retrospectively reanalyzed 14 liver CT images (10 hepatocellular cancers and 4 benign liver lesions; patients who presented with hepatic masses). The hepatic lesions on CT were segmented by rectangular ROI technique and the morphologic features were extracted and quantitated using fractal texture analysis. The contrast enhancement of hepatic lesions was also quantified and added to the differential diagnosis. The best discriminating function combining the textural features and the values of contrast enhancement of the lesions was created using linear discriminant analysis. Textural feature analysis showed moderate accuracy in the differential diagnosis of hepatic lesions, but statistically insignificant. Combining textural analysis and contrast enhancement value resulted in improved diagnostic accuracy, but further studies are needed.

  • PDF

교량케이블 영상기반 손상탐지 (A Vision-based Damage Detection for Bridge Cables)

  • ;이종재
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2011년도 정기 학술발표대회
    • /
    • pp.39-39
    • /
    • 2011
  • This study presents an effective vision-based system for cable bridge damage detection. In theory, cable bridges need to be inspected the outer as well as the inner part. Starting from August 2010, a new research project supported by Korea Ministry of Land, Transportation Maritime Affairs(MLTM) was initiated focusing on the damage detection of cable system. In this study, only the surface damage detection algorithm based on a vision-based system will be focused on, an overview of the vision-based cable damage detection is given in Fig. 1. Basically, the algorithm combines the image enhancement technique with principal component analysis(PCA) to detect damage on cable surfaces. In more detail, the input image from a camera is processed with image enhancement technique to improve image quality, and then it is projected into PCA sub-space. Finally, the Mahalanobis square distance is used for pattern recognition. The algorithm was verified through laboratory tests on three types of cable surface. The algorithm gave very good results, and the next step of this study is to implement the algorithm for real cable bridges.

  • PDF

Vehicle Detection at Night Based on Style Transfer Image Enhancement

  • Jianing Shen;Rong Li
    • Journal of Information Processing Systems
    • /
    • 제19권5호
    • /
    • pp.663-672
    • /
    • 2023
  • Most vehicle detection methods have poor vehicle feature extraction performance at night, and their robustness is reduced; hence, this study proposes a night vehicle detection method based on style transfer image enhancement. First, a style transfer model is constructed using cycle generative adversarial networks (cycleGANs). The daytime data in the BDD100K dataset were converted into nighttime data to form a style dataset. The dataset was then divided using its labels. Finally, based on a YOLOv5s network, a nighttime vehicle image is detected for the reliable recognition of vehicle information in a complex environment. The experimental results of the proposed method based on the BDD100K dataset show that the transferred night vehicle images are clear and meet the requirements. The precision, recall, mAP@.5, and mAP@.5:.95 reached 0.696, 0.292, 0.761, and 0.454, respectively.

주 요소와 독립 요소 분석의 통합에 의한 얼굴 인식 (Face Recognition By Combining PCA and ICA)

  • 류재흥;김강철;임창균
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.687-692
    • /
    • 2006
  • 기존의 독립 요소 방법에 의한 얼굴인식에서는 주 요소 해석법으로 고유치 크기에 의해 특징을 추출하고 감소된 차원에서 특징 개선을 위한 독립 요소 해석법의 학습을 수행한다. 제거된 특징 공간 내에 필요한 요소가 있는 경우를 고려하지 못한 것이다. 새로운 방법은 독립 요소 해석에 의한 학습을 먼저 시행하고 분리된 데이터를 4차 중심 모멘트에 의한 축적 계수(cumulant)인 커토시스(kurtosis)의 절대값 크기에 의하여 특징을 추출한다. 하지만 독립 요소 방법은 효과적으로 노이즈를 제거하지 못한다. 두 방법의 결합효과는 주 요소 해석법을 노이즈 필터로 사용 할 때 극대화 될 수 있다. 즉 주 요소 해석법을 백색화와 노이즈 필터로 하고 독립 요소 해석법을 특징 추출 방법으로 사용하는 것이다. 실험 결과는 새로운 방법론이 기존의 방법론보다 우수함을 보여준다.

특징점 정합 필터 결합 SIFT를 이용한 상대 위치 추정 (Integrated SIFT Algorithm with Feature Point Matching Filter for Relative Position Estimation)

  • 곽민규;성상경;윤석창;원대희;이영재
    • 한국항공우주학회지
    • /
    • 제37권8호
    • /
    • pp.759-766
    • /
    • 2009
  • 본 논문은 INS/vSLAM 통합 항법 시스템의 성능 향상을 위한 기초 연구로써, 비전 센서의 영상처리 성능을 향상을 위한 알고리즘 개발에 목표를 두고 있다. 비전센서의 영상처리알고리즘으로 SIFT 알고리즘을 사용하였으며, SIFT 알고리즘의 특징점 정합 성능을 개선하기 위해 특징점 정합 필터를 적용하였다. 본 논문에서 제안한 알고리즘을 이용하여 기존의 SIFT 알고리즘을 파라미터 조절한 경우보다 향상된 결과를 얻을 수 있었다. 차후 실시간 통합 항법 시스템에 적용하기 위해서 알고리즘의 속도를 향상시키는 작업이 필요하다.