통합 검색 | Korea Science

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

정재희;김우일
- 한국음향학회지
- /
- 제42권2호
- /
- pp.94-101
- /
- 2023
음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.
https://doi.org/10.7776/ASK.2023.42.2.094 인용 PDF

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution)

황재천
- 한국융합학회논문지
- /
- 제8권5호
- /
- pp.13-17
- /
- 2017
음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼의 인식률 향상이 있었다.
https://doi.org/10.15207/JKCS.2017.8.5.013 인용 PDF KSCI

가산 잡음 또는 반향 환경에 강인한 음성인식을 위한 은닉 마르코프 모델 기반 특징 향상 방법

조지원;박형민
- 정보와 통신
- /
- 제33권9호
- /
- pp.17-23
- /
- 2016
실세계 환경의 원거리에서 녹음된 음성은 가산 잡음이나 반향 성분으로 왜곡되기 때문에 음성인식 성능이 현저히 떨어진다. 따라서 음성 전처리 과정은 실세계 환경에서 강인한 음성인식을 위한 필수과정이다. 모델 기반 특징 향상 방법은 전처리 방법 중 하나로 특징 영역 데이터의 적절한 동적 범위(dynamic range)와 차원 수로 인하여 실시간 처리가 가능하고 깨끗한 음성의 선험적 정보를 모델링하기에 용이하다. 또, 인식을 위한 최종 특징 입력에 가까운 단계에서 데이터를 처리하므로 인식에 밀접한 영향을 준다는 장점이 있다. 그러나 대략적인 왜곡 요인 관련 파라미터 추정 때문에 음성인식 성능이 하락되는 단점이 있다. 최근에 기존 모델 기반 특징 향상의 단점을 개선하여 가산 잡음이나 반향 환경에 적합한 방법이 제안되었다. 이글에서는 특징 향상 방법을 소개하고 개선된 방법의 음성인식 강인성을 알아보고자 한다.
PDF KSCI

장르 분류 성능 향상을 위한 거리함수 학습의 활용 (Applying distance metric learning for improvement of genre classification)

장달원;신사임;이종설;장세진;임태범
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2013년도 추계학술대회
- /
- pp.36-37
- /
- 2013
음악 장르 분류 분야에서는 다양한 특징을 모아서 사용하는 방법과 support vector machine (SVM) 분류기가 주로 사용되고 있다. 이 논문에서는 거리 함수 학습를 음악 장르 분류에 적용하여 성능 향상을 꾀한다. 여러 거리 함수 학습 방법 중 하나의 방법을 선택하고, 일반적으로 많이 사용되는 특징 셋을 활용하여 다양한 특징 셋에 대해서 적용하였을 때, 실제 성능 향상이 있는지를 알아본다. 세 종류의 특징 셋을 사용하여 실험한 결과 두 가지 특징이 같이 있는 특징 셋에 대해서만 성능 향상이 있었으며, SVM보다 높은 성능을 보이지 못 했다.
PDF

특징 강도 정보를 이용한 영상 정합 속도 향상 (Speed-up of Image Matching Using Feature Strength Information)

김태우
- 한국인터넷방송통신학회논문지
- /
- 제13권6호
- /
- pp.63-69
- /
- 2013
특징 기반 영상 인식 방법은 객체의 특징을 이용하므로 템플릿 정합에 비해 고속으로 수행될 수 있다. 불변 특징 기반의 파노라마 생성은 영상 인식의 한 응용으로서, 두 영상 간의 특징점 정합에 많은 처리 시간이 필요하다. 본 논문에서는 특징 강도 정보를 이용하여 특징점 정합 속도를 향상시키는 방법을 제안한다. SURF 알고리즘으로 특징점들을 추출한 후, 특징 강도 정보를 계산하여 강한 특징점들을 선택하여 특징 정합에 사용한다. 특징 강도가 강한 특징점들은 그렇지 않은 특징점들 보다 더 의미 있다고 볼 수 있다. 실험에서 $320{\times}240$ 크기의 칼라 영상에 대해 제안한 방법은 특징 강도 정보를 사용하지 않았을 때보다 40% 이상 처리 속도의 향상을 보였다.
https://doi.org/10.7236/JIIBC.2013.13.6.63 인용 PDF KSCI

음성인식에 있어서 특징 파라미터의 기여도에 기반한 상태별 특징 파라미터 가중 (State-Dependent Feature-Parameter Weighting By the Contribition of the feature parameter to the performance of the Speech Recongition)

최환진
- 한국음향학회지
- /
- 제17권1호
- /
- pp.39-48
- /
- 1998
본 논문에서는 은닉 마르코프 모델에 기반한 음성인식에 있어서 특징 파라미터의 인식 성능에 미치는 영향의 차이를 인식 시스템에 반영하여 인식성능을 향상시키기 위한 방 법을 제안하였다. 특징 파라미터별 가중치를 유도하기 위해서 우선 상태별 특징 파라미터의 인식율에 대한 기여도를 가중치로 변환하고, 이를 특징 파라미터 각각의 상태에서의 출력확 률에 곱하여 상태별 출력확률을 재 추정하게 된다. 실험결과, "가변가중"방법이 "고정가중" 방법에 비해서 단어 인식의 경우 3.3%, 그리고 문장 인식율의 경우 5.3%의 성능향상을 보 임으로써 상태별 특징 파라미터의 가중이 인식 성능 향상에 유효함을 알 수 있었다.
PDF

특징 검출 영역 제한을 통한 파노라마 이미지 생성 속도 향상 방법 (Speed Improvement Method by Limiting Area of Feature Extraction for Creating Panorama Image)

아나르;정성기;김효연;정도욱;김기상;최형일
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2016년도 춘계학술발표대회
- /
- pp.737-739
- /
- 2016
파노라마 이미지 생성 기법의 중요한 부분은 입력 영상들로부터 특징을 추출하고, 영상간의 대응점을 찾는 작업이다. 특징 추출할 때 영상의 회전, 스케일, 밝기 변화에 강건하고 수행속도가 비교적 빠른 검출 알고리즘을 사용한다. 파노라마 이미지 생성 과정에 있어서 실제 대응하는 점들을 크게 다루기 때문에 불필요한 영역의 특징들은 오히려 연산속도의 방해 요소가 된다. 본 논문에서는 특징 추출 영역을 제한함으로써 특징 매칭 횟수 감소 및 속도 향상 방법을 제안한다. 특징의 개수가 감소되면 매칭 횟수 감소되고, 이후 이루어질 여러 계산량도 줄어 속도가 향상된다. 본 연구에 SURF(Speeded-Up Robust Feature) 알고리즘을 사용하였다.
https://doi.org/10.3745/PKIPS.y2016m04a.737 인용 PDF

영상 개선을 통한 지문인식 특징점 추출

안효창;심명환;한태규;이상범;김영섭
- 한국반도체및디스플레이장비학회:학술대회논문집
- /
- 한국반도체및디스플레이장비학회 2005년도 추계 학술대회
- /
- pp.165-169
- /
- 2005
지문인식에 있어서 지문의 원 영상이 여러 가지 이유로 손상되어 발생 될 수 있는 특징 및 정보들이 지문인식 시스템에 많은 영향을 주어 인식률이 낮아지게 된다. 본 논문에서는 개선된 영상처리를 통하여 이러한 의사 특징점의 수를 줄여 보다 정확한 특징점을 추출하여 지문인식 시스템의 성능을 향상시키는 알고리즘을 제안하고자 한다. 지문의 손상으로 생기는 의사 특징점을 줄임으로써 전체 시스템의 계산량을 줄여 지문인식 속도를 향상시키고자 한다.
PDF

비지역적 특징 융합을 이용한 물체 검출 기법 (Object Detection Method with Non-local Feature Fusion)

최준호;이민규;송병철
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 하계학술대회
- /
- pp.32-34
- /
- 2019
최근 딥러닝 기반의 다양한 물체 검출 알고리즘이 제안되어 높은 성능을 보이고 있다. 본 논문은 이러한 딥러닝 기반 물체 검출의 성능을 향상시키기 위해 입력영상에서 추출된 특징 지도를 강화하는 비지역적 특징 융합과, 이를 이용한 물체 검출 기법을 제안한다. 제안 기법은 입력영상에서 CNN 을 통해 추출한 특징 지도를 비지역적 특징 강화 블록을 통해 강화한다. 해당 블록 내에서 입력된 특징 지도는 먼저 여러 리셉티브 필드를 갖는 특징 지도로 분기된다. 그리고 분기된 특징 지도들은 비지역적 특징 융합 모듈에 의해 융합되어 강화된다. 이러한 과정을 통해 강화된 특징 지도는 비지역적 문맥 정보가 강화된 특성을 가지며, 해당 특징 지도를 이용하여 최종적으로 물체 검출을 수행한다. Pascal VOC 공인 데이터세트를 통한 실험 결과, 제안 기법은 기존 비교 기법 대비 향상된 검출 성능을 보인다.
PDF

유전 알고리즘을 이용한 특징 결합과 선택 (Feature Combination and Selection Using Genetic Algorithm for Character Recognition)

이진선
- 한국콘텐츠학회논문지
- /
- 제5권5호
- /
- pp.152-158
- /
- 2005
문자 패턴에서 추출한 서로 다른 특징 집합을 결합함으로써 문자 인식 시스템의 성능을 향상시킬 수 있다. 이때 결합된 특징 벡터의 차원을 줄이기 위해 특징 선택을 수행해야 한다. 이 논문은 문자 인식 문제에서 특징 결합과 선택을 위한 일반적인 틀을 제시한다. 또한 필기 숫자 인식을 위한 설계와 구현을 제시한다. 이 설계에서는 필기 숫자 패턴에서 DDD 특징 집합과 AGD 특징 집합을 추출하며 특징 선택을 위해 유전 알고리즘을 사용한다. 실험 결과 CENPARMI 필기 숫자 데이터베이스에 대해 0.7%의 정확률 향상을 얻었다.
PDF

검색결과 3,452건 처리시간 0.037초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)