통합 검색 | Korea Science

특징점과 히스토그램을 이용한 360 VR 영상용 밝기 보상 기법 (Luminance Compensation using Feature Points and Histogram for VR Video Sequence)

이건원;한종기
- 방송공학회논문지
- /
- 제22권6호
- /
- pp.808-816
- /
- 2017
본 논문에서는 360 VR 멀티미디어 시스템에서 복수개의 카메라들이 촬영한 영상 신호들 간의 밝기 차이가 발생하여 360 VR 영상 품질을 저하시키는 것을 막기 위해, 360 VR 시스템에 적합한 밝기 보상 기법을 제안한다. 복수개의 카메라가 촬영한 영상들 간의 특징점들을 분석하고, 이 특징점들을 대상으로 누적 히스토그램을 계산한다. 그리고 이 누적 히스토그램을 기반으로 우선적으로 밝기 보상이 필요한 영상들을 선별한다. 선별된 영상들에 대해서 내부 특징점들의 누적 히스토그램과 외부 특징점들의 히스토그램들을 일치시키기 위한 룩업테이블을 제작하여, 선별된 영상 내부의 모든 화소들의 밝기값을 보상한다. 본 논문의 실험결과에서는 제안하는 알고리즘의 우수성을 히스토그램 보상 측면, 밝기보상 영상의 시각적인 평가, ERP 영상의 화질 평가, Viewport 영상의 화질 평가 등의 측면에서 보였으며, 다양한 기준들에서 제안한 방법이 기존 기술들보다 우수함을 보였다.
https://doi.org/10.5909/JBE.2017.22.6.808 인용 PDF KSCI KPUBS

잡음 환경에 효과적인 음성인식을 위한 특징 보상 이득 기반의 음성 향상 기법 (Speech enhancement method based on feature compensation gain for effective speech recognition in noisy environments)

배아라;김우일
- 한국음향학회지
- /
- 제38권1호
- /
- pp.51-55
- /
- 2019
본 논문에서는 잡음 환경에 강인한 음성 인식 성능을 위해 특징 보상 이득을 이용한 음성 향상 기법을 제안한다. 본 논문에서는 변분모델 생성 기법을 채용한 병렬 결합된 가우스 혼합 모델(Parallel Combined Gaussian Mixture Model, PCGMM) 기반의 특징 보상 기법으로부터 계산할 수 있는 특징 보상 이득을 이용하는 음성 향상 기술을 제안한다. 불일치 환경 음성 인식 시스템 적용 환경에서 본 논문에서 제안하는 기법이 실험 결과에서 기존의 전처리 기법 및 이전 연구에서 제안된 특징 보상 기반의 음성 향상 기법에 비해 다양한 잡음 및 SNR(Signal to Noise Ratio) 조건에서 월등한 인식 성능을 나타내는 것을 확인한다. 또한 잡음 모델 선택 기법을 적용함으로써 음성 인식 성능을 유사한 수준으로 유지하면서 계산량을 대폭적으로 감축할 수 있다.
https://doi.org/10.7776/ASK.2019.38.1.051 인용 PDF KSCI HTML

IMM 기반 특징 보상 기법과 불확실성 디코딩의 결합 (Incorporation of IMM-based Feature Compensation and Uncertainty Decoding)

강신재;한창우;권기수;김남수
- 한국통신학회논문지
- /
- 제37권6C호
- /
- pp.492-496
- /
- 2012
본 논문은 잡음이 많이 존재할 경우 특징 보상 기법들의 불완전한 추정 방법으로 인하여 발생할 수 있는 불확실성 정보를 음성 인식의 디코딩에 반영해 줌으로써 좀 더 인식 성능을 향상시킬 수 있는 방법에 대한 연구이다. 기존의 특징 보상 기법들은 현재 시간에서의 깨끗한 특징 파라미터를 추정하는 단일점 추정 기법들이 대부분이다. 하지만 낮은 SNR 환경에서의 잘못된 추정 파라미터들이 음성 인식 엔진의 입력으로 사용될 경우 성능이 저하되기 때문에 추정된 파라미터의 불확실성 정보를 이용하여 디코딩을 해주면 추정 오류를 보완해줄 수 있다. 본 논문에서는 대표적인 Aurora-2 DB를 활용하여 적용된 기법의 성능 향상을 확인한다.
https://doi.org/10.7840/KICS.2012.37.6C.492 인용 PDF KSCI

이기종 음성 인식 시스템에 독립적으로 적용 가능한 특징 보상 기반의 음성 향상 기법 (Speech Enhancement Based on Feature Compensation for Independently Applying to Different Types of Speech Recognition Systems)

김우일
- 한국정보통신학회논문지
- /
- 제18권10호
- /
- pp.2367-2374
- /
- 2014
본 논문에서는 이기종 음성 인식 시스템에 독립적으로 적용할 수 있는 음성 향상 기법을 제안한다. 잡음 환경 음성 인식에 효과적인 것으로 알려져 있는 특징 보상 기법이 효과적으로 적용되기 위해서는 특징 추출 기법와 음향 모델이 음성 인식 시스템과 일치해야 한다. 상용화된 음성 인식 시스템에 부가적으로 전처리 기법을 적용하는 상황과 같이, 음성 인식 시스템에 대한 정보가 알려져 있지 않은 상황에서는 기존의 특징 보상 기법을 적용하기가 어렵다. 본 논문에서는 기존의 PCGMM 기반의 특징 보상 기법에서 얻어지는 이득을 이용하는 음성 향상 기술을 제안한다. 실험 결과에서는 본 논문에서 제안하는 기법이 미지의 (Unknown) 음성 인식 시스템 적용 환경에서 기존의 전처리 기법에 비해 다양한 잡음 및 SNR 조건에서 월등한 인식 성능을 나타내는 것을 확인한다.
https://doi.org/10.6109/jkiice.2014.18.10.2367 인용 PDF KSCI

병렬 결합된 혼합 모델 기반의 특징 보상 기술 (Feature Compensation Method Based on Parallel Combined Mixture Model)

김우일;이흥규;권오일;고한석
- 한국음향학회지
- /
- 제22권7호
- /
- pp.603-611
- /
- 2003
본 논문에서는 잡음 환경에서 보다 강인한 성능을 얻기 위하여 음성 모델 기반의 효과적인 특징 보상 기법을 제안한다. 일반적인 모델 기반의 특징 보상 기법은 오열 음성 데이터베이스를 이용한 훈련 과정을 필요로 하므로 온라인 상에서의 적응 과정에 적합하지 않다. 제안한 방법에서는 보정 인자 추정 과정에서 병렬 모델 결합 기법을 도입함으로써 훈련 과정을 필요하지 않게 하였다. 모델의 결합 과정이 HMM 전체가 아닌 가우시안 혼합 (Mixture) 모델에만 적용이 되므로, 계산이 비교적 간단하게 되어 온라인 상에서의 모델 결합을 가능하게 하였다. 병렬적 모델 결합의 도입은 잡음 모델의 독립적인 이용을 가능하게 하였고, 본 논문에서는 MAP (Maximum A Posteriori) 적응을 통해 잡음 모델 갱신을 실시하였다 또한 잡음 오열 과정에 대한 근사화를 통해 연속적 형태의 채널 정규화 기법을 유도하여 적용하였다. 보다 효율적인 구현을 위하여 선택적인 모델 결합 방식을 도입함으로써 연산량을 줄일 수 있는 방법을 제시하였다. 제안한 특징 보상 기법이 부가적인 배경 잡음과 채널 왜곡이 존재하는 잡음 환경에서 음성 인식 시스템의 성능을 향상시키는데 효과적임을 실험을 통해 확인할 수 있었다.
PDF KSCI

PCMM 기반 특징 보상 기법에서 변별력 향상을 위한 Minimum Classification Error 훈련의 적용 (Minimum Classification Error Training to Improve Discriminability of PCMM-Based Feature Compensation)

김우일;고한석
- 한국음향학회지
- /
- 제24권1호
- /
- pp.58-68
- /
- 2005
본 논문에서는 잡음 환경에서 강인한 음성 인식을 위하여 특징 보상 기법의 성능을 향상시킬 수 있는 방법을 제안한다. 기존의 음성 모델 기반의 특징 보상 기법에서 이용되는 오염 음성 모델 추정 방식은 입력 음성에 대한 변별력 있는 사후 확률 예측을 보장하지 못하며, 부정확하게 계산된 사후 확률은 복구된 음성에서 명료도 하락의 문제를 일으킨다. 제안하는 기법에서는 오염 음성 모델 추정 과정에 분별적 훈련 방식의 하나인 최소 분류 오류 (MCE) 훈련 기법을 도입한다. MCE 훈련 기법을 적용하기 위해 변별력 하락의 가능성을 가지는 '경쟁 요소' 를 결정하는 기법을 제안한다. 병렬결합된 혼합 모델 (PCMM) 기반의 특징 보상에 MCE 훈련 기법을 적용하는 과정을 제안하고 변별력 향상의 영향을 관찰한다. Aurora 2.0 데이터베이스와 실제 자동차 주행 환경에서 수집된 음성 데이터베이스에 대한 성능 평가를 실시한다. 실험 결과는 제안한 기법이 음성 인식 성능 향상에 도움이 되는 것을 입증한다.
PDF KSCI

다중 에이전트 강화학습 기반 특징 선택에 대한 연구 (Study for Feature Selection Based on Multi-Agent Reinforcement Learning)

김민우;배진희;왕보현;임준식
- 디지털융복합연구
- /
- 제19권12호
- /
- pp.347-352
- /
- 2021
본 논문은 다중 에이전트 강화학습 방식을 사용하여 입력 데이터로부터 분류에 효과적인 특징 집합을 찾아내는 방식을 제안한다. 기계 학습 분야에 있어서 분류에 적합한 특징들을 찾아내는 것은 매우 중요하다. 데이터에는 수많은 특징들이 존재할 수 있으며, 여러 특징들 중 일부는 분류나 예측에 효과적일 수 있지만 다른 특징들은 잡음 역할을 함으로써 올바른 결과를 생성하는 데에 오히려 악영향을 줄 수 있다. 기계 학습 문제에서 분류나 예측 정확도를 높이기 위한 특징 선택은 매우 중요한 문제 중 하나이다. 이러한 문제를 해결하기 위해 강화학습을 통한 특징 선택 방법을 제시한다. 각각의 특징들은 하나의 에이전트를 가지게 되며, 이 에이전트들은 특징을 선택할 것인지 말 것인지에 대한 여부를 결정한다. 에이전트들에 의해 선택된 특징들과 선택되지 않은 특징들에 대해서 각각 보상을 구한 뒤, 보상에 대한 비교를 통해 에이전트의 Q-value 값을 업데이트 한다. 두 하위 집합에 대한 보상 비교는 에이전트로 하여금 자신의 행동이 옳은지에 대한 판단을 내릴 수 있도록 도와준다. 이러한 과정들을 에피소드 수만큼 반복한 뒤, 최종적으로 특징들을 선별한다. 이 방법을 통해 Wisconsin Breast Cancer, Spambase, Musk, Colon Cancer 데이터 세트에 적용한 결과, 각각 0.0385, 0.0904, 0.1252, 0.2055의 정확도 향상을 보여주었으며, 최종적으로 0.9789, 0.9311, 0.9691, 0.9474의 분류 정확도를 보여주었다. 이는 우리가 제안한 방법이 분류에 효과적인 특징들을 잘 선별하고 분류에 대한 정확도를 높일 수 있음을 보여준다.
https://doi.org/10.14400/JDC.2021.19.12.347 인용 PDF KSCI

화자인식 성능 향상을 위한 채널 보상 알고리즘에 관한 연구 (A Study on Channel Compensation Algorithm for Robust Speaker Recognition)

김정호;정희석;강철호
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
- /
- pp.131-134
- /
- 2002
화자 확인시스템에서 화자 변이, 잡음환경, 그리고 학습환경과 인식환경의 불일치등이 화자확인에 어려움을 가져다 준다. 본 논문에서는 유무선 전화망에서 화자 확인의 성능을 개선하기 위한 채널 보상 알고리즘을 제안한다. 화자 확인시스템에서 유무선 전화망의 채널 왜곡을 보상하기 위한 방법으로 RBF(Radial Basis Function) 신경망을 이용하여 특징 벡터를 사상하는 알고리즘을 이용하며 유선과 무선의 채널 왜곡을 감소시킨다. 동일한 화자의 유무선의 벡터 영역이 서로 다르므로 등록단계에서 RBF 신경망을 사용하여 화자의 특징 벡터를 유선과 무선의 비슷한 벡터 영역으로 사상하고, 인식단계에서는 유무선의 우도비를 비교하여 결정규칙에 의해 판별한다. 켑스트럼 평균 차감법(CMS) 보다 제안한 채널 보상 알고리즘이 인식율이 향상을 실험에 의해 확인하였다.
PDF

조명 변화에 강인한 얼굴 인식 (Face Recognition Robust to Illumination Change)

류은진;박철현;구탁모;박길흠
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
- /
- pp.465-468
- /
- 2000
얼굴 영상은 똑같은 표정의 같은 사람이라도 조명에 따라 매우 다른 얼굴 영상으로 나타난다. 따라서 본 논문에서는 조명 변화에 강인한 얼굴 인식 방법을 제안한다. 제안된 방법은 오프라인 훈련(off-line training)과 온라인 인식(on-line recognition)의 두 부분으로 이루어져 있다. 오프라인 훈련은 PCA(principal component analysis)를 기반으로 한다. 온라인 인식에서는 조명 변화에 대한 보상, 얼굴 특징의 추출, 그리고 인식을 위한 분류 과정의 3 단계로 구성되어 있다. 오프라인 훈련에서는 전체 훈련 얼굴 영상 데이터에 PCA를 적용하여 조명 변화가 최대한 제외된 특징 벡터 공간을 생성한다. 실제 인식 단계에서는 첫 번째로 입력 영상으로 들어온 얼굴 영상에서 조명의 영향을 보상하기 위해 준동형 필터링(homomorphic filtering) 후 밝기 정규화(normalization)를 취한다. 두 번째 단계에서는 입력 데이터의 차원을 줄이고 얼굴 특징 벡터를 구하기 위해 PCA를 수행한다. 마지막 과정으로서 입력 영상의 특징 벡터들과 오프라인에서 미리 구하여진 특징 벡터들의 유사도를 측정하여 얼굴을 인식하게 된다. 실험 결과 제안된 방법은 기존의 Eigenface 방법에 비해 우수한 성능을 나타내었다.
PDF

스테레오 데이터에 기반한 차원별 가중 보상에 의한 음성 인식 성능 향상 (Performance Improvement of Speech Recognition based on Stereo Data with Dimensionally Weighted Bias Compensation)

김종현;송화전;김형순
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
- /
- pp.139-142
- /
- 2004
훈련 과정과 인식 과정사이의 주변 잡음과 채널 특성으로 인한 환경의 불일치는 음성 인식 성능을 급격히 저하시킨다. 이러한 차이를 극복하기 위해 다양한 전처리 방법이 제안되어 왔으며, 최근에는 스테레오 데이터와 잡음 음성의 Gaussian Mixture Model(GMM)을 이용하여 보상벡터를 구하는 SPLICE 방법이 좋은 성능을 보여주고 있다. 하지만 차원별로 특징벡터를 보상해주는 추정된 보상벡터는 underestimation되는 경향이 있으며, 그 정도가 각각의 차원마다 달라짐이 관찰되었다. 본 논문에서는 SPLICE 방법에 기반하여 추정된 보상벡터와 실제 보상벡터 사이의 관계를 관찰하여 차원별로 다른 가중치를 적용하는 차원별 가중 보상 방법을 제안하였다. 제안한 방법은 Aurora2 Clean-condition인 경우 baseline 실험 결과에 비해 $68\%$의 높은 상대적인 인식 향상율을 얻었다.
PDF

검색결과 264건 처리시간 0.023초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)