• 제목/요약/키워드: 정규화 추정기

검색결과 34건 처리시간 0.031초

3차원 합성 입체음향 환경에서의 음향반향제거기 (An Acoustic Echo Canceler under 3-Dimensional Synthetic Stereo Environments)

  • 김현태;박장식
    • 한국통신학회논문지
    • /
    • 제28권7A호
    • /
    • pp.520-528
    • /
    • 2003
  • 본 논문에서는 다자간 화상회의 시스템에서 합성 입체 음향을 재현하는 방법과 음향반향제거 방법을 제안한다. 합성 입체 음향은 HRTF(head related transfer function)을 이용하여 구현하고 반향제거를 위하여 주변잡음에 대하여 강건한 적응 알고리즘을 제안한다. 제안하는 알고리즘은 SMAP(set-membership affine projection)을 변형한 것으로 적응필터의 계수를 갱신할 때 입력신호와 추정오차신호의 상호상관을 입력신호의 자기상관 행렬과 투영 차수를 곱한 추정오차신호 전력의 합으로 정규화한다. 제안하는 적응알고리즘은 SMAP 알고리즘과 비교하여 투영차수와 주변잡음에 대하여 강건한 특성을 갖는다. 컴퓨터 시뮬레이션을 통해 제안하는 합성 입체음향 반향제거기의 성능이 효과적으로 반향을 제거할 수 있음을 보인다.

Peak 파라미터와 피치 검색테이블을 이용한 억양 생성방식 연구 (A Study on Generation Method of Intonation using Peak Parameter and Pitch Lookup-Table)

  • 장석복;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-190
    • /
    • 1999
  • 본 논문에서는 Text-to-Speech 시스템에서 사용할 억양 모델을 위해 음성 DB에서 모델 파라미터와 피치 검색테이블(lookup-table)을 추출하여 미리 구성하고, 합성시에는 이를 추정하여 최종 F0 값을 생성하는 자료기반 접근방식(data-driven approach)을 사용한다. 어절 경계강도(break-index)는 경계강도의 특성에 따라 고정적 경계강도와 가변적 경계강도로 세분화하여 사용하였고, 예측된 경계강도를 기준으로 억양구(Intonation Phrase)와 액센트구(Accentual Phrase)를 설정하였다. 특히, 액센트구 모델은 인지적, 음향적으로 중요한 정점(peak)을 정확하게 모델링하는 것에 주안점을 두어 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞뒤 기울기를 추정하여 4개의 파라미터로 설정하였고, 이 파라미터들은 CART(Classification and Regression Tree)를 이용하여 예측규칙을 만들었다. 경계음조가 나타나는 조사, 어미는 정규화된(normalized) 피치값과 key-index로 구성되는 검색테이블을 만들어 보다 정교하게 피치값을 예측하였다. 본 논문에서 제안한 억양 모델을 본 연구실에서 제작한 음성합성기를 통해 합성하여 청취실험을 거친 결과, 기존의 상용 Text-to-Speech 시스템에 비해 자연스러운 합성음을 얻을 수 있었다.

  • PDF

동시통화 및 주변 잡음을 고려한 핸즈프리 환경의 반향제거기 (An Acoustic Echo Canceler for Hands-Free Telephony, Considering Double Talk and Environment Noise)

  • 김현태;이찬희;박장식
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.471-473
    • /
    • 2009
  • 본 논문에서는 핸즈프리 전화통신을 위한 동시통화(double-talk) 및 잡음에 강건한 반향제거 시스템을 제안한다. 제안하는 반향제거 시스템은 동시통화 상황을 판별하기 위해 마이크 입력신호와 추정한 마이크 입력신호의 분산을 기반으로한 동시통화 검출 알고리즘을 사용하고 반향 경로 추정을 위한 적응 필터는 잔여반향 오차 전력과 AP 알고리즘의 투영차수를 곱하여 입력 신호의 자기공분산 행렬에 더해 정규화시킨 알고리즘을 적용한다. 컴퓨터 시뮬레이션을 통한 동시통화 및 주변 잡음이 큰 핸즈프리 환경에서 제안하는 방법이 AIC(acoustic interference cancellation) 측면에서 우수함을 보인다.

  • PDF

새로운 동시통화 검출 알고리즘 (A New Double-Talk Detection Algorithm)

  • 정홍희;김현태;박장식;손경식
    • 한국멀티미디어학회논문지
    • /
    • 제11권3호
    • /
    • pp.281-291
    • /
    • 2008
  • 본 논문에서 반향 제거기의 반향 경로 변화를 추적하면서 근단 신호를 검출할 수 있는 새로운 동시통화 알고리즘을 제안한다. 이 방법은 채널 입력 신호와 추정 오차 신호 간의 교차상관도와 마이크 입력 신호와 추정 오차 신호간의 정규화된 교차상관도를 이용한다. 이 두 교차상관도의 문턱치를 적절히 조합하여 이 알고리듬은 동시통화의 발생과 반향 경로의 변화를 구별한다. 이 방법은 반향경로의 변화를 추적하면서 동시통화를 검출할 수 있다. 동시통화기간동안 근단 신호에 의해 반향제거기의 적응필터계수가 오조정되는 것을 막는다. 이 동안 반향제거기는 반향경로의 변화를 계속 추적할 수 있다. 컴퓨터 시뮬레이션을 통하여 제안된 알고리즘이, 반향 경로 변화 추적과 동시통화를 검출하면서, ERLE 관점에서 Ye등의 알고리즘이나 NLMS 알고리즘보다 우수함이 입증되었다.

  • PDF

다항시행접근 단순 베이지안 문서분류기의 개선 (Improving Multinomial Naive Bayes Text Classifier)

  • 김상범;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.259-267
    • /
    • 2003
  • 단순 베이지언 분류모형은 구현이 간단하고 효율적이기 때문에 실용적으로 사용하기에 적합하다. 그러나 이 분류모형은 많은 기계학습 도메인에서 우수한 성능을 보임에도 불구하고 문서분류에 적용되었을 경우에는 그 성능이 매우 낮은 것으로 알려져왔다. 본 논문에서는 단순 베이지언 분류모형중 가장 성능이 우수한 것으로 알려진 다항 시행접근 단순 베이지언 분류모형을 개선하는 세가지 방법을 제안한다. 첫 번째는 범주에 대한 단어의 확률추정방법을 문서모델에 기반하여 개선하는 것이고, 두 번째는 문서의 길이에 따라 범주와의 관련성이 선형적으로 증가하는 것을 억제하기 위해 길이에 대한 정규화를 수행하는 것이며, 마지막으로 범주판정에 중요한 역할을 하는 단어들의 영향력을 높여주기 위하여 상호정보가중 단순 베이지언 분류방법을 사용하는 것이다. 제안하는 방법들은 문서분류기의 성능 평가를 위한 벤치마크 문서집합인 Reuters21578과 20Newsgroup에서 기존의 방범에 비해 상당한 성능향상을 가져옴을 알 수 있었다.

하이브리드 신뢰도를 이용한 제한 영역 핵심어 검출 성능향상 (Improvement of Domain-specific Keyword Spotting Performance Using Hybrid Confidence Measure)

  • 이경록;서현철;최승호;최승호;김진영
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.632-640
    • /
    • 2002
  • 본 논문에서는 기존의 RLJ-신뢰도 (RLJ-confidence measure)와 정규화 신뢰도 (normalized CM)의 단점을 보완하기 위해 ACM (Anti-filler CM)을 제안하였고, HCM (hybrid CM)을 이용하여 기존의 NCM과 제안한 ACM을 통합하였다. 제안된 ACM은 기존 신뢰도의 단점 중 하나인 오인증 (FA: false acceptance)의 원인이 반음소 모델의 구성방법에 있다고 보고 음소 인식기를 이용하여 실제 음소 수열을 추정한 다음, 이를 반음소 모델로 정의하고 신뢰도를 계산하였다. 두 가지 신뢰도의 특성을 살펴보면, 기존 NCM(FR: false rejection)에 좋은 성능을 보이고, 제안한 ACM은 FA에서 좋은 성능을 보여 두 신뢰도가 상보적인 특성을 가진다 이를 이용하여 두 가지 신뢰도를 가중치 벡터 α를 이용하여 통합하고 이를 합성 신뢰도 (HCM: Hybrid CM)라고 정의하였다. 실험결과 미검출율 (MDR: missed detection rate) 10%부근에서, HCM 적용시에 0.219 FA/KW/HR (false alarm/keyword/how)로서 NCM 단독사용에 비해 성능이 22% 향상되었다.

3차원 얼굴 인식을 위한 오류 보상 특이치 분해 기반 얼굴 포즈 추정 (Head Pose Estimation Using Error Compensated Singular Value Decomposition for 3D Face Recognition)

  • 송환종;양욱일;손광훈
    • 대한전자공학회논문지SP
    • /
    • 제40권6호
    • /
    • pp.31-40
    • /
    • 2003
  • 대부분의 얼굴인식 시스템은 현재 2차원 영상을 기반으로 많은 분야에 응용되고 있다. 그러나 2차원 얼굴인식 시스템은 심하게 변화된 얼굴 포즈에 강인한 얼굴인식이 매우 어렵다. 이에 얼굴 포즈 추정은 정면 영상이 아닐 경우 인식률 향상을 위한 필수적인 과정이라 할 수 있다. 그러므로, 본 논문은 3차원 얼굴인식을 위한 새로운 얼굴 포즈 추정 방식을 제안한다 먼저 3차원 거리(range) 영상이 입력될 때 얼굴 곡선에 기반한 자동 얼굴 특징점 추출 기법을 적용한다. 추출된 특징점을 바탕으로 오류 보상 특이치 분해를 적용 한 새로운 3차원 얼굴 포즈 추정 방식을 제안한다. 특이치 분해를 이용하여 초기 회전각을 획득한 후 존재하는 오류를 보다 세밀하게 보상한다. 제안 알고리즘은 정규화된 3차원 얼굴 공간에서 추출된 특징점의 기하학적 위치를 이용하여 수행된다. 또한 3차원 얼굴인식을 위하여 3차원 최근접 이웃 분류기를 이용한 데이터베이스내에서 후보 얼굴을 선택하는 방식을 제안한다. 실험 결과를 통해 다양한 얼굴 포즈에 대하여 제안 알고리즘의 효율성과 타당성을 검증하였다.

컬러 영상 부호화를 위한 영역 기반 스펙트럴 상관 추정기 (Region-based Spectral Correlation Estimator for Color Image Coding)

  • 곽노윤
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권6호
    • /
    • pp.593-601
    • /
    • 2016
  • 본 논문은 휘도 성분 영상으로부터 컬러 성분 영상들을 추정 부호화함으로써 높은 압축률을 달성할 수 있는 영역 기반 스펙트럴 상관 추정 부호화 방법에 관한 것이다. 제안된 방법은 3단계로 구성되어 있다. 우선, 정규 색차합 영상과 휘도 영상을 이용해 산출한 Y/C 비트 평면합 영상을 대상으로 영상 분할을 수행하여 영역들의 형상 정보를 추출한다. 이후, 각 영역 단위로 휘도 영상과 R, B 영상 간의 근사화 자승 오차가 최소가 되도록 하는 비례 인자와 가감 인자를 산출한다. 최종적으로, 각 영역의 비례 인자와 가감 인자를 비트스트림으로 부호화한다. 컴퓨터 시뮬레이션 결과에 따르면, 제안된 방법은 동일한 PSNR에서 두 칼라 성분 영상을 부호화하기 위해 소요되는 bpp를 비교할 때, JPEG/베이스라인 혹은 JEPG2000/EBCOT 알고리즘에 비해 2배 혹은 3배 이상의 압축률을 제공한다.

회전익 무인기에 탑재된 다중분광 센서를 이용한 콩의 생체중, 건물중, 엽면적 지수 추정 (Estimation of Fresh Weight, Dry Weight, and Leaf Area Index of Soybean Plant using Multispectral Camera Mounted on Rotor-wing UAV)

  • 장시형;유찬석;강예성;전새롬;박준우;송혜영;강경석;강동우;쩌우쿤옌;전태환
    • 한국농림기상학회지
    • /
    • 제21권4호
    • /
    • pp.327-336
    • /
    • 2019
  • 콩은 식량작물 중 단백질 함량이 매우 높고 식생활에서 여러가지 형태로 소비되기 때문에 매우 중요한 식량자원 중 하나이다. 콩은 일반적으로 노지에서 재배되기 때문에 콩의 생산량 및 품질은 갑작스런 기후 변화에 큰 영향을 받는다. 최근 폭염 및 폭우 등과 같은 이상기후로 인해 콩의 생산량이 불안정해짐에 따라 콩의 생육을 실시간으로 추정하여 품질저하를 예방할 수 있는 기술 개발이 필요하다. 본 연구에서는 회전익무인기에 장착된 다중분광 센서를 이용하여 콩 생육을 추정하기 위해 수행되었다. 반사값을 이용하여 산출된 정규화 식생지수(NDVI, GNDVI)와 단순비 식생지수(RRVI, GRVI)와 콩 생육 데이터(생체중, 건물중, 엽면적지수)로 선형회귀분석을 실시하여 생육 추정 모델을 개발하였다. 그 결과, 정규화 식생지수인 NDVI를 이용한 엽면적 지수 추정 모델(R2=0.587, RMSE=1.01 ㎡/㎡, RE=48.98%)보다 GNDVI를 이용한 엽면적 지수 추정 모델(R2=0.789, RMSE=0.73 ㎡/㎡, RE=34.91%)이 높은 정밀도가 나타났으며, 단순비 식생지수를 이용한 엽면적 지수 추정 모델 RRVI (R2=0.760, RMSE=0.78 ㎡/㎡, RE=37.26%) GRVI (R2=0.828, RMSE=0.66 ㎡/㎡, RE=31.59%)과 비교 했을 때, 단순비 식생지수에서 높은 정밀도가 나타났다. 기후변화에 대체하기 위해 재식밀도 및 변량 시비와 같은 재배관리법이 적용된다면, 고품질의 콩을 생산하는데 도움이 될 것으로 판단된다.

서베일런스에서 회선 신경망 기술을 이용한 사람 추적 기법 (Human Tracking Technology using Convolutional Neural Network in Visual Surveillance)

  • 강성관;천상훈
    • 디지털융복합연구
    • /
    • 제15권2호
    • /
    • pp.173-181
    • /
    • 2017
  • 본 논문에서는 현재와 이전의 영상 프레임 뿐 만 아니라 영상의 축척과 이전 위치에 주어진 객체의 비율과 위치 추정에 대한 학습 문제로서 사람 추적 문제를 다룬다. 본 논문에서는 회선 신경망 분류기를 이용한 사람 검출방법을 제안한다. 제안하는 방법은 신경망을 정규화하고 검출 작업을 위한 특징 표현을 자동으로 최적화함으로써 사람 검출의 정확성을 향상시킨다. 제안하는 방법에서는 감시 영상 시스템에서 실시간 영상이 들어오면 제일 먼저 위치를 추정하는 작업을 수행하기 위하여 회선신경망을 학습시킨다. 기존의 다른 학습 방법과 달리 회선신경망은 두쌍의 연속된 영상 프레임으로부터 공간적이고 시간적인 특징을 모두 공동으로 학습시킨다. 회선 신경망에 의해 학습된 특징을 이용하는 SVM 분류기의 정확성은 회선 신경망의 정확성과 일치한다. 이것은 자동적으로 최적화된 특징의 중요성을 확인시켜 준다. 그러나, 회선 신경망을 이용한 사람 객체의 분류에 대한 계산 시간은 사용된 특징의 타입과 관계없이 SVM의 것보다 약 40분의 1정도로 작다.