• 제목/요약/키워드: Speech Signal

검색결과 1,175건 처리시간 0.025초

HEEAS: 감정표현 애니메이션 알고리즘과 구현에 관한 연구 (HEEAS: On the Implementation and an Animation Algorithm of an Emotional Expression)

  • 김상길;민용식
    • 한국콘텐츠학회논문지
    • /
    • 제6권3호
    • /
    • pp.125-134
    • /
    • 2006
  • 본 논문은 음성이 인간에게 전달되어 나타나는 여러 가지 감정 표현 중에서 단지 4가지 감정 즉 두려움, 싫증, 놀람 그리고 중성에 대한 감정 표현이 얼굴과 몸동작에 동시에 나타내는 애니메이션 시스템인 HEEAS(Human Emotional Expression Animation System)를 구현하는데 그 주된 목적이 있다. 이를 위해서 본 논문에서는 감정 표현이 풍부한 한국인 20대 청년을 모델로 설정하였다. 또한 입력되어진 음성 신호를 통해서 추출된 감정표현에 대한 데이터를 얼굴코드와 몸동작코드를 부여하고 이를 데이터 베이스화 하여 실제 애니메이션 구현을 하기 위한 처리의 시간을 최소화하였다. 즉, 입력되어진 음성 신호를 이용해서 원하는 결과인 얼굴, 몸동작에 대한 자료를 이진 검색을 이용해서 데이터베이스에서 찾으므로 검색 시간을 최소화하였다. 실제 감정 표현에 대한문제들을 실험을 통해서 얻은 결과가 99.9%의 정확도임을 알 수가 있었다.

  • PDF

하이드로폰 송신 어레이를 이용한 수중 음향 통신 시스템의 성능 향상 (Performance Enhancement of Underwater Acoustic Communication System Using Hydrophone Transmit Array)

  • 이외형;손윤준;김기만
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.606-613
    • /
    • 2002
  • 본 논문에서는 수중에서 송신 빔 형성기를 이용한 고속 데이터 전송 기법을 연구하였다. 또한 범용 디지털 신호처리 프로세서와 다수의 디지탈-아날로그 변환기를 이용한 시험용 송신단을 설계 및 구현하였으며, 구현된 시스템을 이용하여 수조에서 실험을 수행하여 그 성능을 분석하였다. 이때 실험 과정을 단순화하기 위하여 채널 코딩 및 등화기 (equalizer) 등과 같은 과정은 생략하였고, 간장 간단한 디지털 통신 변조 기법인 OOK(On-Off keying) 기법을 사용하였다. 실험 결과 5개의 하이드로폰 송신 어레이를 사용한 경우에 1개만 사용했을 때보다 오차율 10/sup -2/을 기준으로 전송 속도가 약 3배 향상되었으며, 실험에 사용된 수조에서 음성 신호 전송을 위해 400 bps 정도까지 가능함을 확인하였다.

지연 추정 기능을 갖는 적응 마이크로폰 어레이 알고리즘 (Adaptive Microphone Array System with Self-Delay Estimator)

  • 정양원;강홍구;이충용;윤대희
    • 한국통신학회논문지
    • /
    • 제30권1C호
    • /
    • pp.54-60
    • /
    • 2005
  • 본 논문은 지연 추정 기능을 갖는 적응 마이크로폰 어레이 알고리즘을 제안한다. Generalized sidelobe canceller (GSC)의 적응 차단 행렬이 각 센서간의 상호 시간 지연을 추정할 수 있다는 것을 보임으로써, 제안한 시스템은 적응 차단 행렬을 목적 신호의 차단 뿐 아니라 각 센서의 시간 지연 추정을 위해 사용한다. 이로 인해, 제안한 시스템은 GSC 구조만을 사용하면서. 시간 지연 추정기를 외부의 전처리기로 사용하는 기존의 시스템과 같은 성능을 얻을 수 있다. 실제 환경에서의 실험 결과를 통해 제안한 시스템의 성능이 기존의 시스템과 유사함을 확인하였다.

統計的인 方法에 依한 連結音의 音素分割 알고리듬 (A Segmentation Algorithm of the Connected Word Speech by Statistical Method)

  • 조정호;홍재근;김수중
    • 대한전자공학회논문지
    • /
    • 제26권4호
    • /
    • pp.151-163
    • /
    • 1989
  • 本 論文에서는 音聲信號의 音素分割을 위한 統計的인 方法을 硏究하였다. 이 方法은 3個의 AR 모델을 使用하여, 이 中 2個의 모델은 音聲의 스펙트럼 變化前 및 變化後의 安定된 部分에서 求해지고 이들 間의 距離가 커지면 音素가 바뀐 것으로 간주된다. 다른 한 모델은 두 固定 모델 사이에 位置하며 音素間의 境界를 推定하는데 使用된다. 이 音素分割 알고리듬을 連結音에 對해 試驗해 본 結果, 從來의 方法에 비해 音素의 境界點을 좀더 正確히 찾을 수 있고, 또한 過度分割 誤謬도 줄일 수 있었다.

  • PDF

축소격자필터 구조를 사용한 음향반향제거기 (An Acoustic Echo Canceller By Using the Reduced Lattice Filter Structure)

  • 유재하;조성호;윤대희;차일환
    • 전자공학회논문지B
    • /
    • 제32B권11호
    • /
    • pp.1473-1480
    • /
    • 1995
  • When the LMS algorithm is employed in the transversal filter structure, the computational complexity can be kept reasonably low. However, if the impulse response to be estimated is very long or signals involved are highly correlated like a speech the convergence speed becomes slow. The lattice filter is an excellent alternative to improve convergence speed since the lattice structure inherently has the orthogonal property among the backward prediction errors, but at the expense of the excessive computational load. If the input signal to be used can be sufficiently well modeled as a .RHO.-th order autoregressive(AR) process, the reflection coefficients after the .RHO.- th stage will be close to zero. Then, instead of employing the full lattice structure, the joint lattice filter structure can be implemented in conjunction with the transversal filter structure after the .RHO.-th stage. We propose, in this paper, this new lattice/transversal joint structure, and we will call it the reduced lattice filter. Using the reduced lattice filter, we are now able to achieve the performance as good as that of the lattice filter, while maintaining the complexity as low as that of the transversal filter. The proposed filter is particularly useful for an acoustic echo canceller due to the highly correlatedness nature of speeches and the long and frequently changing echo paths.

  • PDF

확산필터뱅크를 전처리기로 사용한 한국어 단모음인식 (The Recognition of Korean Single vowels by Use of the Diffusion Filter Bank as a Pre-processor)

  • 허만탁;김재창
    • 한국음향학회지
    • /
    • 제16권1호
    • /
    • pp.81-87
    • /
    • 1997
  • 본 논문에서는 스펙트럼 포락선을 이용하여 음성을 인식하기 위한 새로운 전처리 방법을 제안한다. 이는 확산필터뱅크를 사용하여 스펙트럼 포락선을 추출하는 새로운 방법이다. 확산필터뱅크의 분석대역을 몇 개의 작은 대역으로 나눔으로써 확산회수를 줄였으며 차분회수를 늘임으로써 선택도를 높였다. 이 결과, 총처리시간을 대폭 줄였으며 스펙트럼의 변별력을 증가시켰다. 컴퓨터 시뮬레이션을 통하여 간단한 인식 알고리듬으로 실제 음성의 단모음 인식 실험을 해본 결과 3%의 인식율을 얻음으로써 확산필터뱅크가 많은 주파수 성분을 가진 음성의 주파수 분석을 이용하는 음성인식에 대단히 유효하다는 것을 확인하였다.

  • PDF

음성신호 분석 기반의 영화 장르별 감정변화 특성 연구 (A Study of Emotional Variation Tendency by Movie Genre Based on Speech Signal Analysis)

  • 유황준;한상효;김봉현;가민경;조동욱
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2011년도 추계학술논문집 1부
    • /
    • pp.295-298
    • /
    • 2011
  • 인간의 능력 중 가장 주목할 만한 것은 언어를 습득하고 그것을 이용하여 서로 의사소통을 할 수 있다는 것이다. 모든 언어에는 그 언어만이 가지는 특수성뿐만 아니라 공통적으로 존재하는 보편적인 특성이 있다. 이것 외에도 언어 위에 입혀지는 사람의 목소리는 의사소통을 하는데 있어 상대의 심리를 파악하는 중요한 단서가 된다. 특히, 언어는 습득되어져야 활용되고 그 습득되어지는 환경에 영향을 받으며 이러한 환경에 따라 사람의 목소리, 억양 등이 변화하게 되는 것이다. 따라서 본 논문에서는 음성신호 분석 기법을 적용하여 장르별 영화시청에 따른 시각적, 청각적 요인이 목소리에 미치는 영향을 분석하는 연구를 수행하였다. 이를 위해 장르별 영화를 시청한 후 성대 진동 및 음성에너지의 크기 변화를 측정하여 감정변화를 분석하는 실험을 수행하였다.

  • PDF

음성 정보 분석값을 통한 장년기 남성의 사상체질 분류 (Sasang Constitution Classification of a Middle-Aged Man Using Speech Signal Analysis)

  • 김봉현;이세환;박선애;가민경;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.117-120
    • /
    • 2007
  • 개인의 체질에 맞춰 의학적 행위를 시행하는 사상의학은 우리나라 고유의 전통의학으로 가치를 인정받고 있다. 이러한 사상의학에서 가장 중요한 것은 사상체질의 정확한 분류이다. 본 논문에서는 기존의 사상체질 분류 방법인 용모사기, 체형기상, QSCCII, 체질침 등이 임상의들의 직관에 의해 행해지고 있다는 문제점을 해결하기 위해 사상체질 분류의 정량화 및 객관화를 위한 연구를 수행하였다. 이를 위해 본 논문에서는 음성 신호 분석에서 발생하는 정보의 출력값에 의해 사상 체질을 분류하는 방법을 제안하였다. 이를 위해 40대 이상의 장년기 남성을 대상으로 사상체질 전문의의 진단표에서 뚜렷한 특징을 보유하고 있는 집단군을 구성하고 이들의 음성 특성을 분류하여 음성학적 요소를 추출하고자 한다. 또한 출력된 결과값을 토대로 체질 집단별 차이점과 유사성을 분류하여 사상 체질 분류를 행하였다.

Creation of a Voice Recognition-Based English Aided Learning Platform

  • Hui Xu
    • Journal of Information Processing Systems
    • /
    • 제20권4호
    • /
    • pp.491-500
    • /
    • 2024
  • In hopes of resolving the issue of poor quality of information input for teaching spoken English online, the study creates an English teaching assistance model based on a recognition algorithm named dynamic time warping (DTW) and relies on automated voice recognition technology. In hopes of improving the algorithm's efficiency, the study modifies the speech signal's time-domain properties during the pre-processing stage and enhances the algorithm's performance in terms of computational effort and storage space. Finally, a simulation experiment is employed to evaluate the model application's efficacy. The study's revised DTW model, which achieves recognition rates of above 95% for all phonetic symbols and tops the list for cloudy consonant recognition with rates of 98.5%, 98.8%, and 98.7% throughout the three tests, respectively, is demonstrated by the study's findings. The enhanced model for DTW voice recognition also presents higher efficiency and requires less time for training and testing. The DTW model's KS value, which is the highest among the models analyzed in the KS value analysis, is 0.63. Among the comparative models, the model also presents the lowest curve position for both test functions. This shows that the upgraded DTW model features superior voice recognition capabilities, which could significantly improve online English education and lead to better teaching outcomes.

디지털 보청기 벤트 반향제거를 위한 부밴드 성긴 적응필터 (Subband Sparse Adaptive Filter for Echo Cancellation in Digital Hearing Aid Vent)

  • 배현덕
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권5호
    • /
    • pp.538-542
    • /
    • 2018
  • 디지털보청기 벤트에서 발생되는 반향은 사용자의 불편을 초래한다. 벤트에서 귀환되는 반향을 제거하기 위해서는 귀환경로인 벤트의 임펄스응답의 정확한 추정이 요구된다. 벤트의 임펄스응답은 시간에 따라 변하는 특성과 함께 성긴 특성을 가진다. 이러한 특성의 벤트 임펄스응답 추정에 유용한 적응 알고리즘으로는 IPNLMS가 유용한 것으로 알려져 있다. 본 논문에서는 벤트의 성긴 임펄스응답을 추정하여 벤트에 의한 반향의 제거를 위해 IPNLMS를 부밴드 보청기 구조에 적용하는 부밴드 성긴 적응필터를 제안한다. 제안 기법에서 신호의 부밴드 분해는 각 대역 신호의 사전백색화가 가능하므로 적응필터의 수렴속도의 개선이 가능하다. 그리고 적응필터의 다위상 분해는 각 다위상 성분 필터에서 성긴도를 증가시키며, 추가 계산 없이 반향제거 성능개선이 가능하다. 제안 적응필터의 계수갱신 식 유도를 위해 가중 NLMS에 근거한 비용함수를 정의하고 이를 이용 각부밴드에서 적응필터의 계수 갱신 식을 유도한다. 제안한 적응필터의 성능검증을 위해 백색신호를 입력으로 하여 수렴속도와 정상상태오차를, 실제 음성신호를 입력으로 하여 반향제거 결과를 기존 알고리즘과 비교 평가한다.