• 제목/요약/키워드: 음색

검색결과 147건 처리시간 0.028초

헬스케어 로봇으로의 응용을 위한 음색기반의 감정인식 알고리즘 구현 (Implementation of the Timbre-based Emotion Recognition Algorithm for a Healthcare Robot Application)

  • 공정식;권오상;이응혁
    • 전기전자학회논문지
    • /
    • 제13권4호
    • /
    • pp.43-46
    • /
    • 2009
  • 음성신호는 화자에 대한 고유한 정보와 주변의 음향환경에 대한 정보는 물론 감정과 피로도 등 다양한 정보가 포함되어 있다. 이에 음성신호를 이용한 연구분야에서 감정 상태를 파악하기 위한 연구가 지속되어 왔다. 이에 본 논문에서는 화자의 감정을 인식하기 위해 ETSI의 3GPP2 표준코덱인 Selectable Mode Vocoder(SMV)를 분석한다. 이를 기반으로 감정 인식에 효과적인 특징들을 제안한다. 이후 선정된 특징 벡터를 이용하여 Gaussian Mixture Model(GMM) 기반의 감정 인식 알고리즘을 개발하고 Mixture component 개수를 변화시키면서 성능을 검증한다.

  • PDF

음성신호의 실시간 피치변경에 관한 연구 (A Study on Real Time Pitch Alteration of Speech Signal)

  • 김종국;박형빈;배명진
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.82-89
    • /
    • 2004
  • 고음질 합성을 하면서도 다양한 음색을 갖도록 하기 위해서는 파형부호화를 이용한 합성법에 적용할 수 있는 피치 변경법이 필요하다. 따라서 본 논문에서는 스펙트럼 왜곡률을 최소화하는 영교차 단위의 시간축 조절에 의한 피치 변경법과 피치 동기분석이 용이하고 다른 영역으로의 변환과정이 불필요한 피치시점 검출법을 제안함으로써 고음질을 유지하면서 시간영역에서만 처리됨으로써 계산량을 줄이고 스펙트럼 왜곡률을 최소화하고 위상을 그대로 보존할 수 있는 시간영역에서의 피치 변경법을 제안하였다. 결과적으로 전체 피치 변경율에 대해서는 기존의 방법에 비해서 제안한 방법의 스펙트럼 왜곡률이 0.73%개선되었고 피치 압축시에는 제안한 방법의 스펙트럼 왜곡율이 2.18%개선되었다.

청각 기억 게임을 위한 리듬 유사도 측정 기술 (Measurement of Rhythmic Similarity for Auditory Memory Game)

  • 김주완;이세원;박호종
    • 한국음향학회지
    • /
    • 제30권3호
    • /
    • pp.136-141
    • /
    • 2011
  • 본 논문에서는 청각 기억 게임을 위하여 두 개의 소리 파형을 비교하여 파형의 리듬 유사도를 정량적으로 측정하는 기술을 제안한다. 제안한 방법은 두 입력 파형에 대하여 에너지 변화, 에너지 피크의 지속 시간, 음색 등을 분석하여 각 파형에 포함된 비트 위치를 검출하고, 두 파형의 템포 차이와 비트 수의 차이를 보상하는 과정을 통하여 두 파형의 리듬 벡터를 각각 정의한다. 다음, 두 리듬 벡터 사이의 차이와 비트 수의 차이를 적용하여 두 입력 파형의 리듬 유사도를 정량적으로 표현하는 식을 정의한다. 제안한 방법으로 측정한 리듬 유사도와 주관적 청취 평가로 측정한 리듬 유사도를 비교하였으며, 두 방법에 의한 리듬 유사도가 상관도 0.86을 가지는 것을 확인하였다.

현가계 부쉬 이상소음 분식에 관한 연구 (The Study on noise Analysis of Bush on Suspension System)

  • 배철용;이동원;김찬중;이봉현;나병철
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2006년도 추계학술대회논문집
    • /
    • pp.69-74
    • /
    • 2006
  • It is known that the various noise sources which are engine, transmission, tire, intake system, etc exist at vehicle driving status. Specially noises which cannot be expected by a driver induce unpleasantness to all passengers. These noises are difficult to distinguish noise sources or specifications because of too many vehicle parts. Therefore in this paper, study on abnormal noise of bush on suspension system is performed by the measurement and analysis of the noises of bushings that are generated artificially. The measured noises are analyzed by two points-view of spectrum and sound quality. Finally, it is shown that the noise sources of bushings on the suspension system which are the pillow ball joint bush of a control arm and the rubber bush of a lower arm could be distinguished by the spectrum distribution and a index value based on tonality.

  • PDF

시청각 장애관객 및 일반 관객을 위한 오디얼, 비주얼 정보 전달 시스템 연구 (A Study On Audial and Visual Information Transfer System for the disable and general Audience)

  • 이동훈;장태수;신호
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.756-762
    • /
    • 2009
  • 본 연구는 시청각적 장애를 가진 관객 및 일반 관객에게 전시, 테마파크, 회의, 박람회 등 관람 시 그들이 필요한 시청각적 정보를 실시간으로 추출 통합 가공하여 입체감 있게 전달, 원활한 공연 관람을 돕는 시스템에 관한 것을 주제로 한다. 청각적으로는 공연자의 위치를 추적, 연산하여 공연자의 공연환경조건과 가장 유사한 음색을 가진 정보전달음을 전송하기 위한 최적의 알고리즘을 연구 및 구현하며, 시각적으로는 공연자의 위치를 추적하여 공연 중 관심분야를 적합한 디스플레이에 확장해 주고, 여기에 추가적인 정보를 추가 표시하여 시각적 정보를 공연에 방해 없이 전달하며, 이러한 최종 결과물들을 기록매체에 기록하여 보관할 수 있는 알고리즘에 관한 연구이다.

  • PDF

Tapped and nested-allpass delay line을 이용한 잔향특성 개선에 관한 연구 (A Study on the improvement of reverberation characteristics using tapped and nested-allpass delay line)

  • 윤재연;박준선;진용옥
    • 방송공학회논문지
    • /
    • 제12권1호
    • /
    • pp.28-40
    • /
    • 2007
  • 본 논문에서는 기존에 제안된 잔향 알고리즘 구조에서 문제점으로 대두된 잔향특성을 개선한 새로운 알고리즘 구조를 제안하였다. 제안된 알고리즘 구조는 초기 잔향을 위하여 탭 지연라인을 사용하여 초기반사음을 충분히 구현하였고, 후기 반사음과 잔향을 위해 nested allpass delay line을 이용하여 잔향 밀도를 높이도록 제안하였다. 실내음향의 파라메터를 추출하여 각 지연 라인의 지연 시간을 설정 및 조절하여 가장 좋은 잔향 효과를 갖도록 계수 값들을 설정하였으며, 제안한 알고리즘을 일반 범용 신호처리기를 이용하여 구현 및 실험 고찰을 통해 기존에 제시된 모델에서의 임펄스성음에 대한 비선형적인 거친 응답과 급격한 음색변화가 감소하여, 고르고 평탄한 잔향 밀도가 향상되어 잔향특성이 개선됨을 관찰하였다.

공간 기준 디지털 도파관 모델의 지연 특성과 합성음의 음질 (Delay Characteristics and Sound Quality of Space Based Digital Waveguide Model)

  • 강명수;김규년
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.680-686
    • /
    • 2003
  • 디지털 도파관 모델은 악기의 물리적 모델링에 사용되는 일반적인 방법이다. 디지털 도파관 모델에서 파동의 움직임은 시간 또는 공간을 기준으로 해석 가능하다. 음의 샘플링이 시간을 기준으로 이루어지므로 악기 모델은 시간에 의한 파동의 움직임으로 묘사되는 것이 일반적이다. 본 논문에서는 현에 대한 공간 기준의 디지털 도파관 모델에 악기 몸체 모델을 추가해 악기 음을 합성하였다. 그렇게 함으로써 합성 음의 음질을 향상시키고 악기 모델의 음색 조절 변수들을 효과적으로 처리할 수 있었다. 공간 기준 샘플링에서 현 및 몸체에서 발생하는 미소 지연 오차에 대해 설명하고 FD (Fractional Delay) 필터를 이용해 미소 지연을 처리하는 방법을 보였다. 그리고 지연에 수에 따른 합성음의 변화를 설명하고 그 결과를 시간 기준 디지털 도파관 모델과 비교하였다.

음악 장르 분류를 이용한 자동차 오디오 시스템에서의 이퀄라이저 자동 조절 방식 (Automatic Equalizer Control Method Using Music Genre Classification in Automobile Audio System)

  • 김형국;남상순
    • 한국ITS학회 논문지
    • /
    • 제8권4호
    • /
    • pp.33-38
    • /
    • 2009
  • 본 논문은 자동차 오디오 시스템에 내장된 라디오에서 실시간으로 재생되는 연속적인 오디오 신호로부터 음악 신호를 선별하고, 해당 음악에 대한 실시간 음악장르 분류를 통해 자동으로 이퀄라이저를 조절하는 방식을 제안한다. 제안된 방식에서는 음악분류 정확도를 높이고 실시간 신호처리를 실행하기 위해 연속적인 오디오 신호로부터 추출한 음색 특징 벡터와 리듬 특징 벡터를 GMM (Gaussian mixture model) 분류 방식에 적용하여 음악 분류를 수행한다. 제안된 방식은 카오디오 시스템의 라디오로부터 출력된 오디오 신호로부터 분할된 다양한 오디오 구간을 5가지 음악장르로 분류하여 음악 장르 분류 성능을 측정하였다.

  • PDF

선분 근사법과 곡선의 적합성을 이용한 피아노 음의 모델링 (Modeling of Piano Sound Using Method of Line-Segment Approximation and Curve Fitting)

  • 임훈;정의필
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.86-91
    • /
    • 2000
  • 본 논문에서는 피아노 음을 FFT(Fast Fourier Transform)를 이용하여 주파수 영역으로 변환한 후, 크기(magnitude)와 위상(phase)에 대한 특성들을 분석한다. 이 분석한 결과로 크기와 위상을 모델링하여 파라미터를 생성한다. 크기의 특성에서 기본주파수와 고조파 부분은 다른 부분에 비해 크기가 매우 크다. 그래서 이 부분의 모델링은 오차를 줄이기 위해 곡선의 적합성(Curve Fitting) 방법을 이용하였고, 노이즈 부분의 모델링은 기본주파수 전후의 노이즈가 피아노 음색 특성에 중요한 역할을 하고 불규칙하므로 선분 근사법을 이용하였으며, 크기가 작고 완만하게 변하는 나머지 노이즈 부분은 곡선의 적합성을 이용하였다. 위상은 크기에 적응한 방법과 동일하게 적용하였다. 생성된 파라미터로 크기와 위상을 만들어 역변환 FFT를 하면 피아노 원음에 매우 근접한 음을 얻을 수 있다.

  • PDF

퍼지제어를 이용한 바이올린 연주 연습 알고리즘 개발 (Development of Violin Self-Training Algorithm using Fuzzy Logic)

  • 민병철;김동한;김윤혁;김기열;박종국
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.550-555
    • /
    • 2009
  • 바이올린은 아름다운 음색과 풍부한 표현력으로 현악기 가운데 중요한 위치를 차지하고 있다. 그러나 바이올린 연주를 처음 시작하는 초보자들에게는 정확한 연주를 하기가 쉽지 않다. 이는 연주 시 활의 힘과 활을 켜는 속력 그리고 활과 현과의 접촉점 및 현을 집는 손가락 위치의 부정성에서 기인된다. 따라서 본 논문에서는 이 점을 해결하기 위해 전문 바이올리니스트의 운궁법에 대한 데이터베이스를 사전 구축하고, 연주자가 실제 바이올린을 켤 때 얻어지는 데이터를 구축된 데이터베이스와 실시간으로 비교하고 그 결과를 퍼지 Logic을 사용한 성능평가함수로 성능평가를 한 후 Monitor상에 결과를 보이도록 하였다.