• 제목/요약/키워드: 청각특성

검색결과 329건 처리시간 0.031초

Bi-Level HMM을 이용한 효율적인 음성구간 검출 방법 (An Efficient Voice Activity Detection Method using Bi-Level HMM)

  • 장광우;정문호
    • 한국전자통신학회논문지
    • /
    • 제10권8호
    • /
    • pp.901-906
    • /
    • 2015
  • 본 논문에서는 Bi-Level HMM을 이용한 음성구간 검출 방법을 제안하였다. 기존의 음성 구간 검출법은 짧은 상태변화 오류(Burst Clipping)를 제거하기 위하여 별도의 후처리 과정을 거치든가, 규칙 기반 지연 프레임을 설정해야만 한다. 이러한 문제에 대처하기 위하여 기존의 HMM 모델에 상태 계층을 추가한 Bi-Level HMM을 이용하여 음성구간 판정을 위해 음성상태의 사후 확률비를 이용하였다. 사람의 청각특성을 고려한 MFCC를 특징치로 하여, 다양한 SNR의 음성 데이터에 대한 평가지표를 활용한 실험을 수행하여 기존의 음성상태 분류법보다 우수한 결과를 얻을 수 있었다.

대역에너지를 이용한 잡음음성의 끝점검출 알고리즘 (An Endpoint Detection Algorithm for Noise Speech using Band Energy)

  • 박기상;석수영;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.91-94
    • /
    • 2002
  • 음성인식 시스템의 실용화를 위해서 우선적으로 해결되어야 될 문제중 하나로 잡음환경하에서의 끝점검출을 들 수 있다. 잡음이 존재하지 않는 환경에서는 기존의 에너지 파라미터만으로도 어느정도 신뢰성있는 끝점 구간을 검출할 수 있으나 도심 소음과 같은 실제 잡음환경하에서는 대부분 좋지 않은 결과를 보인다. 본 논문에서는 도심환경의 배경잡음을 제거하는 방법으로 입력되는 음성에 대하여 주변소음에 의해 손상된 음성스펙트럼의 크기 성분만을 제거하는 전처리 기법인 Bark scale에 기반한 스펙트럼 차감법을 사용하고, 인간의 청각특성을 고려하여 음성의 주파수 대역을 3개의 대역으로 분리한 후, 대역별로 세밀한 에너지 문턱치값을 설정하여 음성의 끝점을 탐색하는 방법을 제안한다. 제안한 방법의 유효성을 확인하기 위해 실제 사무실 및 지하철역 등의 잡음환경하에서 녹음된 데이터베이스를 이용하여 끝점검출을 수행한 결과 기존의 에너지와 영교차율을 이용한 방법에 비해 평균 $46\%$의 오차율 감소와 대역에너지만을 사용한 경우에 비해 평균 $17\%$의 오차율 감소를 나타내어 제안한 방법의 유효성을 확인할 수 있었다.

  • PDF

음악신호와 뇌파 특징의 회귀 모델 기반 감정 인식을 통한 음악 분류 시스템 (Music classification system through emotion recognition based on regression model of music signal and electroencephalogram features)

  • 이주환;김진영;정동기;김형국
    • 한국음향학회지
    • /
    • 제41권2호
    • /
    • pp.115-121
    • /
    • 2022
  • 본 논문에서는 음악 청취 시에 나타나는 뇌파 특징을 이용하여 사용자 감정에 따른 음악 분류 시스템을 제안한다. 제안된 시스템에서는 뇌파 신호로부터 추출한 감정별 뇌파 특징과 음악신호에서 추출한 청각적 특징 간의 관계를 회귀 심층신경망을 통해 학습한다. 실제 적용 시에는 이러한 회귀모델을 기반으로 제안된 시스템은 입력되는 음악의 청각 특성에 매핑된 뇌파 신호 특징을 자동으로 생성하고, 이 특징을 주의집중 기반의 심층신경망에 적용함으로써 음악을 자동으로 분류한다. 실험결과는 제안된 자동 음악분류 프레임 워크의 음악 분류 정확도를 제시한다.

생리신호 측정에 의한 감성평가

  • 황민철;박재희;박수찬;김철중
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1995년도 춘계학술대회논문집
    • /
    • pp.35-39
    • /
    • 1995
  • 인간의 감성평가 기술은 제품설계에 필요한 중요한 기술로 인식되고있다. 정량적이고 객 관적인 감성평가를 위한 구체적인 연구가 요구된다. 본 연구는 생리신호가 인간감성에 따라 변화한 다는 가정아래 인간 오감(청각, 시각, 후각, 미각, 촉각)에 대한 생리신호 (EEG, ECG, GSR, FEMG)의 변화를 측정하였다. 감각종류로 긍정적 감성과 부정적 감성을 유발할 4개의 자극이 피실험자에게 제시되었고, 모든 생리신호를 동기화하여 측정하였다. 측정된 신호는 통계처리하여 주관적으로 평가한 감성과의 상관성을 분석하였고 긍정적인 감성과 부정적인 감성에 따른 신호변화의 특성을 파악하여 감 성평가를 위한 상관성을 관찰했다.

  • PDF

SnO$_2$-WO$_3$ 반도체 가스센서의 감응 특성 연구 (The Sensing Characteristics of SnO$_2$-WO$_3$ Seminconductor Gas Sensor)

  • 김선태;최일환;김한수;민주식;이태영
    • 한국대기환경학회:학술대회논문집
    • /
    • 한국대기환경학회 2003년도 추계학술대회 논문집
    • /
    • pp.231-232
    • /
    • 2003
  • 인간의 오감은 시각, 청각, 촉각, 미각 및 후각 둥으로 구성된다 최근 과학기술의 괄목할만한 진보에 동반하여 감각기관에 관한 연구와 이들을 대행하는 기기 등의 개발이 다방면에서 시도되어지고 있으며, 그 중 사람의 후각에 관한 것으로 인간에 코의 기능을 모방한 가스센서의 개발이 활발히 진행되고 있다. 이러한 가스센서가 환경유해가스를 손쉽게 감지할 수 있다는 장점을 부각시킴으로써 가스센서의 연구는 더욱 활발히 진행되고 있는 실정이다. (중략)

  • PDF

실리콘 박막을 이용한 가속도센서 제조기술

  • 이종현
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 1993년도 제4회 학술발표회 논문개요집
    • /
    • pp.11-12
    • /
    • 1993
  • 센서를 인간의 오감에 비유한다면 가속도센서는 시각, 청각, 촉각, 미각, 후각 중에서 어떤 감각기관인가\ulcorner 먼저 시각을 쉽게 생각할 수 있다. 시각기능은 거리, 위치, 형상에 민감하다. 그러나 이들의 시간에 다른 변화 즉 1차 미분량인 속도에는 어느정도 정성적으로 감응하나 2차 미분량인 가속도는 시각으로 판단하기 어렵다. 활강하는 스키선수나 써커스의 공중곡예가 시각에만 의존한다고 볼 수 없으며 이러한 로봇(robot)을 만든다고 할 때 가속도 센서의 중요성은 상상 할 수 있을 것이다. 움직이는 모든 시스템의 동적특성을 제어하기 위해 정교한 가속도센서는 필수적이다.

  • PDF

청각장애아를 위한 새 소리 주파수 특성 분석 (The Sounds of Bird's Frequency Analyses for the Hearing Impaired Children)

  • 김홍규
    • 대한후두음성언어의학회지
    • /
    • 제7권1호
    • /
    • pp.20-26
    • /
    • 1996
  • The purposes of this study were to analyze the sound of bird's frequency region and pattern and to discuss hearing impaired children's auditory discrimination. The results were ie follows; 1) The sounds of bird's frequency region were divided into Low(below 1, 000Hz), Mid(between 1, 000 and 4, 000Hz) and High(between 2, 000 and 4, 000Hz). 2) The sounds of bird, which were same, long, high pattern, were in Mid & High. Short and high pattern were above High.

  • PDF

다층 퍼셉트론 네트워크에 의한 연속음성 화자분류

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.682-683
    • /
    • 2017
  • 주변의 배경잡음으로부터 음성인식률을 향상시키기 위하여 적절한 음성의 특징 파라미터를 선택하는 것이 매우 중요하다. 본 논문에서는 위너필터 방법이 적용된 인간의 청각 특성을 이용한 멜 주파수 켑스트럼 계수를 사용한다. 제안한 멜 주파수 켑스트럼 계수의 특징 파라미터를 다층 퍼셉트론 네트워크에 입력하여 학습시킴으로써 화자인식을 구현한다.

  • PDF

잡음 신호의 지각 패턴 제어를 통한 음질 개선 알고리즘 개발에 관한 연구 (The Study for Noisy Speech Improvement with Noise Perception Pattern Suppression)

  • 김헌중;차형태
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.199-202
    • /
    • 2002
  • 본 논문에서는 사람의 청각 모델을 기반으로 잡음에 의해 손상된 음성 신호로부터 잡음 신호의 마스킹 특성과 신호에너지의 지각(知覺)을 나타내는 임계대역(critical band)에서의 잡음 에너지에 대한 지각 패턴인 noise excitation pattern을 이용한 잡음 에너지 차감과 잡음 추정 오차에 의한 변형된 음성신호 내의 순음(tonal) 성분과 비순음(non-tonal)성분의 보정을 통해 효과적인 음성 품질의 개선을 위한 연구를 하였다.

  • PDF

MPEG 오디오 신호처리를 위한 MDCT/IMDCT의 FPGA 구현 (MDCT/IMDCT)

  • 노진수;이강현
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.69-73
    • /
    • 2003
  • 음향압축에 있어서 인간의 청각신경의 특성을 이용하는 방식이 사용되고 있다. 이러한 방법은 심리음향모델(psychoacustical model)에서 도입되었다. 음향압축에서는 이러한 심리음향모델을 사용하여 인간이 지각할 수 없는 한도 내에서 부호화하지 않는 지각음향부호화(perceptual audio coding)사용한다. 지각음향부호화는 분석필터와 합성필터로 각각 부호화 복호화하는데 이것은 필터뱅크(filter bank)로 구현된 서브밴드코더(subband coder) 이다. 본 논문에서는 분석필터와 합성필터에 사용되는 MDCT(Modified Discrete Cosine Transform)와 IMDCT(Inverse Modified Discrete Cosine Transform)를 FPGA에 구현하였다.

  • PDF