• 제목/요약/키워드: 음성 신호 처리

검색결과 474건 처리시간 0.026초

FM 방송 중 블록 단위 음성 음악 판별 시스템의 설계 및 구현 (Design and Implementation of Speech Music Discrimination System per Block Unit on FM Radio Broadcast)

  • 장현종;엄정권;임준식
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.25-28
    • /
    • 2007
  • 본 논문은 FM 라디오 방송의 오디오 신호를 블록 단위로 음성 음악을 판별하는 시스템을 제안하는 논문이다. 본 논문에서는 음성 음악 판별 시스템을 구축하기 위해 다양한 특정 파라미터와 분류 알고리즘을 제안 한다. 특정 파라미터는 신호처리 분야(Centroid, Rolloff, Flux, ZCR, Low Energy), 음성 인식 분야(LPC, MFCC), 음악 분석 분야(MPitch, Beat)에서 각각 사용되는 파라미터를 사용하였으며 분류 알고리즘으로는 패턴인식 분야(GMM, KNN, BP)와 퍼지 신경망(ANFIS)을 사용하였고, 거리 구현은 Mahalanobis 거리를 사용하였다.

  • PDF

연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발 (On the Development of a Continuous Speech Recognition System using Continuous Hidden Markov Model for Korean Language)

  • 김도영;박용규;권오욱;은종관
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.101-110
    • /
    • 1993
  • 본 논문에서는 연속분포 hidden Markov 모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해 주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다. 성능 평가를 위한 화자 독립 인식 실험에서 문법이 없을 경우 83%, finite state network율 적용한 경우에는 94%의 인식률을 나타내었다.

  • PDF

LED PANNEL을 사용하여 근거리 무선 통신망을 연결한 자동차 신호 제어기 및 광고판 (LED PANNEL with Automobile Signal Controller and Advertising Board used to Local area Network)

  • 박진기;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.533-535
    • /
    • 2018
  • 현대시대 생활의 필수품인 자동차의 발전에 비례해 사고율도 급증적으로 증가하는 21세기에 좀 더 사고를 줄이고자, 본 논문은 차량의운전자가 급박한 상황이나 손이 불편한 노약자, 장애우분들을 위하여 편리성을 도모하고자 집필하게 되었다. 자동차의 안전사고 및 다양한 신호를 운전자가 음성으로 스마트폰을 통해 전달하면 자동차후면 LED pannel을 통하여 음성신호를 영상신호로 처리함으로써, 긴급한 상황이나 현재 상태를 명확히 전달이 가능하게 하였으며, 또한 근거리 통신망을 이용 근거리 상업 지역의 광고판으로써의 광고효과와 현 교통상황을 표시할 수 있게 연구를 제안하고자 한다.

  • PDF

가변 대역폭 LPF를 이용한 피치 검출 (Pitch Detection Using Variable Bandwidth LPF)

  • 금홍;백금란;배명진;장호성
    • 한국음향학회지
    • /
    • 제13권5호
    • /
    • pp.77-82
    • /
    • 1994
  • 음성신호 처리에서, 피치를 정확하게 찾아내는 것이 매우 중요하다. 현재까지 많은 피치 검출 방법들이 제안되어 왔지만, 광범위한 화자와 다양한 음성 데이터로부터 정확한 피치를 찾는 것은 어렵다. 따라서 본 논문에서는 G-peak 검출을 이용한 새로운 피치 검출 알고리즘을 제안한다. 이 방법은 G-peak 의 MZCI (최대 영교차 간격) 을 LPF (low-pass filter)의 차단대역폭으로 결정하여 음성신호의 피치를 검출하는 방법이다. 본 알고리즘은 0dB SNR 환경 하에서 3.36%의 그로스 에러를 나타내는 잡음에 강인한 방법이다. 또한 잡음이 없는 음성의 그로스 에러는 0.18%였고, 모든 과정은 고속 처리가 가능하다.

  • PDF

대역폭 계층 구조의 광대역 음성 부호차기 개발 (Bandwidth Scalable Wideband Speech Codec)

  • 이우석;손창용;이영범;박호종
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.481-487
    • /
    • 2004
  • 본 논문에서는 대역폭 계층 구조의 광대역 음성 부호화기 구조와 이를 위한 상위 대역 부호화기를 제안한다. 상위 대역 부호화기는 상위 대역 신호를 다수의 주파수 밴드로 분할하고, 각 밴드 신호를 DCT 변환하여 양자화한다. DCT 계수는 크기와 부호로 분리하여 독립적으로 처리하며, 각각의 특성에 적합한 양자화 방법을 개발하여 성능을 향상시킨다. 또한, 하위 대역의 부호화된 이득 파라미터를 상위 대역의 양자화에 이용함으로써 부호화 성능을 향상시키는 방법을 제안한다. G.729E로 하위 대역을 부호화하고 제안한 부호화기로 상위 대역을 처리하는 대역폭 계층 구조의 광대역 음성 부호화기를 개발하였고, 주관적 음질을 측정하여 24kbps G.722.1보다 우수한 음질을 가지는 것을 확인하였다.

한국어 운율 발생용 인공신경망의 구조 및 학습에 관한 연구 (A Study on the Architecture and Learning of the Artificial Neural Networks for Prosody Generation of Korean Sentence)

  • 민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.135-138
    • /
    • 2004
  • 음성처리기술은 정보화 시대를 위한 주요 기술의 하나이다. 이 중에서도 음성합성의 연구는 디지털 신호처리 기술과 컴퓨터의 발달로 활발히 진행되고 있다. 그러나 음성 합성기에 의해 발생된 합성음의 음질은 이해도 면에서는 상당한 진전이 있었지만, 자연감 면에서는 만족한 수준에 도달할 수 없었는데, 이러한 합성시스템의 문제점을 해결하는 방법은 다양하게 적용되는 언어정보와 합성음의 자연감을 결정하는 정확한 운율정보가 필요하다. 그러나 구한 운율 정보가 자연음에 존재하는 모든 운율 법칙을 포함할 수 없고, 또한 추출한 운율 법칙이 틀린 것이면 자연감이나 이해도가 떨어지는 합성음이 만들어지고 이것은 음성 합성 시스템의 실용화에 장애로 작용할 것이다. 본 논문은 한국어 음성 합성 시 문제가 되는 자연감을 높이기 위한 한 방법으로 자연음에 내재하는 운율 변화를 효율적으로 학습할 수 있는 인공 신경망을 제안하였다.

  • PDF

음성신호를 이용한 A16 혈자리와 심장 기능의 연관관계 분석 (Analysis of Association Relationship Between A16 Acupuncture Point and Heart Function Using Voice Signals)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제35권11B호
    • /
    • pp.1651-1658
    • /
    • 2010
  • 최근 들어 삶의 지표가 향상됨에 따라 질병이 발생되지 전에 조기 진단하는 예방, 보건의 건강 패턴이 행해지고 있다. 이와 같은 예방, 보건 분야를 반영하는 대체의학으로 수지침 요법이 널리 사용되고 있다. 따라서 본 논문처리 기술을 이용하여 성장에 해당하는 상응점인 A16 혈자리를 자극하여 심장과 관련된 음성 요소의 변화를 측정하고 상호간의 비교, 분석을 통해 성장 가능의 향상을 측정하였다. 이를 위해 우선 심장 상응점인 A16 혈자리를 자극하기 전과 후의 음성을 수집하였으며 심장과 연관성이 있는 음성 신호 분석 요소인 제2포먼트 대역폭과 지터를 적용한 실험을 수행하였다. 결과적으로, A16 혈자리 자극에 의해 제2포먼트 대역폭과 지터가 낮아지는 결과를 추출했으며 이를 통해 IT 음성 신호 처리 기술을 이용하여 심장 기능이 향상되는 것을 입증할 수 있었다.

적응 신호 처리를 이용한 멀티콥터 프로펠러 소리 저감 방법 (Noise Reduction Method with Adaptive Signal Processing for Multicopters)

  • 윤소정;박상일;엄유미;유성근
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.312-314
    • /
    • 2015
  • 본 논문에서는 멀티콥터에서의 음향 취득에 필요한 프로펠러 소음 저감 방법을 제시한다. 멀티콥터의 사용성 증대에 따른 방송 및 다분야에서 응용이 늘어남에 비해 방송 분야에서 멀티콥터의 음향 취득 기술이 미비한 것이 사실이다. 높은 품질의 동영상 촬영 기술이 나날이 발전하고 있는데 비해 멀티콥터에서의 음향 취득에 대한 연구는 진행이 활발하지 않다. 이에 본 논문은 음성 신호 처리 분야에서 소음 저감 기술로 많이 쓰이는 적응 신호처리를 이용하여 프로펠러 소리를 저감하는 방법을 제시한다. 먼저, 적용한 적응 신호 처리 기술에 대한 설명을 통해 본 논문에 이용한 프로펠러 소리 저감 방법을 설명토록 하며, 프로펠러 소리에 대한 분석을 통해 발전 가능한 연구를 논의한다.

  • PDF

신장 질환 진단을 위한 신호처리기법의 적용 (Application of Signal Processing for Kidney Disease Diagnosis)

  • 조동욱;이세환;김봉현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.651-654
    • /
    • 2005
  • 신장 질환은 고혈압과 당뇨등에 대한 합병증으로 많이 발생되며 병이 상당 부분 진행이 되어야만 자각 증세가 있는 질환이다. 따라서 신장 질환은 예방이 중요하며 이를 위한 기술적 방법론이 개발되어야 한다. 현재는 소변 검사를 통한 단백뇨와 혈액 검사에 의지하여 질환의 유무와 진행 정도를 파악하고 있지만 이를 생체 신호 분석을 통해 행한다면 질환 예방등에 유익한 방법이 되리라 여겨진다. 본 논문에서는 이를 위해 신호 처리 기법을 적용하여 신장 질환을 판단하는 방법론을 제안하고자 한다. 이를 위해 음성 신호를 분석하고 신장과 관련이 되어 있는 오관인 귀에 대한 영역을 추출하는 방법을 제안하고자 한다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

  • PDF

음성인식기 구현을 위한 잡음에 강인한 음성구간 검출기법 (Robust Speech Segmentation Method in Noise Environment for Speech Recognizer)

  • 김창근;박정원;권호민;허강인
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.18-24
    • /
    • 2003
  • 실시간 음성 인식기의 구현에 있어서 선행되어야 할 과제는 신뢰성 있는 음성구간 검출과 적절한 음성특징벡터를 구하는 것이다. 그러나, 주변 잡음이 인가되는 환경에서는 신뢰성 있는 음성구간 검출이 어렵게 되어 적절한 음성특징벡터를 구할 수 없게 되어 최종적으로 인식기의 성능 저하를 초래하게 된다. 이러한 문제점을 보완하기 위하여 본 논문에서는 일반적으로 사용되어지는 단구간 파러 스펙트럼 외에 잡음에 강인한 특성을 가질 수 있도록 하는 새로운 특징 파라메터로써 스펙트럼 밀도비교척도와 선형회귀를 이용한 선형결정함수를 사용하였다. 이러한 두 가지 파라메터를 추가하여 주변 잡음의 크기에 따라 각각의 (파라메터를 적절한 가중치로 조합하여 음성구간 결정을 수행한 다음 DTW를 사용하여 인식실험을 한 결과 주변 잡음이 존재하는 환경에서도 강인한 특성을 가짐을 확인할 수 있었다.

  • PDF