• 제목/요약/키워드: 음성 분석

검색결과 3,079건 처리시간 0.03초

LPC Smoothed Log Amplitude Spectra를 이용한 자동 음성 분할 (Automatic Segmentation Using LPC Smoothed Log Amplitude Spectra)

  • 김도한;이상운;이기정;홍재근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.795-798
    • /
    • 2000
  • 연속음 인식과 음성 합성을 위해서는 정밀한 음성학적 모델과 연속 음성에 적용 가능한 언어 모델의 개발이 중요하다. 이를 위해서는 음성 데이터 베이스에 대한 인식 단위, 혹은 합성 단위의 분할이 필요한데, 수동음성 분할은 일관성의 유지가 어렵고 긴 시간이 소요되므로 최근에는 자동 분할 기술이 많이 연구되고 있다. 자동 음성 분할 기법으로는 시간 영역이나 주파수 영역특징 벡터의 천이를 분석하는 방법과 특징 벡터간의 상관도를 구하여 경계를 추출하는 방법이 있다. LPC smoothed log amplitude spectra는 음성의 주파수 영역의 특징을 잘 나타내며, 동일 음소 내의 상관도가 서로 다른 음소의 상관도보다 더 크고, 음소의 경계구간에서 급격한 상관도의 변화를 보인다. 이 특성을 이용하여 이웃 프레임에 대한 상관도의 방향성이 특정조건을 만족하는가를 검사하여 음소의 경계를 구하는 방법을 찾았다. 또한 LPC. 이득 인자만으로 묵음 구간을 검출하는 방법을 제시한다. 이렇게 하면 묵음 구간검출과 음소 경계 검출의 일관성을 향상시키고 수행 시간을 단축시킬 수 있다. 제안한 기법으로 허용 오차 20ms 이내에서 연속음성에 대한 음소 경계 검출 실험을 수행한 결과, 수작업으로 행한 경계 검출 지점의 약 88%를 정확히 검출하였다.

  • PDF

내장형 음성인식기를 위한 전용 하드웨어가속기 기술개발 동향 (Trends of Hardware Accelerator for the Embedded Speech Recognition)

  • 김주엽;김태중;이주현;엄낙웅
    • 전자통신동향분석
    • /
    • 제29권4호
    • /
    • pp.91-100
    • /
    • 2014
  • 사람의 말소리를 문자로 변환하여 기기의 제어명령으로 활용하는 것이 음성인식 기술이다. 음성인식에 대한 기술개발 요구는 수십 년 전부터 있어 왔고, 꾸준히 제품화되고 있는 분야라 하겠다. 제품으로의 상용화가 가능한 알고리즘 및 데이터 처리체계는 HMM(Hidden Markov Model)이라는 수학적 모델링으로 정형화되어 있으며, 대규모의 반복적 데이터 수집과 정교한 학습 데이터베이스의 구축이 음성인식기술의 핵심요소라는 것이 일반적인 시각이다. 이러한 이유로 인해, 대용량 음성인식 데이터베이스의 수집, 가공 등이 가능한 인프라를 갖춘 기관 및 업체들이 음성인식기술 시장을 점유할 수 있는 것이다. 그러나, 이러한 음성인식의 서비스 제공 체계는 사물인터넷 또는 웨어러블 디바이스 등으로 음성인식 사용자 인터페이스가 확대되고 통신 및 네트워크가 연결이 불가한 경우 그 한계를 보일 수 있다. 본고에서는 이러한 문제를 해결하기 위한 내장형 음성인식기의 하드웨어가속기 기술개발에 대한 내용과 국내외 현황을 살펴보기로 한다.

  • PDF

음성부호화 방식에 있어서 FIR-STREAK 필터를 사용한 개별 피치펄스에 관한 연구 (A Study on Individual Pitch Pulse using FIR-STREAK Filter in Speech Coding Method)

  • 이시우
    • 한국콘텐츠학회논문지
    • /
    • 제4권4호
    • /
    • pp.65-70
    • /
    • 2004
  • 본 연구에서는 음성부호화 방식에서 피치추출 오류를 줄이고 피치간격의 변위에 적응할 수 있도록 피치간격을 정규화하지 않은 개별 피치펄스 추출법을 제안하였다. 개별피치 펄스의 추출율은 남자음성에서 $96\%$, 여자음성에서 $85\%$를 얻을 수 있었으며, 이 방법은 음성부호화방식, 음성분석, 음성합성, 음성인식 등에 활용할 수 있을 것으로 기대된다.

  • PDF

자연어 음성인식 기술을 이용한 음성 대화 서비스 개발동향 (Spoken Dialogue Service Trends Using Natural Speech Recognition Technology)

  • 정호영;송화전;강병옥;정의석;정훈;오유리;권오욱;이기영;이윤근
    • 전자통신동향분석
    • /
    • 제26권5호
    • /
    • pp.14-28
    • /
    • 2011
  • 모바일 혁명과 빅데이터(big data) 시대에 접어들면서 사용자 중심의 자연스러운 인터페이스와 정보검색에 대한 요구가 늘어가고 있다. 모바일 환경에서의 쉽고 자연스러운 검색을 위해 음성인식 기술을 이용한 음성검색 서비스가 대세를 이루고 있으며 대화형 검색 서비스로 발전하게 될 것이다. 음성 대화 서비스의 주요 응용 분야인 음성검색 및 외국어 교육 서비스에서의 자연어 음성인식 기술 역할 및 사용자 경험을 바탕으로 하는 선순환 구조의 인식 성능 개선에 대해 소개한다. 또한 두 응용분야에서의 국내외 개발동향을 소개하고 실제 개발 사례를 통해 무제한급 자연어 음성인식 기술에 기반한 음성 대화 서비스의 가능성을 살펴본다.

  • PDF

성대폴립 환자를 대상으로 한 GRBAS 척도와 MDVP 측정치 간의 상관관계 연구

  • 표화영;최성희;임성은;심현섭;최홍식;김광문
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1999년도 제12회 학술대회
    • /
    • pp.180-180
    • /
    • 1999
  • 배경 : 음성평가시 그 음질을 파악하기 위한 검사 중 주관적 검사로서 많이 쓰이는 것은 GRBAS 척도에 의한 청인지적 4단계 평정이고, 객관적 검사로서 널리 쓰이고 있는 검사 도구는 CSL 중 MDVP이다. 이중 GRBAS 검사는 평가자의 고도의 숙련도를 요구하며, MDVP에 의한 음성평가는, 나타난 결과에 대한 정확한 해석을 요구한다. 목적 : 이에, 1차적으로 음성과용 환자를 대상으로 하여, GRBAS 척도에 의한 청인지적 음성평가 결과와 CSL 중 MDVP에 의한 객관적 음성평가 결과에 대한 상관성을 비교, 분석해 보고, 이를 통하여 청인지적 음성평가에 숙련되지 못한 평가자가 객관적 검사도구를 통하여 음성평가를 하고자 할 때 주목해야 할 변인들에 관하여 알아보고자 한다. (중략)

  • PDF

음향적 요소분석과 DRNN을 이용한 음성신호의 감성 인식 (Analyzing the Acoustic Elements and Emotion Recognition from Speech Signal Based on DRNN)

  • 심귀보;박창현;주영훈
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.45-50
    • /
    • 2003
  • 최근 인간형 로봇에 대한 개발이 괄목할 만한 성장을 이루고 있고, 친근한 로봇의 개발에 중요한 역할을 담당하는 것으로써 감성/감정의 인식이 필수적이라는 인식이 확산되고 있나. 본 논문은 음성의 감정인식에 있어 가장 큰 부분을 차지하는 피치의 패턴을 인식하여 감정을 분류/인식하는 시뮬레이터의 개발과 시뮬레이션 결과를 나타낸다. 또한, 피치뿐 아니라 음향학적으로 날카로움, 낮음 등의 요소를 분류의 기준으로 포함시켜서 좀더 신뢰성 있는 인식을 할 수 있음을 보인다. 주파수와 음성의 다양한 분석을 통하여, 음향적 요소와 감성의 상관관계에 대한 분석이 선행되어야 하므로, 본 논문은 사람들의 음성을 녹취하여 분석하였다 시뮬레이터의 내부 구조로는 음성으로부터 피치를 추출하는 부분과 피치의 패턴을 학습시키는 DRNN 부분으로 이루어져 있다.

이침요법(耳針療法)을 기반으로 한 심장 관련 음성 분석 요소의 변화 분석 (Change Analysis of Heart Related Voice Analysis Parameter Based on Auricular Acupuncture)

  • 김봉현;임순용;임성수;유황준;연용흠;민지선;한상효;가민경;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1043-1046
    • /
    • 2011
  • 건강에 대한 예방과 관리를 반영한 것이 대체의학이다. 대체의학 중에 이침(耳針)요법은 부작용이 적은 방법으로 널리 사용되고 있다. 이침요법은 간단한 교육과정을 거친 후 자가 진단을 통해 응급처치가 가능한 것으로 실생활에서 손쉽게 이용되고 있다. 따라서 본 논문에서는 심장에 해당하는 이(耳)혈 상응점을 자극하여 심장과 관련된 음성 요소의 변화를 측정하였다. 이를 위해 심장에 해당하는 이(耳)혈 상응점을 자극하기 전과 후의 음성을 수집하여 음성 분석 요소 중 Jitter와 2Formant Frequency Bandswidth을 적용하여 단위 시간안의 발음에서 성대 진동의 변화율과 공명강의 변화를 통해 심장과 음성의 상관성을 분석하는 연구를 수행하였다.

얼굴 영상 및 음성신호 측정을 통한 신장 수지침 효과 분석 기법의 제안 (A Proposal for Effect Analysis Techniques of Kidney Hand Acupuncture through Face Image and Voice Signal Measurement)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제37권3C호
    • /
    • pp.217-223
    • /
    • 2012
  • 본 논문에서는 얼굴 영상 및 음성신호 변화를 측정하는 기술을 적용하여 신장에 해당하는 수지침 자극에 따른 효과를 분석하는 기법을 제안하고자 한다. 이를 위해 신장 수지침 자극 전과 후의 얼굴 영상과 음성을 각각 수집하고 영상신호 분석 실험에서는 신장 관련 영역인 지각(턱) 부위의 색상 변화를 측정하였다. 또한, 음성신호 분석 실험에서는 신장과 관련된 음성신호 분석 요소인 1 포먼트 주파수 대역폭과 Shimmer값의 변화를 측정하였다. 실험을 통해 신장 수지침 자극에 따른 지각 부위의 흑색, 1 포먼트 주파수 대역폭 및 Shimmer 측정값이 감소하는 현상을 나타냈다. 최종적으로 실험 결과에 대한 통계적 유의성 분석을 통해 얼굴 영상 및 음성신호 측정 기법에 의한 신장 수지침 효과를 객관적으로 입증하고자 한다.

디지틀 이동 통신을 위한 음성 부호화 기술

  • 정종태;김영일
    • 전자통신동향분석
    • /
    • 제4권3호
    • /
    • pp.3-12
    • /
    • 1989
  • 디지틀 이동통신 시스팀 개발에 있어서 가용주파수 대역폭의 제한성 때문에 저 전송 속도 음성 부호화기에 관한 연구는 중요하다. 따라서, 음질도 좋고 주파수 효율을 극대화할 수 있는 디지틀 음성 부호화 방식에 대한 연구는 국내 고유모델의 디지틀 이동 통신 시스팀 개발에 초석이 된다고 할 수 있다. 본고에서는 현재 사용되거나 연구가 진행중인 디지틀 음성 부호화 방식들에 대하여 살펴보았고, 세계 각국에서 디지틀 이동통신을 위하여 제안한 디지틀 음성 부호화 방식들을 비교 및 검토 하였다.

음성처리 IC 제적용 PIC 임베디드 시스템 설계 및 제작 (Design And Implementation of Embedded System Board for Voice Processor Control)

  • 황인섭;공휘식
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.123-126
    • /
    • 2000
  • 본 논문에서는 음성 신호 처리 IC를 제어하는 임베디드 시스템을 Micro-controller를 이용하여 설계하고 제어 프로그램을 구성/제작하여 기능을 분석한다. 선택한 음성처리용 IC 중에서 ISD2560은 내장된 EEPROM에, T6668은 외부에 D-RAM을 연결하여 음성 메시지를 저장하고 있다. PIC16F84는 음성데이터의 입출력과 저장과 재생, 초기화를 위한 회로의 동작과 순서 제어, 시작과 종료하는 메모리 번지의 생성과 같은 제어 프로그램을 수행한다.

  • PDF