• Title/Summary/Keyword: 음성 분석

Search Result 3,069, Processing Time 0.03 seconds

Trends of Hardware Accelerator for the Embedded Speech Recognition (내장형 음성인식기를 위한 전용 하드웨어가속기 기술개발 동향)

  • Kim, J.Y.;Kim, T.J.;Lee, J.H.;Eum, N.W.
    • Electronics and Telecommunications Trends
    • /
    • v.29 no.4
    • /
    • pp.91-100
    • /
    • 2014
  • 사람의 말소리를 문자로 변환하여 기기의 제어명령으로 활용하는 것이 음성인식 기술이다. 음성인식에 대한 기술개발 요구는 수십 년 전부터 있어 왔고, 꾸준히 제품화되고 있는 분야라 하겠다. 제품으로의 상용화가 가능한 알고리즘 및 데이터 처리체계는 HMM(Hidden Markov Model)이라는 수학적 모델링으로 정형화되어 있으며, 대규모의 반복적 데이터 수집과 정교한 학습 데이터베이스의 구축이 음성인식기술의 핵심요소라는 것이 일반적인 시각이다. 이러한 이유로 인해, 대용량 음성인식 데이터베이스의 수집, 가공 등이 가능한 인프라를 갖춘 기관 및 업체들이 음성인식기술 시장을 점유할 수 있는 것이다. 그러나, 이러한 음성인식의 서비스 제공 체계는 사물인터넷 또는 웨어러블 디바이스 등으로 음성인식 사용자 인터페이스가 확대되고 통신 및 네트워크가 연결이 불가한 경우 그 한계를 보일 수 있다. 본고에서는 이러한 문제를 해결하기 위한 내장형 음성인식기의 하드웨어가속기 기술개발에 대한 내용과 국내외 현황을 살펴보기로 한다.

  • PDF

A Study on Individual Pitch Pulse using FIR-STREAK Filter in Speech Coding Method (음성부호화 방식에 있어서 FIR-STREAK 필터를 사용한 개별 피치펄스에 관한 연구)

  • Lee See-Woo
    • The Journal of the Korea Contents Association
    • /
    • v.4 no.4
    • /
    • pp.65-70
    • /
    • 2004
  • In this paper, I propose a new extraction method of Individual Pitch Pulse in order to accommodate the changes in each pitch interval and reduce pitch errors in Speech Coding. The extraction rate of individual pitch pulses was $96\%$ for male voice and $85\%$ for female voice respectively. This method has the capability of being applied to many fields, such as speech coding, speech analysis, speech synthesis and speech recognition.

  • PDF

Spoken Dialogue Service Trends Using Natural Speech Recognition Technology (자연어 음성인식 기술을 이용한 음성 대화 서비스 개발동향)

  • Jung, H.Y.;Song, H.J.;Kang, B.O.;Chung, E.S.;Chung, H.;Oh, Y.R.;Kwon, O.W.;Lee, K.Y.;Lee, Y.K.
    • Electronics and Telecommunications Trends
    • /
    • v.26 no.5
    • /
    • pp.14-28
    • /
    • 2011
  • 모바일 혁명과 빅데이터(big data) 시대에 접어들면서 사용자 중심의 자연스러운 인터페이스와 정보검색에 대한 요구가 늘어가고 있다. 모바일 환경에서의 쉽고 자연스러운 검색을 위해 음성인식 기술을 이용한 음성검색 서비스가 대세를 이루고 있으며 대화형 검색 서비스로 발전하게 될 것이다. 음성 대화 서비스의 주요 응용 분야인 음성검색 및 외국어 교육 서비스에서의 자연어 음성인식 기술 역할 및 사용자 경험을 바탕으로 하는 선순환 구조의 인식 성능 개선에 대해 소개한다. 또한 두 응용분야에서의 국내외 개발동향을 소개하고 실제 개발 사례를 통해 무제한급 자연어 음성인식 기술에 기반한 음성 대화 서비스의 가능성을 살펴본다.

  • PDF

성대폴립 환자를 대상으로 한 GRBAS 척도와 MDVP 측정치 간의 상관관계 연구

  • 표화영;최성희;임성은;심현섭;최홍식;김광문
    • Proceedings of the KSLP Conference
    • /
    • 1999.11a
    • /
    • pp.180-180
    • /
    • 1999
  • 배경 : 음성평가시 그 음질을 파악하기 위한 검사 중 주관적 검사로서 많이 쓰이는 것은 GRBAS 척도에 의한 청인지적 4단계 평정이고, 객관적 검사로서 널리 쓰이고 있는 검사 도구는 CSL 중 MDVP이다. 이중 GRBAS 검사는 평가자의 고도의 숙련도를 요구하며, MDVP에 의한 음성평가는, 나타난 결과에 대한 정확한 해석을 요구한다. 목적 : 이에, 1차적으로 음성과용 환자를 대상으로 하여, GRBAS 척도에 의한 청인지적 음성평가 결과와 CSL 중 MDVP에 의한 객관적 음성평가 결과에 대한 상관성을 비교, 분석해 보고, 이를 통하여 청인지적 음성평가에 숙련되지 못한 평가자가 객관적 검사도구를 통하여 음성평가를 하고자 할 때 주목해야 할 변인들에 관하여 알아보고자 한다. (중략)

  • PDF

Analyzing the Acoustic Elements and Emotion Recognition from Speech Signal Based on DRNN (음향적 요소분석과 DRNN을 이용한 음성신호의 감성 인식)

  • Sim, Kwee-Bo;Park, Chang-Hyun;Joo, Young-Hoon
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.13 no.1
    • /
    • pp.45-50
    • /
    • 2003
  • Recently, robots technique has been developed remarkably. Emotion recognition is necessary to make an intimate robot. This paper shows the simulator and simulation result which recognize or classify emotions by learning pitch pattern. Also, because the pitch is not sufficient for recognizing emotion, we added acoustic elements. For that reason, we analyze the relation between emotion and acoustic elements. The simulator is composed of the DRNN(Dynamic Recurrent Neural Network), Feature extraction. DRNN is a learning algorithm for pitch pattern.

Change Analysis of Heart Related Voice Analysis Parameter Based on Auricular Acupuncture (이침요법(耳針療法)을 기반으로 한 심장 관련 음성 분석 요소의 변화 분석)

  • Kim, Bong-Hyun;Lim, Soon-Yong;Lim, Sung-Su;Yoo, Hwang-Jun;Yeon, Yong-Heum;Min, Ji-Seon;Han, Sang-Hyo;Ka, Min-Kyoung;Cho, Dong-Uk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1043-1046
    • /
    • 2011
  • 건강에 대한 예방과 관리를 반영한 것이 대체의학이다. 대체의학 중에 이침(耳針)요법은 부작용이 적은 방법으로 널리 사용되고 있다. 이침요법은 간단한 교육과정을 거친 후 자가 진단을 통해 응급처치가 가능한 것으로 실생활에서 손쉽게 이용되고 있다. 따라서 본 논문에서는 심장에 해당하는 이(耳)혈 상응점을 자극하여 심장과 관련된 음성 요소의 변화를 측정하였다. 이를 위해 심장에 해당하는 이(耳)혈 상응점을 자극하기 전과 후의 음성을 수집하여 음성 분석 요소 중 Jitter와 2Formant Frequency Bandswidth을 적용하여 단위 시간안의 발음에서 성대 진동의 변화율과 공명강의 변화를 통해 심장과 음성의 상관성을 분석하는 연구를 수행하였다.

A Proposal for Effect Analysis Techniques of Kidney Hand Acupuncture through Face Image and Voice Signal Measurement (얼굴 영상 및 음성신호 측정을 통한 신장 수지침 효과 분석 기법의 제안)

  • Kim, Bong-Hyun;Cho, Dong-Uk
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.37 no.3C
    • /
    • pp.217-223
    • /
    • 2012
  • In this paper, we would like to propose techniques to analyze effect according to stimulation kidney associated hand acupuncture by applying technique to measure changes of facial image and voice signal. To this end, we measured color change of JIGAK(jaw) area associated kidney in facial image and voice signal stimulation before and after of kidney associated hand acupuncture. In addition, we measured changes of the first formant frequency bandwidth and Shimmer to element of voice signal analysis in connection with kidney in experiment. We can be measured reduction of the first formant frequency bandwidth and Shimmer, black of JIGAK area according to stimulation of kidney associated hand acupuncture. Finally, we would like to demonstrate objective effect of kidney associated hand acupuncture through the analysis of statistical significance by measurement techniques of facial image and voice signal.

디지틀 이동 통신을 위한 음성 부호화 기술

  • Jeong, Jong-Tae;Kim, Yeong-Il
    • Electronics and Telecommunications Trends
    • /
    • v.4 no.3
    • /
    • pp.3-12
    • /
    • 1989
  • 디지틀 이동통신 시스팀 개발에 있어서 가용주파수 대역폭의 제한성 때문에 저 전송 속도 음성 부호화기에 관한 연구는 중요하다. 따라서, 음질도 좋고 주파수 효율을 극대화할 수 있는 디지틀 음성 부호화 방식에 대한 연구는 국내 고유모델의 디지틀 이동 통신 시스팀 개발에 초석이 된다고 할 수 있다. 본고에서는 현재 사용되거나 연구가 진행중인 디지틀 음성 부호화 방식들에 대하여 살펴보았고, 세계 각국에서 디지틀 이동통신을 위하여 제안한 디지틀 음성 부호화 방식들을 비교 및 검토 하였다.

Design And Implementation of Embedded System Board for Voice Processor Control (음성처리 IC 제적용 PIC 임베디드 시스템 설계 및 제작)

  • Hwang I. S.;Kong W. S.
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.123-126
    • /
    • 2000
  • 본 논문에서는 음성 신호 처리 IC를 제어하는 임베디드 시스템을 Micro-controller를 이용하여 설계하고 제어 프로그램을 구성/제작하여 기능을 분석한다. 선택한 음성처리용 IC 중에서 ISD2560은 내장된 EEPROM에, T6668은 외부에 D-RAM을 연결하여 음성 메시지를 저장하고 있다. PIC16F84는 음성데이터의 입출력과 저장과 재생, 초기화를 위한 회로의 동작과 순서 제어, 시작과 종료하는 메모리 번지의 생성과 같은 제어 프로그램을 수행한다.

  • PDF

Pitch Detection Using Wavelet Transform (웨이브렛 변환을 이용한 피치검출)

  • 손영호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1997.06a
    • /
    • pp.5-8
    • /
    • 1997
  • 음성신호는 성대를 통과한 공기 흐름의 성질에 따라 유성음과 무성음으로 구분될 수 있다. 그 중 유성음에서는 성대의 규칙적인 지동이 존재하게 된는 데 이때 성대가 닫히는 순간을 GCI(Glotal Closure Instant)라 하며 성대 진동의 기본주기를 피치라고 한다. 이러한 피치는 음성합성, 음성인식, 피치동기 음성신호의 분석등에 중요한 파라미터 중의 하나이다. 본 논문에서는 가우시안 함수의 일차미분형태를 갖는 웨이브렛 함수를 사용할 경우 신호의 급격한 변화부분을 검출할 수 있다는 성질을 이용하여 음성 신호의 GCI를 찾아내고 이를 이용하여 피치를 검출하였다.

  • PDF