• Title/Summary/Keyword: 음성 특성

Search Result 1,835, Processing Time 0.032 seconds

Design of Customized lighting control system based on Speech recognition (음성 인식 기반 사용자 맞춤형 조명 제어 시스템 설계)

  • Lim, Mun-Taek;Oh, Seung-Taek;Lim, Jae-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.04a
    • /
    • pp.1166-1168
    • /
    • 2017
  • 기존의 조명제어는 주로 밝기의 제어를 목적으로 하였으나 최근에는 스마트폰을 이용하거나 스마트 홈 디바이스를 이용하는 등 다양한 방법으로 조도 및 색온도를 사용자가 직접 조작할 수 있는 형태로 발전하고 있다. 또한 사용자의 감성이나 능률에도 영향을 미칠 수 있는 조명 시스템에 대한 연구도 활발히 진행되고 있다. 그러나 기존의 조명 제어 서비스는 조명의 색과 밝기 제어가 가능하지만 현재의 조명 환경에 대한 적합 여부는 고려되지 않는 경우가 많았다. 본 논문에서는 스마트폰을 이용한 음성 인식 기반의 사용자 맞춤형 조명제어 시스템을 제안한다. 제안 시스템은 사용자가 제공받고 있는 조명의 특성을 스마트폰을 통해 계측하여 확인하고 스마트폰 어플리케이션 기반의 제어 또는 음성인식 기반의 제어를 통해 사용자 맞춤형 조명 서비스를 제공한다.

Optimization of Critical Band Filter for Improving Performance of Mel-cepstrum (멜켑스트럼의 성능 향상을 위한 critical band 필터의 최적화)

  • 현동훈
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.403.1-406
    • /
    • 1998
  • 현재 음성 인식에서 널리 사용되고 있는 피춰 중의 하나로 멜켑스트럼을 들 수 있다. 멜켑스트럼은 인간의 청각 특성을 적용한 critical band 필터를 사용하여 구하는데, 필터의 형태를 다양하게 적용하여 같은 음성에 대해서 여러 가지의 멜켑스트럼을 구할 수 있다. 본 논문에서는 critical band 필터의 형태, 즉 필터의 모양, 인접한 필터간의 중심 주파수 간격, 그리고 필터의 대역폭을 각각 변화시키면서 멜켑스트럼을 구하여 음성 인식 성능에 미치는 영향을 분석하였다. 또한 최적의 인식 성능을 나타내는 멜켑스트럼을 구하기 위하여 simplex 기법을 사용하여 필터를 최적화하는 방법을 제안한다. DTW(dynamic time warping)를 인식 알고리즘으로 사용하였고 한국어 숫자음을 사용하여 인식 실험을 수행한 결과, 제안된 방법으로 최적화된 필터를 사용하여 구한 멜켑스트럼은 기존의 critical band 필터를 사용하는 것보다 향상된 인식 성능을 나타내었다.

  • PDF

Localization of Multiple Speakers Using Microphone Array System (마이크로폰 어레이 시스템을 이용한 다화자 방향검지)

  • Hung, Vu Viet;Lee, Chang-Hoon
    • The Journal of Engineering Research
    • /
    • v.8 no.1
    • /
    • pp.59-65
    • /
    • 2006
  • 본 논문에서는 마이크로폰 어레이 시스템을 이용하여 여러 화자의 음성 정보로부터 각 화자가 위치한 방향을 추정하는 기술 개발 내용을 다룬다. 성능 향상을 위한 전처리 과정으로 비선형 증폭기를 사용하여 거리에 따른 영향을 최소화하는 과정과 잡음에 대한 강인성을 얻기 위해 음성활성 영역을 검출하는 과정을 포함한다. 등간격으로 배치된 마이크로폰 어레이 시스템의 기하학적 특성에 따른 음원의 위치와 신호의 지연시간차이와의 상관관계로부터 화자의 위치를 역으로 추정하는 알고리즘을 기본으로 하여 가능성 척도를 계산하고 이를 활용하여 가능성이 높은 것들을 클러스터링하여 가능성이 있는 후보를 선정하여 화자의 방향을 검지한다. 이 과정에서 오인식을 최소화하기 위하여 가능성이 희박한 영역에 대한 추정 억제 방법으로 부정식 추론법을 적용하였다. 2 화자의 음성 신호를 입력으로 한 실험을 통하여 제안한 방법에 의한 다화자 방향검지의 가능성을 알아보았다.

  • PDF

A Study on Characteristics of Children's Voice Preference from Different Pitch (음도 차이에 따른 아동의 선호 음성 특성 연구)

  • Ham, Eun-Seon;Lim, Kyung-Suk;Yi, So-Hee;Kim, Ha-Kyung
    • Speech Sciences
    • /
    • v.15 no.3
    • /
    • pp.175-181
    • /
    • 2008
  • The aim of this study was to survey 'voice preference' of children from among three voice pitches, which are high-pitch, mid-pitch and low pitch, and understand acoustic characteristics of the best voice chosen. To record distinctive pitches, Dr. Speech(ver. 4.0 Tiger Electronics) was used and we analyzed their choices. Also, we measured subglottal air pressure in aerodynamic analyze and phonatory aerodynamic system(Model 6600, KAY) was used. As a result children preferred to the low-pitch yet there was not any difference by sex. We fined them to prefer higher HNR voice to lower jitter and shimmer voice rate.

  • PDF

A Single-Channel Speech Dereverberation Method Using Sparse Prior Imposition in Reverberation Filter Estimation (반향 필터 추정에서 성김 특성을 이용한 단일채널 음성반향제거 방법)

  • Zee, Min-Seon;Park, Hyung-Min
    • Phonetics and Speech Sciences
    • /
    • v.5 no.4
    • /
    • pp.227-232
    • /
    • 2013
  • Since a reverberation filter is generally much shorter than the corresponding dereverberation filter, a single-channel speech dereverberation method based on reverberation filter estimation has been developed to improve its performance. Unfortunately, a typical reverberation filter still requires too many coefficients to be accurately estimated using limited speech observations. In order to exploit sparseness of reverberation filter coefficients, in this paper, we present an algorithm to impose a sparse prior to the process of reverberation filter estimation. Simulation results demonstrate that the sparse prior imposition further improves performance of the speech dereverberation method based on reverberation filter estimation.

A Study On Voice and Articulation in Children with Hearing Impairment (청각장애아동의 음성 및 조음 특성 연구)

  • Park HeeJung;Chae JungHee;Park Hyun;Shin HyeJung;Seok DongIl
    • Proceedings of the KSPS conference
    • /
    • 2003.10a
    • /
    • pp.129-132
    • /
    • 2003
  • The purpose of this study was to investigate the fundamental frequency(Fo) of voice signal, the first to the third(F1-F3), and duration in children with hearing impairment. Each subject made a recording of sustained /i/ and /a/, four VbV as and four VsV. The Praat 4.1.6. was used for analysis. The results of this study were as follows: First, F0 of children with hearing impairment were higher than normal children. Second, /a/ vowel was showed that F1, F2 and duration were higher than normal children. Third, /i/ vowel was showed that F1 and duration were higher than normal children. However, F2 was lower than normal children. Therapeutic implications have been drawn.

  • PDF

A Comparison fo Formant frequency of Vowels Produed by Cochlear Implanted and Normal-Hearing Children (인공와우이식을 받은 아동과 건청 아동이 산출한 단모음의 음향음성학적 특성)

  • Lee, Joo-Eun;Yi, Bong-Won
    • Proceedings of the KSPS conference
    • /
    • 2007.05a
    • /
    • pp.64-66
    • /
    • 2007
  • The purpose of this study was to compare and analyze some acoustic parameters of the cochlear implanted children(N=20, aged 3-10) and to suggest a basic data on speech rehabilitaion for the cochlear implanted children. Acoustic analyses of seven Korean monophthongs produced by 4 contexts(V, CV, VC, CVC) were conducted for the cochler implanted children and normal hearing children(N=20, aged 3-10). Subjects were asked to pronounce a list of vowel repeating three times. The results of this study are the same as follows: First, in the case of the cochlear implanted group, there were no significant differences in F1 and F2. Second, in the case of the normal hearing group, there were significant differences in F2 /ㅜ/ between V and CVC, between VC and CVC. Third, there were significant differences in F1, F2 between CI group and normal hearing group.

  • PDF

A Study on Improvement of Bit Rate using Duration Control of Speech in G.723.1 Vocoder (Duration Control 의한 G.723.1 보코더 전송률 개선에 관한 연구)

  • 장경아;유영민;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2475-2478
    • /
    • 2003
  • CELP계열의 부호화기인 G.723.1 5.3kbps ACELP를 기반으로 하여 음질을 유지하면서 전송률을 낮출 수 있는 새로운 부호화 방법을 제안한다. 본 논문에서 적용한 부호화 방법은 음성 합성시 파라미터로 사용되는 지속시간 변경에 의해 CELP형 보코더의 전송률을 감소하고자 한다. 먼저 음성을 보코더 입력단에 입력하기 전 지속시간을 FFT 변환 특성을 이용해 음색의 변경 없이 지속시간을 줄임으써 계산시간을 줄이고 진폭과 위상 각각 1/2ⁿ배의 interpolation과 Decimation을 수행하여 부호화한다. 이렇게 부호화된 데이터는 G.723.1 복호화를 거치고, 다시 FFT point의 1/2ⁿ배 point로 IFFT과정을 수행함으로써 스팩트럼의 변경 없이 지속시간을 변경하여 원 음성을 합성하게 된다. G.723.1 보코더를 통과한 후 파형을 복원 실험한 결과 기존의 5.3kbps ACELP보다 46%정도 감소하였다.

  • PDF

A Study on Reduction of the Processing time of Speaker Recognition using the PSOLA Method (PSOLA 방식을 이용한 화자인식 시스템의 처리시간 단축에 관한 연구)

  • 박현영;서지호;배명진
    • Proceedings of the IEEK Conference
    • /
    • 2003.07e
    • /
    • pp.2447-2450
    • /
    • 2003
  • 화자인식은 음성의 특성을 이용해서 화자의 신원을 확인하는 기술이다. 이러한 기술은 등록된 화자집단 중 화자를 식별하는 화자식별(speaker Identification)과 지금 발성한 화자만을 비교하여 확인하는 화자확인(speaker verification)이 있다. 이러한 화자인식은 음성에 내재되어 있는 화자정보를 추출하여 개인을 확인하는 기술로 전화망을 통한 서비스가 확산되어 가고 있는 현대사회에 가장 효과적인 기술 중 하나이다. 또한 PDA를 이용한 증건거래 시스템 등 현대사회에서는 실시간으로 화자인식이 이루어져야 한다. 본 논문에서는 이와 같이 실시간 화자인식을 위한 처리시간 단축에 관하여 연구하였다. 처리시간 단축을 위하여 우선 피치주기 단위로 음성 파형을 분해한 다음 분해된 피치 단위에 윈도우 함수를 곱해서 단구간 신호의 열로 만들고 분해된 단위를 조절하는 PSOLA 합성방식을 이용하여 인식 시스템의 전처리단을 재구성하였다. 이와 같은 방식으로 제안한 인식시스템의 처리시간, 인식률을 기존의 화자인식 시스템과 비교하였다.

  • PDF

WLL 시장전망 및 국내 표준화 전망

  • 이병철;이상호;김영환
    • TTA Journal
    • /
    • s.62
    • /
    • pp.78-94
    • /
    • 1999
  • 본고는 `99 하반기 시범 서비스를 눈앞에 둔 WLL 시장전망 및 표준화 동향 소개를 목적으로 하였다. 기존의 음성/동회선으로 표현되는 가입자망(Access Network)은 유선망 제공 서비스의 무선망에서의 요구, 데이터 트래픽의 음성 트래픽 추월, 그리고 음성과 데이터 통합 서비스 요구 등 다양한 사용자 요구에 대응하기 위하여 새로운 전환기를 맞이하게 되었다. 그러므로 이와 같은 가입자망 진화 추세에 부응하고 가입자망의 경쟁을 도입하기 위한 정책으로 WLL(Wireless Local Loop)이라는 기술이 대안으로 고려되어지고 있다. 이 기술은 선진국에서는 신규사업자의 우회회선으로, 개발도상국에서는 POTS용으로 필요성이 대두되고 있으나 경제성 여부는 찬반이 일고 있다. 따라서, 본 논고는 ITU/AMD 조사에 기반하여 WLL 시장전망 및 경제성에 관하여 살펴본 후, 엔지니어링 입장에서 구현 기술 및 시스템 특성에 관한 표준화 동향을 소개하였다.

  • PDF