• 제목/요약/키워드: 음성 특성

검색결과 1,834건 처리시간 0.035초

A Study on the Compensating System for the Acoustic Characteristics Caused by the Variation of Distance from Sound Source to Microphone (음원과 마이크로폰 사이의 거리변화에 의한 음향 특성 보정에 관한 연구)

  • Jeoung, Byung-Chul;Choe, Yoon-Sik
    • The Journal of the Acoustical Society of Korea
    • /
    • 제31권3호
    • /
    • pp.197-204
    • /
    • 2012
  • In this thesis, studied the method to minimize the changes in frequency response and level due to the variation of the distance from the source to the microphone. selecting three microphones (omni directional, cardioid, super cardioid) which are being used generally, frequency responses were measured in accordance with the distance changes. Gotten the difference from the reference as the result of measurement, changed responses for each frequency range were compensated in comparison of the original human vocal source. In low frequency range, the low frequency boost caused by the proximity effect and decrease in accordance with the distance were compensated. The variation in mid-frequency range is comparatively small, however since the mid-range is the most important part of the human vocal signal, were compensated the mid-frequency range in comparison of the reference. The human vocal signal variation in high frequency range is extremely small and the high frequency is compensated close to the original source without difficulty. Understanding the microphone characteristics and compensations, this study showed that the response can be maintain among the change of the distance from the source to the microphone.

Delay characteristics of speech packets in virtual cellular network(VCN) (가상 셀룰라 망(VCN)에서의 음성 패킷 지연 특성)

  • 정명순;김화종
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • 제23권9A호
    • /
    • pp.2305-2312
    • /
    • 1998
  • This paper analyzed the delay characteristics of speech packets in virtual cellular network(VCN). The probability distribution of packet delay is obtained using the markov chain model when periodic speech packets are transmitted by slotted-ALOHA protocol. The effects of probility of capture and retransmission policy on the performance were also analyzed. At first, the probability cumulative function of packet delay is calculated from the probability of capture as a function of location of mobile terminal. In order to investigate the effects of backoff delay, we defined a parameter NPr, where N is the period (frame size) of the speech packets and Pr is the retransmission probability for each speech packet. We also obtained the 1% outage delay for various frame size N.

  • PDF

Project Work and Asynchronous Voice Communication (프로젝트 작업과 비실시간 음성 커뮤니케이션)

  • Kim Min-Kyung;Kim Hee-Cheol
    • Journal of Korea Multimedia Society
    • /
    • 제9권5호
    • /
    • pp.681-690
    • /
    • 2006
  • With the rapid development of network and multimedia technologies, computer mediated communication has been realized and there has been a great potential to use and research on asynchronous voice communication systems. This paper reports a case study where 6 groups(3 for documentation work, 3 for software development) of 24 people who used voice mail when carrying out their projects. The purpose of this study is to obtain an overall understanding of usability of voice mail which is a typical example of asynchronous voice communication systems, under a particular situation where project works are performed. Through the study, we came to understand general purposes of usage of voice mail, patterns of using it revealed during the project process, different ways of using it according to different types of projects, and reasons why people are currently not likely to use voice mail. The results hopefully provide systems developers with a guideline to understand the nature of voice mail from users' perspectives.

  • PDF

구개수구개인두성형술 이후의 음성변화

  • 손영익;김선일;윤영선;이은경
    • Proceedings of the KSLP Conference
    • /
    • 대한음성언어의학회 1997년도 제8회 학술대회 심포지움
    • /
    • pp.259-259
    • /
    • 1997
  • 폐쇄성 수면무호흡의 치료를 목적으로 한 구개수구개인두성형술 이후의 음성변화 유무를 파악하여, 성악가 등의 전문적인 음성사용자에게 상기한 수술을 결정함에 있어서 가능한 guideline을 제시하여 보고자 하였다. 수면다원검사상 폐쇄성 수면무호흡증으로 진단된 성인남자 20명을 대상으로 수술전후의 음성변화에 대한 설문조사를 하였고, 수술전, 수술후 1개월에 각각 /아/, /이/, /우/ 모음의 제1, 2, 3 음향대를 비교하였으며, 표준 비음비율이 각기 다른 세가지 문장을 이용하여 수술전후의 비음비율의 변화를 측정하였다. 환자 자신은 수술전후의 음성이나 음색의 변화를 느낄 수 없었고, 비음비율의 변화나 모음의 음형대에 대부분은 변화가 없었지만, /우/ 음의 제3음형대 특성에 변화가 있음을 관찰하였고, 구인두가 중요한 역할을 담당할 수 있는 특정언어의 일부 발음이나 vibrato, singer's formant등의 변화유무에 대한 연구가 없는 점을 감안한다면, 성악가를 비롯한 전문적 음성사용자에?서는 구개수 구개인두성형수술을 결정함에 있어 신중을 기하여야 할 것으로 사료되었다.

  • PDF

Bimodal Speech Recognition Modeling Using Neural Networks (신경망을 이용한 이중모달 음성 인식 모델링)

  • 류정우;성지애;이순신;김명원
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.567-569
    • /
    • 2003
  • 최근 잡음환경에서 강인한 음성인식을 위해 음성 잡음에 영향을 받지 않은 영상정보를 이용한 이중모달 음성인식 연구가 활발히 진행되고 있다. 기존 음성인식기로 좋은 성능을 보이는 HMM은 이질적인 정보를 융합하는데 있어 많은 제약과 어려움을 가지고 있다. 하지만 신경망은 이질적인 정보를 효율적으로 융합할 수 있는 장점을 가지고 있으며 그에 대한 많은 연구가 수행되고 있다. 따라서 본 논문에서는 잡음환경에 강인한 이중모달 음성 인식 모델로 이중모달 신경망(BN-NN)을 제안한다. 이중모달 신경망은 특징융합 방법으로 음성정보와 영상정보를 융합하고 있으며. 입력정보의 특성을 고려하기 위해 윈도우와 중복영역의 개념을 적용하여 시제위치를 고려하도록 설계되어있다. 제안된 모델은 잡음환경에서 음성인식기와 성능을 비교하고, 화자독립 고립단어 인식에서 기존 융합방법인 CHMM과 비교하여 그 가능성을 확인한다.

  • PDF

Characteristics of Spoken Discourse Markers and their Application to Speech Synthesis Systems (담화표지의 음성언어적 특성과 음성합성 시스템에서의 활용)

  • Lee, Ho-Joon;Park, Jong C.
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.254-260
    • /
    • 2007
  • 음성은 컴퓨터로 대변되는 기계와 사람 그리고 기계를 매개로 한 사람과 사람의 상호작용에서 가장 쉽고 직관적인 인터페이스로 널리 활용되고 있다. 인간에게 음성정보를 제공하는 음성합성 분야에서는 합성결과의 자연스러움과 인식성이 시스템의 주요 평가요소로 활용되고 있는데 이러한 자연스러움과 인식성은 합성결과의 정확성뿐만 아니라 발화환경이나 발화자의 발화특징 혹은 감정상태 등에 의해 많은 영향을 받게 된다. 담화표지는 문장의 명제 내용에는 직접 관여하지 않으면서 화자의 발화 의도나 심리적 태도를 전달하는 구성 요소를 말하는데 본 논문에서는 담화표지가 포함된 대화 음성 데이터를 수집하여 담화표지의 음성언어적인 특징을 분석하고 분석된 결과를 음성합성 시스템에 활용하는 표현방식에 대해 논의한다.

  • PDF

Speech Enhancement for DMB Voice commander in Car environment (차량환경에서 DMB용 음성명령어기 사용을 위한 음성개선방법)

  • Beack Seung Kwon;Hahn Minsoo;Nam Seung Hyon;Kang Kyung Ook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.233-236
    • /
    • 2003
  • 본 논문에서는 차량용 음성명령어기의 사용을 위한 전처리 과정으로 음성개선 방법을 다룬다. 특히 DMB 사용환경에서 보다 주위 소음에 자유롭고 단말 조작에 있어 안정성을 보장하기 위하여 일반적 단인 마이크로폰으로 처리되는 잡음뿐만 아니라 음성명령어를 제외한 오디오 신호 등 비정적 통계적 특성을 갖는 소음들도 제거 될 수 있도록 음성개선 방법을 제안한다. 우리는 2개의 마이크로폰을 가지고 BSS 알고리즘을 적용하여 비정적 신호들을 분리하고, 분리된 신호에 대하여 Kalman Filter를 이용하여 시간상 단구간 정적 잡음을 제거한다. 본 논문의 인식 실험 결과를 통하여 공간적, 시간적 음성개선 방법이 순차적으로 적용될 때, 실제 차량 환경에서 음성 개선 알고리즘으로 적용될 수 있음을 보였다

  • PDF

Comparison of Speaker's Source Characteristics in Different Vowel Characteristics (모음에 따른 화자의 음원특성 비교)

  • 이후동;강선미;장문수;박한상
    • Proceedings of the KSLP Conference
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.240-240
    • /
    • 2003
  • 본 논문에서는 기존의 매개변수들과 달리 화자의 고유한 특성을 보여주는 화자인식 매개변수를 발성유형에서 찾고자 한다. 일반적으로 화자의 음원 특성이 발성 유형을 결정한다. 발성유형의 특성을 나타내는 매개변수로는 개방지수(open quotient)와 스펙트럼의 기울기 (spectral tilt)가 있으며, 스펙트럼의 기울기는 음향학적으로 그 특성을 측정할 수 있다. 그러나 기존의 측정방식은 사람마다 다른 기본 주파수와 모음의 영향을 전부 혹은 일부 배제하지 못하였다. (중략)

  • PDF