• 제목/요약/키워드: 음성 특성

검색결과 1,828건 처리시간 0.031초

전역 음성 부재 확률 기반의 향상된 최소값 제어 재귀평균기법을 이용한 음성 향상 기법 (Speech Enhancement Based on Improved Minima Controlled Recursive Averaging Incorporating GSAP)

  • 송지현;방동혁;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.104-111
    • /
    • 2012
  • 본 논문에서는 향상된 최소값 제어 재귀 평균 기법 (improved minima controlled recursive averaging, IMCRA) 알고리즘의 잡음 전력 추정성능을 향상 시키기 위한 알고리즘을 제안한다. 기존의 IMCRA은 주파수 특성이 빠르게 변화하는 비정상적인 환경과 낮은 SNR을 갖는 상황에서 잡음 전력 추정에 직접적으로 영향을 미치는 음성 검출기의 성능이 강인하지 못한 단점이 있다. 본 연구에서는 강인한 음성 검출 성능을 위해서 기존 IMCRA의 음성 검출기에 전역 음성 부재 확률을 적용한 음성 향상 기법을 제안한다. 제안된 알고리즘의 성능 평가는 음성의 perceptual evaluation of speech quality (PESQ)와 composite measure를 통한 음질을 평가하였다. 실험 결과 다양한 잡음 환경 (car, white, babble)에서 전역 음성 부재 확률을 적용한 IMCRA의 음성 향상 기법이 향상된 결과를 보여주었다. 특히, 비정상잡음 환경인 babble 5dB에서 PESQ 0.026, composite measure 0.029의 향상된 음질을 나타내었다.

추체외로 증상에 따른 항정신병 약물 복용량과 음성 특성의 상관관계 분석 (Correlation analysis of antipsychotic dose and speech characteristics according to extrapyramidal symptoms)

  • 이수빈;김서영;김혜윤;김의태;유경상;이호영;이교구
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.367-374
    • /
    • 2022
  • 본 논문은 항정신병 약물의 복용량에 따른 음성 특징의 상관관계 분석을 수행하였다. 항정신병 약물의 대표적 부작용 중 하나인 추체외로 증상(ExtraPyramidal Symptoms, EPS) 발생에 따른 음성 특징의 패턴을 알아보기 위하여, 문장 개발을 통해 한국어 기반 추체외로 증상 음성 코퍼스를 구축하였다. 수집된 자료는 추체외로 증상 군과 비 추체외로 증상 군으로 나누어 음성 특징 패턴을 조사하였으며, 특히 추체외로 증상 군의 높은 음성 특징 상관관계를 보였다. 또한, 발화 문장의 종류가 음성 특징 패턴에 영향을 미친다는 것을 확인할 수 있었으며, 이를 통해 음성 특징을 기반한 추체외로 증상의 조기 발견 가능성을 기대해볼 수 있었다.

가치-태도-행동 모델에 기반한 음성 쇼핑 지속이용의도에 관한 연구 (Continuance Use Intention of Voice Commerce Using the Value-attitude-behavior Model)

  • 김효정
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.491-502
    • /
    • 2022
  • 인간과 정보기기간 대화를 통해 물품을 구매하는 음성 쇼핑에 대한 관심이 증가하고 있다. 본 연구는 가치-태도-행동 모델을 활용하여 음성 쇼핑 지속이용의도에 미치는 영향 요인들을 살펴보았다. 인공지능 비서를 이용해 음성 쇼핑을 이용하고 있는 20-40대 소비자들을 대상으로 온라인 조사를 실시하였고, 총 360명의 응답 자료가 분석에 사용되었다. 데이터 분석을 위해 SPSS 25.0과 Amos 23.0 프로그램을 이용하였고, 기술통계분석, 확인적요인분석, 그리고 구조모형분석을 실시하였다. 본 연구의 결과는 다음과 같이 요약될 수 있다. 첫째, 기능적 가치가 음성 쇼핑에 대한 만족도에 가장 많은 영향을 미치는 것으로 확인되었다. 둘째, 사회적 가치, 감성적 가치, 그리고 진귀적 가치가 음성 쇼핑에 대한 만족도에 정(+)적인 영향을 미치는 것으로 확인되었다. 셋째, 음성 쇼핑의 만족도가 지속이용의도에 정(+)적인 영향을 미치는 것으로 확인되었다. 본 연구의 결과는 음성 쇼핑 이용자들에 대한 특성을 파악하고, 음성 쇼핑에서 추구되는 다양한 가치를 이해하는데 기여할 수 있을 것이다.

국어 분절음 특성에 맞는 음성 데이터 베이스의 모형 (A Model of Speech Database in Korean in consideration of its segmental phonology)

  • 김종미
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.297-302
    • /
    • 1994
  • 본 논문에서는 국어 분절음 특성에 맞는 음성 데이터베이스의 모형을 제시하고자 한다. 음성 데이터 베이스는 1) 각 음의 고유음가정보, 2) 인접음 정보, 3) 빈도수에 따른 확률정보를 포함해야 한다. 이 요건을 충족시키기 위해 본 모형은 1) 음운 단위별로 Labeling 하여, 고유음과 인접음 정보를 편집하고, 2) 음운 규칙과 제약정보에 의해 Phoneme Balanced Words를 작성하여, 허용되는 인접음을 취하고, 허용되지 않는 인접음을 탈락시키며 3) 시스템 평가시, 빈도수가 shb은 음과 음소열의 우선적인 인식 및 합성을 우월하게 평가한다는 고정서, 4) 데이터 집적시, 데이터의 음운기능의 중복과 편중을 피함으로서 데이터량을 간소화할 수 있다는 경제성을 들 수 있다.

  • PDF

스테레오 음향 반향 제거를 위한 적응 알고리즘 (A New Adaptive Algorithm for Stereophonic Acoustic Echo Cancellation)

  • 정양원;이지하;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.11-14
    • /
    • 2000
  • 현장감 있는 원거리 회의를 위해서는 두 채널 이상의 신호를 전송하는 스테레오 시스템이 필요하다. 이러한 원거리 회의 시스템의 경우 스피커와 마이크로폰간의 커플링에 의해 발생하는 음향 반향을 제거하기 위해 스테레오 음향 반향 제거기가 요구된다. 본 논문에서는 스테레오 음향 반향제거기의 성능을 효과적으로 개선하기 위하여 인간의 청각 특성과 음성 신호 특성을 이용한 전처리단을 제안한다 제안한 전처리단은 마스킹 현상을 이용하여 청각적으로 인지할 수 없는 크기의 부가 잡음을 음성 신호 분석을 통해 발생시켜 원 신호에 더해줌으로 두 채널 신호의 상호 상관 관계를 낮추어 준다. 또한 본 논문에서는 적응 반향 제거 알고리즘인 Affine Projection(AP) 알고리즘이 Cram-Schmidt(GS) 직교화 과정을 통한 벡터 연산으로 갱신될 수 있음을 이용하여, 별도의 음성 분석 과정 없이 AP알고리즘의 GS 직교화단으로 제안한 전처리단을 구현할 수 있음을 보이고, 최종적으로 전처리단과 적응 알고리즘이 결합된 스테레오 음향반향 제거를 위한 적응 알고리즘을 제안한다.

  • PDF

3세대망에서의 무선자원관리 알고리즘 (A Radio Resource Management Algorithm in The Third Generation Network)

  • 서정현;김상하
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.106-108
    • /
    • 2002
  • 지금까지의 우선이동통신에서는 주로 음성서비스를 제공하였으나 사용자들의 요구에 의해 음성서비스뿐만 아니라 점차 다양한 패킷서비스도 제공하고 있다. 일정한 자원을 사용하는 음성서비스와는 달리 패킷서비스는 서비스 타입이나 시간에 따라 자원요구량이 달라지는 특성을 지닌다. 따라서 서비스 질이 보장되는 패킷서비스를 제공하기 위해서는 자원요구량이 급변하는 패킷서비스의 특성을 잘 반영하는 무선자원 관리 메커니즘이 필요하다. 현재 패킷서비스를 제공하기 위해 개발된 UMTS망의 표준문서인 3GPP문서에는 무선자원관리를 위한 기본적인 신호체계만이 정의되어 있을뿐 자세한 알고리즘은 각 벤더들에게 일임하고 있다. 또한 여러 단말에서의 자원경쟁시 자원할당을 중재해 줄 수 있는 알고리즘은 정의되어 있지 않다. 본 논문에서는 무선자원을 공용자원과 전용자원으로 구분하고 단말의 서비스 요청시 전송하는 QoS Profile을 통해 우선순위와 초기 자원을 할당한다. 우선순위가 높은 서비스는 낮은 우선순위 서비스의 자원을 일정량 선정할 수 있게 하였다. 이렇게 함으로써 사용자가 요구하는 서비스 질을 만족시키는 동시에 가능한한 많은 패킷서비스를 받아들일 수 있는 무선자원관리 알고리즘을 제안한다.

  • PDF

기저함수의 가중합을 이용한 음원의 모델링 (Voice Source Modeling Using Weighted Sum-of-Basis-Functions Model)

  • 강상기
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.171-174
    • /
    • 1998
  • 본 논문에서는 음성합성(speech synthesis) 및 부호화(coding) 시스템에 있어서 음원(voice source) 모델링에 관한 문제를 살펴보고자 한다. 기존의 음원 모델링 시스템이 가지고 있는 여러 문제들을 극복하고자 기저함수(basis function) 의 가중 합(weighted-sum)으로 음원을 모델링 하는 새로운 기법을 제안하고자 한다. 제안한 방법에서는 음원 파형(voice source waveform)을 적절히 표현하기 위해서 필터뱅크(filter bank)에 기초한 기저함수의 가중 합으로 나타낸다. 다양한 음원 특성을 효과적으로 나타내는 음원 파라미터를 구하기 위하여 EM(estimate maximize)에 기초한 구조에 관해 조사한다. 제안한 방법을 이용하여 다양한 유성음에 대해 실험을 수행하였다. 실험결과 제안한 추정(estimation) 방법 및 모델링 방법을 이용하면 기존의 방법에 비해 더 정확한 음원 파형을 추정할 수 있고, 다양한 음원 특성을 나타낼 수 있다. 또한 음성합성 및 부호화에서도 음성품질(voice quality)를 개선시킬 수 있으리라 기대된다.

  • PDF

상태의존 소스 양자화에 기반한 음성인식을 위한 은닉 마르코프 모델 파라미터의 견고한 추정 (Robust estimation of HMM parameters Based on the State-Dependent Source-Quantization for Speech Recognition)

  • 최환진;박재득
    • 한국음향학회지
    • /
    • 제17권1호
    • /
    • pp.66-75
    • /
    • 1998
  • 최근 음성인식을 위한 대표적인 방법으로써 은닉 마르코프 모델이 사용되고 있으며, 이러한 방법은 음성의 특성을 잘 표현하도록 하는 음향적인 모델링 방법에 따라서 성능이 좌우된다. 본 논문에서는 상태에서의 출력확률은 견고히 추정하기 위한 방법으로 상태에서 의 출력활률을 소스들의 분포와 그들의 빈도로 가중한 출력분포로 표시하는 상태 의존 소스 양자화 모델링 방법을 제안한다. 이 방법은 한 상태 내에서 특징 파라미터들이 유사한 특성 을 가지며, 그들의 변이가 다른 상태에 있는 특징 파라미터들에 비해서 작다는 사실에 기반 한다. 실험결과에 의하면, 제안된 방법이 기존의 baseline시스템보다 단어 인식율의 경우는 2.7%, 문장 인식율의 경우 3.6%의 향상을 보였다. 이러한 결과로부터 제안된 SDSQ-DHMM이 인식율 향상면에서 유효하며, HMM에 있어서 상태별 출력확률의 견고한 추정을 위한 대안으로 사용될 수 있을 것으로 판단된다.

  • PDF

목소리 특성과 음성 특징 파라미터의 상관관계와 SVM을 이용한 특성 분류 모델링 (Correlation analysis of voice characteristics and speech feature parameters, and classification modeling using SVM algorithm)

  • 박태성;권철홍
    • 말소리와 음성과학
    • /
    • 제9권4호
    • /
    • pp.91-97
    • /
    • 2017
  • This study categorizes several voice characteristics by subjective listening assessment, and investigates correlation between voice characteristics and speech feature parameters. A model was developed to classify voice characteristics into the defined categories using SVM algorithm. To do this, we extracted various speech feature parameters from speech database for men in their 20s, and derived statistically significant parameters correlated with voice characteristics through ANOVA analysis. Then, these derived parameters were applied to the proposed SVM model. The experimental results showed that it is possible to obtain some speech feature parameters significantly correlated with the voice characteristics, and that the proposed model achieves the classification accuracies of 88.5% on average.

전력선과 조명등을 이용한 음향신호 전달 (Sound Transimitting System using Power Line and Lamp)

  • 주경돈;강민우;구경완;이승권;이명섭
    • 한국전기전자재료학회:학술대회논문집
    • /
    • 한국전기전자재료학회 2002년도 춘계학술대회 논문집 유기절연재료 전자세라믹 방전플라즈마 일렉트렛트 및 응용기술
    • /
    • pp.237-241
    • /
    • 2002
  • 전력선과 조명등을 이용한 음향전달 시스템을 구성하여 어학실습 교육용으로의 활용 가능성을 평가하였다. 음성신호를 변조하여 전력선에 실어 보내는 송신기와 조명등의 빛으로부터 음성신호를 검출하여 이어폰 또는 헤드폰 둥으로 들을 수 있는 수신기로 구성하였다. 제작한 송신기와 수신기의 주파수 특성과 스펙트럼분석을 하였다. 스피커로 출력되는 음질상태는 최적상태는 아니지만 음성이나 노래 등을 이용한 어학실습 교육용으로는 충분한 수준이 었다.

  • PDF