통합 검색 | Korea Science

좌-우향 은닉 마코프 모델에서 상태결정을 이용한 음질향상 (Efficient Speech Enhancement based on left-right HMM with State Sequence Decision Using LRT)

이기용
- 한국음향학회지
- /
- 제23권1호
- /
- pp.47-53
- /
- 2004
본 논문에서는 좌-우향은닉 마코프 모델 (Left-Right Hidden Markov Model)에서 상태결정을 갖는 음성향상방법을 제안하였다. 은닉 마코프 모델에 기초를 둔 음질향상 방법은 성능은 우수하나, 모든 상태에 대해서 음질향상 알고리즘을 계산하므로, 계산량이 많고, 메모리가 많이 필요하여 실시간 처리에 부적절하다. 좌-우향 은닉 마코프 모델은 마코프 모델을 좌측에서 우측으로의 전이만 허용하는 모델로 단순화시켜 현재 상태에서 현재 상태나 다음 상태로 전이될 수 있는 특성을 가지고 있다. 본 논문에서는, 좌-우향 은닉 마코프 모델에서 유사도비 테스트 (Log-Likelihood Ratio Test)를 이용하여 현재 음성의 상태를 결정하는 알고리즘을 제안하였다. 현재 음성의 상태를 알고 있다면, 현재 상태에 대해서만 음질향상 알고리즘을 계산하므로, 계산량이 줄어든다. 제안된 방법의 성능 평가를 위하여 음질 향상 시간과 신호 대 잡음비를 비교하였다. 제안된 방법은 기존의 방법에 비해 음질향상의 결과는 약 0.2∼0.4 dB 정도 떨어졌지만, 계산량을 많이 줄일 수 있었다.
PDF KSCI

시간영역에서의 파형분석에 의한 무제한 어휘 합성 및 음절 유형별 규칙합성음 음질평가 (Speech Synthesis for the Korean large Vocabulary Through the Waveform Analysis in Time Domains and Evauation of Synthesized Speech Quality)

강찬희;진용옥
- 한국음향학회지
- /
- 제13권1호
- /
- pp.71-83
- /
- 1994
본 논문은 한국어 문어면환(TTS : Text-to-Speech) 시스템내에서의 음성합성시 음질 및 자연성 개선을 위한 연구 결과이다. 합성방법으로는 단음절단위의 파형을 시간영역에서 분석(표1)하여 규칙합성에 필요한 매개변수(표2)를 추출하여 규칙합성시켰다. 실험에 사용된 음절은 한국어 발음 대사전의 빈도순위에 따라 V형 19개, CV형 80개, VC형 30개, CVC형 100개등 총 229음절을 선정하여 규칙합성시켰다. 규칙합성음의 평가방법으로는 229개의 규칙합성음중 음절 유형별로 15개씩 무작위로 추출한 합성음을 사전지식이 없는 임의의 그룹을 선정하여 이해도, 명료도, 잡음감, 자연성등 4가지 항목에 대하여 주관적인 오피니온 평가를 수행하였다. 실험결과, 합성음의 음질은 대단히 명료한 수준이었으며, 운율요소의 제어결과는 지속시간(장단)과 악센트(강약)의 제어(그림 9, 그림 10)가 가능하였으며, 피치주기(억양)의 제어도 Lagrange 보간법을 사용함으로써 가능하였다(그림 11, 그림 12).
PDF

헤드폰 및 이어폰의 데이터 측정 및 객관적 음질 평가 방법 (The Measurement Method and The Sound Quality Evaluation of Headphones and Earphones)

성호영;김종배;이준현;장성철
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
- /
- pp.505-506
- /
- 2004
이어폰과 헤드폰의 성능 향상을 위해서는 특성에 대한 정확한 측정과 평가가 요구된다. 이어폰과 헤드폰은 room 과 같은 acoustic channel 을 거치지 않고 청취자의 귀에 직접 소리가 전달되며 ear canal 특성이 포함되기 때문에 스피커와는 다른 기준이 필요하다. 그러나 사람 귀의 canal 특성은 개인에 따른 편차가 심하여 정확한 측정 및 성능 평가에 어려움이 따른다. 본 논문에서는 이어폰과 헤드폰의 특성을 측정하는 적절한 방법을 고찰하고 측정된 데이터를 이용하여 음질 성능을 평가할 수 있는 객관적인 방법을 제시하고자 한다.
PDF

초고선명 디지털 TV 를 위한 차세대 라우드스피커 레이아웃 (Next-generation loudspeaker layout for Ultra High Definition (UHD) Digital TV)

이영우;김선민
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2011년도 하계학술대회
- /
- pp.57-60
- /
- 2011
본 논문에서는 초고선명 디지털 TV 를 위한 차세대 멀티채널 사운드 시스템의 최적의 라우드스피커 레이아웃을 도출하기 위해 다양한 라우드스피커 배치 환경에서 인지 관점의 오디오 음질 주관평가를 실시하였다. NHK 22.2 채널 시스템, ITU-R BS.775-2 표준의 7.1 채널 시스템과, 실감 음향에 가장 중요한 역할을 하는 Top Layer 라우드스피커에 중점을 두고 다양한 신규 레이아웃 구성들을 비교하였으며, 스튜디오에서 믹싱된 컨텐츠와 B-format 레코딩을 멀티채널로 생성한 컨텐츠를 이용하여 주관 평가를 실시하였다. 주관 평가 결과, Top Layer 에 3 개의 라우드스피커를 가지는 10.2 채널 라우드스피커 레이아웃이 평가에서 사용된 전체적인 오디오 음질의 등급에서 NHK 22.2 채널 시스템과 차이를 인지하기 어렵다는 결과를 도출하였다.
PDF

초고속 네트워크 상에서의 스트림형 트래픽의 전송 품질 평가 (Evaluation of Transmission Quality for Stream-type traffics on Very High-speed Network)

이양민;이재기
- 정보처리학회논문지C
- /
- 제11C권6호
- /
- pp.773-780
- /
- 2004
본 논문에서는 대표적인 스트림형 트래픽인 DV와 MPEG2를 초고속 네트워크 상에서 전송하고 이들 스트림에 대한 최종 사용자의 주관적 평가를 수행하였다. 두 가지 스트림형 데이터에 대해 화질 측정은 ITU-R BT.500-1을 기반으로 하여 측정하였고, 음질 측정은 ITU-R BS.1116-1을 기반으로 측정하였다. 또한 최종 사용자의 주관적 평가를 얻기 위한 실험 방법으로는 DSCQS 5단계 평가 방법을 채택하였다. 유사한 조건하에서 MPEG2 스트림의 경우, 네트워크 트래픽 파라미터가 급증하는 $54\%$의 부하율에서 화질과 음질의 평가 등급이 급격히 하강한다. DV의 경우 화질은 MPEG2와 마찬가지로 $54\%$의 부하율에서 평가 등급이 하락하지만 그 변화의 정도가 MPEG2에 비해 완만하며 점진적인 것을 확인할 수 있다. 반면 DV 음질의 경우는 부하율 $70\%$까지 사용자의 주관적 평가 등급이 우수하여 사용자의 주관적 평가를 고려한 트래픽 제어 및 QoS 제어가 요구된다. 결론적으로 MPEG2의 경우는 네트워크 상의 실측값과 최종 사용자의 주관적 평가가 거의 동일하므로, 네트워크 실측값만으로 트래픽 제어가 가능하고, DV의 경우는 네트워크 상의 실측값과 최종 사용자의 주관적 평가 등급을 동시에 고려한 트래픽 제어가 가능하다.
https://doi.org/10.3745/KIPSTC.2004.11C.6.773 인용 PDF KSCI

직교배열법을 이용한 차량 음향 시스템의 음질평가 (An Assessment on the Sound Quality of the Car Audio System Using the Orthogonal Designs)

두세진;최경미
- 한국음향학회지
- /
- 제27권5호
- /
- pp.229-238
- /
- 2008
음향 튜닝 과정을 통하여 카오디오의 음질은 개선되며 완성차의 품질 또한 향상된다. 하지만 소비자를 대상으로 한 선호도 조사 없이 소비자가 만족하도록 카오디오를 튜닝하는 것은 쉽지 않은 일이다. 소비자의 기호를 조사하기 위하여 주파수 특성, 밸런스, 공간감 등과 같은 매우 다양한 음향특성을 조사해야 하지만, 조사할 음향특성 항목이 많아질수록 비교 청취해야 하는 음원의 수가 급격히 증가하므로 여러 가지 문제점이 발행한다. 평가자의 피로도 증가로 인하여 실험이 어려워질 뿐 아니라, 개개의 음향특성과 전체의 음질의 연관성을 파악하는 것 또한 쉽지 않다. 본 연구에서는 음질 선호도를 조사할 때에 비교 청취되는 음원의 수를 크게 줄일 수 있도록 통계적 직교배열법을 사용하였으며, 분산분석법을 이용하여 청취실험 자료를 분석하였다. 특히, 직교배열법을 사용하여 여덟 가지 음향특성들의 256 가지 조합으로 이루어진 음향 환경을 16가지 비교음원을 사용하여 재생하였다. 분산분석 결과, 팝 음원의 경우에는 Treble이 일반적으로 재생된 음향의 음질 선호도에 가장 유의한 영향을 미치는 음향특성임을 밝혔다. 그 밖에도 Deep Bass와 SAD 및 Treble과 SAD의 교호작용 등이 유의한 음향특성으로 나타났다. 클래식 음원의 경우에는 SAD가 유일하게 유의하게 나타났다.
https://doi.org/10.7776/ASK.2008.27.5.229 인용 PDF KSCI

차수 스펙트럼 변화를 통한 차실내부 음질 향상 (Sound Quality Improvement of Car Interior Noise Through the Change of Order Spectrum)

신성환
- 한국음향학회지
- /
- 제32권4호
- /
- pp.329-334
- /
- 2013
자동차 엔진을 포함한 구동계 및 흡배기계 소음의 특징은 차수 스펙트럼(order spectrum) 분석으로 파악할 수 있다. 기존의 선행 연구에서는 엔진의 1차 및 2차 점화주파수(firing frequency)와 관련된 차수성분이 차실내부 소음에 주요한 영향을 미치는 것으로 알려져 있다. 본 연구에서는 차수스펙트럼의 변환에 따른 차실내부 소음의 음질(쾌적감) 차이를 파악하고자 한다. 이를 위하여 6실린더 및 4실린더 가솔린 엔진을 가진 승용차의 차실 내부 소음을 측정하고, 이 소음에 적응형 디지털 필터(adaptive digital filter)를 적용하여 차수레벨을 가감하는 방법으로 수정한다. 쌍비교법을 이용한 청음실험을 통하여 원음 및 편집음의 음질 정도를 평가하고, 음질 향상을 위한 차수스펙트럼 변화 방향을 제시한다. 결과적으로 반-차수(half-order) 성분의 차수레벨 감소가 차실내부 소음의 쾌적감 향상에 영향을 주는 반면, 점화차수 레벨의 감소가 항상 음질에 긍정적인 영향을 주는 것은 아님을 파악하였다.
https://doi.org/10.7776/ASK.2013.32.4.329 인용 PDF KSCI

EVRC의 고정 코드북 탐색 과정에서의 계산량 감소 알고리듬 (A Complexity Reductio Algorithm for Fixed Codebook Search in EVRC)

정성교
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
- /
- pp.169-173
- /
- 1998
최근 우리 나라 CDMA 디지털 셀룰라 시스템에서 채택한 EVRC 의 고정 코드북 탐색 과정에서의 계산량 감소 알고리듬을 제안한다. 고정 코드북 탐색 과정에서 펄스 위치에 제한을 두어 기존의 방법보다 가능한 펄스 위치의 조합을 줄인다. 또한 ETIR 방법을 적용하여 고정 코드북 연산량을 개선시킨다. 주/객관적 음질 평가 방법을 수행한 결과, 제안된 방법이 기존의 방법에 비해 음질의 저하가 없음을 확인하였다.
PDF

연료주입구 Door open 음의 음질분석 (Sound Quality analysis for Fuel Filler Door open system)

박동철;이동훈;정승균
- 한국소음진동공학회:학술대회논문집
- /
- 한국소음진동공학회 2000년도 춘계학술대회논문집
- /
- pp.1467-1472
- /
- 2000
This paper describes an investigative study for Fuel Filler Door open sound. Using statistical method of analyzing jury preference data, we extract important factor for subjective feeling and also define sound quality index and sound quality guideline for development of fuel filler system.
PDF

OAK DSP Core 기반 CSD17C00에서의 G. 723.1 Speech Codec 의 구현 (Implementation of G.723.1 speech codec on OAK DSP Core based CSD17C00)

성유나
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
- /
- pp.151-154
- /
- 1998
이중 전송율(5.3 과 6.3kbit/s)을 제공하는 G.723.1 음성 코더는 공중망을 통한 H.324 POTS 영상 회의 규격의 음성 코더로 채택된 것으로, MPMLQ, ACELP 알고리즘에 근거한다. 본 논문에서는 Annex A를 포함한 G.723.1 음성 코더 알고리즘을 C&S Technology에서 개발한 음성 신호 처리를 위한 범용 DSP인 CSD17C00 칩을 이용하여 실시간 응용이 가능하도록 구현하였다. G.723.1 에 대한 양방향 평가가 Codec loopback을 통해 수행되었으며, ITU에서 제공한 테스트 절차에 따라 평가되었다. 또한, 본 논문에서 구현된 G.723.1 음성 코더는 27MIPS의 계산 속도를 갖으며, 프로그램 ROM의 크기는 8.85K Words이고, 10K 데이터 ROM과 4K 데이터 RAM을 필요로 하고 있다. 경쟁 제품과의 MOS 측정 음질 평가를 실시한 결과, CSD17C00에서의 음질 성능이 더 우수함을 입증 함으로써, 본 논문에서 보여준 CSD17C00을 기반으로 구현된 G.723.1 알고리즘의 실시간 구현기술의 타당성을 검증하게 되었다.
PDF

검색결과 353건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)