Search | Korea Science

An Automatic Diphone Segmentation for Korean Speech Synthesis-by-Rule (한국어 규칙 합성을 위한 다이폰의 자동 추출)

정인종;경연정;김한우;이양희
- The Journal of the Acoustical Society of Korea
- /
- v.12 no.2E
- /
- pp.63-72
- /
- 1993
본 논문에서는 무제한 음성 생성을 위한 단위음성으로서의 다이폰을 2음절 자연음성으로부터 자동 추출하는 알고리즘을 제안한다. 입력음성을 개량 켑스트럼 파라미터로 분석하여 이로부터 다이폰 추출 파라미터들을 도출한다. 제안된 파라미터로는 에너지 레벨을 나타내는 0차 켑스트럼의 동적변화량, 스펙트럼의 시간 변화량 영교차율, 캡스트럼의 유클리디안 거리이다. 스펙트럼 포락의 변화가 완만한 모음 연쇄등의 음소 경계를 보다 효율적으로 검출하기 위해 스펙트럼의 시간 변화를 미세부분과 개형부분으로 나누어 각각을 파라미터로 사용한다. VV(모음연쇄), VCV(C: 반모음, 자음), VCCV형들로 이루어진 2음절 단어들에 대해 실험한 결과, 모음연쇄 등이 포함되어 있음에도 약 85% 정확도의 음소경계검출을 얻었다. 본 논문에 의한 다이폰을 이용한 합성음의 청취실험 결과 명료도가 높음을 확인하였다.
PDF

A Study on the USAC Transport Mechanism for Digital Audio Broadcasting Plus (USAC 의 DAB+ 전송 방안에 관한 연구)

Yang, Kyutae;Beack, Seungkwon;Lee, Bongho;Lim, Hyoungsoo
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2015.07a
- /
- pp.28-31
- /
- 2015
본 논문에서는 음성 및 음악 모두에 대해 최고의 품질을 제공하는 최신 오디오 코덱인 USAC 을 DAB+에 적용하기 위한 전송 방안을 제안한다. 기존 DAB+는 AAC+ v2 로 불리는 HE-AAC v2 (High Efficiency Advanced Audio Coding version 2) 오디오 코덱을 사용하였다. 하지만 AAC+ v2 는 낮은 데이터 전송률에서 음악에서는 좋은 품질을 제공하나 음성에서는 상대적으로 품질이 떨어지는 단점이 있다. 반면 USAC 은 낮은 데이터 전송률에서 음악 및 음성에 모두 좋은 품질과 높은 압축 성능을 제공할 수 있는 최신 오디오 코덱 기술이다. USAC 의 성능을 최대한 보장하기 위해서는 DAB+와 달리 VBR 을 적용하는 효과적이다. 따라서 본 논문에서는 USAC VBR 스트림을 DAB+에 전송하는 방안을 제안한다. 제안된 전송 방안을 적용할 경우 최적의 음악 및 음성 품질을 효율적으로 제공할 수가 있다.
PDF

The Development of Speech Synthesizer In Korean TTS System (한국어 문어변환 시스템 내에서의 음성 합성기 개발)

강찬희;진용옥
- The Journal of the Acoustical Society of Korea
- /
- v.12 no.2
- /
- pp.14-27
- /
- 1993
본 논문은 매 40ms 정도의 음성파형으로부터 추출된 6내지 9ms 정도의 1피치주기 파형을 합성단위로 사용하여 합성시킨 시간영역에서의합성방식을 한국어 문어 변환 시스템내에서의 음성합성기에 적용시킨 연구결과이다. 시험 결과, 4가지 유형의 한국어 음절 합성이 가능하고, 장단강약과 같은 운율요소의 제어가 용이하고, 또한 합성 알고리즘이 간단하여 실시간 처리가 가능하였으나, 문장 단위의 음성을 합성하기 위하여는 문장내에서의 다양한 피치 패턴에 대한 연구와 이의 효율적인 제어에 관한 연구가 이루어져야 할 것이다. 합성음에 대한 평가방법으로는 원음과 합성음에 대한 시간영역에서의 파형비교, 주파수 영역에서의 스펙트럼 포락선 유사성 비교 및 합성음에 대한 청취도 실험을 행하였다.
PDF

Vocal Efficiency Measures in Classically Trained Western Singers (서양음악을 전공으로 하는 성악인에서의 음성효율 측정)

정성민
- Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
- /
- v.9 no.1
- /
- pp.43-46
- /
- 1998
Background and Objectives : Singers, the vocal equivalents of Olympic athletes, may present with vocal dysfunction in the singing voice before adverse effects are noted in the speech mode. For the classically trained singers, any imbalance in the respiratory, laryngeal or resonatory subsystems may manifest first in technical compensations. Therefore it is necessary that baseline values be available in order to differentiate technique related dysfunction from abnormalities within the phonatory system. Materials and Methods : Vocal efficiency measures were collected from 55 classically trained singers and 20 untrained adults. All singers was divided into 3 groups : (1) Singers who have normal larynx with out voice symptoms. (2) Singers who have vocal nodule without voice symptoms. (3) Singers who have vocal nodule with voice complaints. Results and Conclusion : Results were compared with each other. Differences in each group wert found, suggesting the need for separate normative data to be used for the evaluation of the classically trained singers.
PDF

Endpoint Detection of Speech Signal Using Wavelet Transform (웨이브렛 변환을 이용한 음성신호의 끝점검출)

석종원;배건성
- The Journal of the Acoustical Society of Korea
- /
- v.18 no.6
- /
- pp.57-64
- /
- 1999
In this paper, we investigated the robust endpoint detection algorithm in noisy environment. A new feature parameter based on a discrete wavelet transform is proposed for word boundary detection of isolated utterances. The sum of standard deviation of wavelet coefficients in the third coarse and weighted first detailed scale is defined as a new feature parameter for endpoint detection. We then developed a new and robust endpoint detection algorithm using the feature found in the wavelet domain. For the performance evaluation, we evaluated the detection accuracy and the average recognition error rate due to endpoint detection in an HMM-based recognition system across several signal-to-noise ratios and noise conditions.
PDF

On the Development of a Continuous Speech Recognition System using Continuous Hidden Markov Model for Korean Language (연속분포 HMM을 이용한 한국어 연속 음성 인식 시스템 개발)

Kim, Do-Yeong;Park, Yong-Kyu;Kwon, Oh-Wook;Un, Chong-Kwan
- Annual Conference on Human and Language Technology
- /
- 1993.10a
- /
- pp.101-110
- /
- 1993
본 논문에서는 연속분포 hidden Markov 모델을 이용한 화자독립 연속 음성 인식 시스템에 관해 기술한다. 연속분포 모델은 평균과 분산 벡터로 구성되며 음성신호를 직접 모델링하여 양자화 왜곡이 없어진다. 특징벡터는 filter bank 계수 및 그 1, 2차 미분계수를 사용하여 음성신호의 동적 특성을 반영하였다. Segmental K-means 알고리즘을 이용하여 학습하였으며, 연속어 인식에서 가장 문제가 되는 조음화 현상으로 인한 인식률 저하를 막기 위해 앞뒤의 음소를 고려해 주는 triphone을 인식단위로 사용하였다. Search 알고리즘으로는 시간 면에서 효율이 좋은 one-pass search 알고리즘을 사용하였다. 성능 평가를 위한 화자 독립 인식 실험에서 문법이 없을 경우 83%, finite state network율 적용한 경우에는 94%의 인식률을 나타내었다.
PDF

Diphone-based Intonation and VoiceXML document Generation using Multi-dimensional Linguistic Information (다양한 언어 정보를 이용한 음소 단위 억양 및 VoiceXML 문서 생성)

Lee, Hwa-Jin;Park, Jong-C.
- Annual Conference on Human and Language Technology
- /
- 2002.10e
- /
- pp.69-76
- /
- 2002
최근 음성 합성 과정에서 화자의 의도를 가장 많이 반영하는 언어 정보인 문맥 정보를 사용하려는 시도가 이루어지고 있으나 문맥 정보를 적은 비중으로 사용하기 때문에 자연성 향상에 큰 도움을 주지 못하고 있다. 본 연구에서는 구문 정보, 의미 정보를 억양 생성 과정에 이용함과 동시에 문맥 정보와 음성 정보와의 관계를 음성 데이터를 바탕으로 분석하여 다양한 문맥 정보를 음성 합성 과정에 반영하는 방법을 제안한다. 또한 한국어에서 나타나는 다양한 억양 곡선 유형을 형태소를 이용하여 의다 효율적으로 처리할 수 있는 방법을 제안하여 자연스러운 억양 생성 시스템을 구현하고 시스템의 결과를 음소 단위 억양 생성기와 VoiceXML을 이용하여 적용시켜보고 결과를 논의한다.
PDF

Design and Implementation of Gateway for CC and SIP in Next Generation Mobile Communication Network (차세대 이동통신망에서 CC와 SIP 연동 게이트웨이의 설계 및 구현)

김형국;이정준;정운영;김정훈;박석천
- Proceedings of the Korea Multimedia Society Conference
- /
- 2002.05c
- /
- pp.402-405
- /
- 2002
차세대 이동통신망(IMT-2000 : International Mobile Telecommunication-2000)에서는 기존 통신망에서 제공하는 기능을 그대로 제공하면서 여러 향상된 기능을 제공하는 형태로 개발되고 있으며 기존 망 구조를 적절히 수용하면서 현재 제공하고 있는 음성 서비스를 수용할 수 있는 경제적이고 효율적인 통신망의 구축이 필요하다. 그러므로 음성과 데이터의 통합 및 서비스의 확장성과 포괄성으로 인하여 미래의 각광받는 서비스로 예상되는 IP망에서의 음성 서비스와 차세대 이동통신망과의 연동 게이트웨이 개발은 필수적이다. 따라서 본 논문에서는 차세대 이동통신망 환경에서 기존 망 구조를 적절히 수용해 줄 수 있으면서 음성 서비스를 제공하기 위하여 차세대 이동통신망의 CC(Call Control)와 IP 망의 SIP(Session Initiation Protocol)를 이용한 연동 프로토콜을 설계 및 검증하고, 이를 구현하였다.
PDF

A Study on the Analysis of the Audio DAC Performance (음성 DAC 의 성능 분석에 대한 고찰)

Sung, Kyunghun;Park, Seungsang;Nam, Wongtae;Go, Junghwan
- Proceedings of the Korea Information Processing Society Conference
- /
- 2018.05a
- /
- pp.484-485
- /
- 2018
DAC 는 디지털-아날로그 변환 회로는 디지털 전기 신호를 아날로그 전기 신호로 변환하는 전자 회로이다. 특히 최근 음성 신호는 그 효율성 및 경제성 때문에 디지털 데이터 형태로 저장/전송되고 있어 DAC 는 음성 관련 사업에서 필수적으로 쓰이고 있다. 본 논문은 음성 신호의 디지털-아날로그 변환 시 DAC 의 성능에 대한 분석 및 시험 결과를 소개한다.
https://doi.org/10.3745/PKIPS.y2018m05a.484 인용 PDF

A Technique to Improve the Practicality of SVM-based Speech/Music Classifiers Through Hierarchical Classification (계층구조의 분류를 통한 서포트벡터머신 기반의 음성/음악 분류기의 실용도 향상기법)

Choi, Seokhwan;Cho, Youngok;Cho, Jiu;Lim, Chungsoo;Lee, Yeonwoo;Lee, Seong Ro
- Proceedings of the Korea Information Processing Society Conference
- /
- 2012.04a
- /
- pp.1033-1034
- /
- 2012
본 논문은 제한된 대역폭의 효율적인 활용을 위한 가변 전송률 코덱을 목표로 제안된 서포트벡터머신 기반의 음성/음악 분류기의 실용도를 높이기 위한 기법을 제안한다. 서포트벡터머신 기반의 음성/음악 분류기는 높은 분류능력을 가지고 있지만 많은 계산량을 요구하기 때문에 실시간으로 사용하기에는 부적합한 면이 있다. 따라서 계층적 분류를 통해 서포트벡터머신 기반의 음성/음악 분류기의 실용성을 향상시키는 기법을 제안한다.
https://doi.org/10.3745/PKIPS.y2012m04a.1033 인용 PDF

Search Result 871, Processing Time 0.023 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)