• Title/Summary/Keyword: 음합성

Search Result 333, Processing Time 0.023 seconds

Design Space Exploration of Many-Core Architecture for Sound Synthesis of Guitar on Portable Device (휴대 장치용 기타 음 합성을 위한 매니코어 아키텍처의 디자인 공간 탐색)

  • Kang, Myeongsu;Kim, Jong-Myon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.01a
    • /
    • pp.1-4
    • /
    • 2014
  • Although physical modeling synthesis is becoming more and more efficient in rich and natural high-quality sound synthesis, its high computational complexity limits its use in portable devices. This constraint motivated research of single-instruction multiple-data many-core architectures that support the tremendous amount of computations by exploiting massive parallelism inherent in physical modeling synthesis. Since no general consensus has been reached which grain sizes of many-core processors and memories provide the most efficient operation for sound synthesis, design space exploration is conducted for seven processing element (PE) configurations. To find an optimal PE configuration, each PE configuration is evaluated in terms of execution time, area and energy efficiencies. Experimental results show that all PE configurations are satisfied with the system requirements to be implemented in portable devices.

  • PDF

Formant Locus Overlapping Method to Enhance Naturalness of Synthetic Speech (합성음의 자연도 향상을 위한 포먼트 궤적 중첩 방법)

  • 안승권;성굉모
    • Journal of the Korean Institute of Telematics and Electronics B
    • /
    • v.28B no.10
    • /
    • pp.755-760
    • /
    • 1991
  • In this paper, we propose a new formant locus overlapping method which can effectively enhance a naturalness of synthetic speech produced by ddemisyllable based Korean text-to-speech system. At first, Korean demisyllables are divided into several number of segments which have linear formant transition characteristics. Then, database, which is composed of start point and length of each formant segments, is provided. When we synthesize speech with these demisyllable database, we concatenate each formant locus by using a proposed overlapping method which can closely simulate haman articulation mechanism. We have implemented a Korean text-to-speech system by using this method and proved that the formant loci of synthetic speech are similar to those of the natural speech. Finally, we could illustrate that the resulting spectrograms of proposed method are more similar to natural speech than those of conventional method.

  • PDF

A Word List Construction and Measurement Method for Intelligibility Assessment of Synthesized Speech by Rule (규칙 합성음의 이해성 평가를 위한 단어표 구성 및 실험법)

  • 김성한;홍진우;김순협
    • Journal of the Korean Institute of Telematics and Electronics B
    • /
    • v.29B no.1
    • /
    • pp.43-49
    • /
    • 1992
  • As a result of recent progress in speech synthesis techniques, the those new services using new techniques are going to introduce into the telephone communication system. In setting standards, voice quality is obviously an important criterion. It is very important to develope a quality evaluation method of synthesized speech for the diagnostic assessment of system algorithm, and fair comparison of assessment values. This paper has described several basic concepts and criterions for quality assessment (intelligibility) of synthesized speech by rule, and then a word selection method and the word list to be used in word intelligibility test were proposed. Finally, a test method for word intelligibility is described.

  • PDF

An improved automatic segmentation algorithm (자동 음성 분할 시스템의 성능 향상)

  • Kim Mu Jung;Kwon Chul Hong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.45-48
    • /
    • 2002
  • 본 논문에서는 한국어 음성 합성기 데이터베이스 구축을 위하여 HMM을 이용하여 자동으로 음소경계를 추출하고, 음성 파라미터를 이용하여 그 결과를 보정하는 반자동 음성분할 시스템을 구현하였다. 개발된 시스템은 16KHz로 샘플링된 음성을 대상으로 삼았고, 레이블링 단위인 음소는 39개를 선정하였고, 음운현상을 고려한 확장 모노폰도 선정하였다. 그리고 언어학적 입력방식으로는 음소표기와 철자표기를 사용하였으며, 패턴 매칭 방법으로는 HMM을 이용하였다. 유성음/무성음/묵음 구간 분류에는 ZCR, Log Energy, 주파수 대역별 에너지 분포 등의 파라미터를 사용하였다. 개발된 시스템의 훈련된 음성은 정치, 경제, 사회, 문화, 날씨 등의 코퍼스를 사용하였으며, 성능평가를 위해 훈련에 사용되지 않은 문장 데이터베이스에 대해서 자동 음성 분할 실험을 수행하였다. 실험 결과, 수작업에 의해서 분할된 음소경계 위치와의 오차가 10ms 이내가 $87\%$, 30ms 이내가 $91\%$가 포함되었다.

  • PDF

Korean Speech Recognition using the Phoneme (음소를 이용한 한국어의 인식)

  • 김영일;차일환;조문재
    • The Journal of the Acoustical Society of Korea
    • /
    • v.3 no.2
    • /
    • pp.35-45
    • /
    • 1984
  • 본 연구는 한국어의 발음상의 특징과 구조에 의해서 한국어를 음소별로 분리할 수 있음에 착안 하여, 자음과 모음으로 구성된 한국어 단음을 자음의 음소와 모음의 음소로 각각 분리하여 인식하는 새 로운 방법에 관한 연구이다. 특정 화자 2명에 대하여 한국어 단음 84자를 모음의 음소와 자음의 음소로 각각 분리하여 인삭한 실험결과 모음을 인식한 경우에는 선형 예측 계수를 이용하면 인식률이 95.2%이 고, 편자기 상관계수로 92.5%, 폴만트로 97.6%의 인식률을 얻었고, 자음을 인식한 경우에는 선형 예측 계수로 88.7%, 편자기 상관계수로 92.9%의 인식률을 얻었다. 또, 자음의 음소와 모음의 음소를 결합시킨 단음을 인식한 경우에는 선형 예측 계수로 83.9%, 편자기 상관계수로 86.3%의 인식률을 얻었다. 이 때, 각 음소들의 데이터의 수는 256개이고, 선형 예측 계수와 편자기 상관 계수와의 예측차는 15차이다. 이 와 같이 한국어를 자음의 음소와 모음의 음소로 분리하면 작은 데이터 양으로 처리 시간을 단축 시켜 한국어의 모든 단음, 단어, 연속음, 문장 등을 분석하고 인식할 수 있고, 또한 각 음소들을 원칙적으로 결합시켜 모든 한국어의 합성이 가능함을 알 수 있다.

  • PDF

Timbral Analysis of the Piri Sound and Designing an Audio Filter for Yoseong Expression (요성을 중심으로 한 피리의 음색 변화 분석 및 필터 디자인)

  • Nam, Sangbong;Lee, Sun-jin;Lee, Gangseong;Lee, Donoung
    • Journal of the HCI Society of Korea
    • /
    • v.10 no.2
    • /
    • pp.5-11
    • /
    • 2015
  • Yoseong sound is one of the Piri's representative techniques including unique timbre of Korean traditional musical instrument. This paper presents the acoustic characteristics of Yoseong sound by analyzing the sound of Piri and suggests audio filters that make Yoseong sound from ordinary sound of the Piri.

A Study on the Korean Accentuation Rule for the Korean text to speech conversion (문장-언어 변환을 위한 한국어 액센트에 관한 연구)

  • 진달복;김성곤
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.8 no.4
    • /
    • pp.804-806
    • /
    • 2004
  • this paper is to propose the formative Korean accentuation rule for the korean tort to speech conversion. The accentuation rule is as following: (1) If the rhyme of first syllable is -v, then accent is on the next syllable. (2) If the rhyme of first syllable is not -v, then accent is on the first syllable.

Synthesis of photopolymer containing chalconyl and cholesteryl moieties and their LCD applications (Chalconyl 과 Cholesteryl 기를 함유한 광폴리머의 합성 및 LCD 응용)

  • 황정연;서대식;김재형;손정호;서동학
    • Proceedings of the Korean Institute of Electrical and Electronic Material Engineers Conference
    • /
    • 2000.11a
    • /
    • pp.137-140
    • /
    • 2000
  • Synthesis of a new copoly (M4Ch-ChMA), copoly ((4-methacryloyloxy) chalcone-cholestery methacrylate), with chalconyl and cholesteryl moiety characteristics for photoalignment materials was investigated. Good thermal stabilities of the synthesized copolymers are confirmed by thermogravimetric analysis (TGA) measurement. The pretilt angles of the nematic liquid crystal (NLC) are reduced as UV exposure time is increased on the copolymer surfaces. A pretilt angle of 81$^{\circ}$ in NLC was observed with UV exposure of 3 min on the copolymer-3 surface. The NLCs pretilt angle is attributable to increased chalcone with increasing the UV exposure time.

  • PDF

Common-mode Voltage Reduction of Three Level Four Leg PWM Converter (3레벨 4레그 PWM 컨버터의 커먼 모드 전압 저감 방법)

  • Chee, Seung-Jun;Ko, Sanggi;Kim, Hyeon-Sik;Sul, Seung-Ki
    • Proceedings of the KIPE Conference
    • /
    • 2014.07a
    • /
    • pp.287-288
    • /
    • 2014
  • 본 논문에서는 3레벨 4레그 컨버터에서 커먼 모드 전압(Common-mode Voltage, CMV)을 저감하기 위한 삼각파 비교 전압 변조 기법을 제안하였다. 제안한 PWM 방법은 매우 직관적이고, DSP 제어 시스템에서 쉽게 구현할 수 있다. SVPWM, SPWM의 스위칭 패턴 분석을 통하여 CMV 저감을 위한 4번째 레그(f상)의 극 전압 패턴을 제안하였고, 해당하는 f상 극 전압의 합성을 위하여, f상 양/음의 극 전압 지령 값을 계산하였다. 또한 a, b, c상 전압 왜곡을 막기 위한 옵셋 전압을 유도하였다. 제안한 PWM 방법의 유효성은 모의실험과 실험 결과를 통하여 검증되었다. 제안된 방법에서 CMV의 첨두치 및 스위칭 수는 SVPWM 방법에 비하여 각각 33%, 25%로 대폭 감소하였다.

  • PDF

Synthetic Speech Quality Improvement By Glottal parameter Interpolation - Preliminary study on open quotient interpolation in the speech corpus - (성대특성 보간에 의한 합성음의 음질향상 - 음성코퍼스 내 개구간 비 보간을 위한 기초연구 -)

  • Bae, Jae-Hyun;Oh, Yung-Hwa
    • Proceedings of the KSPS conference
    • /
    • 2005.11a
    • /
    • pp.63-66
    • /
    • 2005
  • For the Large Corpus based TTS the consistency of the speech corpus is very important. It is because the inconsistency of the speech quality in the corpus may result in a distortion at the concatenation point. And because of this inconsistency, large corpus must be tuned repeatedly One of the reasons for the inconsistency of the speech corpus is the different glottal characteristics of the speech sentence in the corpus. In this paper, we adjusted the glottal characteristics of the speech in the corpus to prevent this distortion. And the experimental results are showed.

  • PDF