• Title/Summary/Keyword: 음성평가

Search Result 1,615, Processing Time 0.029 seconds

Construction of the Standard Telephone Speec Database in Korean (한국어 표준 전화 음성 데이터 베이스 구축)

  • 김종교
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06a
    • /
    • pp.5-9
    • /
    • 1998
  • 음성처리 연구자들이 연구 수행을 하기 이해서 최초로 해야 할 일은 음성학적 범주가 풍부한 많은 사람이 발성한 음성 데이터의 확보이다. 그러나 음성 데이터를 확보하는 데는 많은 시간과 노력이 소요되므로 음성 DB의 구축이 필요하다. 따라서 본 연구에서는 한국어 전화 음성 인식 기술 연구시 시스템의 객관적 성능평가와 알고리즘 개발등에 모든 연구 개발자들이 공통으로 사용할 수 있는 표준 음성 데이터 베이스를 구축하여 국내 음성처리 연구의 활성화를 꾀할 수 있도록 하였다.

  • PDF

Implementation of G.723.1 speech codec on OAK DSP Core based CSD17C00 (OAK DSP Core 기반 CSD17C00에서의 G. 723.1 Speech Codec 의 구현)

  • 성유나
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.151-154
    • /
    • 1998
  • 이중 전송율(5.3 과 6.3kbit/s)을 제공하는 G.723.1 음성 코더는 공중망을 통한 H.324 POTS 영상 회의 규격의 음성 코더로 채택된 것으로, MPMLQ, ACELP 알고리즘에 근거한다. 본 논문에서는 Annex A를 포함한 G.723.1 음성 코더 알고리즘을 C&S Technology에서 개발한 음성 신호 처리를 위한 범용 DSP인 CSD17C00 칩을 이용하여 실시간 응용이 가능하도록 구현하였다. G.723.1 에 대한 양방향 평가가 Codec loopback을 통해 수행되었으며, ITU에서 제공한 테스트 절차에 따라 평가되었다. 또한, 본 논문에서 구현된 G.723.1 음성 코더는 27MIPS의 계산 속도를 갖으며, 프로그램 ROM의 크기는 8.85K Words이고, 10K 데이터 ROM과 4K 데이터 RAM을 필요로 하고 있다. 경쟁 제품과의 MOS 측정 음질 평가를 실시한 결과, CSD17C00에서의 음질 성능이 더 우수함을 입증 함으로써, 본 논문에서 보여준 CSD17C00을 기반으로 구현된 G.723.1 알고리즘의 실시간 구현기술의 타당성을 검증하게 되었다.

  • PDF

Implementation of Digital Map Information Retrieval System Using Speech Recognition (음성을 이용한 수치지도정보 검색시스템의 구현)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.55-58
    • /
    • 1998
  • 본 논문에서는 음성인식기능을 이용하여 지리정보 검색시스템을 구현하고 그 성능 평가 결과에 관하여 보고한다. 성능평가실험을 위하여 사용한 수치지도 자료는 1:5,000의 대구광역시 수성구의 국가 기본도를 사용하였으며, 이 수치지도에서 속성단어와 제어단어를 포함한 68단어를 음성인식과 지도정보 검색의 대상으로 한다. 또한, 음성인식 결과와 지도자료와의 인터페이스는 OLE Automation 프로그래밍 기법을 이용하였으며, Pentium 150MHz, 64MB 메모리를 가진 개인용 컴퓨터 환경하에서 개발하였다. 성능평가 실험결과 남성 3인이 지도검색용 68단어를 실제 사무실 환경하에서 마이크를 통하여 on-line 테스트하여 평균 98.02%의 인식률을 얻었다. 이사의 결과로부터 음성인식기능을 이용한 수치지도 정보검색 시스템의 실용화 가능성을 확인할 수 있었다.

  • PDF

Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System (음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가)

  • 김태수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

Real-time Implementation of a GSM-EFR Speech Coder using a OakDSP Core (OakDSP Core를 이용한 GSM-EFR 음성 부호화기의 실시간 구현)

  • 최민석;변경진;김경수
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.135-138
    • /
    • 2000
  • 본 논문에서는 DSP Group사의 16 비트 고정 소수점 DSP인 OaKDSP Core를 사용하여 유럽의 이동통신에서 표준으로 사용되고 있는 음성 부호화기 알고리즘인 GSM-EFR (Global System for Mobile communications -Enhanced Full Rate) 을 실시간으로 구현하였다. 구현된GSM-EFR 음성 부호화기의 계산량은 약 24 MIPS가 소요되며, 7.06K 워드의 코드 메모리와 12.19K 워드의 데이터 메모리를 사용하였다. 구현된 음성 부호화기는 ETSI에서 제공하는 시험 벡터 샘플을 모두 통과하였으며, 객관적 평가 툴을 이용하여 지각 평가를 수행한 결과, 32kbps ADPCM과 비슷한 음질을 보였다. 본 논문에서 실시간으로 구현된 GSM-EFR 음성 부호화기는 IMT2000 비동기 방식의 음성 부호화기 표준인 GSM-AMR의 최상위 전송률 모드로서. 앞으로 IMT-2000 비동기식 단말기용 모뎀 ASIC에 탑재할 GSM-AMR 음성부호화기의 구현을 위한 기본 구조로 이용될 예정이다.

  • PDF

Influence of SNR difference on the Korean speech intelligibility in classrooms (교실에서 신호대잡음비 변이가 한국어 음성명료도에 미치는 영향)

  • Park, Chan-Jae;Jo, Sung-Min;Haan, Chan-Hoon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.6
    • /
    • pp.651-660
    • /
    • 2019
  • The present study aims to find out the necessary speech sound level which can satisfy with the speech intelligibility in a noisy classroom environments. For this, auralized materials were made to undertake listening tests with 27 people. Speech intelligibility tests were carried out using both Consonant-Vowel-Consonant (CVC) and Phonetically Balanced Words (PBW) methods. Signal to noise ratio was changed by 5 dB for each test. As a result, it was found that speech intelligibilities are increasing with larger Signal to Noise Ratio (SNR). It was also found that there is a lot of difference of speech intelligibilities by SNR for syllables (CVC) with the Reverberation Time (RT) of 1.5 s. However, any significant difference was not found for words (PBW) in the case with RTs of below 0.8 s. Also, it was revealed through the 2-way analysis of variance (ANOVA) test that SNR is the only attentive factor which can affect the Korean speech intelligibilities for both PBW and CVC methods. Therefore, RTs below 0.8 s could be the acoustic criteria for classroom which can minimize the effects of noise. In the case with RTs larger than 0.8 s, much larger SNR is needed to give sufficient speech intelligibility.

Acquisition of natural Emotional Voice Through Autobiographical Recall Method (자전적 회상을 통한 자연스런 정서음성정보 수집방법에 관한 연구)

  • Jo, Eun-Kyung;Jo, Cheol-Woo;Min, Kyung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.2
    • /
    • pp.66-70
    • /
    • 1997
  • In order to obtain natural emotional voice in laboratory, an autobiographical recall method was used and happy, angry, sad and afraid feelings were induced in 16 college students. Three independent judges rated the subject's facial expressions and vocal characteristics. The mood induction results were compared with those from the actor-initiated method. Data analysis showed that recall-induced voices successfully conveyed subtle emotional cues, while actor-induced voices signaled more extreme emotioms. Implications of the autobiographical recall method in emotional voice research and potential problems are discussed.

  • PDF

A Systematic Review on Voice Characteristics and Risk Factors of Voice Disorder of Korea Teachers (우리나라 교사의 음성 특성과 음성장애 위험 요인에 관한 체계적 문헌고찰)

  • Cha, Seulki;Byeon, Haewon
    • Journal of the Korea Convergence Society
    • /
    • v.9 no.8
    • /
    • pp.149-154
    • /
    • 2018
  • As the range of professional voice users are expanding, interest towards voice increases as well. Especially as teachers compose the occupational group, exposed to high risk of voice disorder, it is necessary to identify the cause of speech problems and speech disorders. The purpose of this study is to analyze the voice characteristics of teachers and to investigate the causes of voice disorders. From 2000 to 2018, 414 studies were found under a combinated set search words of 'profession', 'Teacher', 'Professional Voice User', 'Voice', 'Voice disorders', 'Risk' and out of them, 8 studies were selected as final focus analysis subjects. The qualitative evaluation was carried out by modifying the Quality: checklist for assessing the Risk of bias. The study confirmed that voice misuse frequently occurred to teachers when they used their voice and this feature was affected by the environment. These results suggest that environment improvement of teachers' speech abuse and consistent voice education are necessary.

English auditory discrimination test for Japanese (일본인을 대상으로 한 영어 청취판별 테스트)

  • Lee Hyun Bok;Song YoonGyoung;Kong JungHye
    • MALSORI
    • /
    • no.37
    • /
    • pp.119-128
    • /
    • 1999
  • 이 논문의 목적은 일본 학생들의 영어 청취 능력에 대한 확실한 평가를 내릴 수 있는 청취판별테스트를 개발하는 데에 있다. 이 테스트를 통하여 일본사람들이 범하는 청취 오류를 평가, 분석하고 일본어의 음성·음운체계가 이러한 오류에 미치는 영향을 평가한다. 테스트의 결과는 청취 및 발음훈련에 적용될 수 있으므로 일본인의 영어 능력을 향상시키는데 공헌할 수 있을 것이다.

  • PDF