• 제목/요약/키워드: 음성평가

검색결과 1,638건 처리시간 0.023초

한국어 표준 전화 음성 데이터 베이스 구축 (Construction of the Standard Telephone Speec Database in Korean)

  • 김종교
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 음성.음향 WORKSHOP
    • /
    • pp.5-9
    • /
    • 1998
  • 음성처리 연구자들이 연구 수행을 하기 이해서 최초로 해야 할 일은 음성학적 범주가 풍부한 많은 사람이 발성한 음성 데이터의 확보이다. 그러나 음성 데이터를 확보하는 데는 많은 시간과 노력이 소요되므로 음성 DB의 구축이 필요하다. 따라서 본 연구에서는 한국어 전화 음성 인식 기술 연구시 시스템의 객관적 성능평가와 알고리즘 개발등에 모든 연구 개발자들이 공통으로 사용할 수 있는 표준 음성 데이터 베이스를 구축하여 국내 음성처리 연구의 활성화를 꾀할 수 있도록 하였다.

  • PDF

OAK DSP Core 기반 CSD17C00에서의 G. 723.1 Speech Codec 의 구현 (Implementation of G.723.1 speech codec on OAK DSP Core based CSD17C00)

  • 성유나
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.151-154
    • /
    • 1998
  • 이중 전송율(5.3 과 6.3kbit/s)을 제공하는 G.723.1 음성 코더는 공중망을 통한 H.324 POTS 영상 회의 규격의 음성 코더로 채택된 것으로, MPMLQ, ACELP 알고리즘에 근거한다. 본 논문에서는 Annex A를 포함한 G.723.1 음성 코더 알고리즘을 C&S Technology에서 개발한 음성 신호 처리를 위한 범용 DSP인 CSD17C00 칩을 이용하여 실시간 응용이 가능하도록 구현하였다. G.723.1 에 대한 양방향 평가가 Codec loopback을 통해 수행되었으며, ITU에서 제공한 테스트 절차에 따라 평가되었다. 또한, 본 논문에서 구현된 G.723.1 음성 코더는 27MIPS의 계산 속도를 갖으며, 프로그램 ROM의 크기는 8.85K Words이고, 10K 데이터 ROM과 4K 데이터 RAM을 필요로 하고 있다. 경쟁 제품과의 MOS 측정 음질 평가를 실시한 결과, CSD17C00에서의 음질 성능이 더 우수함을 입증 함으로써, 본 논문에서 보여준 CSD17C00을 기반으로 구현된 G.723.1 알고리즘의 실시간 구현기술의 타당성을 검증하게 되었다.

  • PDF

음성을 이용한 수치지도정보 검색시스템의 구현 (Implementation of Digital Map Information Retrieval System Using Speech Recognition)

  • 김태수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.55-58
    • /
    • 1998
  • 본 논문에서는 음성인식기능을 이용하여 지리정보 검색시스템을 구현하고 그 성능 평가 결과에 관하여 보고한다. 성능평가실험을 위하여 사용한 수치지도 자료는 1:5,000의 대구광역시 수성구의 국가 기본도를 사용하였으며, 이 수치지도에서 속성단어와 제어단어를 포함한 68단어를 음성인식과 지도정보 검색의 대상으로 한다. 또한, 음성인식 결과와 지도자료와의 인터페이스는 OLE Automation 프로그래밍 기법을 이용하였으며, Pentium 150MHz, 64MB 메모리를 가진 개인용 컴퓨터 환경하에서 개발하였다. 성능평가 실험결과 남성 3인이 지도검색용 68단어를 실제 사무실 환경하에서 마이크를 통하여 on-line 테스트하여 평균 98.02%의 인식률을 얻었다. 이사의 결과로부터 음성인식기능을 이용한 수치지도 정보검색 시스템의 실용화 가능성을 확인할 수 있었다.

  • PDF

음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가 (Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System)

  • 김태수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

OakDSP Core를 이용한 GSM-EFR 음성 부호화기의 실시간 구현 (Real-time Implementation of a GSM-EFR Speech Coder using a OakDSP Core)

  • 최민석;변경진;김경수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.135-138
    • /
    • 2000
  • 본 논문에서는 DSP Group사의 16 비트 고정 소수점 DSP인 OaKDSP Core를 사용하여 유럽의 이동통신에서 표준으로 사용되고 있는 음성 부호화기 알고리즘인 GSM-EFR (Global System for Mobile communications -Enhanced Full Rate) 을 실시간으로 구현하였다. 구현된GSM-EFR 음성 부호화기의 계산량은 약 24 MIPS가 소요되며, 7.06K 워드의 코드 메모리와 12.19K 워드의 데이터 메모리를 사용하였다. 구현된 음성 부호화기는 ETSI에서 제공하는 시험 벡터 샘플을 모두 통과하였으며, 객관적 평가 툴을 이용하여 지각 평가를 수행한 결과, 32kbps ADPCM과 비슷한 음질을 보였다. 본 논문에서 실시간으로 구현된 GSM-EFR 음성 부호화기는 IMT2000 비동기 방식의 음성 부호화기 표준인 GSM-AMR의 최상위 전송률 모드로서. 앞으로 IMT-2000 비동기식 단말기용 모뎀 ASIC에 탑재할 GSM-AMR 음성부호화기의 구현을 위한 기본 구조로 이용될 예정이다.

  • PDF

교실에서 신호대잡음비 변이가 한국어 음성명료도에 미치는 영향 (Influence of SNR difference on the Korean speech intelligibility in classrooms)

  • 박찬재;조성민;한찬훈
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.651-660
    • /
    • 2019
  • 본 연구는 소음 환경에서 화자의 음성 레벨이 어느 정도일 때 한국어에 대한 청자의 음성명료도 변화를 파악하고자 시행되었다. 이를 위해 잔향시간이 다른 교실 환경을 모형화하여 가청화시재를 제작한 후 피실험자 27명을 대상으로 청감실험을 실시해 음성명료도를 평가하였다. 음성명료도에 대한 평가는 한국어 음성명료도 평가법 중 음절법과 단어법을 이용하였으며 잔향시간과 신호대잡음비를 5dB씩 변화시키면서 정답률의 변화를 관찰하였다. 실험결과 음절법의 경우 신호대잡음비가 커질수록 이에 비례해 음성명료도 평가점수 또한 높아짐을 알 수 있었다. 단어법의 경우 잔향시간이 1.5 s인 경우에는 음성명료도 평가점수가 신호대잡음비와 비례적인 관계를 보이지만, 잔향시간이 0.8 s로 짧은 상황에서는 비례관계를 찾을 수 없었다. 이원변량분석 결과 한국어 음성명료도 평가법 중 음절법과 단어법에 공통적으로 유의한 영향 인자는 신호대잡음비라는 것으로 확인되었다. 따라서, 한국어 교실의 적정 잔향시간 기준인 0.8s 이하를 만족하는 경우 소음에 따른 영향을 제어할 수 있으나, 잔향시간이 기준보다 긴 경우에는 신호대잡음비가 커야만 높은 음성명료도를 확보할 수 있을 것으로 판단된다.

자전적 회상을 통한 자연스런 정서음성정보 수집방법에 관한 연구 (Acquisition of natural Emotional Voice Through Autobiographical Recall Method)

  • 조은경;조철우;민경환
    • 한국음향학회지
    • /
    • 제16권2호
    • /
    • pp.66-70
    • /
    • 1997
  • 통제된 실험실에서 자연스런 정서음성을 수집하기 위하여 자전적 회상 방법이 시용되었다. 16명의 대학생에게 행복, 화, 슬픔, 두려움을 가장 강하게 경험한 과거 사진을 회상하도록 하였고, 비교집단으로서 4명의 연극배우에게는 스스로 감정 상태에 몰입하게 하였다. 3명의 독립적 평정자들이 피험자들의 얼굴 표정과 음성 특징을 평가하였다. 대학생들의 유도된 음성과 배우들의 음성을 비교한 결과, 자전적 회상 방법은 미묘한 감정적 단서를 전달하는데 효과적으로 평가되었으며 배우들이 모사한 음성은 더 극단적인 정서를 표출하는 것으로 평가되었다. 정서음성 수집에 있어서 자전적 회상 방법이 가지는 함의와 이 방법의 잠재적인 문제점도 논의되었다.

  • PDF

일본인을 대상으로 한 영어 청취판별 테스트 (English auditory discrimination test for Japanese)

  • 이현복;송윤경;공정혜
    • 대한음성학회지:말소리
    • /
    • 제37호
    • /
    • pp.119-128
    • /
    • 1999
  • 이 논문의 목적은 일본 학생들의 영어 청취 능력에 대한 확실한 평가를 내릴 수 있는 청취판별테스트를 개발하는 데에 있다. 이 테스트를 통하여 일본사람들이 범하는 청취 오류를 평가, 분석하고 일본어의 음성·음운체계가 이러한 오류에 미치는 영향을 평가한다. 테스트의 결과는 청취 및 발음훈련에 적용될 수 있으므로 일본인의 영어 능력을 향상시키는데 공헌할 수 있을 것이다.

  • PDF

한국어 음성합성기 성능평가에 의한 합성 음질개선 (Speech Quality Improvement by Speech Quality Evaluation)

  • 양희식;한민수;김종진
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.37-40
    • /
    • 2002
  • 본 논문에서는 한국어 합성기의 명료도 및 자연성 평가방안에 대한 개략적인 설명과 이 방안을 실제로 2종류의 서로 다른 한국어 합성기에 적용한 결과를 요약하였다. 한편, 이러한 평가결과를 바탕으로 실제로 이루어진 음질 개선 실 예를 소개하는 한편 향후 한국어 합성기의 성능 개선 방향을 제안하였다.

  • PDF