• 제목/요약/키워드: 인식실험

검색결과 6,444건 처리시간 0.034초

잡음환경 및 어휘독립 환경에서의 가변어휘 음성인식기의 성능 분석 (Performance Evaluation of the Variable Vocabulary Speech Recognition System in the Noisy and Vocabulary-Independent Environments)

  • 이승훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.56-59
    • /
    • 1998
  • POW 3848 DB 및 SNR 이 크게 다른 2 종류의 PC168 DB를 대상으로 가변어휘 음성인식 시스템을 이용하여 훈련 및 성능 평가 실험을 수행한 내용에 대해서 기술하고 있다. 실험의 목적은 위의 3종류의 DB를 조합하여 얻은 DB 환경하에서 인식기를 훈련시키면서, DB 의 조합 및 훈련방법에 따른 인식기의 성능과의 상관관계를 도출하고자 하였다. DB 의 조합은 POW DB 와 SNR 이 높은 PC DB , 및 3종류의 DB 모두로 구성하였다. 인식기는 40개의 음소로 구성된 문맥 독립형 SCHMM 모델이며, 각 음소당 3개의 상태로 이루어져 있다. 실험 결과, 대부분의 경우에서 ITERATION이 1.0인 경우에 최고 인식률을 나타내고 있으며, INTERATION 이 3.0 이상인 경우에는 항상 CASE 3의 실험방법이 우세한 결과를 나타내었다. 또한 CASE 1으로 훈련한 경우가 CASE 2 보다는 각각의 실험 DB 에 대해서 대체적으로 좋은 결과를 보였다.

  • PDF

가변 어휘 인식 모델을 이용한 한국어 방송 뉴스 음성의 인식 (Automatic Recognition of Korean Broadcast News Using Flexible Vocabulary Recognition Models)

  • 유하진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.70-73
    • /
    • 1998
  • 본 논문에서는 한국어 방송 뉴스 인식 시스템에 관하여 기술한다. 인식 실험 과정에서는 실제로 방송된 음성을 인식하였으나, 인식을 위한 음향 모델은 본 연구소에서 갭라한 고립단어 인식용 가변 어휘 인식모델을 이용하였다. 가변 어휘 인식기는 방송 음성의 연속 문장을 이용하지 않고, 음향학적으로 고르게 분포된 고립 단어를 이용하여 학습되었다. 본 연구에서는 한국어의 특성상 문장이 영어권과 같이 단어 단위가 아닌 어절로 나누어 지는 점을 고려하여, 다양한 형태의 사전 표제어를 대상으로 실험하였다. 또한 탐색과정의 초기단계에 장거리 언어모델을 사용함으로써 인식 오류를 줄일 수 있었다.

  • PDF

중학교 과학 수업에서 일정성분비 법칙의 강의와 실험에 대한 교사 및 학생들의 인식 (The Teachers' and Students' Perceptions on Lectures and Experiments of Law of Definite Proportion in Middle School Science Classes)

  • 한감봉;민희정;백성혜
    • 대한화학회지
    • /
    • 제56권1호
    • /
    • pp.144-158
    • /
    • 2012
  • 이 연구에서는 중학교 과학 수업에서 다루는 일정성분비 법칙의 강의와 실험에 대한 과학 교사들과 학생들의 인식을 알아보았다. 이 연구를 위해 3명의 교사 수업을 관찰 기록하고, 면담을 통해 수업과 실험에 대한 인식을 알아보았다. 또한 학생들의 과학 성적과 인지 수준과 과학 태도, 실험 보고서 등을 분석하였다. 연구 결과, 교사들에 따라 강의 수업에서 강조하는 점이 달랐으며, 특히 화학교사들은 기본 개념보다는 비례 관계의 계산과 응용에 더 큰 관심을 가지고 있었다. 그러나 학생들은 기본 개념을 제대로 이해하지 못하였다. 실험 수업에서도 교사들은 학생들의 수행 수준이 낮다고 보고, 실험 과정을 설명하는데 많은 시간을 할애하였다. 그리고 실험 결과의 오차에 대해 부정적인 인식을 가졌다. 학생들은 실험 과정에 대해 제대로 이해하지 못하였으며, 실험 결과를 인위적으로 조작하고, 실험 오차에 대해 부정적인 인식을 가지고 있었다. 이러한 문제는 교사의 학교 과학 수업과 실험에 대한 인식의 변화를 통해 해결될 수 있음을 제안하였다.

운율 정보를 이용한 문장 독립형 화자인식 (Text Independent Speaker Recognition System Using Prosody)

  • 경연정
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.396-400
    • /
    • 1998
  • 문장 독립형 화자인식 시스템에 운율정보 사용을 제안한다. 스펙트럴 특징패턴만을 주로 사용하고 있는 기존의 화자인식 시스템은 채널왜곡이나 기타 잡음환경에서 성능이 크게 저하된다. 그러나 화자의 speaking style을 반영하는 운율정보는 주위환경에 강인한 특성을 갖는다. 적합한 코드북 크기와 피치 컨투어 특징 벡터의 길이를 실험 치로 구하여 자동차 소음과 백색 가우시안 소음이 섞인 음성에 대하여 화자인식 실험을 하였다. 실험 결과 소음 환경에서 운율 정보를 이용한 화자 dsltlr 시스템이 스펙트럴 모델보다 인식율이 높음을 보였다.

  • PDF

RBFN을 이용한 음소인식에 관한 연구 (A Study on the Phoneme Recognition using RBFN)

  • 안종영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.88-91
    • /
    • 1995
  • 개층형 신경망은 교사신호들의 학습으로 원하는 입출력간의 매핑을 할 수 있으므로 패턴분류를 위해 사용되어왔다. 본 논문은 계층형 신경망의 일종인 RBFN 중 GPFN 과 PNN으로 한국어 음소인식을 수행하였다. RBFN 의 구조는 계층형 신경망과 유사하나 차이점으로는 은닉층에서 시그모이드 함수, 참조벡터 및 학습알고리듬의 선택이 다르다. 특히 PNN 의 시그모이드 함수는 지수를 포함한 함수들로 대체되며 학습없이 패턴을 분류하므로 계산시간이 빠르게 수행된다. 본 실험에서는 한국어 단음절에서 모음과 자음을 추출하여 음소인식을 수행하였다. 실험 결과 학습과 평가데이타에 의한 인식률은 계층형 신경망과 비교하여 향상 되었으며, Hybrid 구성에 의한 실험에서도 항상된 인식률을 얻을 수 있었다.

  • PDF

가변어휘 음성인식기 구현에 관한 연구 (A Study on the Implementatin of Vocalbulary Independent Korean Speech Recognizer)

  • 황병한
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제5권
    • /
    • pp.60-63
    • /
    • 1998
  • 본 논문에서는 사용자가 별도의 훈련과정 없이 인식대상 어휘를 추가 및 변경이 가능한 가변어휘 인식시스템에 관하여 기술한다. 가변어휘 음성인식에서는 미리 구성된 음소모델을 토대로 인식대상 어휘가 결정되명 발음사전에 의거하여 이들 어휘에 해당하는 음소모델을 연결함으로써 단어모델을 만든다. 사용된 음소모델은 현재 음소의 앞뒤의 음소 context를 고려한 문맥종속형(Context-Dependent)음소모델인 triphone을 사용하였고, 연속확률분포를 가지는 Hidden Markov Model(HMM)기반의 고립단어인식 시스템을 구현하였다. 비교를 위해 문맥 독립형 음소모델인 monophone으로 인식실험을 병행하였다. 개발된 시스템은 음성특징벡터로 MFCC(Mel Frequency Cepstrum Coefficient)를 사용하였으며, test 환경에서 나타나지 않은 unseen triphone 문제를 해결하기 위하여 state-tying 방법중 음성학적 지식에 기반을 둔 tree-based clustering 기법을 도입하였다. 음소모델 훈련에는 ETRI에서 구축한 POW (Phonetically Optimized Words) 음성 데이터베이스(DB)[1]를 사용하였고, 어휘독립인식실험에는 POW DB와 관련없는 22개의 부서명을 50명이 발음한 총 1.100개의 고립단어 부서 DB[2]를 사용하였다. 인식실험결과 문맥독립형 음소모델이 88.6%를 보인데 비해 문맥종속형 음소모델은 96.2%의 더 나은 성능을 보였다.

  • PDF

중학교 과학교사의 실험수업 실태 및 인식 조사 (A Study of Middle School Science Teachers' Perceptions on Science Lessons with Experiments)

  • 박현주
    • 과학교육연구지
    • /
    • 제37권1호
    • /
    • pp.79-86
    • /
    • 2013
  • 이 연구는 중학교 과학과 실험수업 실태 및 교사의 실험수업에 대한 인식을 조사한 것이다. 실험연수에 참여한 중학교 교사 110명을 대상으로 실험수업에 대한 인식을 설문지 방법으로 조사하였다. 중학교 과학교사들은 이론 중심의 강의식 수업을 주로 실시하고, 실험수업은 1학기에 1~3회의 빈도로 진행하는 것으로 조사되었다. 실험활동은 교과서에 제시된 실험활동의 결과를 확인하는 수준에서 진행하는 것으로 조사되었다. 연구대상에 참여한 교사 대부분은 과학수업지도 능력과 실험수업지도 능력을 평균 이상으로 인식하고 있었다. 실험수업의 장점을 '과학에 대한 흥미 및 호기심 유발,' '과학적 탐구능력 신장,' '과학 이해력 향상' 등으로 인식하고 있었다. 그러나 교사의 '업무과다,' '실험실 여건 요인,' '교육 환경 요인' 등은 과학실험을 저해하는 요인이라고 하였다. 과학교사가 실험을 통하여 학생들의 과학적 태도 형성 및 학습 동기를 유발할 수 있도록 과학교사의 업무 경감, 실험 환경 개선 등에 대한 지속적인 관심과 투자가 요구된다.

  • PDF

음성인식을 이용한 반려 로봇의 모션제어에 대한 연구 (A Study on Motion Control of the Pet-Robot using Voice-Recognition)

  • 조예진;김현석;배태성;이수행;김진현;김재욱
    • 한국전자통신학회논문지
    • /
    • 제17권6호
    • /
    • pp.1089-1094
    • /
    • 2022
  • 본 논문에서는 일상생활에서 사람과 교감하며 돌봄 인력의 공백을 완화할 수 있는 인간 공존형 반려 로봇을 연구하였다. 음성인식 모듈과 서보모터, 아두이노 보드를 기반으로 음성인식을 이용한 로봇팔 제어기능, RC카를 활용한 위치 이동 기능, 음성인식 기능을 활용하여 도트 매트릭스를 이용한 반려 로봇의 감정표현 기능을 탑재한 반려 로봇을 실험, 제작하였다. 실험 결과로 거리에 따른 음성인식 실험 결과 5~30cm의 거리에서 최적의 인식률을 보였고 성별에 따른 음성인식 실험 결과에서는 남성의 인식률이 더 높은 것을 확인할 수 있었으며 성조에 따른 음성인식 실험 결과 첫 번째 성조인 단조로운 톤에서 높은 인식률을 보였다. 이러한 동작 실험에 대한 평가 결과를 통해 반려 로봇을 만들 수 있음을 확인할 수 있었다.

금속 환경에서 RFID Tag 인식률 실험 및 개선 방안 (RFID Tag recognition rate improvement program from metal environment)

  • 전은만;조병록;김영백
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 춘계학술대회
    • /
    • pp.513-517
    • /
    • 2009
  • 본 논문에서는 UHF대역의 그동안 문제로 되어왔던 일반 태그들의 금속 환경에서의 인식률 저하문제를 태그 패키징(Packaging)을 통해 개선하고자 한다. 다양한 환경에서 실험을 통해 일반태그와 패키징 태그의 인식률의 차이를 실험을 통해 비교해 보았다. 실험결과를 토대로 금속 환경에서 패키징 태그들을 실험 할 수 있는 최적의 태그 실험환경을 구성하여 태그들을 산업현장에서의 테스트와 같은 결과들을 도출하고자 한다.

  • PDF

대화체 연속음성인식을 위한 확장 다중발음 사전에 관한 연구 (A Study on the Multiple Pronunciation Dictionary for Spontaneous Speech Recognition)

  • 강병옥
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.65-68
    • /
    • 2003
  • 본 논문에서는 대화체 연속음성인식 과정에서 사용되는 다중발음사전의 개념을 확장하여 대화체 발화에 빈번하게 나타나는 불규칙한 발음변이 현상을 포용하도록 한 확장된 발음사전의 방법을 적용하여 대화체 연속음성인식에서 인식성능의 향상을 가져오게 됨을 실험을 통해 보여준다. 대화체 음성에서 빈번하게 나타나는 음운축약 및 음운탈락, 전형적인 오발화, 양성음의 음성음화 등의 발음변이는 언어모델의 효율성을 떨어뜨리고 어휘 수를 증가시켜 음성인식의 성능을 저하시키고, 또한 음성인식 결과로 나타나는 출력형태가 정형화되지 못하는 단점을 가지고 있다. 이에 이러한 발음변이들을 발음사전에 수용할 때 각각의 대표어휘에 대한 변이발음으로 처리하고, 언어모델과 어휘사전은 대표어휘만을 이용해 구성하도록 한다. 그리고, 음성인식기의 탐색부에서는 각각의 변이발음의 발음열도 탐색하되 대표어휘로 언어모델을 참조하도록 하고, 인식결과를 출력하도록 하여 결과적으로 인식성능을 향상시키고, 정형화된 출력패턴을 얻도록 한다. 본 연구에서는 어절단위 뿐 아니라 의사형태소[2] 단위의 발음사전에도 발음변이를 포용하도록 하여 실험을 하였다. 실험을 통해 어절단위의 다중발음사전 구성을 통해 ERR 10.9%, 의사형태소 단위의 다중발음 사전의 구성을 통해 ERR 4.3%의 성능향상을 보였다.

  • PDF