• 제목/요약/키워드: 연속률

검색결과 773건 처리시간 0.028초

휴대 멀티미디어 단말용 음성인식 시스템 개발 (Development of Continuous Speech Recognition System for Multimedia Mobile Terminal Applications)

  • 김승희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.59-62
    • /
    • 1998
  • 본 논문에서는 한국전자통신연구원의 Handy Combi 응용 도메인을 대상으로 한 화자독립 연속음성인식 시스템 개발에 관하여 기술한다. 불특정화자가 자연스럽게 발음한 연속음성을 인식하는 기술은 펜인식 등과 더불어 멀티모달 인터페이스의 핵심 요소로서, 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 에이전트에 구현을 위해 필수적으로 개발되어야 하는 기술이다. 본 논문에서는 연속확률분포를 가지는 Hidden Markov Model(HMM) 기반의 연속음성인식 시스템을 구현하였다. 개발된 시스템은 음성특징벡터로 MFCC를 사용하였으며, 음소 모델의 강인한 훈련을 위해 음성학적 지식에 기반을 둔 tree-based clustering 방식을 도입하였다. 인식단계에서는 인식속도를 개선시키기 위해 beam-search 기법을 적용하였다. 인식 실험 결과, 99.7%의 어절 인식률과 98.8%의 문장 인식률을 얻었으며, 최종적인 문장의 이해도는 99% 이상이었다.

  • PDF

Voice Dialing System을 위한 음성인식 (A Study on the Speech Recognition For the Voice Dialing System)

  • 이성권
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.365-368
    • /
    • 1998
  • 본 연구는 음소 단위의 CHMM(Continuous Hidden Markov Model)을 이용한 Voice Dialing System을 위한 연속 음성인식에 관한 내용이다. 연구실 환경에서 음성으로 전화를 걸기 위하여 전국 지역명과 연속 숫자음 인식을 수행하였다. ETRI 445 데이터를 사용하여 초기의 모델은 ML(Maximum Likelihood) 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 음성으로 다이얼링을 수행하기 위하여 문맥자유문법을 이용하여 제한적이나마 대화체문장으로 수행할 수 있도록 하였다. 그리하여 숫자음에 대하여 5인의 화자에 대하여 4연속 숫자음에 대하여 96%의 인식률을 보이고 있으며 7연속 숫자음에 대하여도 약 91%의 결과를 보여주고 있다. 문장으로도 음성 다이얼링을 수행하였을 경우 문장내에 단어와 숫자음에 대하여 약 80%의 인식률을 보였다.

  • PDF

CHMM을 이용한 전화번호 인식에 관한 연구 (A Study of Telephone Digit Recognition Using CHMM)

  • 이성권
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.31-34
    • /
    • 1998
  • 본 연구는 음소 단위의 CHMM을 이용한 연속어 숫자음 인식에 관한 내용이다. ETRI 445 데이터를 사용하여 초기의 모델은 ML 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 또한 한국어 숫자음 음성의 음향학적 특성을 고려하여 발성 사전을 작성하였고 음절 다누이로 되어있는 한국어 숫자음의 모든 경우를 고려하여 복수개의 단어를 사전에 등록하였다. 또한 적응화 학습에 있어서 숫자음의 앞 뒤 모든 경우를 고려하여 작성한 21 종류의 7자리 전화번호 숫자음 DB로 사용하였고 이의 효율성을 입증하기 위하여 ETRI에서 작성한 35종류의 4연속 숫자음 목록을 대상으로 인식실험을 수행하였다. 그 결과 5인의 화자에 대하여 4연속 숫자음에 대하여 96%의 인식률을 보이고 있으며 7연속 숫자음에 대하여도 약 91%의 결과를 보여주고 있다. 또한 후처리를 두어 연음 현상으로 인한 오인식의 경우에 대해서도 약 2%의 인식률의 증가를 보여주었다.

  • PDF

신경망을 이용한 연속 숫자음 인식에 관한 연구 (A Study On Continuous Digits Recognition Using the Neural Network)

  • 이성권;김순협
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.3-13
    • /
    • 1998
  • 본 논문은 음성 다이어링 시스템을 구현하기 위한 한국어 단독 숫자음 및 연속 숫 자음 인식에 관한 것이다. 단독 숫자음의 인식은 미지의 입력 음성을 재귀 신경망을 이용하 여 모델링된 각 모델에 인가하고, 신경 회로망의 출력 노드의 상태열을 검사하여 적절한 상 태 전이를 하며 최고의 확률값을 출력하는 모델을 인식된 결과로 출력한다. 연속 숫자음의 인식은 미지의 연속 숫자음을 재귀 신경 회로망을 이용한 연속 숫자음 모델에 입력하고, 신 경 회로망의 출력에 대하여 적절한 상태 전이에 대한 검사와 레벨 빌딩(Level Building)을 수행하여 최소의 오차를 가지는 모델열을 인식된 결과로 출력한다. 재귀 신경 회로망을 이 용하여 음절 모델을 만드는 과정에서 재귀 노드는 예상치가 주어지지 않으므로 신경 회로망 의 학습에서 제외되어 현저한 학습 속도의 저하를 가져온다. 따라서 본 논문에서는 재귀 신 경 회로망의 학습 속도를 향상시키기 위한 2가지 방법을 제안 한다. 첫 번째는 재귀 신경 회로망의 재귀 노드의 예상치를 실험적으로 주어줌으로써 학습 속도의 향상을 도모하였다. 두 번째는 음절 모델의 출력노드의 개수와 음절 모델의 세그먼트 경계를 알고리듬을 이용하 여 자동적으로 조절하였다. 실험결과, 단독어의 경우 음절 '에'에 포함하는 한국어 11개의 숫 자음에 대하여 화자 종속의 경우 97.3%, 화자 독립의 경우 80.5%의 인식률을 얻었으며, 연 속 숫자음의 경우는 21종류의 연속 숫자음에 대하여 화자 종속에서 88.2%, 화자 독립의 경 우 81.3%의 인식률을 얻을 수 있었다.

  • PDF

차로이용률을 유도하는 차로변경모형의 개발 (Development of a Lane Changing Model Yielding Reallstic Lane Usage)

  • 연지윤;장명순;김진태;손봉수
    • 대한교통학회지
    • /
    • 제20권5호
    • /
    • pp.99-111
    • /
    • 2002
  • 전산기술의 발달에 힘입어 근래에 모의실험을 이용한 연속교통류의 미시적 분석이 활발히 수행되고 있고 다양한 모의실험 전산모형이 소개되고 있다. 미시적 연속교통류 전산모의실험은 차량추종모형과 차로변경모형을 적용하여 다양한 운전자들의 차량운행행태를 모사하여 분석하는 실험이다. 전산모형은 난수를 토대로 차량의 자유속도와 초기 발생 차로를 배정하기 때문에 낮은 자유속도를 할당받은 차량이 높은 속도의 차로(예:1차로)로 발생되는 경우가 발생한다. 많은 모의실험모형이 사용하고 있는 차로변경의 가정이 "운전자는 자신이 원하는 속도(자유속도)를 유지한다"는 것이며 그러한 가정만의 적용으로 인해 현실적이지 않은 차로 이용률이 결과되고, 따라서 전산모형을 통한 교통류 흐름분석에 문제를 제공하고 있다. 본 논문에서는 미국 도로국에서 20여년 동안 개발되고 수정되어왔으며 현재 실용적으로 가장 많이 사용되고 있는 Freeway Simulation(FRESIM) 전산모형이 내재한 차로변경모형을 토대로 고속도로 기본구간에서의 선택적 차로변경모형을 제시한다. 제시된 모형에서는 (1)저속의 선행차량이 고속의 후행차량에게 차로를 양보하는 가정이 새롭게 추가되고 (2)FRESIM모형에서 사용하는 상수값을 국내 현장조사를 통하여 도출된 분포식을 통한 값으로 대체하였다. 수집된 자료분석결과 연속 교통류에서의 15% 차두시간은 1.34초이며 차로변경시간은 평균 2.22초인 F분포를 따르고, 자유속도는 정규분포를 따르는 것으로 결과되었다. 모의실험결과 무작위난수를 토대로 배정된 차로로 생성된 차량들이 새롭게 제시된 차로변경모형의 적용으로 현장 차로이용률을 95% 신뢰수준에서 모사하는 것으로 분석되었다.

연속 음성 인식 기법을 이용한 단어 음성 인식 (The recognition of word by continuous speech recognition technic)

  • 조영훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.91-94
    • /
    • 1998
  • 우리만은 영어와는 달리 단어를 공백으로만 구분할 수 없다. 그러므로 대용량 어휘를 갖는 연속 음성을 인식하기 위한 언어모델을 만들기가 매우 어렵다. N-gram의 언어 모델을 우리말 문장에 적용하기 위해 하나의 문장을 한 단어로 구성하여 처리하였다. 우리의 인식시스템을 평가하기 위하여 시스템 공학 연구소에서 제공한 음성을 대상으로 인식률을 계산하였다. 단어의 종류는 452개이며 한명이 이 단어들을 2번씩 발음하고 총70명이 발음한 총 63,280개의 단어에 대하여 92.8%의 인식률을 얻었다. 일간지 사설로부터 추출한 단어를 대상으로 발음 사전을 10K 크기로 만들었다. 음성 모델은 uniphone을 사용하였다.

  • PDF

투수성 콘크리트포장의 실용화를 위한 실험적 연구 (An Experimental Study of Permeable Concrete Pavement for Application)

  • 문한영;김성수;정호섭
    • 콘크리트학회지
    • /
    • 제10권3호
    • /
    • pp.165-173
    • /
    • 1998
  • 투수성 콘크리트포장은 우천시 도로포장 노면의 배수, 차량 주행 안전성의 향상 및 소음의 저감등을 목적으로 개발된 포장이지만 주행환경 및 도로주변과의 환경조화에도 기여한다. 일반적인 배수성 아스팔트 콘크리트포장에서는 투수계수 1$\times$10-2cm/sec를 목표로 정하고 있으나 본 연구에서는 투수성 콘크리트포장의 실용화를 위한 연구의 일환으로 투수계수1$\times$10-1cm/sec를 목표로 정하여 골재의 최대치수, 잔골재율 및 단위시멘트량을 변화시킨 투수성 콘크리트의 공극률, 연속공극률 및 투수계수와 제강도를 측정한 결과에 대하여 고찰하였다. 투수성 콘크리트의 목표투수계수 1$\times$10-1cm/sec 일 때 공극률 및 연속공극률은 각각 15 %와 12%정도이며, 압축강도는 240kg/$\textrm{cm}^2$정도의값을 나타내었으며, 골재의 최대치수가 10~13mm일 경우, 잔골재율 10~20%, 단위시멘트량 380 kg/$\textrm{cm}^2$정도가 적절한 배합으로 생각된다.

음성 인식 후처리를 위한 연속 음절 문장의 키워드 추출 알고리즘 (Keyword Spotting Algorithm within a Continuous Syllable Sentence for the Post-Processing of Speech Recognition)

  • 조시원;이동욱
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.170-171
    • /
    • 2008
  • 연속적인 음성 인식 결과는 띄어쓰기를 하지 않은 연속 음절 문장들로 이루어져 있다. 본 논문은 음성 인식 후처리 단계에서 연속 음절 문장을 조사/어미 사전을 이용한 어절 생성 과정과 형태소 분석기를 이용하여 어절을 생성한 후 키워드를 추출한다. 실험 결과, 어절 생성기만 적용한 방식보다 제안된 알고리즘의 인식률이 향상되는 것을 확인하였다.

  • PDF

연속미디어 파일 시스템의 버퍼 캐시에서 데이터 참조 유형의 고려 (Considering Data Reference Pattern in Buffer Cache for Continuous Media File System)

  • 조경운;류연승;고건
    • 정보처리학회논문지A
    • /
    • 제9A권2호
    • /
    • pp.163-170
    • /
    • 2002
  • 연속미디어 파일을 위한 버퍼 캐시 기법들은 연속 미디어의 순차적 접근만을 고려하고 반복참조는 고려하지 않았다. 그러나, 외국어 영상 학습의 경우 사용자가 어떤 장면을 반복 구간으로 설정하면 자동으로 수회 반복 상영하는 기능이 있을 수 있다. 본 논문에서는 순차 참조와 반복 참조가 혼재하는 연속미디어 파일 시스템을 위한 새로운 버퍼 캐시 기법을 제안한다. 제안한 기법은 파일의 참조 유형을 탐지하고 파일 별로 적절한 교체 정책을 적용하여 버퍼 캐시 적중률을 높인다.