• 제목/요약/키워드: 음성 분석

검색결과 3,062건 처리시간 0.028초

음성 인식률 개선방법에 관한 연구 (A Study on Improved Method of Voice Recognition Rate)

  • 김영포;이한영
    • 한국전자통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.77-83
    • /
    • 2013
  • 본 논문에서는 음성 인식률 개선에 관한 방법을 제시하고 연구하였다. 기존의 음성 검출 방법 중 많이 이용되고 있는 HMM(Hidden Markov Model) 알고리즘을 이용하여서 음성을 검출하였다. 실험은 음성 검출과 음성 인식의 두 가지 방법으로 진행하였다. 음성 검출은 음성의 단위로 영교차율을 구하여 데이터의 유무를 판별하였다. 음성 인식은 음성의 형상의 패턴을 분석한 후 학습된 패턴과 비교 하는 형식으로 분석하였다. 실험 결과, 제안된 음성 형상의 패턴인식 이용한 알고리즘은 92%의 음성 인식률을 얻어 80%의 기존 HMM 알고리즘에 비해서 약 12%의 향상된 인식률을 얻을 수 있었다.

ITU-T 8kbit/s 음성부호화표준 CS-ACELP의 성능 (Performance of ITU-T 8kbit/s Speech Coding Standard (CS-ACELP))

  • 김정환
    • 전자통신동향분석
    • /
    • 제13권2호통권50호
    • /
    • pp.53-66
    • /
    • 1998
  • 본 고에서는 ITU가 수행해 온 음성 부호화 표준의 역사 그리고 1996년 ITU-T에서 승인된 8kbit/s 음성 부호화 표준인 CS-ACELP의 구성에 대해서 분석하였다. 또한, 미래 유, 무선 통신 시스템에 있어서 핵심 음성 부호화 기술로 자리잡게 될 CS-ACELP의 품질평가와 주요 애플리케이션을 살펴보았다.

감정 인식을 위한 음성신호 비교 분석 (Comparison and Analysis of Speech Signals for Emotion Recognition)

  • 조동욱;김봉현;이세환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.533-536
    • /
    • 2006
  • 본 논문에서는 음성 신호로부터 감정의 특징을 나타내는 요소를 찾아내는 것을 목표로 하고 있다. 일반적으로 감정을 인식할 수 있는 요소는 단어, 톤, 음성신호의 피치, 포만트, 그리고 발음 속도 및 음질 등이 있다. 음성을 기반으로 감정을 익히는 방법 중에서 현재 가장 많이 접근하고 있는 방법은 피치에 의한 방법이 있다. 사람의 경우는 주파수 같은 분석 요소보다는 톤과 단어, 빠르기, 음질로 감정을 받아들이게 되는 것이 자연스러운 방법이므로 이러한 요소들이 감정을 분류하는데 중요한 요소로 쓰일 수 있다. 따라서, 본 논문에서는 감정에 따른 음성의 특징을 추출하기 위해 사람의 감정 중에서 비교적 자주 쓰이는 평상, 기쁨, 화남, 슬픔에 관련된 4가지 감정을 비교 분석하였으며, 인간의 감정에 대한 음성의 특성을 분석한 결과, 강도와 스펙트럼에서 각각의 일관된 결과를 추출할 수 있었고, 이러한 결과에 대한 실험 과정과 최종 결과 및 근거를 제시하였다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증하고자 한다.

  • PDF

Loglet 분석을 이용한 음성 및 데이터 서비스의 수요 확산 패턴 차이 (A Loglet Analysis of Voice and Data Service Diffusion Pattern)

  • 김문수
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.69-73
    • /
    • 2000
  • 정보통신기술의 역사는 다른 산업 기술에 비해 매우 일천하다. 그러나 현재 가장 빠르게 진보하고 있는 기술이며, 기업활동과 개인의 일상 생활에 커다란 영향 요소로 대두되고 있다. 특히 인터넷의 영향은 지대하다. 인터넷을 이용하여 기업의 생산성을 증대하거나 전자 상거래와 같은 새로운 형태의 사업 기회 제공의 장이 되고 있다. 또한 개인은 매우 다양하고 방대한 정보를 획득, 이용함으로써 자신의 효용을 극대화할 수 있다. 이는 사회, 경제의 새로운 패러다임의 출현으로까지 표현되고 있다. 따라서 과거의 음성통신 서비스 수요와 현재 및 미래의 데이터 통신 수요의 패턴에는 많은 차이가 존재할 수 있다. 본 논문은 대표적 음성 서비스인 전화 서비스 그리고 데이터 서비스라 할 수 있는 인터넷 서비스를 대상으로 수요 속성별 즉, 업무용과 가정용 수요의 확산 패턴을 Logier 분석을 이용하여 고찰하였다. 분석 결과 전체적으로 음성보다는 데이터 수요 확산 속도가 컸으며, 수요 속성별로는 데이터 서비스에서 업무용보다 가정용확산이 음성의 경우보다 훨씬 빠르게 이루어지고 있었다. 그리고 인터넷 가입에 대한 여러 결과를 얻었으며, 이는 정보통신관련 기업과 정책 당국자에게 매우 중요한 자료로 활용할 수 있을 것으로 기대된다.

  • PDF

부산 지역 청소년 음성의 연령별 특징 변화 분석 (Acoustics of Young People's In Busan : Developmental Changes of Spectral Parameters)

  • 백승관;노용주;윤종락
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.49-52
    • /
    • 2001
  • 부산지역 청소년 음성의 지속시간, 피치주파수 포만트 주파수 특성을 연령별, 성별로 분석하였다. 실제 발음 환경에서의 음성 패턴은 발성화자 개인 및 화자별로 다양하게 변화한다. 이를 모델 화하기 위해서는 다량의 음성 데이터로부터 통계적 방법에 의한 변화 요인별 파라미터 분석이 선행되어야 할 것이다. 실험에 사용된 데이터는 부산지역에 거주하는 청소년(초등학생, 중학생, 고등학생)들이 연령별로 3회 발성한 우화의 일부와 단모음(/아/,/이/,/우/,/에/,/오/)이다 실험 결과로부터 얻어진 지속시간, 주파수 특성 변화 패턴을 연령별, 성별로 구분하여 통계적으로 분석한 뒤 이를 정량화 하였다. 실험 결과로부터 부산 지역 청소년 음성의 지속시간, 주파수 특성은 예측된 바와 같이 기 연구된 성인 음성과 많은 차이를 보였으며 이는 부산 지역 방언의 DB 구축 시 설계자가 고려해야 할 기초자료로 활용 될 수 있을 것이다.

  • PDF

한국어 음성 인식 시스템의 오류 유형 분류 및 분석 (Categorization and Analysis of Error Types in the Korean Speech Recognition System)

  • 손준영;박찬준;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.144-151
    • /
    • 2021
  • 딥러닝의 등장으로 자동 음성 인식 (Automatic Speech Recognition) 기술은 인간과 컴퓨터의 상호작용을 위한 가장 중요한 요소로 자리 잡았다. 그러나 아직까지 유사 발음 오류, 띄어쓰기 오류, 기호부착 오류 등과 같이 해결해야할 난제들이 많이 존재하며 오류 유형에 대한 명확한 기준 정립이 되고 있지 않은 실정이다. 이에 본 논문은 음성 인식 시스템의 오류 유형 분류 기준을 한국어에 특화되게 설계하였으며 이를 다양한 상용화 음성 인식 시스템을 바탕으로 질적 분석 및 오류 분류를 진행하였다. 실험의 경우 도메인과 어투에 따른 분석을 각각 진행하였으며 이를 통해 각 상용화 시스템별 강건한 부분과 약점인 부분을 파악할 수 있었다.

  • PDF

시간-주파수영역에서의 새로운 피치검출 방법 (A New Pitch Detection Method in time-Frequency Domain)

  • 김종국;최호진;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.805-808
    • /
    • 2001
  • 음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하나 만일 음성신호의 기존주파수를 정확히 검출할 수 있다면 음성인식에 있어서 화자에 따른 영향을 줄일 수 있기 때문에 인식의 정확도를 높일 수 있고, 음성합성 시에 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석시 피치에 동기 시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 따라서 제안한 논문에서는 시간영역처리에서 시간영역파형에서 먼저 성도성분이 제거된 성문특성 즉 피치주기 성분을 강조하기 위해 음성신호의 기울기를 이용한 Positive 센터 클리핑를 수행하고 주파수 영역에서는 원신호의 스펙트럼과 센터클립된 신호의 스펙트럼과의 Peak-Fiting을 수행하고 선형 인터폴래이션(스무딩)을 통해 평탄화된 스펙트럼을 얻었다. 결과적으로 유성음 구간과 음성이 변하는 전이구간에서 G-peak가 강조된 더욱 정확한 Pitch를 검출할 수 있었다.

  • PDF

실험에 의한 음성·음악 분류 특징의 비교 분석 (Comparison & Analysis of Speech/Music Discrimination Features through Experiments)

  • 이경록;류시우;곽재영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.308-313
    • /
    • 2004
  • 본 논문에서는 각 특징 파라미터 조합의 음성/음악 분류 성능을 비교 분석하였다. 음향신호는 3가지(음성, 음악, 음성+음악)로 분류하였다. 본 실험에서는 분류 특징으로 멜캡스트럼, 에너지, 영교차 3가지 형태가 사용되었다. 음성/음악 분류 성능이 가장 좋은 특징간의 상호 조합을 비교 분석하였다. 실험결과 멜캡스트럼, 영교차 조합이 가장 좋은 결과(음성: 95.1%, 음악: 61.9%, 음성+음악: 55.5%)를 보인다는 것을 확인할 수 있었다.

  • PDF

화자 의도 분석을 통한 모바일 기기 제어 시스템 (Mobile Control System using Semantic Analysis of User's Intent)

  • 박희근;장정훈;안영민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.282-284
    • /
    • 2012
  • 음성 인식 기술의 발전과 더불어 다양한 분야에서 음성 인식 시스템이 활용되고 있다. 본 논문에서는 사용자 음성으로부터 입력된 문장의 의도를 파악하여 모바일 기기를 제어할 수 있는 시스템에 대해서 기술한다. 사용자의 의도를 파악하기 위해, 동일한 의미를 가진 문장 형태들을 LSP(Lexico Semantic/Syntactic Pattern)로 구성하였고, 이를 이용하여 입력된 문장의 의도를 파악할 수 있는 문장-의미 분석 시스템을 구현하였다. 사용자의 음성 인식은 구글 안드로이드 음성 인식 모듈을 이용하였으며, 음성 인식 모듈과 문장-의미 분석 시스템을 통해 얻어진 화자의 의도는 모바일 기기의 동작과 연결된다. 본 논문은 자연적인 음성 명령을 통해 자연스러운 모바일 제어가 가능하다는 것을 보여준다.