• 제목/요약/키워드: 음성 분석

검색결과 3,079건 처리시간 0.03초

웨이브렛 변환을 이용한 피치검출 (Pitch Detection Using Wavelet Transform)

  • 손영호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1997년도 영남지회 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.5-8
    • /
    • 1997
  • 음성신호는 성대를 통과한 공기 흐름의 성질에 따라 유성음과 무성음으로 구분될 수 있다. 그 중 유성음에서는 성대의 규칙적인 지동이 존재하게 된는 데 이때 성대가 닫히는 순간을 GCI(Glotal Closure Instant)라 하며 성대 진동의 기본주기를 피치라고 한다. 이러한 피치는 음성합성, 음성인식, 피치동기 음성신호의 분석등에 중요한 파라미터 중의 하나이다. 본 논문에서는 가우시안 함수의 일차미분형태를 갖는 웨이브렛 함수를 사용할 경우 신호의 급격한 변화부분을 검출할 수 있다는 성질을 이용하여 음성 신호의 GCI를 찾아내고 이를 이용하여 피치를 검출하였다.

  • PDF

정상인과 후두폴립환자 음성의 음향적 분석 (Acoustic measures from normal and vocal polyp patients)

  • 최흥식;장미숙;이정준
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1993년도 제1회 학술대회 연제순서 및 초록집
    • /
    • pp.15-15
    • /
    • 1993
  • 정상 성대는 규칙척인 진동을 보이지만 병변이 있는 사람들은 진폭과 시간에 있어서 주기마다의 불규칙성을 보여준다. 이 때 각 주기마다의 시간의 불규칙성은 Jitter를 의미하며 강도의 불규칙성은 Shimmer로 표현된다. 본 연구는 우리나라 정상인 음성의 떨림을 객관적으로 조사해보고 이에 따라 병변이 있는 사람들의 음성의 떨림을 판별할 수 있는 가능성을 알아보기 위하여 저자들은 CSpeech를 이용해 정상인과 후두폴립환자의 jitter, shimmer, S R를 비교해보았다.(중략)

  • PDF

ETRI신기술-확장 합성단위 기반 한국어 음성합성기 기술

  • 한국전자통신연구원
    • 전자통신동향분석
    • /
    • 제14권3호통권57호
    • /
    • pp.127-128
    • /
    • 1999
  • 확장 합성단위 기반 한국어 음성합성장치는 통상의 문자로 쓰여진 텍스트를 인간이 소리내어 읽듯이 기계에 의해 자동적으로 음성을 합성하는 시스템이다. 이 시스템은 1995년부터 수행하고 있는 "다중 매체 환경 하에서의 대화체 음성번역 통신 기술개발" 사업의 연구 결과물 중 하나로 1997년도에 개발되어 학습형 자동합성단위 생성기 및 영역의존 음성합성기 기술을 전수할 예정이다.

  • PDF

운율 분석용 DB 작성을 위한 자동 레이블러(Automatic labeler)의 성능 평가 및 유용성

  • 강상훈;이항섭;김회린
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.468-471
    • /
    • 1996
  • 이 논문에서는 대량의 음성합성용 운율 DB를 용이하게 구축하기 위해 음성번역시스템을 이용한 자동 레이블러의 성능을 다양한 음성데이타를 대상으로 평가하였다. 실험 결과 FM radio news문장, 대화체 문장 및 낭독체 문장 등에는 레이블링 대상 음소의 약 80% 이상이 오류가 30msec 이내인 범위로 레이블링 되며, 고립단어에 대해서는 약 60%의 성능을 보여주고 있다. 현재 당 연구실에서는 자동 레이블러를 이용하여 합성용 운율 DB 및 합성단위를 작성하고 있으며. 자동 레이블러를 이용함으로서 일관성 있는 레이블링 결과를 얻을 수 있을 환 아니라 작성하는데 소요되는 시간도 줄일 수 있었다

  • PDF

Pulse-Train code 여기 선형 예측 (PT-CELP) 부호화기에 관한 연구 (A Study on the Pulse-Train Code Excited Linear Prediction Coder: PT-CELP)

  • 김흥국
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.246-249
    • /
    • 1995
  • 4.16kbps의 전송률을 갖는 음성 부호화기 구조에 관하여 기술한다. 제안된 음성 부호화기는 개방 회로 피치 검출기와 이로부터 생성된 pulse train을 코드북으로 갖는 CELP 부호화기이다. Pulse-Train codebook은 분석 프레임별로 부호화 및 복호화 양단에서 생성되며 음성의 피치 및 포만트 정보를 내포하고 있다. 구현된 PT-CELP는 random codebook 방식의 CELP에 비해 적은 크기로 codebook을 만들 수 있으며 음성의 특징을 충분히 반영하므로 합성된 음성의 음질을 향상시킬 수 있다.

  • PDF

해외 음성 DB 구축 동향 (Activities of Speech DB construction out of Countries)

  • 이용주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.253-260
    • /
    • 1995
  • 음성정보처리 연구에 공통으로 이용 가능한 대량의 각종 음성 데이터를 수집, 편집, 배포하는 dfl은 연구 개발자의 입장에서는 분석, 합성, 인식등의 알고리즘 개발 평가에 이용 가능하며, 음성인식, 합성 시스템의 사용자 입장에서는 각종 시스템의 성능을 객관적으로 평가할 수 있다는 면에서 매우 중요하다. 본 논문에서는 국내 음성 DB 의 효율적인 구축을 위한 방안 도출에 참고하기 위하여 해외 각국의 구축 동향을 기관별, 형태별, 분야별로 구체적으로 정리하여 소개한다.

  • PDF

범죄음성의 식별

  • 고도흥
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.176-179
    • /
    • 2003
  • 범인의 음성을 녹취하여 본격적으로 컴퓨터를 이용하여 음향분석을 하는 것은 스펙트로그래프가 등장하는 1940년대 말 이전에는 없었다고 해도 과언이 아니다. 그러나 청지각적인 문제는 아마 수 백년 전부터 법정에서 논란이 있었을 것으로 추정한다. 영국에서는 이미 1660년에 법정에서 청지각적인 검사를 시행하였다는 기록이 있으며, 미국에서는 20세기 초엽에 플로리다 주에서 이미 청지각적인 증거를 법정에서 채택하였다는 기록이 있다. 오늘날 범죄음성에 대한 연구는 무고한 어린이의 유괴와 폭발물 설치협박 등과 같은 죄질이 무거운 범죄에 이용되기 때문에 문제가 심각한 실정이다. (중략)

  • PDF

음성검사 및 음성재활장치의 개발

  • 이상준;성명훈;김광현;권택균;최종민;김욱은;김희찬;박광석;김동영
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.212-214
    • /
    • 2003
  • 후두는 호흡, 발성, 기도의 보호기능을 한다. 이 중 발성은 의사소통의 수단으로 인간에게 매우 중요한 의미를 가진다. 본 교실에서 개발한 발성기능을 객관적이고 정량적으로 평가할 수 있는 Videostrobokymorgraphy(VSK), 다채널 음성분석장치, 그리고 발성재활장치인 Hands free 전기후두에 대해 소개하고자 한다.

  • PDF

음성 단어를 이용한 구간검출에 의한 패턴인식 (Pattern Recognition by Section Detection Using Speech Word)

  • 최재승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.681-682
    • /
    • 2016
  • 본 논문에서는 화자 식별에서 음성신호의 애매한 점을 보완할 수 있는 신경회로망의 오차역전파학습 알고리즘과 모음구간 검출에 기초하여 입력되는 음성의 화자 패턴을 구분하는 일본어 단어 패턴인식 알고리즘을 제안한다. 제안하는 알고리즘에서는 일본어 데이터베이스로부터의 단어를 사용하여 음성의 특징벡터를 추출하여 분석하고 이러한 음성의 특징벡터의 차이를 이용하여 일본어 화자에 대한 패턴인식 실험을 수행하였다.

  • PDF

자유발화형 음성대화처리 기술동향 (Trends of Spontaneous Speech Dialogue Processing Technology)

  • 권오욱;최승권;노윤형;김영길;박전규;이윤근
    • 전자통신동향분석
    • /
    • 제30권4호
    • /
    • pp.26-35
    • /
    • 2015
  • 모바일 혁명 빅데이터와 사물인터넷 시대에 접어들면서 인간의 음성과 말로 다양한 장치와 서비스를 제어하고 이용하는 것은 당연시되고 있다. 음성대화처리 기술은 인간 중심의 자유로운 발화를 인식하고 이해 및 처리하는 방향으로 발전하게 될 것이다. 본고에서는 현재 음성대화처리 기술 국내외 기술 및 산업 동향과 지식재산권 동향을 살펴보고, 인간 중심의 자유발화형 음성대화처리 기술 개념과 발전방향에 대해 기술한다.

  • PDF