• 제목/요약/키워드: 음성분석

검색결과 3,082건 처리시간 0.025초

Shifted Window를 이용한 음성신호의 분석에 관한 연구 (On a Study of Analysis Using Shifted Window in the Speech Signal)

  • 강은영;민소연;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.131-134
    • /
    • 2000
  • 음성신호처리에서 스펙트럼 분석은 매우 중요하다. 하지만 스펙트럼 분석을 위해서 사용되는 윈도우에 의해 생기는 누설에러지 때문에 음성신호의 스펙트럼 정보가 왜곡된다. 본 논문에서는 스펙트럼 분석 시 발생되는 창함수 사용에 의해 생기는 누설에너지를 최소화하기 위한 새로운 창함수를 제안하고자 한다. 그 형태는 전체 창함수크기의 반을 방형창으로 나머지 반을 해밍창으로 하고 창의 처음 부분은 $\pm$20표본에서 영점을 찾아주는 것이다. 이 창함수의 특징은 신호분석에 있어서 왜곡은 크지만 그 형태에 있어서 가장 이상적인 방형창함수의 장점과 side lobe가 작아 비교적 왜곡이 적은 해밍창함수의 장점을 취한 것이라 하겠다. 실제 음성 신호에의 적용에 있어서 방형창과 해밍창의 적용비는 신호의 종류 및 용도에 따라 달리할 수 있다. 제안한 창함수는 해밍창함수 보다는 좁은 main lobe 특성으로 음성신호의 단구간 스펙트럼 분석시 음성의 빠른 변화특성을 적절히 보여줄 수 있고 방형창보다는 side lobe의 영향을 줄일 수 있다.

  • PDF

PC를 이용한 실시간 음성검출 알고리즘에 관한 연구 (A Study on the Fevelopment of Teal Time Speech Detection in PC)

  • 정훈;정권;정익주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.129-132
    • /
    • 1994
  • 본 논문에서는 윈도우즈용 음성인식 software "voice access"를 개발하여 연구한 실시간 음성검출 알고리즘에 관해 소개한다. 이 음성검출 알고리즘은 200 sample 단위의 프레임 에너지, 프레임 영교차율, 음성의 길이를 음성검출의 파라메타로 사용한다. 각 파라메타의 문턱값은 신호의 평균값, 잡음의 표준편차, 미디안 표준편차와 한국어의 음성적 특성을 고려하여 설정하였으며 주변의 환경에 적응해 가며 문턱값을 조정하므로 주변 잡음환경의 변화에 대해서도 강인한 음성검출 결과를 보여준다. 또한 실시간으로 음성을 검출하므로 실용성이 높다. 음성의 검출은 일반사운드 카드를 통해 16-bit의 8KHz로 샘플링된 신호를 사용한다. 음성검출을 위한 분석은 200 sample 씩 하고 100 sample 씩 overlap 하면서 수행한다. 음성검출을 위한 모든 분석은 특별한 DSP의 도움없이 486D 이상에서 실시간으로 구현했다.시간으로 구현했다.

  • PDF

자기상관함수에서 위상 성분의 보존에 의한 피치 시점 검출에 관한 연구 (On a Pitch Point Detection by Preserving the Phase Component of the Autocorrelation Function)

  • 함명규;최성영;박종철;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.799-802
    • /
    • 2000
  • 음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.

  • PDF

담화 정보를 이용한 음성 인식 후처리 (Post Correction of Speech Recognition using Discourse Information)

  • 김주희;강상우;선충녕;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.147-151
    • /
    • 2010
  • 본 연구는 대화 시스템에서 처리되는 사용자 발화의 의도 분석 기법과 담화 정보를 사용하여 음성 인식 결과로서의 인식 후보 문장들을 재순위하는 방법을 제안한다. 담화 정보는 사용자 발화의 의도 분석에 매우 중요한 자질로 사용되고 있기 때문에 음성 인식 결과들의 후보를 선택하는 문제에서도 담화 정보는 매우 중요한 자질로 사용될 수 있다. 음성 인식 결과의 후보 문장들을 모두 의도 분석 과정을 거치고 각각의 후보 의도들과 이전 담화 정보의 연관성을 이용하여 음성 인식 결과를 재순위화 한다. 실험을 통하여 재순위 과정을 수행한 결과 1순위 음성 인식 결과는 재순위 과정을 거치지 않는 결과에 비해 7.08%의 오류 감소율을 보였다.

  • PDF

비대면 음성 쇼핑의 인지된 가치, 지속이용의도에 미치는 영향 관계에 관한 연구 (The Influence of Perceived Value on Continuance Use Intention in Voice Commerce Context)

  • 김효정
    • 디지털융복합연구
    • /
    • 제20권4호
    • /
    • pp.225-234
    • /
    • 2022
  • 음성 쇼핑이 새로운 정보 탐색 및 구매 채널로 주목을 받고 있다. 본 논문은 비대면 음성 쇼핑의 지속이용의도에 영향을 미치는 요인들을 가치기반수용모델을 이용하여 살펴보았다. 음성 쇼핑 이용 경험이 있는 소비자들을 대상으로 온라인 조사를 실시하였으며, 총 470명의 응답자료가 최종 분석에 활용되었다. 음성 쇼핑 경험자는 음성 쇼핑으로 물품을 구매하였거나 음식 배달 서비스를 이용한 개인들로 한정하였다. SPSS 23.0과 Amos 23.0 프로그램을 이용하여 기술통계 분석, 상관관계 분석, 확인적 요인분석, 그리고 구조모형 분석을 실시하였다. 본 연구의 결과를 요약하면 다음과 같다. 첫째, 유용성과 응대 정확성이 음성 쇼핑의 인지된 가치를 증가시키는 것으로 확인되었다. 둘째, 기능적 위험이 음성 쇼핑의 인지된 가치를 감소시키는 것으로 확인되었다. 셋째, 인지된 가치가 음성 쇼핑의 지속이용의도를 향상시키는 것으로 나타났다. 본 연구 결과는 음성 쇼핑을 이용하는 소비자들의 특성을 이해하고, 음성 쇼핑이 이용자들에게 혜택을 제공하는 유용한 서비스로 자리매김하는데 기여할 수 있을 것이다.

정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구 (Analysis of Speech Signals According to the Various Emotional Contents)

  • 조철우;조은경;민경환
    • 한국음향학회지
    • /
    • 제16권3호
    • /
    • pp.33-37
    • /
    • 1997
  • 본 논문은 정서정보를 포함하여 수집된 음성자료를 여러 가지 신호처리 방법으로 분석한 결과에 대하여 기술하고 있다. 정서정보를 포함한 음성은 연극배우로부터 수집하였으며 분석은 주로 피치정보의 변화와 지속시간을 중심으로 행하였다. 수집된 음성에 대한 분석결과 정서정보의 변화에 따른 음성 파라미터의 변화치를 얻을 수 있었으며 이 실험은 앞으로의 정서음성정보의 분석에 필요한 기초적 실험으로 의의가 있다.

  • PDF

매운 음식과 음성신호와의 상관성 분석 (Correlation Analysis of Between Spicy Food and Voice Signals)

  • 김봉현;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.799-801
    • /
    • 2013
  • 최근 들어 봄과 가을이 짧아지고 여름이 길어지면서 매운 음식을 즐겨 먹는 현대인들이 증가하고 있다. 매운 음식은 더위 속에서 건강을 지키기 위해 만들어진 과학적인 음식으로 기후가 덥고 습한 환경에서 매운 음식으로 땀을 빼야 몸이 가뿐해진다고 알려져 있다. 따라서 본 논문에서는 매운 음식을 섭취함으로써 인체 기관에 미치는 기능적 변화를 음성신호 분석학적 방법의 적용으로 연구를 수행하였다. 이를 위해 20대 남성 15명을 대상으로 매운 음식을 섭취하기 전과 후의 음성을 수집하고 음성분석 요소를 적용한 실험을 수행하여 상호간의 비교, 분석을 통해 매운 음식과 음성신호 변화와의 상관성 분석을 수행하였다.

음성 합성을 위한 음성 파라미터 분석법의 개선에 관한 연구 (A Study on Improvements of Speech Analysis Methods for Speech Synthesis)

  • 방호균
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.111-114
    • /
    • 1995
  • 포만트 합성에 필요한 음성 파라미터를 분석하는 방법의 개선에 관하여 논한다. 내용은 주로 피치 동기 분석을 위한 피치 위치 추정법의 개선과 포만트 분석시 발생하는 스펙트럼의 왜곡 현상을 기존이 포만트 분석법 및 선형예측분방법과 비교한다.

  • PDF

경량화 MobileNet을 활용한 축산 데이터 음성 분석 (Analysis of Livestock Vocal Data using Lightweight MobileNet)

  • 정세연;김상철
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.16-23
    • /
    • 2024
  • 돼지는 꿀꿀거림, 기침, 비명과 같은 다양한 소리로 환경에 대한 반응과 건강 상태를 나타낸다. 돼지 음성의 중요성으로 최근 들어 돼지의 음성은 축산업 종사자에게 매우 중요한 데이터로 활발하게 연구되고 있다. 이를 위해 돼지의 음성 패턴을 분석하여 농장 소음 속에서 돼지의 음성을 구분하고 음성과 기침 소리를 구분하는 경량화 MobileNet 모델을 제안한다. 이 MobileNet은 돈사 내에서 다양한 배경 잡음, 기침 소리 등의 다양한 소리 속에서 돼지의 음성만을 정밀하게 구분하고 분석할 수 있었다. 테스트 결과, 이 모델은 98.2%의 높은 정확도를 보여주었다. 이러한 결과를 바탕으로 향후 연구에서는 돼지의 감정 분석, 스트레스 파악 등의 문제 해결을 기대한다.