• 제목/요약/키워드: 포먼트

검색결과 96건 처리시간 0.023초

성대신호 기반의 명령어인식기를 위한 특징벡터 연구 (Effective Feature Vector for Isolated-Word Recognizer using Vocal Cord Signal)

  • 정영규;한문성;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권3호
    • /
    • pp.226-234
    • /
    • 2007
  • 본 논문은 환경 노이즈를 원천적으로 차단하는 성대 마이크를 이용한 명령어 인식기를 개발한다. 성대마이크는 환경 노이즈의 효과를 최소화하는 장점이 있다. 그러나 고주파의 부재와 부분적인 포먼트 정보 손실 때문에, 성대마이크를 이용해서 개발된 ASR시스템은 표준마이크를 이용한 시스템에 비해 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로 낮은 성능을 보인다. 이러한 문제 때문에 ASR시스템 개발에 성대마이크를 이용한 경우는 표준 마이크로부터 입력되는 정보 보안하는데 주로 사용된다. 본 논문은 한국어의 음운적 특정과 신호 분석을 통해 성대마이크만을 사용한 높은 성능의 ASR 시스템을 개발 할 수 있음을 보인다. 주파수 대역내 에너지 합을 이용하는 MFCC 알고리즘이 갖는 성대신호 분석의 문제점을 제시하고, 성대신호를 대상으로 보다 높은 성능을 갖는 특정추출 알고리즘의 조건을 제시한다. 이러한 조건은 (1) 민감한 band-pass filter와 (2) 유/무성음 분리를 위해 사용하는 특정벡터의 사용이다 실험 결과 제안된 조건을 만족하는 ZCPA 알고리즘을 적용한 경우가 MFCC를 적용한 경우보다 약 16%정도의 높은 성능을 보인다. 그러고 CMS와 RASTA와 같은 channel normalization 알고리즘을 적용한 경우 약 2%의 성능 향상이 있다.

경직형과 불수의운동형 뇌성마비아동의 /아/ 모음 음향학적 비교 (A comparative study of the acoustic characteristics of the vowel /a/ between children with spastic and dyskinetic cerebral palsy)

  • 정필연;심현섭
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.65-74
    • /
    • 2020
  • 본 연구의 목적은 경직형과 불수의운동형 뇌성마비 아동의 음향학적 특성에서 차이가 있는지 알아보는 것이다. 연구대상은 만 4~12세의 뇌성마비 아동 34명이 참여하였다(경직형 26명, 불수의운동형 8명). 연구과제는 모음 '아' 연장발성하기이고, Praat을 사용하여 MPT, F0, Jitter, Shimmer, NHR과 F1, F2를 측정하였다. 두 유형 간 음향학적 차이를 알아보기 위해 두 독립표본 t-검정과 등분산가정이 충족되지 않는 경우 Welch-Aspin 검정을 사용하여 통계분석을 실시하였다. 연구결과, 첫째, 경직형 뇌성마비아동에 비해 불수의운동형에서 유의하게 낮은 MPT를 나타내었다. 둘째, Shimmer에서 불수의운동형의 측정치가 유의하게 높았다. 셋째, F1과 F2에서는 두 유형 간에 유의한 차이를 보이지 않았다. 이러한 결과는 경직형에 비해 불수의운동형의 호흡능력과 호흡조절능력이 더 제한적이고, 음성의 불안정성과 불규칙성도 더 많이 나타난다는 것을 시사한다. 본 연구의 결과는 뇌성마비 유형 간 말운동통제능력의 차이를 확인하고, 유형에 따른 중재계획을 수립하는데 필요한 정보를 제공해 줄 수 있을 것이다.

음란물 시청으로 야기된 성욕이 인체에 미치는 영향 (Influence of Sexual Desire Caused by Watching Phonography on Human Body)

  • 김봉현;조동욱;김희대;이범주;박영;정연만
    • 한국통신학회논문지
    • /
    • 제42권4호
    • /
    • pp.831-837
    • /
    • 2017
  • 인터넷, 스마트 폰 등과 같은 각 종 전자매체의 발전은 여러 형태의 다양한 미디어 정보가 하나의 매체에서 제공된다는 순기능과 더불어 또 다른 한 편으로는 스마트 폰 중독 등을 비롯한 여러 역기능 또한 대단히 큰 사회적 문제로 야기되고 있는 실정이다. 특히 가장 큰 대표적 역기능 중 하나가 음란물(야한 동영상, 이하 '야동') 시청에 따라 증가된 성욕으로 말미암은 성 범죄 야기 등과 같은 사회 범죄 문제이며, 사회적 범죄는 아니더라도 야동 시청이 정신적, 육체적으로 인체에 나쁜 폐해를 끼치는 부분이다. 이를 위해 본 논문에서는 야동을 시청 한 후 이것이 인체에 어떤 나쁜 영향을 미치는가를 규명하기 위해, 음성에 어떤 변화가 발생하는 가에 대한 분석을 행하고자 한다. 즉, 인체에 있어 음성은 인체의 생체신호가 얼굴과 더불어 가장 많이 발현되는 곳이다. 따라서 야동 시청 전과 후의 음성 변화를 비교, 분석하여 야동의 시청이 인체 장기에 어떤 영향을 미칠 수 있는지에 대한 규명 연구를 수행하고자 한다. 실험 결과, 야동 시청 후 성욕을 해소치 못 함으로 스트레스 호르몬 증가하고 이것이 3 포먼트 주파수 대역폭이 증가하는 결과로 나타났다.

성별에 따른 빗소리의 힐링 효과 규명 및 개인 맞춤형 빗소리 제작 (An Identification of the Healing Effect of Rain Sound According to the Gender and Personal - Adjusted Rain Sound Making)

  • 이범주;조동욱;조상현;송영빈;정연만
    • 한국통신학회논문지
    • /
    • 제41권10호
    • /
    • pp.1263-1269
    • /
    • 2016
  • 스트레스는 건강 수명을 단축시키는 가장 큰 위험 요소 중 하나가 되고 있다. 따라서 건강 수명 연장을 위한 스트레스 해소는 대단히 중요한 사항이 아닐 수 없다. 이를 위해 많은 사회적 경비가 투입되고 있으나 경제성 대비 그 효용성은 그다지 높지 않은 것이 현 실정이다. 이 같은 문제점을 개선하기 위해 본 논문에서는 스트레스 해소를 위해 많은 비용과 시간을 소모하는 방법 대신 비교적 일상생활에서 쉽게 접할 수 있는 자연의 소리 중에서 사람의 심신을 안정시켜주는 화이트 노이즈와 유사한 빗소리가 스트레스 해소에 효능이 있는지에 대한 규명 작업을 3 포먼트 주파수 대역폭의 변화를 통해 행하였다. 아울러 20대 남녀를 대상으로 스트레스 경감 효과에 대한 규명 뿐 아니라 남녀 간에 선호하는 빗소리의 차이가 존재하고 있는지에 대한 연구도 수행하였다. 최종적으로 스트레스 경감 효과의 극대화를 위해 개인맞춤형 빗소리 제작에 대해 논하였다.

음성특징의 거리 개념에 기반한 한국어 모음 음성의 시각화 (Speech Visualization of Korean Vowels Based on the Distances Among Acoustic Features)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.512-520
    • /
    • 2019
  • 음성을 시각적으로 표현하는 것은 외국어를 습득하는 과정의 학습자나 음성을 직접 들을 수 없는 청각장애자에게 매우 유용하며 기존에 다수의 연구가 이루어졌다. 그러나 기존의 연구들은 발음의 특징을 단지 컬러로 표현한다든가 입모양을 3차원 그래픽으로 표현하거나 입과 구강의 변화하는 형태를 애니메이션으로 보여 주는 방식에 머물러 있다. 따라서 이런 방식을 사용하는 학습자들은 자신의 발음이 표준 발음과 얼마나 멀리 떨어져 있는지 알 수가 없고 더 나아가서 학습 중에 스스로 교정을 해 나가는 시스템을 개발하기가 기술적으로 어려운 단점이 있다. 이를 극복하기 위해 본 논문에서는 음성 간의 상대적 거리를 토대로 음성을 시각화하는 모델을 제시하고, 이를 한국어 모음에 적용하여 모음의 음성적 특징을 이용한 시각화의 구체적인 구현 방법을 제시한다. 음성데이터에서 F1, F2, F3의 세 개의 포먼트를 구하고 이들 특징벡터를 코호넨 자기조직화맵 알고리즘으로 2차원 화면에 사상하여 각 음성을 화면 위의 각 점에 대응하여 표현하였다. 제안하는 시스템의 실제적인 구현은 인터넷에 공개된 음성처리 공개소프트웨어를 사용하고 한국인 교사의 표준 발음과 한국어를 배우고 있는 외국인 유학생의 음성을 이용하여 음성특징의 상호간 거리를 구하였으며, 사용자 인터페이스는 자바스크립트를 이용하여 구현하였다.

양측 인공와우이식 아동의 성대진동시작시간 특성 (Voice onset time in children with bilateral cochlear implants)

  • 전예솔;이영미
    • 말소리와 음성과학
    • /
    • 제14권2호
    • /
    • pp.77-86
    • /
    • 2022
  • 본 연구는 조기 양측 인공와우이식 아동과 건청 아동 간 파열음의 조음위치와 발성유형에 대한 성대진동 시작시간(voice onset time, VOT)의 차이를 살펴봄으로써, 조기 양측 인공와우이식을 통한 청각적 보상과 피드백이 청각장애 아동의 말 운동통제 능력에 미치는 영향을 살펴보고자 하였다. 대상자는 만 5세부터 10세 사이의 양측 인공와우이식 아동 15명과 건청 아동 15명을 선정하였다. 검사 과제는 조음위치 및 발성 유형을 고려한 9개 파열음의 VCV음절을 사용하였다. VOT 측정을 위해 Praat 프로그램을 사용하였으며, 정확한 측정을 위해 녹음된 음성, 스펙트로그램, 포먼트 정보를 함께 사용하였다. 삼원혼합분산분석 결과, 집단에 대한 주 효과는 유의하지 않았다. 조음위치에 대한 주 효과는 유의하였으며, 연구개음의 VOT값이 양순음과 치조음보다 유의하게 길었다. 발성유형에 대한 주 효과도 유의하였으며, VOT값은 격음, 평음, 경음 순으로 유의하게 길었다. 이러한 결과는 조기 양측 인공와우이식을 통한 양이 청취가 고도 이상의 난청 아동의 말 운동 통제 능력에 긍정적인 영향을 준다는 것을 시사한다.