• 제목/요약/키워드: 스펙트럼 음향 매개변수

검색결과 9건 처리시간 0.017초

과도기형태 신호의 매개변수 추정기법을 이용한 성덕대왕 신종의 음향분석 (Acoustic Analysis of King Songdok Bell Using Parameter Estimation of Transient Signals)

  • 김영수;진용옥
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.91-100
    • /
    • 1998
  • 본 논문에서는 지수함수적 감쇄신호의 매개변수를 효율적으로 추정하기 위한 신호 모델링 기법을 제안한다. 이 방법은 맥놀이 주파수 성분을 갖으면서 과도기 형태 신호인 성 덕대왕 신종의 음파(공중음파 및 지중음파)를 분석하기 위하여 개발되었으며 선형예측모델 을 기본으로 하고 있다. 제안된 방법은 일반적인 데이터 행렬 대신에 자기상관 유사행렬을 사용하였으며 SVD 방법을 이용하여 매개변수를 추정한다. 성덕대왕 신종의 스펙트럼 및 감 쇄계수 특성을 분석하기 위하여 제안된 방법을 수집한 데이터에 적용하였고 분석결과를 토 대로하여 고유주파수 신호의 감쇄계수 및 움통의 역할도 규명하였다.

  • PDF

모음에 따른 화자의 음원특성 비교 (Comparison of Speaker's Source Characteristics in Different Vowel Characteristics)

  • 이후동;강선미;장문수;박한상
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 2003년도 제19회 학술대회
    • /
    • pp.240-240
    • /
    • 2003
  • 본 논문에서는 기존의 매개변수들과 달리 화자의 고유한 특성을 보여주는 화자인식 매개변수를 발성유형에서 찾고자 한다. 일반적으로 화자의 음원 특성이 발성 유형을 결정한다. 발성유형의 특성을 나타내는 매개변수로는 개방지수(open quotient)와 스펙트럼의 기울기 (spectral tilt)가 있으며, 스펙트럼의 기울기는 음향학적으로 그 특성을 측정할 수 있다. 그러나 기존의 측정방식은 사람마다 다른 기본 주파수와 모음의 영향을 전부 혹은 일부 배제하지 못하였다. (중략)

  • PDF

고해상도의 바이스펙트럼을 추정하기 위한 개선된 매개변수 방법 (An Improved Parametric Estimation Method of High-Resolution Bispectrum)

  • 박소현;안종구
    • The Journal of the Acoustical Society of Korea
    • /
    • 제14권2E호
    • /
    • pp.19-24
    • /
    • 1995
  • 측정된 신호의 길이가 짧은 경우, 높은 해상도의 전력스펙트럼을 추정하는 매개변수 방법으로 최대 엔트로피 방법이 있다. 바이스펙트럼을 추정하기 위한 매개변수 방법은 최근에 제안되었는데 표본화한 데이터의 길이가 약 1000 정도의 비교적 짧은 신호에 적용할 경우 좋은 해상도를 얻기 어렵다. 이 논문에서는 위와 같은 비교적 짧은 신호에 대해서도 높은 해상도의 바이스펙트럼을 추정할 수 있는 방법을 제안하였다.

  • PDF

모음 스펙트럼에 기반한 전후 비자음 조음위치 판별 (Classification of nasal places of articulation based on the spectra of adjacent vowels)

  • 윤지현;성철재
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.25-34
    • /
    • 2023
  • 본 연구에서는 한국어 비음의 조음위치 변별을 위한 지표로서 모음 음향 특성의 활용 가능성을 타진하였다. 비음에 인접한 /ㅏ/ 모음 시료를 대용량 한국어 자연발화 말소리 자료에서 추출하여 모음 구간의 25%, 50%, 75% 시점에서 음향 매개변수를 측정하였다. 이 스펙트럼 및 지속시간 변수를 이용하여 판별분석을 수행하고 이를 바탕으로 선행 또는 후행 비자음의 조음위치 분류정확도를 추정하였다. 또한 조음위치 공조음(coarticulation)의 관점에서 순행적 공조음과 역행적 공조음의 영향을 확인하기 위하여 측정 대상 모음에 비음이 선행하는 경우와 후행하는 경우로 나누어 비교하였다. 분석 결과, 전후 비자음의 조음위치 분류정확도는 약 50%-60%로 나타났다. 모음의 음향 매개변수 측정값만으로 비음의 조음위치를 예측·분류하기에는 어려움이 있으나, 공조음 정도가 가장 약할 것으로 예상되는 모음 정중 구간에서 측정된 음향 변수만으로도 위와 같은 정확도를 얻었다는 점에서 비음 구간의 분석결과와 함께 모음 측정치를 활용함으로써 비음 조음위치 인식률 향상에 기여할 수 있을 것으로 기대한다. 한편 측정 대상 모음에 선행 또는 후행하는 비음 조건 간에 비교하였을 때, 후행 비음 조음위치의 분류정확도가 더 높게 나타났다는 점에서 역행적 조음위치 공조음의 영향이 더 클 가능성이 확인되었다.

한국어 스펙트럼과 캡스트럼 측정시 안면마스크의 영향: 남녀 성우 2인 사례 연구 (Impact of face masks on spectral and cepstral measures of speech: A case study of two Korean voice actors)

  • 양원영;권미지
    • 한국음향학회지
    • /
    • 제43권4호
    • /
    • pp.422-435
    • /
    • 2024
  • 본 연구의 목적은 안면 마스크가 한국어에 미치는 영향을 음향적, 공기역학적, 포먼트 매개변수 측면에서 검증하고자 하였다. 국내에서 판매되는 모든 종류의 마스크를 필터 성능과 접이식 방식을 기준으로 선택하였다. 본 연구에는 표준 한국어를 구사하는 경력 20년 이상의 한국인 전문 성우 2명(남녀)이 음성 데이터의 화자로 참여하였다. 연구 결과, 안면 마스크는 고주파수 범위를 약화시켜 Vowel Space Area(VSA) 및 Vowel Articulation Index(VAI) 점수를 감소시키고 모든 음성 샘플에서 Low-to-High spectral ratio(L/H ratio)을 증가시킨 것으로 나타났다. 이로 인해 음성 명료도가 낮아질 수 있음을 파악하였다. 그러나 음성 특성에 따라 증가 및 감소 정도가 결정되며 여성 화자의 경우 안면 마스크 두께가 증가함에 따라 Speech Level(SL)과 Cepstral Peak Prominence(CPP)가 증가하였다. 그러나 남성 화자의 경우 안면 마스크 두께가 증가함에 따라 이 두 매개변수가 감소하였다. 결론적으로, 본 연구에서는 마스크의 유무나 필터 성능이 음성 특성에 따른 음성 음향 매개변수에 영향을 미치는 것으로 나타났다. 안면 마스크는 음성 강도가 충분히 강하지 않거나 환경의 반향이 덜할 때 음성 노력에 영향을 미치는 것으로 나타났다. 마스크 착용시 음향 변형을 극복하기 위해 안면 마스크로 유도된 음성 노력에 대한 추가적인 연구가 수행되어야 함을 시사한다.

한국어 연속음인식에 관한 연구(유성음 분류 및 단모음 인식 ) (On the Classification of Voice Sound and the Recognition of Vowels for Korean Continuous Speech)

  • 하판봉;이철희;방승찬;안수길
    • 한국음향학회지
    • /
    • 제5권3호
    • /
    • pp.28-35
    • /
    • 1986
  • 우리나라 음성의 유성음을 모음, 비음 및 유성화 자음으로 분류하는 알고리즘을 기술하였다. 먼 저 기존의 PITCH 검출 알고리즘에 의하여 음성을 유성음과 무성음으로 나눈 뒤, 단지 정규화된 1차 상 관계수, 영교차율, LOG 에너지 및 LPG 에너지의 골짜기 검출만을 이용하여, 유성음은 모음, 비음 및 유 성화자음으로 분류하고 무성음은 실제의 무성음과 묵음으로 분류하였다. 그리고 이렇게 분류된 모음에 대하여 단모음 인식을 행하였다. 단지 한 FRAME으로 모음을 대표하였기 때문에 메모리 크기와 인식 시간을 줄였다. 여기서 UP & DOWN 및 수정된 영교차율을 새로이 정의하여 적용한 결과 만족한 결과 를 얻을 수 있었다. LPC 매개변수 및 전력 스펙트럼도 단모음 인식의 FEATURE로 사용하였다. 그리고 각 FEATURE 의 성능을 비교하였다. 이들 FEATURE을 잘 조합하여 2단계 인식을 행한 결과 92%의 높은 인식율을 얻을 수 있었다.

  • PDF

자폐스펙트럼장애 아동의 후두 높이 및 음성 특성 (Laryngeal height and voice characteristics in children with autism spectrum disorders)

  • 이정헌;김고운;김성태
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.91-101
    • /
    • 2021
  • 본 연구의 목적은 자폐스펙트럼장애를 가진 아동의 후두 특성을 확인하고자 하였다. 자폐스펙트럼장애로 진단받은 2~4세 아동 8명과 같은 연령의 정상 대조군 42명을 포함하여 총 50명의 아동이 실험에 참여하였다. 모든 아동들은 경추와 후두의 중앙시상면의 X-ray 영상을 촬영하여 두 군의 후두 위치를 비교하였다. 또한 모음 연장발화 시 음성 샘플을 수집하여 음향 매개 변수들을 분석하였다. X-ray 검사 결과, 정상군의 설골 높이는 3세가 가장 낮았으며, 4세에 후두 높이가 상승하였다. 다른 한편으로, 외이도에서 설골까지의 거리는 4세가 가장 긴 것으로 나타났다. 이와는 대조적으로, 모든 연령대의 자폐스펙트럼장애군의 설골 높이는 정상군보다 낮았으며, 연령에 따른 설골 위치의 차이는 없었다. 음향학적 평가 결과, PFR, vFo, vAm은 정상 대조군에 비해 자폐스펙트럼장애군이 통계적으로 유의미하게 높게 나타났다. 결론적으로, 자폐스펙트럼장애 아동들의 낮은 후두 높이는 언어발달의 지연과 관련이 있는 것으로 사료된다. 음향학적 변수들 중 음성 조절기능을 보여주는 PFR, vFo, vAm은 정상 아동과 자폐스펙트럼장애 아동의 음질 차이를 보여주는 voice marker로 생각된다.

조건 사후 최대 확률 기반 최소값 제어 재귀평균기법을 이용한 음성향상 (Speech Enhancement Based on Minima Controlled Recursive Averaging Technique Incorporating Conditional MAP)

  • 금종모;박윤식;장준혁
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.256-261
    • /
    • 2008
  • 본 논문에서는 기존의 최소값 제어 재귀 평균기법(minima controlled recursive averaging, MCRA) 알고리즘에 조건 사후 최대 확률 (maximun a posteriori, MAP)을 적용한 음성향상을 제안한다. 기존의 MCRA는 파워스펙트럼에 평균을 취하고 각 서브밴드에서 음성 신호 존재 확률로 조절하는 스무딩 매개변수를 사용한다. 본 논문에서 제안된 알고리즘은 현재 프레임에 들어온 신호가 이전 프레임에서의 음성의 존재와 부재에 대한 조건을 부여해 주어 음성 신호 존재확률을 수정하여 음성향상에 적용한다. 제안된 음성 향상은 ITU-T P.862 perceptual evaluation of speech quality (PESQ)와 주관적 음질평가를 이용하여 평가하였고 기존의 MCRA 방법보다 향상된 결과를 나타내었다.

주파수 대역별 잔향시간 추정을 위한 변형된 AWSSDR 방식 (Modified AWSSDR method for frequency-dependent reverberation time estimation)

  • 김민식;김형순
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.91-100
    • /
    • 2023
  • 잔향시간(reverberation time, T60)은 대표적인 음향 매개 변수로서, 잔향에 대한 정보를 제공한다. 동일한 공간이라도 주파수 대역에 따라 잔향이 미치는 영향은 다르기 때문에, 주파수 대역별(frequency-dependent, FD) T60은 음향환경에 대한 세부적인 정보를 제공하여 유용하게 사용될 수 있다. 하지만 음성신호로부터 T60을 추정하는 기존의 블라인드 T60 추정 방식들은 대부분 전 대역 T60 추정에 집중되어 있으며, 소수의 블라인드 FDT60 추정 방식들은 공통적으로 저주파 대역에서 열악한 성능을 보인다. 본 논문은 블라인드 FDT60 추정을 위해, 이전에 제안한 주의 집중 풀링 기반 스펙트럼 감쇠율의 가중 합(Attentive pooling based Weighted Sum of Spectral Decay Rates, AWSSDR) 방식을 변형하여 목표를 전 대역 T60에서 FDT60으로 확장하였다. 본 논문에서 제안한 방식은 ACE challenge의 평가데이터 셋에 대한 성능 평가 결과, 기존의 블라인드 FDT60 추정 방식들보다 우수한 성능을 달성하였으며, 특히, 모든 주파수 대역에서 일관성 있는 우수한 추정 성능을 보였다. 이는, 잔향의 물리적인 특성과 관련된 스펙트럼 감쇠율을 주파수 대역별로 처리하여, 음성신호로부터 FDT60에 대한 정보를 취합하는, AWSSDR 방식의 매커니즘이 주파수에 따라 변하는 잔향의 영향을 반영하여 FDT60 추정에 유용함을 보여준다.