• 제목/요약/키워드: 음향학적 평가

검색결과 137건 처리시간 0.024초

자동 음성분할 및 레이블링 시스템의 구현 (Implementation of the Automatic Segmentation and Labeling System)

  • 성종모;김형순
    • 한국음향학회지
    • /
    • 제16권5호
    • /
    • pp.50-59
    • /
    • 1997
  • 본 논문에서는 한국어 음성 데이터베이스 구축을 위하여 자동으로 음소경계를 추출하는 자동 음성분할 및 레이블링 시스템을 구현하였다. 기존의 음성분할 및 레이블링 기술을 근간으로 본 시스템을 구현하였으며, 또한 사용자가 자동분할된 음소경계를 확인하여 그 경계를 쉽게 수정할 수 있도록 한글 모티프 환경에서 그래픽 사용자 인터페이스를 개발하였다. 개발된 시스템은 16kHz로 샘플링된 음성을 대상으로 하고 있으며, 레이블링 단위는 45개의 유사음소와 하나의 묵음으로 구성하였다. 그리고 언어학적 정보의 입력방식으로는 음소표기와 철자표기를 사용하였으며, 패턴매칭 방법으로는 hidden Markov model(HMM)을 이용하였다. 개발된 시스템의 각 음소 모델은 수작업에 의해서 음소단위로 분할한 음성학적으로 균형잡힌 445 단어 데이터베이스를 이용해서 훈련되었다. 그리고 본 시스템의 성능평가를 위해 훈련에 사용되지 않는 문장 데이터베이스에 대해서 자동 음성분할 실험을 수행하였다. 실험결과, 수작업에 의해서 분할된 음소경계위치와의 오차가 20ms 이내인 것이 74.7%였으며, 40ms이내에는 92.8%가 포함되었다.

  • PDF

음성압축 방식의 변화가 한국어 단음절 숫자 인지기능에 미치는 영향의 비교 연구 (Comparative Studies of Perceiving Korean Monosyllabic Digit Words under Different Speech Compression Schemes)

  • 임덕환;원유경
    • 한국음향학회지
    • /
    • 제32권3호
    • /
    • pp.262-268
    • /
    • 2013
  • 다양한 음성 압축방식이 여러 분야에서 광범위하게 사용되고 있으며 그 심리음향적 인지결과는 대상 언어의 특성과 압축 방식에 따라서 다를 수가 있다. 한국어에서도 이러한 인지 결과를 비교하는 정량적인 자료가 관련된 임상이나 응용 분야에서 필요하지만 구체적인 내용이 확인되어 있지 않다. 본 연구에서는 통제된 언어적 특성을 갖는 0에서 9까지 한국어 단음절 숫자 들이 무작위로 조합되는 다섯 쌍 조합(quintet set)을 대상으로 하여 자주 사용되는 세가지 대표적인 음성 압축방식의 특성을 비교 분석하였다. 비교 기준으로는 기존의 연구에서 분석 정리된 시간과 주파수 정보가 모두 일정하게 변화되는 PNT (Preserving No Trait) 압축에서 얻은 자료를 비교 근거로 선정하였다. 이를 기준으로 하여 동일한 조건의 정상인 그룹에서 심리음향적 피치(pitch) 정보가 주로 보전되는 PPT (Preserving Pitch Trait), 시간 정보가 주로 보전되는 PTT (Preserving Time Trait) 압축방식의 인지 결과를 기록하고 분석하였다(N=20). 본 연구 결과에서 얻어진 자료를 보면, 정보의 압축비율이 높을 수록 심리음향학적으로 중요한 주파수 정보(피치)를 보전하는 것이 인지도 측면에서 가장 유리한 것으로 나타났다(PPT>PTT>PNT). 또한, 세가지 압축방법에서 50% 인지율을 보이는 압축률의 역치도 PPT가 20%, PTT가 42%, PNT가 44% 순으로 나타났다. 따라서 인지도 측면에서만 살펴보면 본 조건에서는 PPT 압축 방식이 가장 우수한 것으로 추정되었다. 이러한 숫자 자극을 이용한 평가 방법은 향후 새로운 압축 방식의 효율성과 인지도 측면을 비교 가능하게 하며, 이를 이용하면, 청각정보처리기능을 진단하거나 압축 관련 특수 보청기 적합 재활에서 정량적인 지표를 제공하는 도구로도 사용될 수 있을 것으로 판단된다.

전기적-미세역학 시험법과 음향 방출을 이용한 탄소 나노튜브와 나노섬유 강화 에폭시 복합재료의 비파괴 손상 감지능 (Nondestructive Damage Sensitivity of Carbon Nanotube and Nanofiber/Epoxy Composites using Electro- Micromechanical Technique and Acoustic Emission)

  • 김대식;박종만;김태욱
    • 폴리머
    • /
    • 제28권4호
    • /
    • pp.285-290
    • /
    • 2004
  • 전기적-미세역학 시험법을 이용하여 탄소 나노튜브와 탄소 나노섬유로 강화된 에폭시 복합재료의 비파괴 손상 감지능에 대해 고찰하였다. 카본블랙은 탄소 나노튜브 및 탄소 나노섬유와 비교하기 위해 사용하였다. 두 기지 복합재료 시험에서 탄소 섬유의 파단은 전기저항 변화 측정과 함께 음향방출을 이용하여 동시에 감지하였고 탄소나노복합재료 내부에 함침된 탄소 섬유에 대한 응력 감지는 반복 하중 하에서 전기적-pullout 시험법을 이용하여 수행하였다. 같은 부피 함량에서 섬유파단, 기지재료 변형 및 응력에 대한 감지능은 탄소 나노튜브/에폭시 복합재료에서 가장 높았으며, 카본블랙의 경우가 가장 낮았다. 전기적물성 및 손상 감지능은 탄소나노복합재료의 형상학적인 관찰 결과와 상호 비교하였다. 본 연구에서 탄소 나노재료의 균일한 분산은 손상 감지능을 높이기 위한 가장 중요한 요인으로 고려되며, 탄소 나노복합재료에 대한 손상감지는 전기저항측정과 음향 방출을 이용하여 비파괴적으로 평가할 수 있었다.

리벳 구멍을 가진 알루미늄 박판구조의 피로손상 탐지를 위한 음향방출의 활용 (Detection of Fatigue Damage in Aluminum Thin Plates with Rivet Holes by Acoustic Emission)

  • 김정찬;김성진;권오양
    • 비파괴검사학회지
    • /
    • 제23권3호
    • /
    • pp.246-253
    • /
    • 2003
  • 항공기 구조를 모사하여 일련의 리벳 구멍을 갖는 AA2024-T3 박판 구조를 대상으로 피로하중에 의한 단균열(short crack)의 발생시점과 성장거동을 음향방출(AE)을 위주로 한 측정으로 평가하였다. AE 위치표정에 의해 단균열의 좌표를 정확하게 결정하였으며, 이동식 현미경으로 균열의 크기를 측정하였다. 누적 AE 발생수 곡선은 단균열의 발생과 성장에 따라 일정한 간격을 두고 급격히 증가하는 양상을 보임으로써 여러 차례의 계단식 곡선을 형성하였다. AE 위치표정에서는 리벳 구멍을 중심으로 파괴역학에 근거한 관심영역(ROI)을 설정하였으며, 웨이블릿변환 잡음제거 방법을 사용하여 위치표정의 정확도를 향상할 수 있었다. 실제로 탐지된 신호의 대부분이 단 균열의 발생 및 성장과 관계없는 외부 잡음신호로 나타났으며, ROI 내에서 발생한 AE 발생원의 위치도 구조의 기하학적 특징이나 신호대잡음비의 영향에 의해 왜곡될 수 있음을 알 수 있었다.

CDMA 통신망에서의 객관적 음질 평가 척도에 관한 연구 (A Study on Objective Speech Quality Measure under CDMA Telephone Networks Environment)

  • 김광수;김민정;석수영;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.53-58
    • /
    • 2001
  • 이동전화망을 위한 신뢰성 높은 객관적 통화품질평가 척도개발을 위하여 Bark Spectral Distortion Perceptual Speech Quality Measure의 성능을 분석하여 이 척도들을 실제 환경에서 수집된 음성 데이터에 대해서 실험한 결과, 성능의 저하가 나타났다. 본 논문에서는 인간의 심리음향학적 특성인 마스킹을 적용하는 방안을 제안하여 그 유효성을 실험으로 확인하였다. 이때, masking threshold 계산에 tone 신호를 사용하기 때문에 음성신호에 대하여 계산할 경우 문제점이 있을 수 있으므로 scaling 을 적용하는 새로이 제안하였다. 디지털 이동통신망에서 수집된 음성 데이터에 대한 성능평가 결과, 기존의 척도들 보다 더 높은 성능을 보임을 확인하였다.

  • PDF

소프라노의 성악 발성에 대한 음향학적 특징 연구 (A Study on Acoustical Properties of Soprano′s Singing)

  • 임동철;문소연;이행세
    • 한국음향학회지
    • /
    • 제19권5호
    • /
    • pp.60-64
    • /
    • 2000
  • 본 논문에서는 소프라노가 성악 발성으로 한국어 단모음을 발음할 때, 그 단모음들의 포르만트가 F0(Fundamental frequency)에 따라 어떻게 바뀌어지는지 연구되었다. 일반적으로 다른 파트의 경우와는 달리, 소프라노가 노래를 할 때에는 포르만트가 그 F0의 영향을 크게 받는 것으로 알려져 있다. 따라서, 성악발성에 대한 연구를 위해서는 소프라노가 발성할 수 있는 전 음역 대의 F0에서 각 모음에 대한 포르만트 분석이 필요하다. 이러한 분석 결과를 바탕으로 성악 발성의 특징들을 패턴화하여 성악발성 평가 시스템이나 성악발성 합성 시스템을 구축할 수 있다. 5명의 전문 소프라노를 대상으로 '아, 에, 이, 오, 우' 5모음의 성악발성을 A3(220.0Hz)에서부터 A5(880.0Hz)까지의 피치에서 포르만트 분석을 하였다. 또한, 일반적인 대화 시 이 5가지 모음의 포르만트를 분석하여 성악발성의 경우와 비교하였다. 연구 결과, '아, 에, 이'의 F2/F1의 그래프가, B4(493.8Hz)이상의 F0에서는 거의 직선으로 나타났다. B4는 Changing Voice가 시작되는 곳으로, 성악가의 음색 변화가 포르만트 형태의 변화와 밀접한 관계가 있음을 알 수 있다. 또한, A5에서는 '아, 에, 이, 오, 우'의 F1, F2의 수치가 거의 일치하는 것으로 나타났다. 즉, 최고음부에서 불려지는 모음들은 서로 구별되기가 어렵게 되는 것이다. 본 논문은 성악발성 평가 시스템이나 성악발성 합성 시스템을 구축할 때에, '아, 오, 우'의 경우에는 B4에서 A5의 F1, F2를 F0대한 기울기로 규정화할 것을 제안한다. 이와 같은 규정화를 통하여 성악발성과 관련된 시스템 구축에 필요한 노력과 비용을 줄일 수 있을 것이다.

  • PDF

초음파 반복 조사에 따른 NIPAM 팬텀의 특성 변화 관찰 (Characteristic Changes Observation of N-isopropylacrylamide Phantom by Repeated Ultrasound Irradiation)

  • 김주영;김재영;노시철;최흥호
    • 한국방사선학회논문지
    • /
    • 제9권7호
    • /
    • pp.509-513
    • /
    • 2015
  • 본 연구에서는 재사용이 가능한 NIPAM 팬텀의 열적 민감도를 측정하여 조직유사 팬텀의 열변성 특성을 평가하였으며, 초음파 재사용 횟수와 재사용 기간에 따른 음향학적 특성 및 열 변성 형태 특성을 관찰하였다. 측정 결과조사 횟수가 증가함에 따라 NIPAM 팬텀의 음속은 100 m/s 정도 감소하고 감쇠계수는 조금 증가하는 경향을 보였다. 반면에 재사용 기간에 따른 변화는 관찰되지 않았다. 초음파 조사에 따른 열변성의 형태 및 크기는 유효할 정도의 변화는 확인되지 않았다. 본 연구를 통하여 NIPAM 팬텀이 반복 조사를 통한 초음파 치료 평가에도 적합한 것으로 판단되었다.

성대에어로빅치료법이 음성장애환자의 음성개선에 미치는 효과 (Effects of vocal aerobic treatment on voice improvement in patients with voice disorders)

  • 박준희;유재연;이하나
    • 말소리와 음성과학
    • /
    • 제11권3호
    • /
    • pp.69-76
    • /
    • 2019
  • 본 연구는 성대에어로빅치료법(vocal aerobic treatment, VAT)이 음성장애 환자의 음성 개선에 미치는 효과에 대해 알아보았다. 연구대상은 후두스트로보스코피, 음성검사 상 음성장애로 진단된 20명(남 13명, 여 7명)이었다. 음향학적 평가는 CSL(computerized speech lab)의 MDVP(Multi-Dimensional Voice Program)와 VRP(Voice Range Profile)를 통해 평가하였다. 공기역학적 평가는 PAS(Phonatory Aerodynamic System)를 통해 평가하였다. MDVP를 통해 치료 전 후 기본주파수(Fo), 주파수변동률(Jitter), 진폭변동률(Shimmer), 소음대배음비(NHR)의 변화를 측정하였고, VRP에서는 치료 전 후 주파수 범위(Fo range), 강도범위(Energy range)를 측정하였다. PAS에서는 치료 전 후 폐활량(FVC), 최대연장발성시간(PHOT), 평균호기류율(MEAF), 성문하압(MPAP), 음성효율성(AEFF)의 변화를 알아보았다. 후두스트로보스코피에서는 치료 전 후 양측 성대의 규칙성, 대칭성, 점막파동, 진폭 변화 소견을 알아보았다. 음성치료는 총체적 음성치료 접근법 중 하나인 VAT 프로그램을 환자별로 주 1회 실시하였다. 환자별 평균 치료 회기는 6.5회였다. 연구결과, MDVP에서는 Jitter, Shimmer, NHR이 통계적으로 유의하게 감소하였다(p<.001, p<.01, p<.05). VRP 결과, 주파수 범위에서 Hz와 Semitones이 치료 후 유의미하게 향상하였다(p<.01, p<.05). PAS 결과, FVC, PHOT에서 유의미한 향상이 나타났다(p<.01, p<.001). 후두스트로보스코피 결과 치료 후 기능적 음성장애, 인후두역류질환, 양성성대점막질환군에서 성대소견이 정상범주에 해당하였다. 따라서 VAT 프로그램은 음성장애환자의 음향학적 공기역학적 후두스트로보스코피 측면에서의 음성 개선에 효과적인 것으로 나타났다. 차후 연구에서는 동일 집단의 음성장애 환자에게 VAT 적용 연구가 필요하다고 생각된다. 또한 객관적인 음성 개선뿐만 아니라 주관적 음성 개선을 알아볼 필요가 있다. 나아가 직업적 음성사용자를 대상으로 VAT 효과에 대한 적용연구가 필요가 있다.

ISO 9613-2를 이용한 철도 환경소음 예측 모델 개선에 관한 연구 (Study on the improvement of prediction model for the railway environmental noise using ISO 9613-2)

  • 장승호;고효인;홍지영
    • 환경영향평가
    • /
    • 제26권1호
    • /
    • pp.11-26
    • /
    • 2017
  • 철도 소음의 환경영향평가 업무에 있어서 소음도에 대한 정확한 예측이 중요하지만, 국내에서는 overall 소음도의 거리별 측정을 통한 경험식이 근사적으로 이용되고 있다. 본 논문에서는 소음원과 소음전파의 주파수 특성을 고려하여 철도 소음의 예측 정확도를 향상할 수 있는 예측 모델을 제안하였다. 먼저 철도 소음원을 궤도(레일 및 침목), 차륜, 동력, 공력 성분으로 구분하여 각각의 옥타브 밴드 주파수별 음향파워와 속도계수를 정의하고 음향 조도와 궤도/교량 특성을 반영할 수 있는 보정항을 도입하였다. 소음원에서 수음점까지의 전파 특성은 ISO 9613-2를 적용하여 기하학적 확산, 대기 흡음, 지면 효과, 장애물의 회절에 따른 감쇠 및 지향특성을 반영하여 계산하였다. 소음원 음향파워와 지향인자를 추정하기 위하여 전동 소음원 해석 모델 및 수치해석 결과와 통과 소음도 측정값을 이용하였다. 본 철도 소음 예측 모델을 이용하여 여러 철도 차량과 궤도 유형에 따라서 예측한 소음도를 측정값과 비교하여 정확도를 검증하였으며 기존 예측 모델보다 비교적 정확한 예측이 가능하였다. 따라서 본 결과는 철도 환경 소음의 정확한 영향 예측과 효율적인 소음 저감 대책 수립에 활용될 수 있을 것이다.

바닥충격음의 심리음향학적 평가 (Psvchoacoustical Evaluation of Floor Impact Noise)

  • 전진용;정정호;조문재
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2001년도 춘계학술대회논문집
    • /
    • pp.253-258
    • /
    • 2001
  • Floor impact noises in apartment buildings have been investigated as they are most annoying in living environment. Several experiments were undertaken to compare perceived noisiness of floor impact noises generated by bang and tapping machine along with children's jumping and running. Results show that bang noise is more annoying than tapping noise and floor impact noise generated by children is less annoying than the noise generated by machine. The floor impact noise generated by children's jumping and running corresponds well with the bang-machine noise in terms of loudness, unbiased annoyance, ${\Phi}$$\_$0/ and IACC. The noise generated by children is somewhat different from machine noise; in spatial impression the real noise is similar to tapping-machine noise but is less annoying that the machine noises.

  • PDF