통합 검색 | Korea Science

한국어 고립단어인식을 위한 고속 알고리즘 (Fast Algorithm for Recognition of Korean Isolated Words)

남명우;박규홍;정상국;노승용
- 한국음향학회지
- /
- 제20권1호
- /
- pp.50-55
- /
- 2001
본 논문에서는 청각모델을 이용하여 음성신호로부터 추출한 특징벡터를 2차원 DCT (discrete cosine transform)방법을 사용하여 가공한 후, 새로운 거리측정 방법에 적용하여 한국어 고립단어 인식 실험을 행하였다. 고립단어 인식은 기존에 많은 방법들이 제안되어졌으나, 본 논문에서 제안한 방법은 고립단어 인식을 위한 특징 파라미터로 2차원 DCT 계수를 사용한 것으로 구현이 간단하며, 간단한 계산식으로 인하여 빠른 인식 시간을 가지는 장점이 있다. 제안한 방식의 타당성 검토를 위하여, 고립단어 인식에서 좋은 인식결과를 나타내는 DTW (Dynamic Time Warping)방법을 사용하여 인식률을 비교하였다[5][6]. 실험결과 제안한 방식은 DTW를 사용한 인식방법에 비하여 화자종속 고립단어 인식에서는 거의 유사한 인식결과를, 화자독립 고립단어 인식에서는 더 높은 인식결과를 얻을 수 있었다. 또한, DTW에 비해 패턴비교를 위한 계산시간에 있어서는 200배 이상의 감소효과를 볼 수 있었다. 제안된 방법은 비교 방법에 비하여 잡음환경에서도 강한 특성을 보였다.
PDF

음향 자극에 의한 인체 경락의 반응분석 (Analysis of Meridian Response by Sound Stimulus in Body)

김용진;정동명
- 전자공학회논문지SC
- /
- 제38권3호
- /
- pp.47-54
- /
- 2001
본 논문에서는 경락의 실체를 객관화하기 위한 방법으로서, 경락과 비경락을 음향 자극하고 인체의 임피던스 변화를 분석하였으며, 인체 에너지에 대한 고전 동양의학 이론인 경락순행통로 학설의 타당성을 입증하기 위하여 경락지하수 학설을 제안하였다. 현대의학의 주장과 같이 경락은 그 존재를 증명할 만한 채널이나 파이프 형태의 해부학적 실체를 가지고 있지 않다. 그러나 생체에너지는 인체 안에서 관상구조없이 지하를 흐르는 지하수 흐름과 유사하게 경락을 따라 흐른다. 이러한 모델의 반응특성을 확인하기 위하여, 인체의 경락을 지하수가 흐르는 관로로 보고 지하수를 탐지하는 산업용 음향탐사기법을 적용하기 위하여, 피부와 청각을 구분하여 음향자극하고 경혈과 대조적인 비경혈에서의 인체 임피던스 반응을 분석하였다. 특히 자극 음향과 12경락과의 주파수 상관성을 추출하기 위하여, 5개의 특정 음으로 자극하고 측정전류의 평균치와 변화율을 처리하였다. 분석결과 전류 변화율은 족궐음간경(宮), 수소음심경(商) 30.6%, 족소음신경(角) 33.1%, 족태음비경(徵) 33.9%, 수태음폐경(羽) 30.7%로 대조점과 구별되는 특성을 가지고 있어서, 경락은 비경락과 구별되는 채널 특성을 나타내고 있으며 5개 경락은 5개의 특정 음과 상관성이 있음을 확인하였다.
PDF

웹 접근성 향상을 위한 시각장애인과 일반인의 감성 비교 (Emotion of People with Visual Disability for Enhancing Web Accessibility)

박주현;류한영
- 감성과학
- /
- 제11권4호
- /
- pp.589-598
- /
- 2008
본 연구는 시각장애인의 감성적 특성을 밝혀 향후 웹 접근성 지침에 반영하기 위해 진행된 기초연구로, 통일한 청각적 자극에 대한 시각장애인과 일반인의 감성 반응을 비교하고 그 차이점을 알아보고자 진행되었다. 이러한 목적을 위하여 본 연구에서는 음악(Representation Sound)과 음향효과(Abstraction Sound)를 이용한 15개의 청각 자극과 긍정 및 부정 감성어휘를 이용한 11개의 감성평가 척도를 선정하여 웹 설문 시스템을 제작하였으며, 이를 활용하여 31명의 시각장애인과 53명의 일반인을 대상으로 준비된 청각 자극에 대한 감성 반응을 측정하였다. 예외적인 경우가 있기는 하지만 설문의 결과는 대부분의 경우에서 두 집단 간의 감성반응패턴이 일치하는 것으로 나타나, 장애인의 감성욕구가 일반인과 크게 다르지 않음을 보여주고 있다. 이러한 결과는 디자인에서 사용자의 감성을 중요시 하는 것과 마찬가지로 웹 접근성에 대한 연구에서 장애인의 감성적 욕구가 중요시 되어야 함을 보여주고 있는 것이다.
PDF

청각 주파수 응답에 기반한 자동 모음 개시 지점 탐지 (Automatic Vowel Onset Point Detection Based on Auditory Frequency Response)

장한;김학태;정길도
- 한국산학기술학회논문지
- /
- 제13권1호
- /
- pp.333-342
- /
- 2012
이 논문에서는 인간 청각 시스템에 기반한 모음 개시 지점 (VOP) 탐지 방법을 제시하였다. 이 방법을 통해 '지각의' 주파수 범위, 즉 선형 음향 주파수에서의 Mel Scale을 보여준 후 일련의 삼각 Mel-weighted Filter Bank를 만들어 인간의 청각 시스템에서 대역 필터링 기능을 시뮬레이션하였다. 이러한 비선형 임계 대역 Filter Bank는 데이터 차원수를 크게 감소시키고 비선형적으로 간격을 둔 Mel 스펙트럼에서 더욱 효과적으로 포먼트를 생성하기 위해 조파들의 영향을 제거해준다. Mel 스펙트럼의 첨두 에너지 합은 각 프레임의 특징으로 추출하고 에너지 진폭이 급격히 상승하기 시작할 때의 특성은 Gabor 윈도우를 사용하여 VOP로 탐지한다. 실험 결과를 통해서 다른 종류의 자음들과 연결된 12개의 모음들을 포함하는 한 단어 데이터베이스에 대한 제안된 방법의 평균 정확도는 단시간 에너지와 zero-crossing 비율에 기반을 둔 다른 모음 탐지 방법들보다 높은 72.73% 이상임을 확인하였다.
https://doi.org/10.5762/KAIS.2012.13.1.333 인용 PDF KSCI

시간-주파수 구조에 근거한 지각적 오디오 부호화기 (A Perceptual Audio Coder Based on Temporal-Spectral Structure)

김기수;서호선;이준용;윤대희
- 방송공학회논문지
- /
- 제1권1호
- /
- pp.67-73
- /
- 1996
일반적으로 고음질 오디오 부호화 방법은 전통적인 데이터 압축 기법과 인간의청각 모델을 결합한 구조를 갖고 있다. 고음질 오디오 부호화에 사용되는 주요한 청각 특성은 주파수 영역에서의 마스킹 현상이므로 서브밴드 부호화나 변환 부호화와 같은 주파수 영역 방법들이 널리 사용된다[1][2]. 그러나 지금까지의 고음질 오디오 부호화에서 시간 영역 마스킹과 시간 영역 중복성을 제거하는 방법은 적용되지 않았다. 본 논문에서 제안한 오디오 데이터 압축 방법은 시간 및 주파수 영역에서 통계적, 지각적 중복성을 제거한다. 주파수 영역으로 변환된 오디오 신호는 6프레임으로 구성된 패킷으로 나뉘어진다. 한 패킷은 1536 샘플 ($256{\times}6$)로 되어 있으며 패킷 내에서의 중복성은 시간 및 주파수 영역에서 존재한다. 각 패킷에서 두 중복성이 동시에 제거되어진다. 심리음향 모델에 있어서도 세밀한 주파수 마스킹과 함께 시간 영역 마스킹을 고려하여 보다 정확한 결과를 얻을 수 있도록 향상되었다. 양자화를 위해서 각 패킷은 비선형적인 임계 대역과 시간적인 청각 특성을 반영할 수 있도록 설계된 부블럭으로 분할되었다. 따라서 낮은 비트율에서 고음질의 복원음을 얻을 수 있었다.
PDF

디지털 보청기에서의 포먼트 강조에 의한 마스킹 효과 연구 (A Study of Acoustic Masking Effect from Formant Enhancement in Digital Hearing Aid)

전유용;길세기;윤광섭;이상민
- 전자공학회논문지SC
- /
- 제45권5호
- /
- pp.13-20
- /
- 2008
청력 손실을 보상하고 난청인이 다른 사람들과 대화할 수 있도록 디지털 보청기 알고리즘은 개발 되어 왔음에도 불구하고, 디지털 보청기 사용자들은 음성을 듣는데 어려움이 있다고 불만을 토로한다. 그 이유는 피드백이나 잔여 노이즈 등에 의해 디지털 보청기를 통한 음성의 질이 이해하기에 불충분하기 때문이다. 또 다른 이유로 포먼트들 사이에서 일어나는 마스킹 현상이 될 수 있다. 이 연구에서 정상 청각 피험자와 노인성 난청을 갖고 있는 난청인 피험자의 마스킹 특성을 측정하여 음성에서의 마스킹에 의한 음성 인지 저하를 확인하기 위한 실험을 하였다. 실험은 순음검사, 어음 청취 역치 검사, 낱말 분별력 검사, 수음 마스킹 검사, 어음 마스킹 검사의 5개 테스트로 이루어졌다. 어음 마스킹 검사에서 각각 어음 세트에 25개의 어음이 사용되었다. 각 어음의 왜곡을 객관적으로 평가하기 위해서 log likelihood ratio (LLR)를 도입하였다. 결과적으로 포먼트 향상의 양을 늘리면 늘릴수록 어음 인지는 낮아졌고, 각 어음 세트에서 각각의 향상된 어음은 통계적으로 비슷한 LLR을 갖지만 어음인지는 그렇지 않게 나타났다. 이것은 왜곡이 아닌 음향 마스킹이 어음 인지에 영향을 준다는 것을 의미한다. 실제로 피험자들 대부분이 맞추지 못한 음성을 주파수 분석한 결과 첫 번째와 두 번째 포먼트 사이의 레벨 차이가 약 35dB이며 이는 순음 마스킹 실험 결과(정상 청각 피험자:36.36dB, 난청인 피험자:32.86dB)와 비슷한 양상을 보였다. 실험 결과에서 볼 수 있듯이 음향 마스킹의 특성은 정상 청각인과 난청인 사이에서 다르게 나타난다. 그렇기 때문에 보청기 착용 전 마스킹 특성을 검사하고, 피팅 시에 적용해야 한다.
PDF KSCI

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

서상원;임우택;정영호;이태진;김휘용
- 방송공학회논문지
- /
- 제23권6호
- /
- pp.855-865
- /
- 2018
음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.
https://doi.org/10.5909/JBE.2018.23.6.855 인용 PDF KSCI KPUBS HTML

직물 마찰음의 주관적 평가에 시각적 변수가 미치는 영향 (Effect of Visual Factor on Subjective Evaluation of Frictional Fabric Sounds)

한아름;양윤정;조길수
- 한국감성과학회:학술대회논문집
- /
- 한국감성과학회 2009년도 추계학술대회
- /
- pp.62-65
- /
- 2009
본 연구는 동작 속도별 마찰음의 주관적 평가에 있어서 시각적 변수의 영향을 분석하는 것을 목적으로 한다. 현재 유통되고 있는 79 종의 스포츠웨어용 투습발수직물 중 음향 특성으로 계층적 군집분석에 의해 나누어진 3 개의 군집에서 각각 하나씩 추출한 총 3가지 시료를 대상으로 walking, jogging, running의 속도로 마찰시켜 총 9가지의 소리에 대하여 실험하였다. 직물 소리에 대한 주관적 평가 시 시각적 변수의 영향을 분석하기 위하여 두 가지 방법으로 직물 소리에 대한 주관적 반응을 평가하였다. 첫 번째는 기존의 연구에서 주로 이루어진 방법으로, 실험 진행자가 피험자에게 직물소리를 들려주면서 설문을 하게 하였다. 두 번째는 녹음된 직물의 소리와 함께 모니터를 통해 해당 자극물의 마찰 속도에 따라 인체 모델이 움직이는 동작을 보여줌으로써 청각과 시각 자극을 동시에 제시하여 주관적 평가의 자극물로 사용하였다. 주관적 평가는 8개의 형용사 쌍에 대해 의미미분척도로 평가되었고, 두 가지 방법을 비교하기 위하여 '실제 옷을 착용하고 움직일 때 발생하는 직물 소리와 유사하게 들린다.' 와 '옷을 착용하고 움직일 때 발생하는 소리라고 느껴진다.' 두 문항을 추가하여 평가하였다. 그 결과 시각 자극의 유무에 의한 감성평가 결과에는 큰 영향을 미치지는 않았지만, 피험자가 소리만으로 직물이 마찰되는 장면을 의식적으로 상상해야 하는 심리적 부담을 줄여주었고, 주관적 평가 몰입도를 향상시켰다고 사료된다.
PDF

CASA 시스템의 비모수적 상관 특징 추출을 이용한 목적 음성 분리 (Target Speech Segregation Using Non-parametric Correlation Feature Extraction in CASA System)

최태웅;김순협
- 한국음향학회지
- /
- 제32권1호
- /
- pp.79-85
- /
- 2013
CASA 시스템의 특징 추출은 시간의 연속성과 채널 간 유사성을 이용하여 청각 요소의 상관지도를 구성하여 사용한다. 채널 간 유사성을 교차 상관 계수를 이용하여 특징 추출 할 경우 상관성을 정량적으로 나타내기 위해 계산량이 많은 단점이 있다. 따라서 본 논문에서는 특징 추출 시 계산 량을 줄이기 위한 방법으로 비모수적 상관 계수를 이용한 특징 추출 방법을 제안하고 이를 CASA 시스템을 통하여 목적 음성을 분리하는 실험을 수행하였다. 목적 음성의 분리 성능을 평가하기 위하여 신호 대 잡음비를 측정한 결과, 제안 방식이 기존 방식에 비해 평균 0.14 dB의 미세한 성능 개선을 보였다.
https://doi.org/10.7776/ASK.2013.32.1.079 인용 PDF KSCI

압전 단결정 재료를 이용한 인공중이용 적층형 액츄에이터의 개발 (Development of multilayer actuators with single crystals for implantable middle ears)

선주헌;이수성;노용래
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
- /
- pp.315-318
- /
- 2004
이식형 인공중이에 있어 그 특성은 트랜스듀서의 성능에 따라 크게 좌우된다. 따라서 성능이 우수한 인공중이 제작을 위해서는 트랜스듀서의 주파수 특성 및 구동 성능이 우수해야 하고 인체 내 이식을 위해서는 그 크기가 작아야 한다. 본 연구에서는 인공중이용 소형 트랜스듀서로서 단결정 압전 재료인 PMN-PT를 이용한 적층형 액츄에이터를 제안하였다. 또한 제안된 모델을 두께 0.2mm를 갖는 $1mm{\times}1mm$ 크기의 PMN-PT 시편을 14층으로 쌓아 2.8mm 두께로 제작하였고, 이때 절연층으로 P.R을 사용하였다. 제작된 트랜스듀서의 성능은 Impedance Spectrum, 구동변위 측정 및 구동력의 계산을 통해 평가하였다. 이를 통해 PMN-PT를 재료로 사용한 적층형 액츄에이터의 성능이 기존의 PZT를 재료로 사용한 Bimorph 액츄에이터보다 훨씬 뛰어날 뿐만 아니라 청각 장애가 심한 고도난청자들에게 적용이 가능한 이식형 인공중이용 트랜스듀서로서 충분한 성능을 가지고 있음을 입증하였다.
PDF

검색결과 230건 처리시간 0.022초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)