Search | Korea Science

A Study on the Speech Recognition For the Voice Dialing System (Voice Dialing System을 위한 음성인식)

이성권
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06e
- /
- pp.365-368
- /
- 1998
본 연구는 음소 단위의 CHMM(Continuous Hidden Markov Model)을 이용한 Voice Dialing System을 위한 연속 음성인식에 관한 내용이다. 연구실 환경에서 음성으로 전화를 걸기 위하여 전국 지역명과 연속 숫자음 인식을 수행하였다. ETRI 445 데이터를 사용하여 초기의 모델은 ML(Maximum Likelihood) 추정법을 이용하여 작성하였고 적응화를 위해 최대 사후 확률 추정법을 사용하였다. 음성으로 다이얼링을 수행하기 위하여 문맥자유문법을 이용하여 제한적이나마 대화체문장으로 수행할 수 있도록 하였다. 그리하여 숫자음에 대하여 5인의 화자에 대하여 4연속 숫자음에 대하여 96%의 인식률을 보이고 있으며 7연속 숫자음에 대하여도 약 91%의 결과를 보여주고 있다. 문장으로도 음성 다이얼링을 수행하였을 경우 문장내에 단어와 숫자음에 대하여 약 80%의 인식률을 보였다.
PDF

Speech Unit Concatenation by Phase Succession in an ABS/OLA Sinusoidal Model (ABS/OLA Sinusoidal 모델에서 위상계승을 이용한 단위음성의 연결)

Bae Jae-Hyun;Byeon Heo-Jin;Oh Yung-Hwan
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.11-14
- /
- 1999
본 논문에서는 중첩가산 Sinusoidal 합성방식에서 매칭된 정현파별로 위상을 계승하는 단위음성 연결방법을 제안한다. 선행 단위음의 마지막 프레임, 후행 단위음의 첫 프레임, 후행 단위음의 나머지 프레임의 단계로 나누어 각 단계마다 제안한 방식으로 선행 프레임의 위상을 계승하였다. 실험결과 후행 단위음의 연결 위치를 이동하는 기존의 방식을 사용한 연결음에 비해 연결부분에서 음성파형의 급격한 변화가 줄었다.
PDF

English Segmental Sounds adapted into Korean and Phonological Theory (한국어에 차용된 영어 분절음과 음운 규칙)

Lee Hae-Bong;Gu Pon-Seok
- MALSORI
- /
- no.40
- /
- pp.91-104
- /
- 2000
생성음운론의 입장에서 본 Hyman 가설을 적용할 때 영어와 한국어에 공통으로 나타나는 영어 분절음 $/p^h,{\;}t^h,{\;}k^ h/$는 한국어 화자에게서 그대로 인식되며, 영어에는 있지만 한국어에 없는 /f, v, $\theta$/는 관련 음운 규칙이 적용되어 한국어음과 유사하게 된 $[/p^h]$], [p], [s]로 각각 인식된다고 설명했다. 이와 같은 Hyman 가설의 적용은 /f, v, $\theta$/가 왜 한국어에서 존재하지 않고 관련 음운규칙이 적용된 형태로 나타나는 지에 대한 이유를 제시하지 못하는 한계가 있다. 그러나 최적성 이론에서는 입력형에서 모든 분절음을 받아들이고 언어간 제약등급의 차이로 /f, v, $\theta$/와 같은 분절음이 한국어에서 나타나지 않고 [p, t, k]로 나타난다고 설명하였다. 따라서 최적성 이론은 영어 분절음이 한국어에서 나타나는 다양한 양상을 적절히 설명할 수 있음을 보여 주고 있다.
PDF

Pitch Determination and Voiced/Unvoiced Decision of Noisy Speech Based on the Higher-Order Statistics (고차 통계를 이용한 잡음 환경에서의 음성신호의 피치 추출과, 유, 무성음 판별)

신태영
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1995.06a
- /
- pp.55-60
- /
- 1995
고차 통계 방법을 이용하여 잡음이 섞인 음성 신호에서 피치를 구하는 방법과 이를 이용하여 유성음 및 무성음 구간을 구분하는 방법을 구현하고 그 결과를 기술하였다. 고차 통계의 일종인 3차 cumulant 함수의 경우 Gaussian 또는 대칭적인 분포를 갖는 잡음 신호를 음성신호로부터 효과적으로 분리하여 제거시키는 특징을 가지고 있으며, 이러한 특징을 이용하면 잡음 환경에서 여러 가지 음성 특징 파라메터들을 보다 신뢰도 높게 추정할 수 있다. 본 논문에서는 dam성 신호의 3차 cumulant 함수의 자기상관함수로부터 음성의 피치 주기를 추정하였으며, 피치 위치에서의 normalized peak 크기에 의해 유성음과 무성음을 구분하였다. 또한 성능 비교를 위해 음성 신호 자체의 자기 상관 함수로부터 역시 피치 주기 및 유성음/무성음 구분을 수행하였다. 백색 및 유색 Gaussian 잡음 환경에서의 음성의 피치 주기 추정 실험 결과 SNR가 낮은 경우에 3차 cumulant를 이용한 방법이 2차 통계에 비해 우수한 성능을 나타내었다. 또한 동일한 잡음 환경에서의 유성음/무성음 판별 시험에서도 3차 cumulant를 이용한 방법이 기존의 2차 통계를 이용한 방법에 비해 성능이 크게 향상된 결과를 얻었다.
PDF

The method to minimize the number of sample modules in the electronic musical instrument using pitch shifting technique (Pitch Shifting 기법을 사용하는 전자악기에서 Sample Module의 개수를 최소화하는 방안)

박진원;최제헌;김규년
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.04b
- /
- pp.439-441
- /
- 2001
현재 사용되고 있는 전자악기는 한 옥타브에 대해 여러 개의 샘플 모듈(sample module)을 메모리에 저장해두면서, 옥타브내의 다른 음들은 그 샘플 모듈을 피지 시프팅(pitch shifting)하여 생성한다[1]. 따라서, 하나의 악기에 대해 많은 샘플 모듈을 사용하게 되고 많은 메모리를 필요로 한다. 본 논문에서는 보다 적은 샘플 모듈을 사용하여 메모리를 절약할 수 있는 방법을 연구하였다. 피치 시프팅의 범위를 하나의 옥타브 이내로 제한하지 않고, 피치 시프팅에 의해 발생하는 원음과 오차 평균을 줄이면서 가장 적절한 샘플 모듈음을 찾아낸다. 본 논문에서는 전자악기의 악기음 중에서 피아노 음을 선택했으며, 피아노의 88개 음들 중에서 피치 시프팅을 했을 때 원음과 가장 가까운 음을 만들어내는 음들을 샘플 모듈로 사용한다. 이러한 방법으로 샘플 모듈음들을 선택하면 기존의 전자악기에서 사용하는 샘플 모듈 개수보다 훨씬 적으면서도 동일한 음질을 보장하고, 또한 메모리 공간도 절약할 수 있다.
PDF

Standardization Activity of ISO/TC 43/SC 2/WG 22 Measurement of impact sound improvement of light-weight floors (ISO 140-11(경량 바닥구조의 바닥충격음 저감량 실험실 측정방법)의 제정동향)

장길수;정광용;김선우
- Proceedings of the Korean Society for Noise and Vibration Engineering Conference
- /
- 2002.05a
- /
- pp.1132-1137
- /
- 2002
최근 국내에서는 바닥충격음에 대한 측정방법이 개정(2001년 6월 19일자 기술표준원 고시 제2001-334호)되어 KS F 2810-1(바닥충격음 차단성능 현장 측정방법 1부- 표준중량충격원에 의한 방법)과 KS F 2810-2(바닥충격음 차단성능 현장 측정방법 2부- 표준중량충격원에 의한 방법)의 체계가 구축되었다. 이는 현장 측정방법으로서 완성된 건축물에 대한 공간성능을 측정하는 의미를 가지고 있다.(중략)
PDF

수중 저주파음에 의한 능성어의 행동제어에 관한 기초적 연구 II. 음향순치

양용수;서두옥;백철인
- Proceedings of the Korean Society of Fisheries Technology Conference
- /
- 2003.05a
- /
- pp.80-82
- /
- 2003
어군의 음향에 대한 행동을 알아내는 것은 어업에 있어서 중요한 일로, 많은 어종의 청각특성을 파악하는 것이 필요하며 많은 연구자들이 다양한 실험방법으로 측정하여 왔으며, 그 결과 어류도 어느 주파수대의 음을 감지하는 능력이 있다든가 음원 방향을 탐지하는 능력을 가진다는 것 등이 밝혀지고 있다. 이처럼 어류의 청각능력을 어업생산에 응용하기 위한 하나의 시도로서 음과 사료에 의한 학습, 즉 수중음향을 이용하여 어군의 유집행동을 유발하고, 어군을 학습시켜 어군의 행동영역, 섭이행동 등을 제어하기 위해서는 어느 주파수의 음을 어느 정도의 음압으로 방성할 때 어류가 들을 수 있는지, 어떤 음이 학습음으로 가장 효과적인지, 어느 정도의 기간동안 학습을 시켜야 학습효과가 명확하게 나타나고 가장 오랜 동안 학습효과를 유지시킬 수 있는지 등을 구명하는 일이 매우 중요하나 이에 관해서는 참돔, 넙치, 연어, 송어 등 극히 일부의 어종에 대해서만 연구되고 있는 실정이다. (중략)
PDF

Basic Study on the Standardization of Information Sound in Home Appliances (가전제품의 정보음 표준화 기초연구)

김원식;조문재;김교헌
- Proceedings of the Korean Society for Emotion and Sensibility Conference
- /
- 2001.11a
- /
- pp.49-54
- /
- 2001
본 연구에서는 가전제품의 동작상태를 사용자에게 적절히 알릴 수 있는 정보음의 적합성 평가기준을 마련하기 위하여 선행연구 결과와 주부들을 대상으로 가전제품의 사용실태를 분석하였으며, 고령자들도 알아듣기 쉽고 생활소음에 mask 되지 않으며 들어서 쾌적하도록 1, 1.6, 2, 3, 4 kHz의 완전 5도화음으로 구성된 정보음을 제작하여, 평균발음빈도(F)가 1.67 Hz인 그룹과 0.91 Hz인 그룹의 Attac(A)과 Decay(D)를 변화시켜 A/D의 변화에 따른 단순반응시간을 측정한 결과 F가 1.67Hz 그룹에서 A/D가 작을수록 단순반응시간이 짧아지는 경향을 확인하였으며, F가 1.67Hz와 0.91Hz의 수준에 따른 단순반응시간 차이검증 결과 p < 0.001 수준에서 유의미하여 5점 척도로 평가하였으며, 요인분석결과 첫 번째 요인은 긴박성요인, 두 번째 요인은 명료성 요인, 세 번째 요인은 역능요인, 네 번째 요인은 평가요인으로 나타났다.
PDF

A Study on Color Analysis of Auditory Image (청각이미지의 색채분석 연구)

Choi, young-jo
- Proceedings of the Korea Contents Association Conference
- /
- 2012.05a
- /
- pp.307-308
- /
- 2012
인간은 음에서도 색을 느낄 수 있다. 그리고 청각을 통하여 음의 높고(고음), 낮음(저음), 장(길고), 단(짧음), 맑고, 탁함에 따라 색을 다르게 느낄 수 있다. 이러한 현상을 색청(色聽)이라고 한다. 소리와 색의 연관성에 대하여 선행 연구를 고찰한 결과 색의 3속성 색상, 채도, 명도는 음악의 음계, 옥타브, 음색과 연관성이 있었다. 그리고 음악의 리듬은 조형의 공간, 형태의 조화와 반복이 유사하다는 것을 알 수 있었다. 본 연구는 에드워드 마이언(Edward D. Maryon)의 마르코톤의 음과 색의 이론을 바탕으로 뉴턴의 색채와 음계로 경상도 민요 밀양아리랑의 색채를 분석하였다. 분석 결과 밀양아리랑 음의 빈도에 의한 색채는 Blue Violet, Green Blue, Red, Yellow, Orange의 순으로 색채를 추출할 수 있었다. 추출된 색에서 연상되는 형용사 이미지는 힘, 정열, 인내, 열정, 진취적인, 우호적, 야망, 불꽃 등으로 경상도 지역 이미지로 연관 시킬 수 있다. 본 연구는 경상도민요 밀양아리랑의 음을 분석하여 색의 연상이미지와 지역 색을 찾는데 그 의의를 두었다.
PDF

A Neural Network Based Musical Instrument Support System (Neural Network 기반 악기 보조 시스템)

Kim, Dae Yeon;Oh, Jeong Rok;Lee, Soo Gyeong;Kang, Woo Chul
- Proceedings of the Korea Information Processing Society Conference
- /
- 2017.11a
- /
- pp.857-860
- /
- 2017
현재 초보적인 능력을 가진 악기 연주자가 접근할 수 있는 하드웨어, 소프트웨어를 사용해 악기 연주법을 연습할 수 있는 수단은 전무하다. 따라서 본 논문은 악기 연주자가 연습을 하기 위해 사용할 수 있는 음 인식과 악보 정보의 처리, LSTM을 통한 자동 악보 생성의 복합적 기능을 가진 악기 보조 시스템을 제안한다. 또한 본 시스템은 기존의 FFT와 같은 일반적인 Pitch Detection 알고리즘보다 더 우월한 음 인식 성능을 보유한 Autocorrelation 전처리를 거친 LeNet-5 Convolutional Neural Network 모델을 사용하여 음 인식 성능을 높이는 기법을 제안한다. 이 음 인식 모델은 실험 결과 기존의 음 인식 기법보다 최대 약 5.4%의 성능 증가를 이루어냈다.
https://doi.org/10.3745/PKIPS.y2017m11a.857 인용 PDF

Search Result 6,501, Processing Time 0.031 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)