Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
The Acoustical Society of Korea
- Semi Annual
Domain
- Physics > Interdisciplinary Physics
autumn
-
본 논문에서는 유럽 통신 표준화기구인 ETSI 의 SMGll에서 채택된 GSM Full Rate(FR) 보코더 알고리wma[1]을 Teak DSP Core를 이용하여 실시간 구현하였다. GSM FR 보코더는 유럽에서 사용하는 통신 시스템인 GSM 의 full-rate Traffic Channel(TCH)의 표준 코덱[2]으로서 GSM HR, GSM EFR GSM AMR과 더불어 모뎀칩 내에 장착되는 필수적인 음성 서비스이다. 구현된 GSM FR는 13.05kbps의 비트율을 가지고 있으며, 인코더와 디코더 기능 외에 voice activity detection(VAD)[3]블록과 DTX[4]블록 등의 부가 기능도 구현되어 있다. 구현에 사용된 Teak[5]는 DSP Group 의 16bit고정 소수점 DSP core로서 최대 140MIPS 의 성능을 낼 수 있고 400bits ALU 와 두개의 MAC 이 장착되어 있어 음성 및 채널 부호화기의 실시간 처리에 최적화 되어있다. 구현된 GSM FR 은 인코더와 디코더 부분이 각각 약 235 MIPS 및 1.19MIPS 의 복잡도를 나타내며, 사용된 메모리는 프로그램 ROM 3.9K words, 데이터 ROM(table) 396 words 및 RAM 932words이다.
-
본 논문에서는 3GPP 규격에 따른 IMT-2000 시스템용 UE AMR 코덱의 소프트웨어 및 하드웨어 개발에 관하여 논한다 UE AMR 코덱은 ASIC 개발을 고려하여 Teak-Lite DSP 칩을 사용하여 개발하였다 AMR 코덱을 구현하기 위한 효율적인 소프트웨어 개발 기법을 설명하고 하드웨어 디자인도 논한다 개발된 UE AMR 코덱에는 음성 데이터 입출력 기능은 물론 리부 호스트 프로세서와의 통신 기능도 포함된다. Teak-Lite EVM보드를 사용하여 실시간으로 동작하는 AMR 코덱 소프트웨어를 개발하였다. 또한 동시에 UE AMR 코덱용 하드웨어도 개발하였다. ETRI에서 개발 및 시험 중인 IMT-2000 시스템 상에서 개발한 UE AMR 코덱의 동작 및 기능을 검증하였다.
-
본 논문에서는 분절 특징 HMM(SFHMM)의 매개변수를 줄이는 방법을 제안한다 SFHMM이 HMM보다 우수한 성능을 보이더라도, SFHMM의 매개 변수 수는 HMM보다 많기 때문에 매개 변수 수를 줄이는 방법에 대한 연구가 필요하다. 일반적으로 궤적(trajectory)은 경향(trend) 정보와 위치(location) 정보로 분리될 수 있다. 경향은 분절 특징의 변이를 나타내며, SFHMM 변수의 많은 부분을 담당하기 때문에, 경향 정보를 공유할 수 있다면 SFHMM의 매개 변수 수는 감소될 수 있을 것이다. 제안된 방법은 궤적의 경향 정보를 양자화(quantization)에 의하여 공유한다. 제안된 방법의 성능을 살펴보기 위하여 영어 데이터베이스인 TIMIT 자료를 사용하여 실험하였다. 실험 결과 제안된 방법의 성능은 기존 연구와 거의 유사하나, 궤적의 다양한 정보를 이용한다면 궤적 정보의 공유에 의하여 매개 변수를 줄일 수 있을 것으로 보인다.
-
본 논문은 신경 회로망을 이용하여, 전화망 대역의 음성, 즉, narrowband 음성에서 wideband 음성을 복원하고자 했다. BP 알고리즘을 사용하는 기존의 신경 회로망의 경우에는 음성과 같이 복잡하고 크기가 큰 훈련데이터에 대해서는 훈련이 제대로 되지 않는 단점이 있다. 그러므로 븐 논문에서는 이를 해결하기 위해 입력으로 들어온 LPC 켑스트럼 벡터를 k-means 알고리즘을 이용하여 미리 정한 개수의 cluster로 나눈 다음, 각각의 cluster에 대해 독립적인 신경 회로망을 적용했다 이로 인해 각각의 신경 회로망은 제한되고 서로 상관관계가 많은 음성들만 훈련하면 되므로, 기존의 신경 회로망에서 생기는 훈련의 정체를 개선할 수 있었다. 또 clustering 과정에서 생기는 오류를 보완하기 위해 후보신경 로망들의 출력에 fuzzy 개념을 적용해서 최종 출력을 내도록 했다 실험 결과에서, 제안한 알고리즘은 기존의 codebook mapping 알고리즘보다 스펙트럼 거리척도에 의한 비교 및 주관적인 음질 평가 양쪽에서 개선된 성능을 보였다.
-
본 논문에서는 조음 효과에 대처할 수 있는 반음절, 반음절 + 반음절 단위 HMM과 모음열 정보를 적용하여 연속 숫자 음성인식을 구현하였다. 모음열 정보를 적용하여 기준모델을 모음이 포함된 HMM단위로만 구성한 시스템과 모든 기준모델과 비교하는 시스템과 성능을 비교하였다. 인식실험결과 인식률의 향상으로 제안된 방법이 효율적임을 확인하였다.
-
본 논문에서는 연구실에서 만든 음성인식기와 합성기를 이용하여 십자말 게임을 구현하였다. 십자말 게임에는 고사성어 600개 정도의 단어가 사용되었으며, 다른 영역별 사전을 추가 할 수 있도록 만들어졌다. 구현된 게임은 시작, 진행 등의 모든 과정이 음성으로 동작하며, 부과적인 정보는 음성 합성(TTS)에 의해 이루어진다. 십자말 게임에 사용되는 단어의 배열은 매번 랜덤하게 선택되도록 구성되며, 음성 인식기는 VCCV (Vowel + Consonant + Consonant + Vowel) 기반의 화자독립으로 구현되었다. 선택된 문제에 대한 설명은 텍스트로 보여주면서, 동시에 TTS 시스템에 의해 음성으로 출력된다.
-
본 논문에서는 기존의 음성인식에서 사용하는 특징벡터인 MFCC(Mel-Frequency Cepstral Cefficients)를 대신하여 웨이블렛 변환을 이용한 새로운 특징벡터를 추출하는 방법을 제안한다. 새 특징벡터로는 MRA(Multi-Resolution Analysis)를 이용하여 구성하였다. 웨이블렛 변환을 이용한 새로운 특징벡터의 추출 목적은 시간축과 주파수축에서의 더 좋은 해상도를 가지는 성질을 이용하는 것이다. 실험결과에서 웨이블렛 변환을 이용한 새로운 특징벡터를 이용한 인식이 기존의 방식보다 더 좋은 인식률을 보이고 있음을 확인하였다.
-
본 논문에서는 PDA상에서 음성으로 명령어를 제어하기 위해 Window CE 3.0 환경에서 음성인식기를 설계하였다. 전처리과정에서 26차 특징파라미터를 추출하고, HTK를 통해 학습하였다. 트라이폰 기반의 가변어휘 음성인식기를 설계하였으며, PDA의 응용프로그램은 Embedded Visual C++언어를 사용하여 22개의 음성명령어를 제어하도록 하였다. 그 결과 PDA상에서
$92\% 의 인식률이 나타났으며 이것은 음성인식이 모바일 환경에서도 접근이 가능함을 알 수 있었다. -
본 논문에서는 음성합성 과정에서 음성유닛을 연결할 때 모음의 결합부분에서 포만트의 불일치로 일어나는 부자연스러운 합성음이 발생되는 문제점을 개선하기 위해서 앞에 오는 음성 유닛과 뒤에 오는 합성 유닛의 포만트 변경에 관한 방법을 제안한다. 요즘에 연구되는 코퍼스 방식에선 에너지와 피치와 음순지속시간 등을 기준으로 유닛을 선택한 후 연결하지만, 스펙트럼의 불일치가 이루어진다. 이런 스펙트럼의 불일치는 음질의 저하를 유도한다. 그래서 앞 음성유닛의 연결부분의 일정부분과 뒤 음성 유닛의 연결부분의 일정부분의 포만트를 천이시켜 일치시켜줌으로써 음질을 향상시켰다. 음성신호를 FFT한 후 magnitude와 phase를 분리한 후 앞 음성의 연결부분의 magnitude와 뒷 음성의 연결부분의 magnitude를 기준으로 linear interpolation한 값을 목표치로 이동하고 다시 합하여 원 신호를 복원하는 방식으로 포만트를 변경시켰다.
-
립리딩은 잡음 환경 하에서 음성 인식 성능을 향상을 위해 영상정보를 이용한 바이모달(bimodal)음성인식으로 연구되었다[1][2]. 그 일환으로 이미 영상정보를 이용한 립리딩은 구현되었다. 그러나 현재까지의 시스템들은 환경의 변화에 강인하지 못하다. 본 논문에서는 이미지 기반 립리딩 방법을 적용하여 입술 영역을 보다 안정적으로 찾아 성능을 향상 시켰다. 그러나 이 방법은 많은 데이터량을 처리해야 하므로 전처리 과정이 필요하다. 전처리로 입력영상을 그레이 레벨로 변환하는 방법과, 입술을 반으로 접는 방법, 그리고 주성분 분석(PCA: Principal Component Analysis)을 사용하였다. 또한 인식성능 향상을 위해 음성에서 잡음 제거나 분석
$\cdot$ 합성에 효과적인 성능을 보이는 RASTA(Relative Spectral)필터를 적용하여 시간 영역에서의 변화가 적은 성분이나 급변하는 성분, 그 밖의 잡음 등을 제거하였다. 그 결과$72.7\%$ 의 높은 인식 성능을 보였다. -
부산지역 청소년 음성의 지속시간, 피치주파수 포만트 주파수 특성을 연령별, 성별로 분석하였다. 실제 발음 환경에서의 음성 패턴은 발성화자 개인 및 화자별로 다양하게 변화한다. 이를 모델 화하기 위해서는 다량의 음성 데이터로부터 통계적 방법에 의한 변화 요인별 파라미터 분석이 선행되어야 할 것이다. 실험에 사용된 데이터는 부산지역에 거주하는 청소년(초등학생, 중학생, 고등학생)들이 연령별로 3회 발성한 우화의 일부와 단모음(/아/,/이/,/우/,/에/,/오/)이다 실험 결과로부터 얻어진 지속시간, 주파수 특성 변화 패턴을 연령별, 성별로 구분하여 통계적으로 분석한 뒤 이를 정량화 하였다. 실험 결과로부터 부산 지역 청소년 음성의 지속시간, 주파수 특성은 예측된 바와 같이 기 연구된 성인 음성과 많은 차이를 보였으며 이는 부산 지역 방언의 DB 구축 시 설계자가 고려해야 할 기초자료로 활용 될 수 있을 것이다.
-
사람은 연령, 성별 등에 따라 성도(vocal tract), 성대(vocal cord, 혹은 vocal fold), 비강(nasal tract)등 발성기관의 차이가 있고, 이는 음성의 음색, 높낮이 등 음향 특성에 영향을 미치며, 시간이 지나감에 따라 변하는 특성을 가지고 있다. 예를 들어, 발성기관의 차이가 큰 남성과 여성은 동일한 단어를 발성하더라도 음향학적으로 매우 큰 차이를 보이며, 이러한 특성은 다른 문장 발성 시에도 음향학적으로 일정한 영향을 미치게 되므로 정적특성이라 한다. 본 논문에서는 이러한 정적특성 중 음성의 발성크기에 따른 Glottal Spectrum을 비교
$\cdot$ 분석 하고자 한다. -
This paper reports on speaker-Recognition of context independence-speaker recognition in the field of the speech recognition. It is important to select the parameter reflecting the characteristic of each single person because speaker-recognition is to identify who speaks in the database. We used Mel Frequency Cesptrum Coefficient and Vector Quantization to identify in this paper. Specially, it considered to find characteristic-vector of the speaker in different from known method; this paper used the characteristic-vector which is selected in MFCC Parameter Space. Also, this paper compared the recognition rate according to size of codebook from this database and the time needed for operation with the existing one. The results is more improved
$3\sim4\%$ for recognition rate than established Vector Quantization Algorithm. -
본 논문에서는 class간의 변별력을 증가시키기 위한 유용한 방법인 LDA(Linear Discriminant Analysis)를 사용하여 한국어 숫자음간의 변별력을 높여 연결숫자 인식성능을 높이고자 하였다. 한국어 숫자음은 모두 단음절이며 또한 혼동가능성이 높은 숫자쌍이 존재하여 이것이 전체 인식률을 저하시킨다. LDA를 사용한 경우 숫자열 오인식률이
$8\%$ 감소하였다. 그리고, 음성특징 벡터의 차수를 감소시키고 LDA 사용전 보다 약간의 인식률 증가를 보였다. 그러나, 선형적인 방법으로 분리가 불가능한 class들의 분포가 존재할 때는 LDA를 사용하여도 변별력 향상은 기대하기 어렵다. 이와 같은 분포의 class사이의 변별력을 증가시키기 위해 between-scatter covariance matrix를 구할 때 class 사이에 혼동가능성 정도를 나타내는 weighting factor를 적용하였으며, 그 결과 숫자열 오인식률이 LDA 사용전보다$9.7\%$ 감소하였다. -
현재 음성인식기는 다채널의 음성입력방식을 사용하고 있는 추세이다. 이런 방법으로 음성인식기를 사용할 때에 자동적으로 음성을 검출하는 음성입력방식은 발성자와 마이크간의 거리에 따라 발성음성, 반사음성과 잡음이 입력된 경우에 원 음성의 고차포만트 성분에 왜곡이 발생하게 된다 이러한 문제점을 개선하기 위하여 본 논문에서는 고주파영역의 특성을 강조시킬 수 있는 프리엠퍼시스를 이용하여 더욱 더 정확한 음성입력 방법을 제안한다. 제안한 방법은 원음과 유사한 합성입력음을 얻었고, 또한 기존의 시간영역 법 보다 더 높은 SNR을 얻을 수 있다는 것을 알 수가 있다.
-
에밀레종은 771년도에 성덕대왕의 공적을 기리기 위해 34년간 주조(높이 3.663m, 최대지름 2.227m, 무게 18,900kg)하여 만든 세계적인 문화유산이다. 외형도 미려하지만 종소리는 천, 지, 인을 뒤흔드는 신비감을 갖추고 있다. 에밀레 종소리는 끊어질 듯 이어지는 소리, 애끓는 소리, 심금을 울리는 소리 등의 특징을 갖는데 끊어질듯 이어지는 소리는 맥놀이 현상으로 나타난다. 지금까지 맥놀이 현상의 규명에 대한 많은 연구가 있었다 하지만, 사람의 목소리에 대해 주파수성분을 분석하여 굵직한 중년 남성의 목소리를 그 기본주파수인 150Hz 근방에서 에밀레 종소리로 재현하기는 이번이 처음이다. 여기에는 우리 선조들이 750년경에 과학적 근거를 토대로 하여 응용이 가능하였음을 알 수 있다.
-
본 논문에서는 음소인식기와 음소결합확률모델을 이용하여 전화음성을 대상으로 입력음성이 어느 나라 말 인지를 식별할 수 있는 언어식별시스템을 구현하였고 성능을 실험하였다. 시스템은 음소인식기로 입력음성에 대한 음소열을 인식하는 과정, 인식된 음소열을 이용하여 인식대상 언어별 음소결합확률모델을 생성하는 훈련과정, 훈련과정에서 생성된 음소결합확률모델로부터 확률 값을 계산하여 인식결과를 출력하는 식별과정으로 구성된다. 본 논문에서는 음소결합확률모델로부터 우도를 계산할 때 정보이론(Information Theory, Shannon and Weaver, 1949)을 이용하여 가중치를 적용하는 방법을 제안하였다. 시스템의 훈련 및 실험에는 OGI 11개국어 전화음성 corpus (OGI-TS)를 사용하였으며, 음소인식기는 HTK를 이용하여 구현하였고 음소인식기 훈련에는 NTIMIT 전화음성 DB를 이용하였다. 실험결과 11개국어를 대상으로 45초 길이의 음성에 대해서 평균
$74.1\%$ , 10초 길이의 음성에 대해서는 평균$57.1\%$ 의 인식률을 얻을 수 있었다. -
본 논문에서는 HMM알고리즘을 이용한 중규모급, 화자독립, 연결음성시스템에서의 인식성능 향상을 위해, 단어 인식기가 가지고 있는 고려사항들 중에 잡음(Noise)에 강한 모델을 위해 동작환경에 따른 적절한 필터를 구성하고 이차적으로 특징 파라미터를 개선하여 Noise를 보상하는 방법을 적용하였다. 인식기의 성능에 큰 영향을 미치는 요인중 하나인 전처리 기능의 평가로 성능향상의 요인을 찾아 음질개선을 위한 보다나은 잡음보상 방법을 제시하고자 하였다.
-
본 논문은 중규모 단어급의 핵심어 검출 시스템에서 인식률 향상을 위해 미등록어 거절(Out-of-Vocabulary rejection) 기능을 제어하기 위한 연구이다. 이것은 핵심어 검출기에서 인식된 결과를 확인하는 과정으로 검증시스템이 구현되기 위해서는 매 음소마다 검증 기능이 필요하고, 이를 위해서 반음소(anti-phoneme model) 모델을 사용하였다. 검증의 역할은 인식기에서 인식된 단어가 등록어인지 미등록어인지 판별하는 것이다. 단어인식기는 비터비 탐색을 하므로, 기본적으로 단어단위로 인식을 하지만 그 인식된 단어는 내부적으로 음소단위로 인식된다. 따라서, 최소 검증 오류를 갖는 반음소 모델을 사용하고, 이를 이용하여 인식된 음소 단위들을 각각의 반음소 모델과 비교하여 통계적인 방법에 의해 신뢰도를 구한다 이 음소단위의 신뢰도를 단어 단위의 신뢰도로 환산하기 위해서 음소단위를 평균 내는 방식 을 취한다. 이렇게 함으로서, 등록어와 미등록어 사이의 분별력을 크게 하여 향상된 인식 성능을 얻었다.
-
Line spectrum pair(LSP) 계수는 양자화 오류에 강하고. 선형 릴간에 효율적이며, 필터의 안정성 판정이 용이하므로 LPC를 대신하여 음성 부호화에 널리 사용되고 있다. 일반적으로 LSP 계수간에는 일정한 상관관계가 나타나고, 이 특성을 이용하면 LSP 계수의 부호량을 줄일 수 있는 가능성이 있나. 본 논문에서는 LSP 계수를 압축하기 위해 principal component analysis(PCA)를 사용한 방법을 제안한다. 제안된 방법에서는 LSP 계수를 Karhunen-Loeve(KL) 변환해 에너지가 집중되는 고유치(eigenvalue)와 고유벡터(eigenvector)를 찾고 값을 양자화 한다. 성능 평가를 위해 2.4kbps MELP(mixed excitation linear prediction)와 8kbps QCELP(qualcumn code excited linear prediction) 음성 부호화기를 사용해 결과 값을 비교했고, 압축률이 증가하는 것을 확인했다.
-
본 논문에서는 한국어 대용량 음성인식 시스템의 기초가 되는 자소(grapheme)가 지니는 음가를 분류하였다. 한국어 자소를 음성-음운학적으로 조음 위치와 방법에 따라 분류하여, 그 음가 분석에 관한 연구와 함께 한국어 음성인식에서 앞으로 많이 논의될 청음음성학(auditory phonetics)에 대하여 연구하였다. 한국어는 발음상의 구조와 특성에 따라 음소 분리가 가능하여 초성, 중성, 종성 자소로 나눌 수 있다. 본 논문에서 초성은 자음음소 18개, 중성은 모음 음소(단모음, 이중모음) 17개, 그리고 'ㅅ' 추가 8종성체계의 자음음소로 하였다. 청음음성학적 PLU(Phoneme Like Unit)의 구분 근거는 우리가 맞춤법 표기에서 주로 많이 틀리는 자소(특히, 모음)는 그 음가가 유사한 것으로 판단을 하였으며, 그 유사음소를 기반으로 작성한 PLU는 자음에 'ㅅ' 종성을 추가하였고, 모음에 (ㅔ, ㅐ)를 하나로, (ㅒ, ㅖ)를 하나로, 그리고 모음(ㅚ, ㅙ, ㅞ)를 하나의 자소로 분류하였다. 혀의 위치와 조음 방법과 위치에 따라 분류한 자음과 모음의 자소를 HTK를 이용하여 HMM(Hidden Markov Model)의 자소 Clustering하여 그것의 음가를 찾는 결정트리를 검색하여 고립어인식과 핵심어 검출 시스템에 적용 실험한 결과 시스템의 성능이 향상되었다.
-
ACELP 구조의 음성 압축기는 우수한 음질을 제공하지만 최적의 코드 벡터를 구하기 위한 계산량이 상당히 많은 단점이 있다. 이를 해결하기 위해서 본 논문에서는 AMR 음성 압축기의 코드북을 매우 효율적으로 검색하는 새로운 방법을 제안한다. 제안하는 코드북 검색 방법은 완전 순차적인 검색 방법을 사용하여 대략적인 코드 벡터를 구하고, 코드 벡터의 각 펄스들의 중요도를 계산하여 중요도가 낮은 펄스를 새로운 펄스로 교환하는 펄스 교환 과정을 수행하여 코드 벡터의 성능을 향상시키는 방법을 사용한다. 또한, AMR 음성 압축기의 구조에 맞도록 트랙별로 이동하면서 순차적으로 코드북을 검색하여 다수의 대략적인 코드벡터를 찾은 후, 각 코드 벡터에 대하여 펄스 교환 과정을 수행하여 최적의 코드 벡터를 구한다. 제안한 코드북 검색 방법을 AMR 음성 압축기의 모든 모드에 적용하여 코드북 검색을 위한 계산량과 성능을 측정하였으며, 모든 모드에 대하여 매우 적은 계산량으로 동등한 성능을 가지는 것을 확인하였다
-
초기 DTW(Dynamic Time Warping)를 이용한 화자인식 방법은 인식률이 시간이 지남에 따라 저하된다는 단점이 있었다[1][3][4]. 따라서 이를 보완하기 위한 새로운 알고리즘이 많이 제안되었다. 본 논문에서는 DTW방법을 이용한 화자 인식 시스템의 사용자 등록시기에 화자에 대한 불충분한 음성특징을 보충하고 시간이 지남에 따라 발생하는 오인식률의 증가를 줄이기 위해 사용자 등록시 기준패턴의 정규화를 수행하고 시스템 사용시 기준패턴을 변경하는 방법이다. 본 논문에서 사용된 핵심적인 알고리즘은 VQ(Vector Quantization)와 DTW 방법이다. 본 논문의 알고리즘을 이용한 모의 실험 결과 기존의 방법에 비해
$3.3\%$ 인식률 향상되어$97.5\%$ 의 인식률을 얻을 수 있었다. -
한국어 숫자는 각 숫자가 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 한편 연속적인 숫자의 발성을 기대하는 인식시스템에 반하여 일부 사용자는 숫자들을 고려시켜서 발성하기도 한다. 이는 연결숫자의 음운현상만을 고려한 인식 시스템에서는 성능저하의 한 원인이 된다 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운 변화를 고려하여 변이음군을 정하였으며, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수 할 수 있도록 인식 네트웍을 구성하는 방식을 검토하였다. 전화망 4연숫자음을 이용한 화자독립 인식실험을 통해서 한국어 숫자에서 자주 오인식 되는 '이', '오', '일' 인식 성능이 각각
$4..2\%$ ,$4.2\%$ ,$2.9\%$ 씩 향상되었으며, 인식속도도$33\%$ 의 개선이 있었다 -
본 논문에서는 한국어 Trainable TTS System의 자연스러운 음성 합성을 위해 400문장(어절수 : 6,220, 음운수: 총43,701: 자음 23,899,모음: 19,802)에 대하여 단일 남성화자가 발성한 문 음성 데이터를 음운레벨세그먼트, 음운 라벨링 ,어절간의 띄어쓰기 ,어절에 대한 음운별 품사가 태깅된 문 음성 코퍼스를 사용하여 음운 환경과 품사에 의하여 음운의 지속시간이 어떻게 변화하는가에 대하여 통계적으로 분석하였다. 그리고 음운 지속시간을 보다 정교하게 예측하기 위하여, 각 음운에 대한 고유 지속시간의 영향이 배제된 정규화 음운지속시간에 대한 회귀트리를 이용하여 정규화 지속시간에 영향을 미치는 특징요소들 간의 관계를 통계적인 방법으로 분석하였다. 그 결과 문법적인 특징요소를 나타내는 요소들간에 서로 상관이 높게 나타나는 것을 알 수 있었다 그리고 이러한 경우 유사한 특징 요소들간에 상관이 1에 가까울 정도로 상관이 높은 요소들의 경우 예측지수가 낮은 요소들을 제거하여도 지속시간변화에 영향을 미치지 못하는 것으로 나타났다. 그 결과 문법적 성질이 유사한 특징 요소들을 회귀트리를 통해 모델링할 경우에 요소들간의 상관정도를 분석하여 최소한의 특징요소들을 선택 할 수 있는 방법을 제시하였다 그리고 이를 토대로 한 정규화 회귀트리의 모델링이 지속시간 회귀트리 모델링보다 우수함을 입증하였다.
-
본 연구에서는 상보적인 빔형성에 기반한 대수적 마이크로폰 배열을 이용한 음성개선 시스템을 제안한다. 사람들이 많이 모여있는 회의실이나 사무실 환경에서는 백색잡음 보다 음성잡음, 즉, 다른 화자의 음성신호가 더 큰 영향력을 가질 수 있다. 따라서 대수적인 마이크로폰 배열을 사용함으로써 기존의 빔형성 기법에 비하여 저주파 영역에서의 성능을 향상시키고자 하였다. 모의실험 결과, 백색 가우시안 잡음에 대해서는 별다른 성능저하 없이 저주파 성분이 강한 음성잡음에 대해서는 우수한 성능을 가짐을 알 수 있었다.
-
Recognition rate of Korean digit is lower than that of other words because it is composed of similar phonemes. In this paper, a new method is proposed for the improvement of recognition rate by using the phoneme boundary information. In addition, the proposed method rarely increase cost because phoneme boundary is found by using simple method. We experimented with speech data of one man and then obtained results of enhanced speech recognition rate.
-
음성 합성기의 합성음의 자연감을 높이기 위해 자연음에 내재하는 정확한 운율 법칙을 구하여 음성합성 시스템에서 이를 구현해 주어야 한다 무제한 어휘 음성합성 시스템의 문-음성 합성기에서 필요한 운율 법칙은 언어학적 정보를 이용해 구하거나, 자연음에서 추출하고 있다 그러나 추출한 운율 법칙이 자연음에 내재하는 모든 운율 법칙을 반영하지 못했거나, 잘못 구현되는 경우에는 합성음의 자연성이 떨어지게 된다. 이런 점을 고려하여 본 논문에서는 한국어 자연음을 분석하여 추출한 운율 정보를 인공 신경망이 학습하도록 하고 훈련을 마친 인공 신경망에 문장을 입력하고, 출력으로 나오는 운율 정보와 자연음의 운율 정보를 비교한 결과 제안한 인공 신경망이 자연음에 내재하고 있는 운율을 학습할 수 있음을 알 수 있었다. 운율의 3대 요소는 피치 , 지속시간, 크기의 변화이다. 제안한 인공 신경망이 한국어 문장의 음소 열을 입력으로 받아들이고, 각 음소의 지속시간에 따른 피치변화와 크기 변화를 출력으로 내보내면 자연음을 분석해 구한 각 음소의 운율 정보인 목표 패턴과 출력 패턴 의 오차를 최소화하도록 인공 신경망의 가중치를 조절할 수 있도록 설계하였다. 지속시간에 따른 각 음소의 피치와 크기 변화를 학습시키기 위해 피치 및 크기 인공 신경망을 구성하였다. 이들 인공 신경망을 훈련시키기 위해 먼저 음소 균형 문장 군을 구축하여야 하고, 이들 언어 자료를 특정 화자가 일정 환경에서 읽고 이를 녹음하여 , 분석하여 구한운율 정보를 운율 데이터베이스로 구축하였다. 문장 내의 각 음소에 대해 지속 시간과 피치 변화 그리고 크기 변화를 구하고, 곡선 적응 방법을 이용하여 각 변화 곡선에 대한 다항식 계수와 초기 값을 구해 운율 데이터베이스를 구축한다. 이 운율 데이터베이스의 일부는 인공 신경망을 훈련시키는데 이용하고, 나머지로 인공 신경망의 성능을 평가하여 인공 신경망이 운율 법칙을 학습할 수 있었다. 언어 자료의 문장 수를 늘리고 발음 횟수를 늘려 운율 데이터베이스를 확장하면 인공 신경망의 성능을 높일 수 있고, 문장 내의 음소의 수를 감안하여 인공 신경망의 입력 단자의 수는 계산량과 초분절 요인을 감안하여 결정해야 할 것이다
-
본 연구에서는 음성신호의 왜곡에 대해 음성 부재 확률을 고려한 MMSE(Minimum Mean Square Error) STSA(Short-Time Spectral Amplitude Estimator)를 전처리기로 도입하여 HMM(Hidden Markov Model)에 기반 한 음성인식시스템의 인식성능을 평가하였다. 음성인식 시스템의 실시간 구현을 고려하여, MMSE STSA 기법을 음성개선을 위한 전처리기로 사용할 때 MMSE STSA의 이득계산 과정에서 많은 계산량이 요구되는 modified Bessel 함수를 근사 화하여 사용하였다.
-
본 논문에서는 EVRC 음성 부호화 시스템을 7MS320C54x를 이용하여 전 과정을 어셈블리어로 실시간 구현하였다. 구현된 EVRC 음성 부호화기는 최대의 계산량을 요구하는 8kbps 일때 잡음제거 알고리즘을 제치한 인코더부분이 평균 26.3MIPS 이며 디코더부분은 3.6MIPS의 복잡도를 나타낸다. 사용된 메모리양은 프로그램 ROM 16.9K words, 데이터 ROM(table) 7.9K words 및 RAM 5.8K words 이다. 구현된 EVRC 음성 부호화기는 북미 표준화 기구인 TIA(Telecommunications Industry Association)에서 제공하는 19 개의 테스트 백터들을 모두 통과하였다.
-
오늘날 오디오 포맷의 대부분은 마스킹 효과를 이용한 손실 압축 기법(lossy coding)이다. 그러나 고음질을 요구하는 매니아가 있고 DVD등 차세대 멀티미디어 포맷으로 무손실 오디오 압축기법이 요구되고 있고 이를 위해 일반적인 무손실 데이터 압축방법인 PkZip 등으로 압축할 경우 압축비가 약 1.07:1 밖에 되지 않으므로 적절하지 못하여, 디지털 오디오 데이터를 위한 무손실 압축 알고리즘의 연구가 필요하게 되었다. 본 논문에서는 플래이밍(Framing), 상호상관제거(intrachannel decorrelation), 엔트로피 코딩(Entropy coding) 의 세가지 단계로 구성되는 일반적인 오디오 무손실 압축 기법을 효율적으로 압축하기 위해 wavelet transform을 적용한 알고리즘은 제안한다.
-
코드북을 설계하는 알고리즘 중에서 가장 대표적인 방법은 K-means 알고리즘이다. 이 알고리즘은 그 성능 이 초기 코드북에 크게 의존한다는 문제점을 가지고 있다. 따라서 본 논문에서는 Splitting 방법을 이용한 새로운 초기 코드북 생성 알고리즘을 제안하고자 한다. 제안된 방법에서는 기존의 초기 코드북 생성 알고리즘인 Splittng 방법을 적용하여 코드벡터를 생성하되, 미소분리 과정 시 학습벡터의 수렴 빈도가 가장 낮은 코드벡터를 제거하고 수렴 빈도가 가장 높은 코드벡터론 미소분리 하여 수렴 빈도가 가장 낮은 코드벡터와 대체해가며 초기 코드북을 설계한다. 제안된 방법으로 생성된 초기 코드북을 사용하여 K-means 알고리즘을 수행한 결과 기존의 Splitting 방법으로 생성된 초기 코드북을 사용한 경우보다 코드북의 성능이 향상됨을 확인할 수 있었다.
-
본 논문에서는 랜덤초기화 방법을 사용하여 초기 코드북을 생성하고, 이를 이용하여 초기 반복학습 시 수렴영역을 벗어난 2 이상의 가중치에 의한 K-means 알고리즘을 제안한다. 기존의 K-means 알고리즘이 국부적으로 최적화되고 초기 반복학습 시에 가중치의 영향이 크다는 점을 이용하여, 제안된 방법에서는 초기 반복학습 시의 가중치를 수렴영역에서 벗어난 큰 값으로 주고 이후 반복학습시의 가증치는 수렴영역 안에 있는 값으로 고정하여 코드북을 설계한다. 또한 초기 코드북을 얻기 위해 Splitting 방법과 같은 추가적인 과정 없이 랜덤한 방법에 의한 초기 코드북을 적용함으로써 제안된 알고리즘이 단순한 구조를 가지며, 구해진 코드북의 성능도 우수함을 확인할 수 있었다.
-
본 논문은 비최소 위상을 가지는 시스템에 대한 역변환 문제를 실험적으로 고찰, 연구하였다. 일반적으로 선형적이고 인과적인 시스템의 입
$cdot$ 출력관계는 행렬형태로 공식화할 수 있다. 최소위상(minimum phase) 시스템의 시스템행렬은 항상 역행렬이 존재하며 안정적이지만 비최소 위상(non-minimum phase)시스템의 시스템행렬은 근사특이(near-singular)행렬 또는 특이(singular) 행렬이므로 불량조건(ill-conditioning)이 발생하고 역변환이 존재할 수 없다. 비최소 위상 시스템의 역변환 문제는 다른 과정을 포함하지 않고서는 인과적이고 안정적인 역변환 필터를 가질 수 없다. 따라서 역변환 필터의 구현을 위해 SVD(singular value decomposition)를 이용하였다. 비최소 위상 시스템인 경우 시스템행렬은 하나이상의 매우 작은 특이 값을 가지며 이것은 시스템의 위상정보를 가진다. 이 성질을 이용하여 시스템의 근사적인 역변환 필터를 구현하고 비최소 위상을 갖는 외팔보에 대해 실험적으로 검증하였다. -
에밀레종은 771년도에 성덕대왕의 공적을 기리기 위해 34년간 주조(높이 3.663m, 최대지름 2.227m, 무게 18,900kg)하여 만든 세계적인 문화유산이다. 외형도 미려하지만 종소리는 천, 지, 인을 뒤흔드는 신비감을 갖추고 있다. 에밀레 종소리는 끊어질 듯 이어지는 소리, 애끓는 소리, 심금을 울리는 소리 등의 특징을 갖는데 끊어질듯 이어지는 소리는 맥놀이 현상으로 나타난다. 지금까지 맥놀이 현상의 규명에 대한 많은 연구가 있었다 하지만, 에밀레종이 갖는 애끓는 소리에 대한 분석을 통해 애끓는 소리의 재현을 하기는 이번이 처음이다 여기에는 우리 선조들이 750년경에 과학적 근거를 토대로 하여 응용이 가능하였음을 알 수 있다. 결론적으로 우리는 1228년 전에 완성한 우리민족의 지혜와 숨결이 스며있는 에밀레 종소리의 세 가지를 규명하고 재현함으로서 문화민족의 자부심으로 새로운 세대를 개척해 나아갈 수 있는 원동력을 얻고자 한다
-
소나나 레이더분야에서의 방위 정보 추정에 있어서 직접신호와 반사신호가 있는 경우의 연구가 많이 이루어져왔다 특히 반사 신호 성분 중에 직접신호와 상관도가 높은 성분이 있는 스펙큘러 반사 성분이 있는 경우에 대한 연구가 많이 이루어져왔다. 이런 연구들은 대부분이 Block 데이타 처리 구조를 가지고 있다 따라서 방위가 시간에 따라서 변하는 경우 이런 Block 처리 구조를 가지고 처리하는 것은 오류를 범할 가능성이 높다. 본 논문에서는 recursive 구조를 갖는 알고리즘을 스펙큘러 환경에 강하도록 수정하여 시간에 따라 방위가 변하는 환경에 적용할 수 있도록 만든 알고리즘을 제안한다.
-
음장의 공간 음향적인 특성에 영향을 받은 음성신호를 원래 신호로 복원하기 위해서 본 논문에서는 MPSV (Minimum Phase Space Volume) 방법 을 도입한다 MPSV 방법 은 신호를 복원하기 위해 원래 신호의 어떠한 사전 정보나 가정을 필요로 하지 않고 그 신호의 비선형적인 동적 특이성만을 이용하는 블라인드 디콘볼루션 (Blind deconvolution) 방법이다. 또한, 이 방법을 이용하여 원래 신호를 복원하는 동시에 음장의 충격응답과 같은 시스템 특성까지도 유추가 가능하다.
-
초음파를 이용하여 인체 조직의 특성을 알아내는 방법은 매우 광범위하게 응용되어 오고있다. 그 중에서 초음파를 발생시킨 후 반사되어 되돌아오는 신호를 측정하여 그 감쇠 정도로부터 조직의 특성을 추정하는 방법이 많이 사용되고 있다. 이러한 감쇠현상은 발생된 초음파가 조직 내에서 흡수 또는 산란현상을 거치면서 주파수가 변이를 일으키기 때문에 발생한다. 따라서, 조직의 감쇠 특성을 알아내기 위해서, 주파수의 함수로 근사할 수 있는 감쇠 계수(attenuation coefficient)를 이용하여 시간에 따라 달라지는 주파수 변화를 추정한다. 그러나, 기존의 Ah(Auto-Regressive) 모델을 통한 시간영역 및 주파수 영역에서의 추정 방법을 사용하면 잡음이 존재하는 상황에서 시변 신호를 추정하는데 성능이 많이 저하된다. 본 논문에서는 이러한 단점을 보완하기 위해서, 가변 망각 인자와 재귀적인 TLS(Total Least Squares) 방법을 사용하여 시간에 따라 변하는 신호를 정확하게 추정하고 잡음환경에도 강인한 알고리듬을 제안하였다. 또한, 제안된 알고리듬은 추정 성능을 향상시킬 뿐 아니라 감쇠정도의 강약에 관계없이 망각인자의 값을 적응적으로 변화시켜 동작하는 장점을 가진다.
-
본 논문에서는 미국에서 고 선명(High Definition) TV를 위한 오디오 표준인 ATSC에 의해서 채택되고, DVD의 오디오 코덱으로 널리 채택된 Dolby AC-3 복호화기를 고정 소수점으로 변환한 후, ARM929T를 기반으로 실시간 구현하였다. 실시간 구현에 사용된 ARM920T 는 저전력 소비형 32-비트 고정 소수점 RISC 구조이며, 명령어 Cache 와 데이터 Cache, MMU(Memory Management Unit)로 구성되어 있다. 그리고 200MIPS 의 성능을 가지고 있어, 음성/오디오, 통신, 디지털 셀룰라폰에 적용할 수 있고, ASIC 화 할 수 있는 장점을 가지고 있다. 구현된 AC-3 복호화기는 약 67MIPS(6 채널, 640kbps, 48KHz)의 복잡도를 나타내며, 사용된 메모리양은 프로그램 ROM 23.3K Bytes, 데이터 ROM(table) 4.62K Bytes 및 RAM 45K Bytes 이다. 구현된 AC-3 복호화기는 Dolby사에서 제공하는 40 개의 test 벡터들을 bit-exact하게 통과하였다.
-
랩을 주로 하는 신세대 테크노 가수들의 음악을 들어보면 자막을 보지 않고서는 무슨 말인지 알아들을 수가 없다. 그들이 노래할 때 입 크기의 변화 없이 입술모양만 변화시키면서 발성하기 때문이다. 음성은 기본적으로 여기성분과 성도성분으로 구분할 수 있다. 성도는 인두강과 구강을 합쳐서 일컫는다 따라서 입 모양을 어떻게 하느냐에 파라서 같은 말이라도 명료성이 달라지게 된다. 본 논문에서는 이 명료성을 비교 평가하기 위해서 기존가수와 테크노 가수의 한 음절에 대한 지속시간을 비교하여 보았고 8Khz까지의 스펙트로그램을 비교하였다. 비교결과 기존가수가 신세대 테크노 가수에 비하여 말의 의사 전달에 있어서 명료하게 전달 할 수 있다는 것을 알 수 있었다.
-
실제 피아노 연주 녹음에서 연주된 음표를 검출하는 과정은 녹음된 데이터만으로 원래의 악보를 복원하거나 같은 악보로 연주한 서로 다른 연주를 비교 평가하는데 있어 필수적인 과정이다. 본 논문에서는 피아노 연주 평가프로그램에 적용될 알고리듬 구상의 첫 단계로서 타격 시간을 찾는 알고리듬을 제안하고, 실제의 연주 sample을 이용한 analysis와 기존의 다른 방법과의 비교를 통하여 그 성능과 효용성을 점검하였다 또한, 이 알고리듬을 실제 연주 평가 프로그램에 적용시켜 완성된 프로그램에 대해서도 간략히 소개하였다
-
본 논문에서는 기존의 VFF PASTd 알고리듬의 개선안을 제시하였다. 이 알고리듬은 각 부공간마다 가변망각인자를 각각 사용하던 기존 방법과는 달리 최종 잔류 오차를 이용하여 하나의 망각인자를 계산하고 이것을 이용함으로써 계산량을 줄임과 동시에 망각인자를 보다 정확히 구할 수 있다. 여기서는 주파수 추정 문제에 대한 모의 실험을 통해 제안된 알고리듬이 우수함을 입증하였다.
-
-
음료수 제조공정에서 살균처리는 필수이며, 이때 살균시간과 살균온도는 맛과 향에 영향을 미친다 기존에 열에 의한 살균처리보다 살균시간과 살균온도를 낮추어 음료수의 맛과 향을 자연그대로 유지하고 품질을 개선하기 위해 초음파와 열을 병행한 살균처리연구를 수행하였다. 실험장치는 자체 개발한 연속식 heptagonal 초음파처리 조를 사용하였고, 대장균과 microbateria를 대상으로 살균처리실험을 수행하였다. 연구결과 상온초음파처리실험에서 처리속도
$2\ell/min$ 에서 살균효과를 확인하였다. 처리용량 증대를 위해 상온초음파처리 후 저온실험결과$3\ell/min$ 에서 살균효과를 확인하였다. -
본 연구에서는 원활한 정재파 생성과 양방향 구동이 가능한 새로운 형태의 초음파 리니어 모터를 제작하고, 그 특성을 평가하였다 본 연구에서 제안한 모터는
$\lambda/4$ 간격으로 이빨 구조를 가지는 스테이터의 상, 하부에 압전소자를$90^\circ$ 의 위치 위상차를 갖도록 부착한 형태의, 상, 하부 압전소자에 각각 동위상, 180도의 시간 위상차를 가지는 교류 전압을 인가함으로써 양방향 구동이 가능하도록 하였다. 또한 원활한 정재파를 생성할 수 있는 최적의 구조를 결정하기 위해, 여러 가지 형태의 경계조건들에 대해 유한요소해석법을 이용하여 모델링하여 각 이빨들의 변위를 관찰함으로써 각각의 구조에 대해 타당성을 검증하였다. 위 결과를 바탕으로 세 종류의 초음파 리니어 모터를 제작하여 구동실험을 하였고, 실험 결과에 따라 속도와 추력 및 양방항성이 가장 우수한 최적의 구조를 결정하였다. 본 연구에서 제작한 모터는 최대 82.4cm/s의 속도와 0.46N의 추력을 가졌다. -
입사된 음파에 대한 배진동 주파수의 발생과 입사 음파들간의 합
$\cdot$ 차 주파수 발생은 물체내 결함이 존재할때에 나타나는 중요한 비선형 효과라는 것을 이용하여 단순화된 실험실 조건의 겹쳐진 두 장의 유리판에 적용하였다. 본 논문에서는 적층 접합 물체에 있어서의 비파괴 검사법을 위해 접합되지 않은 결함 부분은 두 장의 유리판 사이의 공기 층으로 단순화하였고, 접합되어진 부분은 물 층으로 단순화하여 실험을 진행하였다. 서로 다른 조건의 두 접합 부분으로부터 발생된 입사된 기본 주파수의 배진동 주파수 발생과 합$\cdot$ 차 주파수 발생을 관측함으로써 구조물 내의 결함 유$\cdot$ 무를 판별하였다. 배진동 주파수의 발생과 합$\cdot$ 차 주파수의 발생은 결함이 존재할 경우에 두드러지게 나타났지만, 결함이 존재하지 않는 경우에서는 비선형 반응의 발생이 억제되었다. 이 결과로부터 비선형 현상의 발생은 이차원적인 적층 구조물에도 적용 가능하며, 비선형 비파괴 음향 탐사법에 의한 결함의 존재 유$\cdot$ 무 판별이 가능하였다. -
Rosen형 또는 적층 Rosen형과 같은 압전세라믹 변압기는 고전압, 고효율의 출력특성과 소형이라는 장점을 가지는 반면에, 온도에 따른 압전 특성의 변화가 심하다는 단점을 가진다. 이러한 이유로 압전 단결정과 같은 온도특성이 안정적인 재료를 이용한 변압기의 개발이 진 행되고 있다. 따라서, 본 연구에서는 온도계수가 낮은
$LiTaO_3$ 단 결정$(X-112^\circ\;Y)$ 을 이용한 압전변압기를 제작 그 특성을 시뮬레이션 및 실험으로 해석하였다. -
기존 의료용 초음파 진단장치에 사용되고 있는 선형 배열 탐촉자를 대상으로, 과도음장의 전파특성을 해석하고, 음장 변화에 민감하게 영향을 미치는 구동 펄스의 형태 및 탐촉자의 요소의 크기(element width), 곡률반경(Radius of curvature), 초점길이(focal length) 등 구조적인 변화에 따른 과도음장 전파 특성의 변화 양상을 시뮬레이션을 통해 체계적으로 해석하였다. 나아가, 매질이 간, 근육, 지방 등의 생체 조직인 경우의 음장 변화 특성을 비교 분석하였다.
-
수중에서 물과 공기 다공을 갖는 다공성 매질의 주파수 및 다공율 변화에 따른 음향특성을 고찰하였다. 다공성 매질로서 원통형 다공을 인위적으로 균일하게 배열한 판형 루사이트 (Lucite)를 사용하였다. 수중에서 음파를 다공성 매질의 원통형 다공의 축 방향과 평행하게 입사하였을 때, 빠른 파 (fast wave)는 다공 내의 매질에 영향을 받지 않으나, 느린 파 (slow wave) 및 원통형 다공을 전파하는 비평면 고차 정상 모드 파 (nonplanar higher normal mode wave)는 다공 내의 매질에 크게 영향을 받는다. 3MHz부터 4MHz까지의 주파수 영역에서 전체 파 (total wave), 빠른 파 및 느린 파의 음속 및 음압투과계수를 주파수 및 물과 공기 다공율 변화에 따라 측정하였다. 비강체 다공성 매질에서의 음파 전파특성에 대한 MBA (modified Biot-Attenborough) 모델의 이론 결과와 실험결과를 비교, 분석하였다.
-
Finite element models are constructed using the commercial code ANSYS for two most representative types of ultrasonic transducers, cMUTs and piezoelectric transducers. Calculation result shows the origin and level of cross talk between array elements in each transducer type For reduction of the cross talk level, the effects of various structural variations are Investigated for each transducer type. The results say that proper design of the coupling isolation structures between the transducing elements can significantly reduce the cross talk in ultrasonic transducers.
-
Nondestructive nonlinear acoustic method in two dimensions is suggested as a useful tool for detecting defects in a composite layer-structured material. Spectrum level changes in fundamental and harmonic frequencies are observed in the presence of a layer type defect compared with in the absence of such a defect. It is proposed in this study that such spectrum changes we due to the mode conversion. The layer type defect makes different normal modes due to different boundary conditions in the thickness direction for the Lamb waves propagating in a layer-structured material. Specifically, the normal mode with the fundamental frequency in the case of the water-layer gap is converted to the normal mode with the second harmonic frequency in the case of the air-layer gap.
-
Acoustic pressure transmission coefficient and phase velocity are measured as the functions of water porosity and air porosity in sand sediment slabs with water- and air-filled pores. Pores in the sand sediment slab we modeled as the structure of circular cylindrical tube shape filled with water and air. The first kind(fast) wave and second kind (slow) wave, identified by Biot, in the solid and fluid mixed medium are affected by the presence of water and air pores. Acoustic characteristics of such porous medium in water are also theoretically investigated in terms of the modified Biot-Attenborough (MBA) model, which uses the separate treatment of viscosity effect and thermal effect in non-rigid porous medium with water- and air-filed pores. The information on the fast waves introduces new concepts of the generalized tortuosity factor and dynamic shape factor.
-
콘형 스피커를 사용한 임피던스 흡음 제어시스템에서는 진동판의 진동속도와 음압 모두를 궤환하는데 이는 궤환 이득이 큰 반면에 궤환 루프상의 요소들 때문에 안정한 동작이 곤란하였다. 이 연구에서는 전기단 접속형 제어시스템과 속도 궤환형 제어시스템의 적용에 대해 그 가능성을 확인하였다.
-
일반적으로 스피커를 동작시키게 되면, 스피커 보이스 코일에 열이 발생하게 되고, 열에 의한 보이스코일의 저항의 증가가 나타나게 되는데, 기존의 연구는 저음용 스피커(Woofer) 만을 대상으로 스피커의 음향특성 변화들에 관해 수행되었다. 그러나, 현대의 스피커는 A/V시스템분야의 발전에 따라 고음재생의 충실도가 강조되고 있는 경향이므로, 고음용 스피커(Tweeter)에 대한 열 발생의 영향을 조사하였다. 본 연구에서는 고음용 스피커의 입력전력에 따른 특성 변화를 조사하고, 입력전력의 증가로 인한 보이스코일(voice coil)의 저항 증가에 따른 고음용 스피커의 특성변화에 관해 실험하였다. 그리고, 스피커의 진동에 의한 펌프(pump) 역할을 이용하는 냉각용 구멍을 뚫어 스피커의 특성변화를 검토하였다. 실험대상으로는 직경 25mm의 돔(Dome)형 진동판을 가진 고음용 스피커와 이 스피커의 후면 중심부에 구멍을 뚫어 열 방출구가 형성된 3종의 시료를 대상으로 특성변화를 비교
$\cdot$ 측정하였다. 여기에서, 사용된 시료는 국내 Y사의 판매용 고음용 스피커로 제품의 원 상태인, 구멍이 없는 것을 기준시료로 하고, 이와 동일한 제품들의 후면에 각각 직경 5mm, 10mm, 15mm의 구멍을 가공하여 비교시료로 하였다. 기준 및 비교시료의 스피커 특성을, 한국산업규격 KS C 6027의 측정법에 따라, 입력 1W 상태에서 기준시료의 사양을 측정하였고[1], 입력을 0.5W, 1W, 2W, 4W, 8W, 16W로 가하여, 시료별 입력증가에 따른 스피커의 주파수 응답특성, 임피던스(Impedance), 조화 왜(Harmonic Distortion)의 변화율 측정을 통해 스피커의 특성변화 정도를 검토하였다. 향후, 본 연구의 결과는 고음용 스피커의 특성 열화에 대한 예측 및 개선 방안을 제시하는 기본 자료로 활용이 가능할 것으로 사료된다.용하여 현금흐름예측을 할 수 있는 Model을 제시하였다. 특히 건설공사의 현금흐름 예측의 중요한 요소인 Cash-Out에 대하여, 공사비 구성요소인 자재, 노무, 중기, 외주, 경비등 각 Resource의 보할(Weights)을 실 공사원가에 따른 보할의 변화와 Resource들의 Time Lag를 적용 기존 연구자의 Model과 다른 Model을 제시하였다. 또한 기존 연구자들의 Model과 비교하여 편리성, 정확도 및 신뢰성이 높은 Model임도 증명하였다.세대까지도 발현수준이 유지될 것으로 판단된다. 이러한 연구결과는 계통으로 확립된 형질전환 동물에 부여된 새로운 유전형질은 지속적으로 후대로 유전될 수 있음을 제시한다. 잖⨀ 瘀Ā 퀇 Ā ゑ잖⨀ Ā 퀇 Ԁ 잖⨀ 䌀Ā 퀇 Ā ꄏĀ ꀏ ꄏĀ ꀏ ₱?⨀ Ā Ԁ 䂱?⨀ ऀĀ 耀 Ā 삱?⨀ Ā Ā ?⨀ ጀĀ 耀 Ā ? 돀ꢘ?⨀ 硩?⨀ ႎ?⨀ ?⨀ 넆 돐 쁖잖⨀ 쁖잖⨀ /ࠐ?⨀ 焆 덐 瀆 倆 Āⶇ퍟 ⶇ퍟 Ā Ā Ā Ā 磀鲕 좗?⨀ 肤?⨀ ⁅ Ⴅ?⨀ 쀃잖⨀ 䣙熸 ጁ ?⨀ -
MP3는 현재 디지털 오디오 압축 표준으로 널리 사용되고 있으며 12:1의 높은 압축률을 가진다. MP3 encoding의 경우 현재는 대부분 PC를 이용하고 있으므로 MP3 encoding과 decoding을 동시에 할 수 있는 칩이 나오면 이러한 불편함 없이 portable이 가능해지며 라디오, CD, 카세트 테이프 등으로부터 고음질 녹음 후 재생이 가능해진다. TMS320C30과 호환되는 DSP 코어를 이용하였으며 MP3 엔코딩과 디코딩 실시간 수행을 위하여 알고리즘 개선과 FFT block, 주변 interface block을 설계하였다. 최종적으로 MP3 encoder와 decoder 칩 설계하고 이를 하드웨어 에뮬레이션을 이용하여 검증하였다.
-
다채널 음장 재현 시스템에서 공간 전달 특성을 제거하는 역필터의 설계가 불가결하다. 주파수영역에서 최소 Norm해를 이용한 설계 방법은 시간 영역 설계방법과 비교하여 볼 때, 적은 계산량과 메모리량으로 설계할 수 있다. 그러나, 이 방법에서는 역필터를 필요로 하게 되고 FIR 필터로 설계 가능하다는 보장이 없다. 따라서, 본 연구에서는 주파수 영역 처리를 반복하여 수행하는 것으로 다 채널 음장 재현시스템을 위한 안정한 역필터를 설계하는 방법을 제안한다.
-
Howling을 억제하기 위하여 Howling의 원인인 피드백 신호를 적응 필터로 소거하는 방법이 연구되어왔다. 이 방법은 적응 필터로 피드백 경로의 전달함수를 추정하고, 입력 신호에서 피드백 신호를 소거하는 것이다. 그러나, Open-100p 이득이 평탄하고 시스템의 Group-delay가 짧은 Howling의 경우에는, 현재 다른 분야에서 사용되고 있는 Howling 억제 기법을 이용하는 것은 어렵다. 따라서, 본 연구에서는 적응 Notch 필터를 이용하여 Howling을 억제하는 방법을 제안, 평가하고, 또한, 이득 여유를 증가시키기 위한, Notch 필터의 설계 방법에 관해서 검토한 후, 시뮬레이션을 통해 그 타당성을 입증하고자 한다.
-
본 논문에서는 ETRI와 연세대가 공동 개발한 AAC/MP3 복합 복호화기 ASIC 칩을 이용한 AAC/MP3 오디오 플레이어의 설계 및 구현에 대해 기술한다. 본 논문에서 사용한 AAC/MP3 복합 복호화 ASIC Chip은 20비트 고정소수점 DSP 코어를 이용하여 MP3와 MPEG-2 AAC LC 프로파일을 복호화하며, MPEG-2 AAC 메인 프로파일을 실시간으로 복호화하기 위하여 허프만 복호화 과정과 예측 과정은 전용 하드웨어 모듈을 이용하였다 이를 이용한 오디오 플레이어는 AAC/MP3 파일 재생 기능, USB를 이용한 호스트 PC와의 인터페이스 기능, Flash 메모리와의 인터페이스 기능 등의 특성을 갖는다.
-
본 논문에서는 MPEG-2 AAC(Advanced Audio Coding)와 RTP/RTCP, RTSP, TCP/IP 등의 인터넷 프로토콜을 이용한 고품질 인터넷 오디오 방송 기술에 대해 기술한다. AAC 데이터를 인터넷을 통해 실시간으로 전송하기 위해 RTP/RTCP 프로토콜을 사용하고, 사용자에게 편리한 인터페이스를 제공하기 위해 RTSP 프로토콜을 사용한다. TCP/IP 프로토콜은 서버/클라이언트간에 중요한 정보의 교환에 이용되어 진다. 본 논문에서는 위의 다양한 프로토콜을 이용하여 AAC 데이터를 스트리밍 하는 방법과 이를 이용한 인터넷 오디오 방송용 서버/클라이언트를 구성하는 방법에 대해 기술한다.
-
인간이 실제 생활에서 느끼는 입체음향을 녹음해서 재생기를 통해 듣고자하는 시도는 역사적으로 이미 한 세기가 지났으나 아직도 실감 있는 입체음향 녹음 및 재생기법 연구는 계속진행 중에 있다. 스피커 혹은 헤드폰으로 전후, 좌우, 상하의 모든 방향 및 거리감까지도 재생시킬 수 있는 있어야 진정한 입체음향이라 말할 수 있겠지만 많은 오디오 기기 제조업체들이 홍보효과를 위해 입체음향을 부적절하게 사용함으로써 일반 사용자들은 입체음향에 대해 많이 혼돈하고 있는 실정이다. 정확한 의미로 오늘날 대부분의 오디오 기기를 차지하고 있는 스테레오 사운드는 1차원(좌우 축)사운드라고 말할 수 있으며, 극장 사운드는 2차원(좌우, 전후 축)사운드이며 상용화된 3차원 사운드 제품은 아직 존재하지 않는다고 말할 수 있다 본 논문에서는 현재 연구 중인 "방송을 위한 입체음향 생성 및 재생 기법" 중 대표적인 바이노럴 기법과 Ambisonic 기법 및 문제점에 대해 알아보았다
-
-
강의실의 언어 요해도에 관한 연구는 그 평가방법과 지표에 대한 주제로 꾸준히 이루어져 왔다. 기존의 지표들에서는 전체 음에너지에 대한 초기음에너지의 비율로 계산하거나(C80, D50) 주파수 대역별 음에너지의 감쇠율(RASTI)을 구하여 명료도를 평가하였다. 본 연구에서는 Autocorrelation Function (ACF)의 시간적 요소를 통해 강의실의 언어 요해도를 평가하였다. 먼저 시뮬레이션 대상 강의실에서 무향실 음원이 제시되었을 때 12개 수음점에서 음향특성을 측정
$\cdot$ 분석하였으며 청감실험과 ACF 분석을 통해 강의실 요해도와의 상관관계 규명하였다 -
RASTI와
$D_{50}$ 이 명료도와 상관이 높은 것은 사실이지만, 음질과는 상관이 없다. RASTI는 잔향과 잡음이 적으면 값이 높아지지만, 스피커 자체에서 재생되는 음질이 찌그러지거나 명료하지 않은 음질이 재생되어도 값은 변하지 않는다.$D_{50}$ 스피커에서 재생되는 음질과 관계없이 직접음 성분이 많으면 단지 값이 높아질 뿐이다. 그런데, RASTI와$D_{50}$ 이 높으면 음질도 좋을 것이 라고 생각하는 경우가 많다. 따라서 스피커의 음향 특성에 따른 RASTI,$D_{50}$ 의 변화 측정 및 음질 선호도 평가를 실시하고, 재생 주파수 대역에 따른 RASTI,$D_{50}$ 의 변화 측정 및 음질 선호도 평가를 실시하므로써, 명료도 척도와 음질과의 상관을 고찰하였다. -
해마다 실시되고 있는 대학수학능력시험의 듣기 평가시험에 있어서, 고사장 및 지점별 음향 성능에 기인한 레벨 편차와 명료도를 산출하여 학생 선발의 공공성과 객관성을 검토해 보고자 한다. 일반적으로 듣기 평가가 이루어지는 각 고사장은 듣기 평가 실시에 지장이 없는 고등학교 교실로 지정하고 있지만, 균등한 음 환경을 제공해야 하는 시험의 성격에 반해 학교 자체의 방송 시설을 그대로 사용하는 것은 평가의 형평성 및 객관성에 충실하지 못하게 되는 요인이 된다. 따라서, 각 고사장의 확성 시스템에 따른 음성 전달품질과 수험생간의 좌석별 음압 레벨 및 명료도를 평가하였고, 실험 결과 RASTI를 비롯한 음성 및 음절 명료도를 나타내는 파라메터에서 좌석별로 큰 편차가 있는 것으로 분석되었다.
-
본 논문은 전기적으로 음장을 가변하여 청감적 인상에 변화를 주는 실험 결과를 기술하였다. 본 실험은 마이크로폰으로 무대의 음원을 수음하고 잔향기로 옆방향 반사음과 잔향음을 각각 생성하여 스피커로 출력하였다. 실험 결과 실내의 청감적 인상이 개선됨을 확인하였다. 또 음원 수음 시 발생하는 하울링, 실내 잔향과 다른 스피커의 음색, 잔향기에서 발생하는 음색 변조 둥 기술적 문제를 해결하였다.
-
당과 같은 실내 음향 문제는 강당의 사용자와 관리자의 주관적인 평가가 배제되기 힘든 것이므로 문제를 개선하기 위해 물리적 측정이나 실험, 해석 등을 통한 다각적인 정량적 분석 자료를 산출하는 과정이 선행되어야 한다 이를 위해 본 논문에서는 기존의 강당에 대한 고유 음향 특성-잔향시간, 명료도, 음압레벨-을 실험과 컴퓨터 시뮬레이션을 통해 얻어 음향 분포를 파악하고, 현재 설치되어 있는 스피커의 지향성 및 위치 등에 따른 음향 특성을 알아보았다. 대표적인 음향평가 지수인 잔향 시간은 랜덤노이즈를 음원으로 사용하여 음향측정을 수행하였으며, 이 결과를 시뮬레이션과 비교함으로써 컴퓨터 시뮬레이션의 신뢰성 또한 검토하였다.
-
1990년대 중반 이후 우리나라 초등학교 교실은 열린교육과 다양성을 추구하는 새로운 열린교실을 표방하고 진행되고 있다. 또한 건축설계에 있어서도 과거의 종합 표준설계에 의하지 않고 각 학교마다 별도의 건축설계에 따라 지어지고 있다. 본 논문의 목적은 현재의 초등학교 교서의 차음환경을 조사하고 새로이 지어진 교사의 교실과 열린교실의 실내 음환경을 조사하여 현재 상황을 분석평가하고 이에 대한 대안을 제시하고자 하는 것이다. 이를 위하여 건축시공연대가 다른 초등학교 3개 학교를 선택하여 단위교실에서의 실내음향인자(RT60, C80, D50, RASTI)와 인접교실과의 차음성능(TL)을 측정하였다. 또한 해당교실의 학생과 교사에 대하여 설문조사를 실시하였다. 각 측정은 외부와 복도에 인접한 창문의 개폐여부와 실내의 위치별로 이루어 졌다. 실험결과, 열린교육에 따라 가변적 교실의 구성은 기존의 교실보다 차음성능이 평균
$5\sim6dB$ 낮은 것으로 나타났다. 또한 신축교사의 RASTI값(0.73)이 10년 이상 된 학교(0.70)나 열린교실(0.64)보다 높은 것으로 나타났다. 음성명료도(D50) 역시 일반 신축교사가 열린교실 보다 높게 나타났다. 이것은 실의 기밀과 내부바닥의 마감자재로 비롯되었으며 최근의 열린교실은 음의 차음과 실내명료도에서 열악한 것으로 결론되었다. -
기존의 고분자 자체를 그냥 쓰거나 (발포체 형태로 만들면 음파가 내부의 공기 층을 통과할 때 주위의 벽과 마찰이나 점성 저항에 의해 음파의 에너지의 일부가 고분자 매트릭스의 열에너지로 변화하여 고분자에 흡수된다) 유리섬유나 석면(광물면), 식물 섬유류를 넣어 복합재료로 만들어 기능성과 물리적인 성질(강도, 치수 안정성, 방염성, 내후성, 단열성 등)을 높여왔다. 하지만 고분자의 이온기에 변화에 따른 음향 특성의 변화에 따른 연구는 없었다. 본 논문에서는 고분자의 흡음 성질을 향상시키기 위해 이온기를 가지고 있는 고분자나 산 혹은 염기 작용기를 가진 고분자를 합성하고 또한 이들 고분자들을 블렌딩하여 이들의 음향학적 성질을 알아 보려한다. 흡음율을 측정하기 위한 방법으로는 2-마이크로폰법을 이용하고 임피던스 관내의 얇고 지름이 작은 시편 샘플들의 음향인자를 측정이 가능하도록 기존에 사용되고 있는 콘덴서 마이크로폰이 아닌 프로브 마이크로폰을 이용하였다.
$\;^{(1)}$ 특별히 실험을 위해 제작된 아이오노머는 PS, P$(S-14.3-AZn^{2+})$ , P$(S-14.5-SSNH_4)$ , P(S-6.6-ITANa), P(S-8.95-ITANa) 등의 고분자를 블렌딩한 샘플을 이용하여 흡음 패턴을 측정하였다. -
최근의 야외경기장의 설계는 운동 경기 뿐만 아니라 각종이벤트 및 대형콘서트를 수용하는 다목적경기장으로 건설되어지고 있으며 지붕의
$50\%$ 이상이 천장으로 덮히는 야외경기장의 건설이 증가하는 추세로 변화되고 있으며 이에 대한 음향장해 현상이 심각한 실정이나 이에 대한 건축음향적인 대책은 미미한 실정이다. 본 연구는 서울월드컵경기장을 중심으로 경기장의 음향시스템을 고찰하고 과 측정결과 치와 음향시뮬레이션 결과치를 음향인자 (잔향시간, 명료도, 음압레벨)들을 서울시의 설계기준과 비교분석 평가 고찰하는데 있다. -
콘서트 홀 등의 음향 측정을 측정하는 데 있어 다채널 마이크로폰을 이용하여 그 공간의 반사음 패턴을 파악하는 기술이 널리 이용되고 있다. 이 기법은 그 공간 특유의 반사음의 입사 시간과 방향을 측정할 수 있을 뿐만 아니라, 충격응답(Impulse response)의 측정을 기반으로 하므로 기존에 사용되고 있는 모든 모노성의 음향 특성의 측정에도 이용할 수 있다. 그러나 LEF나 IACC등의 다차원의 음향 특성의 측정을 위해서는 양지향성 마이크로폰이나 더미헤드 등을 이용한 측정을 별도로 수행하고 있다. 본 연구에서는 다채널 마이크로폰으로 구한 방향성 충격응답으로부터 각각의 반사음들의 특성을 구하고 그 결과에 양지향성 마이크로폰의 지향특성을 적용하여 LEF를 얻어내도록 하였다. 제안하는 기법의 유효성을 검증하기 위하여 기존의 무지향성 및 양지향성 마이크로폰을 이용하여 구한 결과와 비교, 분석하였다
-
이동전화 서비스에 있어서 가장 중요한 것 중 하나가 H/O이다. 그동안 동일 세대간
$(2G\leftrightarrow2G)$ H/O를 위해 소프트 H/O방식과 소프터 H/O방식이 이용되어 왔으며 별다른 문제점이 없었다. 그러나 사용자의 욕구와 통신기술의 발달로 세대가 다른 시스템이 공존하여 서비스를 시작하므로써 세대간$(2.5\leftrightarrow2G)$ H/O를 위해 파이롯 비컨 방식과 주기형 비컨 방식이 이용되어 왔으나 비경제적이고 능률적이지 못하였다. 이를 개선하기 위해 2001년 4월 ENHHO방식이 개발되어 현재 이용되고 있다. 이 방식 또한 파이롯 신호가 5개 이상인 경우 H/O가 진행되는 동안 통화정보가 순간적으로 단절되는 단점을 갖고 있다. 따라서 본 논문에서는 ENHHO방식의 문제점을 개선하기 위한 알고리즘을 제안하고 이를 이용한 현장측정 결과를 분석하므로써 그 타당성을 검증하였다. -
정보 통신 기술의 발달이 인간 생활에 많은 편리함을 가져다 주었지만 개인의 정보 유출이나 소음 공해 등의 여러 가지 문제점도 야기 시켰다. 특히 휴대 전화 통화시 사용자의 개인적인 정보들이 공공 장소에서 그대로 노출이 되고, 또 그러한 통화로 인해서 타인에게 소음 피해를 주기도 한다. 이러한 병폐를 막기 위해서 휴대 전화 사용자는 최대한 작은 소리로 통화를 하되, 상대방에게 의도하고자 하는 바를 확실히 전달하여야 한다. 그러기 위해서는 휴대 전화에 근접 통화가 가능해야 하며, 일정한 방향의 방향성을 가져서 주위의 잡음에 대해 독립적으로 작동하도록 해야한다. 본 논문에서는 이러한 기능을 향상시키기 위하여 음향학적 이론을 바탕으로 휴대전화에 사용되어지는 마이크로폰을 새로 설계, 제작하고 그 성능을 시험하였다. 아주 작은 소리로 근접 통화를 할 때 발생하는 팝핑(popping) 현상이 최소한이 되도록 미세관 배열을 적용하였으며, 외부 소음 영향을 줄이기 위하여 방향성을 증폭시키고자 음원의 위치에 초점을 맞추는 기술을 적용하였다. 방향성 증폭은 4개의 마이크로폰 사용과 근거리 음원의 방향성 증가를 위한 신호 처리기술을 적용하였다. 이 기술의 적용 효과를 실험을 통하여 검증할 수 있었다.
-
Factor Analysis on Ajective Pairs for Compatibility Evaluation of Frequency Mixed Information Sounds본 연구는 가전제품의 정보음을 평가할 수 있는 어휘 척도의 개발을 목적으로 행해졌다. 21명의 주부를 대상으로 8개의 주파수혼 정보음을 제시하여 각 정보음에 대해 30개의 형용사 쌍 체크리스트를 이용하여 5점 척도로 평가하게 하였다. 요인분석은 SPSS S/W를 이용하였고 요인추출 방법은 주성분법(principal component method)으로 하였으며 요인추출 갯수는 scree test와 최종요인구조의 심리적 해석에 기초하여 4개로 결정하였으며 해석의 용이성을 위하여 직교회전방법을 적용하였다. 가전제품의 경고음그룹 4개와 종료음그룹 4개로 구성된 주파수혼합 정보음의 적합성평가에 사용된 30개 형용사 쌍의 요인분석 결과, 4가지 요인구조로 가장 잘 설명할 수 있었으며, 첫 번째 요인은 긴박성 요인, 두 번째 요인은 명료성 요인, 세 번째 요인은 역능 요인, 네 번째 요인은 평가 요인으로 나타났다.
-
피아노 향판의 진동 특성은 피아노 음질을 결정짓는 매우 중요한 요소이다. 그런데 피아노를 제작함에 있어 브릿지를 향판에 부착함으로서 진동 특성이 브릿지 부착 전과 달라지게 된다. 본 연구에서는 브릿지가 부착되지 않은 피아노 향판의 진동 특성을 측정한 후 동일한 항판에 대하여 브릿지를 부착한 상태에서의 진동 특성을 클라드니 패턴을 이용하여 비교, 측정하였다. 두 경우에 대한 비교 측정 결과 저주파에 대해서는 진동 특성이 큰 차이를 보이지 않지만 고주파에 대한 진동 특성은 크게 달라짐을 확인할 수 있었다
-
잔향음은 시변동성이 존재하는 유동성 경계면 잔향음(해수면, 체적)과 시변동성이 존재하지 않는 고정 경계면 잔향음(해저면)으로 분류된다. 그러나 고정 경계면 잔향음으로 알려진 해저면 잔향음에서도 단주기적 시변동성이 존재하고 있음이 여러 실측자료에서 관측되고 있다. 본 연구는 시변동성의 원인을 파악하고자 실험실에서 부유성 퇴적물의 농토에 따른 후방산란 신호를 측정하였다. 또한 동해에서 측정된 시간에 따른 잔향음신호(80kHz)와 ADCP(4.2MHz) 자료를 비교하여 천해에서의 체적 산란체의 변동이 잔향음 신호에 영향을 미칠 수 있음을 확인하였다. 아울러 본 논문에서는 잔향음 신호의 단주기적 시변동성에 의한 잡음 성분을 제거하여 표준화된 잔향음 신호를 획득하기 위한 방법으로 Low Rank Approximation(LRA)을 제안하였다. 이 기법은 특이해 분해(Singular Value Decomposition, SVD)를 수행하여 실측 자료 행렬로부터 고유치(Eigenvalue)과 고유벡터(Eigenvector)를 추출한 후, 추출된 고유치를 제한적으로 사용하여 근사화 하는 기법으로 시변동성 신호를 제거하는데 효율적인 방법이다.
-
본 연구에서는 수중 음의 전달에 작용하는 기하와 지음향 매개변수들을 전역 최적화(global optimization) 방법인 유전자 알고리듬을 사용하여 추정하려한다. 유전자 알고리듬은 목적함수가 불규칙적인 경우에도 모든 가능한 매개변수들을 조사하지 않으면서 전역 최대치 또는 최소치를 추정할 수 있는 최적화 방법으로, 정합장처리와 관련된 매개변수의 조사에 적합한 방향성 조사법이라 할 수 있다. 유전자 알고리듬을 이용하여 천해 해양환경에서 수치실험을 통해 매개변수 역산의 가능성을 살펴보도록 하였다.
-
해수 체적에 의한 산란 특성을 이해하기 위해 방향 특성(directional response)에 대한 연구를 실시하였다. 이를 위해 공기로 채워진 PVC(polyvinyl- chloride) 재질의 실린더를 등 간격으로 설치하여 일정한 체적을 기하학적으로 배열하였다. 동일한 체적에 대한 산란강도의 방향 특성 모의로부터 수중의 표적 탐지 및 수산 자원량 조사의 중요 변수인 체적 산란강도의 음원 방향에 대한 고찰이 필요함을 알 수 있다.
-
본 논문은 수중방사소음을 이용한 선박 클래스 식별을 위하여 비선형매핑법을 제안한다. 수중방사소음으로부터의 특성벡터 추출과정은 신호의 주파수영역 변환, 규준화, 및 특성추출 과정들을 포함하며, 비선형매핑법은 이러한 과정을 통하여 추출된 특성벡터를 입력으로 선박의 클래스를 분류한다. 제안된 비선형매핑법은 인공적으로 생성한 데이터들을 이용한 시뮬레이션을 통해 검증되고, 실제 데이터를 이용한 테스트 결과들은 본 논문에서 제시한 방법이 식별을 위해 사용될 수 있음을 보여준다.
-
본 논문은 수중 음향을 이용하여 다중경로(Multipath) 환경에서의 해저면 설치 수신기의 3차원 위치 추정 알고리즘을 제안한다. 해저면 설치 수신기의 위치 추정을 위해 기준 음원의 위치와 음원과 수신기 사이의 수평거리를 사용하며, 수평거리 산출 시 다중경로의 영향을 고려하기 위해 음선 이론 모델을 사용하여 음원과 수신기 사이의 수평거리를 추정한다. 또한 특이치 분해법(Singular Value Decomposition estimator; SVD)을 사용하여 설정된 3차원 위치 추정 문제의 최적해를 추정하며, 이를 사용하여 동해 해상 실험 자료를 분석한다. 논문의 연구 결과 제안된 해저면 설치 3원 위치 추정 알고리즘은 다중경로 환경에서도 좋은 성능을 나타냄을 알 수 있다.
-
정합장 처리기법은 일반적으로 고정된 음원의 위치를 추정하는데 사용된다. 본 연구에서는 알고리즘 중에서 Bartlett, MV, MCM, FEM 프로세서를 CTA에 적용하여 이동하는 음원의 이동 경로를 추적하는 성능을 분석하였다. 천해환경에서 이동하는 음원의 경로를 추적하는 경우 FEM 기법이 다른 정합장 처리 방법보다 좋은 성능을 보여줌을 확인하였다. 이동음원 데이터는 2001년 동해 실험 자료를 이용하였고, 실험환경에 대한 복제음장은 ORCA를 사용하여 구현하였다.
-
지금까지 수중음향 시스템에서 jammer 신호를 제거하는 방법에 관한 많은 연구가 진행되어 왔다. 그러나, 기존의 빔형성 기법은 간섭 신호원(interference source)이 움직일 경우 그 성능이 현저히 떨어지는 문제점을 갖고 있다. 이러한 현상은 수중 음향 시스템이 간섭 신호원의 움직임에 대하여 즉각적으로 null의 위치를 변화시키지 못하기 때문에 발생하게 된다. 이를 해결하기 위해서는 시간에 따라 위치가 변하는 jammer 환경에 대하여 대응할 수 있는 새로운 알고리즘이 필요하게 된다. 이러한 단점을 보완하기 위해 본 논문에서는 가변 망각인자를 갖는 적응 빔형성 기법을 제안하고, 컴퓨터 모의실험을 통하여 제안된 알고리즘이 기존의 적응 빔형성 기법에 비하여 출력 SINR(signal to interference plus noise ratio)의 측면에서 성능 향상을 가짐을 보였다.
-
Various shapes of the noise barrier frame and construction of the sound absorbing panels are studied. It is found that insertion of the sound absorbing panel into barrier frame results in the decrease of the sound absorption coefficient, while the empty frame shows a peak around 250Hz. Using double sound absorbing panels with air gap can increase sound absorption coefficient up to NRC 0.85.
-
내연기관의 흡기 소음을 줄이기 위한 효과적인 소음 제어 요소로서 다공형 직조관(porous woven hose)이 널리 사용된다. 직조관이 사용된 흡기계의 음향 특성을 예측하기 위해서는 직조관의 임피던스(acoustic wall impedance)에 대한 정보를 알아야 한다. 그러나, 높은 저항(resistance), 두께, 곡률, 비균질성 등의 특수한 음향학적/구조적 특성 때문에 직조관의 임 피던스를 정확하게 측정하는 것은 쉽지 않다. 본 연구에서는 소음기의 전달손실(transmission loss)을 측정하는데 널리 사용되는 간단한 측정장치를 이용하여 직조관의 임피던스를 측정하였다. 측정된 임피던스에 대해 직조상태를 나타내는 인자와 주파수를 독립 변수로 사용하여 curve-fitting을 수행하여, 직조상태가 다른 직조관의 임피던스를 예측하였다. 이렇게 예측된 임피던스로부터 실제 사용되는 범위 내에서 임의의 길이를 가지는, 직조상태가 다른 직조관의 전달 손실을 예측하였고, 측정된 전달손실과 비교하여, 잘 일치하는 것을 확인하였다. 본 연구에서 제시한 방법은 직조관의 음향 특성을 파악하고, 직조관이 사용된 자동차 흡기계의 음향성능을 예측하는데 유용하게 사용될 수 있다.
-
천공 요소는 유체 기계의 흡기계나 배기계의 소음기에 널리 사용되고 있으며, 스치는 유동 (grazing flow)과 통과하는 유동 (cross flow)을 접하게 된다. 천공 요소의 임피던스는 소음기의 음향학적인 특성에 영향을 미치게 된다 본 연구에서는 유동이 임피던스에 미치는 영향을 고려하기 위하여, 실험을 통하여 얻은 임피던스 값을 유동 레지스턴스 (flow resistance)와 종단 보정 비 (end correction ratio)로 나타내고, 스트롤 수 (Strouhal number)로 무차원 화하여 분석하였다 이를 난류를 고려하여 제안된 선행 임피던스 모델들과 비교하여 난류가 미치는 영향을 분석하였다.
-
In the muffler industry, the main purpose of the research works is to determine a way to increase the TL (Transmission Loss) properties of the muffler, without deteriorating the back pressure influence. In order to obtain better results, several works have been done by changing the geometrical characteristics of the muffler or the type of the muffler. This work will focus on the perforated muffler components with concentric chamber, to investigate the effect of a non-uniform porosity along the inner perforated tube of the muffler on the TL. It is noted that varying the perforation ratio affects the peaks frequencies of the TL, especially fer
$2\pi < kL < 4\pi$ (in the case of L : 200mm for the concentric resonator). The magnitudes of the TL, for this range of frequencies, vary noticeably by changing the porosity distribution. -
최근 선진 자동차 회사에서는 변속기 개발 단계에서 기어 소음 문제를 해결하고 차량의 소음 품질을 향상시키기 위하여 많은 연구가 수행되고 있다. 그러나, 설계 단계에서 기어 소음을 고려한 기어 제원 결정이 불가능하여, 설계 완료 후 개발 단계에서 기어 소음 문제를 해결하는 것이 매우 어려운 일이었고, 설사 가능하여도 시간적, 성능적인 한계가 있었다. 기어 소음은 크게 Source 와 전달경로의 문제로 나누어지고, 본 연구는 주로 전자에 중점을 둘 것이며, 기어 화인 소음의 주 요인으로 알려져 있는 기어의 전달 오차를 최소화하는 것이다. 그 방법으로 기어 설계의 선진 핵심 기술인 기어 해석을 통한 기어 화인 소음을 최소화하는 최적 기어 설계 제원 결정이다.
-
To investigate the generation mechanism of the shock-associated noise, an underexpanded supersonic jet from an axisymmetic nozzle is simulated under the conditions of the Nozzle exit Mach number of 2 and the exit pressure ratio of Pe/Pe =1.5. The present simulation is performed based on the high-order accuracy and high-resolution ENO (Essentially Non-Oscillatory) scheme to capture the time-dependent flow structure representing the sound source. It was found that the shock-associated noise is generated by the weak interaction between the downstream propagating large turbulence structures of the jet flow and the quasi-periodic shock cell structure during the one is passing through the other. The directivity of propagating waves to the upstream is clearly shown in the visualization of pressure field. It is shown that the present calculation of the centerline pressure distribution is in fare agreement with the experimental data at the location of first shock cell.
-
차량 주행시 발생되는 소위 mimic 소음은 접이식 outside mirror의 접합부에서 발생하는 이음(異音)으로서 예민한 승객에게 지적된다. Mimic 소음은 2kHz이 상의 고주파 영역에서 특정 대역에 간헐적으로 발생하는 소음이며, 시간에 대해 앙상블 에버리지를 하는 일반적인 분석 방법으로는 나타나지 않는다. 그러나 주의 깊은 청취에 의해 그 존재를 분명히 느낄 수 있으므로 다꾸찌 시험 계획법에 의거 실험 샘플을 제작하여 녹음한 뒤, 청음 평가를 통하여 개선하는 과정을 거쳤다. 분석 결과 mimic 소음은 folding gap의 폭보다는 균일도를 유지하는 것이 중요하며, gap내의 공동(공동, cavity)을 메워 주는 것이 효과적이라는 결론을 얻었다.