Search | Korea Science

Measurement of Time Varying Loudness by Using the Critical-banded Filters (임계 대역 필터를 이용한 과도음의 라우드니스 모델)

Jeong, Hyuk;Ih, Jeong-Guon
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06c
- /
- pp.279-282
- /
- 1998
본 연구에서는 기존의 문헌에 자세히 기술되지 않은 주파수 분할 방법에 대한 고찰을 통해 과도음의 라우드니스 해석에 적합한 임계 대역 해석 방법을 제안하고, 이를 근거로 과도음의 라우드니스 모델을 구현하여 기존의 임상 실험 결과와의 비교함으로써 그 유효성을 확인하였다. 또한 순음의 라우드니스 해석에서 기존 라우드니스 모델이 안고 있는 신호해석 상의 문제점 등을 지적하고 이를 개선한 새로운 모델을 제시하였다. 개선 방법으로서 임계 대역폭의 1/2 간격으로 총 47개의 임계 대역 필터를 배치하여 필터의 경계에 순음이 존재할 때 발생할 수 있는 라우드니스 오차를 최소화 하였다. 또한 이 모델에서는 Zwicker가 제안했던 기존의 방법을 제안된 임계 대역 필터에 적합하도록 수정하는 작업이 포함되었다.
PDF

A Study On the Automatic Generation Algorithm of Reference Pattern Using Levelbuilding Algorithm. (Levelbuilding 알고리즘을 이용한 참조패턴의 자동생성 알고리즘에 관한 연구)

김윤중
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.06c
- /
- pp.79-82
- /
- 1998
본 연구에서는 연결단어 음성인식 상에서 올바른 참조 패턴을 생성하기 위해 Levelbuilding 알고리즘을 이용하여 인식대상 단어의 표본 집합(훈련패턴 집합)으로부터 참조 패턴을 자동적으로 생성하는 알고리즘을 개발하였다. 본 연구는 분한 K-Mans 훈련방법에 기초하고 있으며, Levelbuilding 알고리즘을 이용하여 훈련패턴으로부터 참조 패턴을 생성하는 것이다. 먼저 초기화 과정에서 훈련 패턴을 그에 포함된 단어 수만큼 등간격 분리하여 분리된 단어들을 소속 Cluster로 분류하고 각 Cluster의 Center들로 초기 참조패턴을 구성한다. 그리고 참조패턴, 제어정보 및 Levelbuilding 알고리즘을 이용하여 각 훈련패턴을 분리하고, 분리된 단어들을 소속 Cluster로 분류하여 단어 Cluster집합을 구성한 후 DTW 및 minimax알고리즘을 이용해 각 Cluster의 Center를 구하여 참조 패턴을 생성한다. 참조패턴 구성에 변화가 없을 때까지 전 단계의 참조패턴과 본 알고리즘을 반복 수행하여 최적의 참조패턴을 생성한다. 본 알고리즘을 이용하여 3개 숫자의 연결단어 집합으로부터 영('0')에서 구('9')까지 숫자음에 대한 참조패턴을 자동 생성하였다. 참조패턴 생성과정에서 가정 중요한 처리인 훈련패턴 분리과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.
PDF

A Flat Loudsspeaker driven by Multi-layer diaphragm (다층 진동판으로 구동되는 평판 스피커)

Yi H.R.;Kim B.N.;Oh S.J.
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.131-136
- /
- 2004
스피커는 진동판의 크기와 형태 외에도 소재 또는 내부구조에 따라 구동 특성이 달라진다. 본 연구에서는 동일한 신호가 입력되는 두 진동판 사이에 공동을 형성시킨 경우, 다공성 흡음재를 삽입한 경우 스피커의 특성 변화를 관측하였다. 특히, 다공성 흡음재를 삽입한 경우, 다공성 물질의 체적을 동일하게 하고 진동판 표면 상태에 따른 영향과 진동판 상의 진동 전달 경로에 의한 영향을 제거하여 내부물질에 따른 특성의 변화를 측정하였다.
PDF

An implementation of Speech Synthesis system based on the next generation PC (차세대 PC 환경에서의 음성합성 시스템 구현)

Park Hye-Mee;Shin Jeong-Hoon;Hong Kwang-Seok
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.97-100
- /
- 2004
유비쿼터스 컴퓨팅 환경에서의 차세대 PC는 다양한 입출력 장치를 이용하여 사용자에게 효과적으로 실제와 같은 정보를 제공하며, 사용자들의 편의를 고려해 웨어러블 형태의 플랫폼으로 발전하고 있다. 이러한 사용자 편의를 고려한 기술개발 동향(소형화, 경량화, 착용화)에 발맞추어 웨어러블 컴퓨팅 환경에서의 HCI 방안으로 음성 인식과 합성은 주요한 자리매김을 하고 있다. 본 논문에서는, 현재 정부에서 국가적인 차원으로 연구 개발 중인 차세대 PC 플랫폼 기반에서 음성합성 엔진을 구현하며, 구현상의 문제점 파악 및 개선사항에 대해 제안한다. 또한, 실질적인 구현 결과를 토대로 사용자 편의성 및 S/W 개발 환경을 고러한 차세대 PC플랫폼의 개선사항에 대해 제안을 한다.
PDF

DOA Estimation of Cross-type Microphone Array Using the Quadrature Sampling Method (직교형 마이크로폰 배열에서의 4분 샘플링을 이용한 음원 도래 방향 탐지)

Park Soon-Jong;Lee Mi-Hyun;Chun Byuung-Doo;Kim Moo-Joon;Kim Chun-Duck
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.535-538
- /
- 2004
마이크로폰을 이용하여 평면상에 직교형으로 배열된 음인 도래 방향 탐지 시스템을 구성하고, A/D 변환에 있어 일반저인 샘플링 기법과 spilt-beam형 어군 탐지 시스템에 적용된 4분 샘플링 기법을 이용하여 공기중에서의 음원의 토래 방향 탐지 성능에 관한 실험을 수행하였다. 일반 실내에서 단일 주파수의 음원에 대하여 직교형 마이크로폰 배열을 사용한 음인 토래 방향 탐지 시스템 및 4분 샘플링 기법의 적용이 유용함을 확인하였다.
PDF

A Study on the Architecture and Learning of the Artificial Neural Networks for Prosody Generation of Korean Sentence (한국어 운율 발생용 인공신경망의 구조 및 학습에 관한 연구)

Min Kyung-Joong;Lim Un-Cheon
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.135-138
- /
- 2004
음성처리기술은 정보화 시대를 위한 주요 기술의 하나이다. 이 중에서도 음성합성의 연구는 디지털 신호처리 기술과 컴퓨터의 발달로 활발히 진행되고 있다. 그러나 음성 합성기에 의해 발생된 합성음의 음질은 이해도 면에서는 상당한 진전이 있었지만, 자연감 면에서는 만족한 수준에 도달할 수 없었는데, 이러한 합성시스템의 문제점을 해결하는 방법은 다양하게 적용되는 언어정보와 합성음의 자연감을 결정하는 정확한 운율정보가 필요하다. 그러나 구한 운율 정보가 자연음에 존재하는 모든 운율 법칙을 포함할 수 없고, 또한 추출한 운율 법칙이 틀린 것이면 자연감이나 이해도가 떨어지는 합성음이 만들어지고 이것은 음성 합성 시스템의 실용화에 장애로 작용할 것이다. 본 논문은 한국어 음성 합성 시 문제가 되는 자연감을 높이기 위한 한 방법으로 자연음에 내재하는 운율 변화를 효율적으로 학습할 수 있는 인공 신경망을 제안하였다.
PDF

A Speech Coder for Server-Based Speech Recognition in Mobile Communication (이동통신 환경 하에서의 서버 기반 음성 인식을 위한 음성 부호화 기법)

Lee Gil Ho;Yoon Jae Sam;Oh Yoo Rhee;Kim Hong Kook
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.89-92
- /
- 2004
본 논문의 목적은 이동통신 환경 하에서 음성 인식과 음성 부호화를 성능의 저하 없이 동시에 수행하기 위한 기법을 개발하는 것에 있다. 이를 구현하기 위해 통신상에서 전송되는 음성 특징 파라미터는 기존 음성 부호화기의 LPC 대신 음성 인식 파라미터인 MFCC를 사용하였다. 따라서 음성 인식 성능은 향상된다 하지만 음성 재생을 위해 MFCC를 LPC로 변환하는 과정에서 오차가 발생하여 전송되는 bit 수에 비해 만족할만한 음질을 얻을 수 없다. 따라서 이 오차를 보상하여야 하며 이를 위한 변수를 추가하여 음질을 개선시켰다. 그 결과 음질과 음성 인식에서 안정된 성능을 보이는 음성 부호화기를 개발하였다.
PDF

A Study on Recognizing faces in broadcast video (영상에서의 얼굴인식)

Han Jun-hee;Nam Kee-hwan;Joung Youn-sook;Jeong Joo-byeong;Ra Sang-dong;Bae Cheol-soo
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.339-342
- /
- 2004
최근 영상 자료의 저장과 검색을 위한 시스템이 많이 연구되고 있다. 방대한 양의 영상 자료를 디지털화하여 파일로 저장하고 영상에 관한 각종 정보를 데이터 베이스로 구성한 뒤, 키워드 등을 사용하여 필요한 영상을 네트워크를 통하여 검색하고 이것을 편집 등에 활용할 수 있도록 하는 것이 본 논문의 목적이다. 영상을 데이터베이스로 구축하기 위해 선행되어야 할 것은 연속적인 장면마다 또는 의미 있는 장면마다 영상을 분류하는 작업이다. 본 논문에서는 MPEG 비트스트림을 분석하여 장면 전환 지점을 자동으로 찾는 실험을 워크스테이션을 통하여 시행하였으며 기존 실행한 실험을 바탕으로 PC상에서 동영상 검색 시스템을 구현하였다. 동영상 검색 시스템은 뉴스, 드라마는 물론 각종 보안 영상 등 다양한 분야의 영상을 분석하여 장면 전환 지점을 찾고, 각 장면의 대표 영상을 저장한 뒤, 네트워크 환경에서 동영상을 검색할 수 있도록 만든 시스템이다.
PDF

A Tracking Method of Robust Lip Movement Image Regions for Blocking the External Acoustic Noise (외부응향잡음 차단을 위한 강인한 입술움직임 영상영역 추적방법)

Kim, Eung-Kyeu
- Proceedings of the KIEE Conference
- /
- 2009.07a
- /
- pp.1913_1914
- /
- 2009
본 논문에서 조명환경하에서 음성/영상 연동시스템을 통해서 외부음향잡음의 차단을 위한 강인한 입술움직임 영상영역을 추적하는 한 가지 방법을 제안한다. 조명환경하에서 강인한 입술움직임 영상영역을 추적하기 위해 온라인상에서 입술움직임 표준영상을 수집하였고 다양한 조명환경에 적응하는 입술 움직임 영상의 특징들을 추출하였다. 동시에 온라인 템플릿 영상을 획득하였고, 이 영상들을 템플릿 정합을 위해 사용했다. 음성/영상처리시스템의 연동결과, 다양한 조명환경하에서 그 연동률을 99.3%까지 높일 수 있었고 음향잡음에 의한 음성인식 실행을 원천적으로 차단할 수 있었다.
PDF

The HRTF compensation method according to the audiences head width and distance (청취자의 머리 크기와 거리에 따른 머리전달함수 보정 방법)

Myung, Hyun;Kim, Hyun-Bin
- Proceedings of the Korean Society for Emotion and Sensibility Conference
- /
- 2000.04a
- /
- pp.76-80
- /
- 2000
본 논문은 입체 음상 정위 시스템에 있어서 청취자의 머리 크기와 음상 정위를 원하는 위치와의 거리에 따른 머리전달함수 (HRTF; Head Related Transfer Function)의 보정 방법에 관한 것이다. 제안된 방법은 먼저 표준 반경에서 표준 머리 크기의 더미 헤드를 이용해 측정된 표준 머리전달함수 데이터베이스로부터 실제의 왼쪽 또는 오른쪽 귀를 기준으로 한 방위각과 고도각을 산출한다. 이렇게 산출된 방위각과 고도각을 기준으로 머리전달함수 데이터베이스의 인덱스를 보정한다. 음상 정위하고자 하는 3차원 공간상의 위치를 입력받게 되면, 입력받은 위치로부터 청취자의 왼쪽 또는 오른쪽 귀를 기준으로 한 방위각과 고도각을 산출한 후에 보정된 머리전달함수 데이터베이스로부터 머리전달함수를 가져와서 입력 모노 신호를 보정된 머리전달함수와 콘볼루션하여 입체음향을 생성하게 된다.제안된 방법에 의해 청취자의 머리 크기 및 거리에 따라 보정된 머리전달함수를 사용함으로써 청취자에게 보다 실감나는 3차원 음상 정위 효과를 제공할 수 있다.
PDF

Search Result 505, Processing Time 0.029 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)