• 제목/요약/키워드: 오디오신호

검색결과 435건 처리시간 0.021초

다채널 포맷 변환과 공간적인 입체 음향 정보의 효과적인 유지에 대한 연구 (A Study on Multichannel Format Conversion and Representation of Spatial Sound Information)

  • 전세운;박영철;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.34-44
    • /
    • 2010
  • 본 논문에서는 다채널 스피커를 사용하는 서로 다른 포맷의 채널 환경에서 입체 음향 신호의 공간 정보를 효과적인 유지할 수 있는 다채널 포맷 변환 알고리즘을 제안한다. 이를 위하여 다채널 오디오 신호에 대한 공간 정보 분석 및 음원 분리 기술과, 다채널 신호의 재합성 및 공간 정보 재현 기술을 적용하였다. 입체 음향 신호의 공간 정보를 유지하기 위하여 음원의 방향감을 생성하는 패닝 게인 정보를 추정하고, 이를 이용하여 방향성을 가지는 음원과 각 채널의 잔향을 분리하는 음원 분리 알고리즘을 제안하였다. 또한 변환하고자 하는 다채널 포맷에서 음원의 방향성을 유지하고 입체 음향 정보를 충실히 재현하기 위하여, 채널 포맷에 따른 후처리 기술을 적용한 다채널 재합성 알고리즘을 제안하였다. 기존의 다채널 포맷 변환 기술에서는 음원 분리 및 재합성 과정에서 음원의 에너지 비율 및 방향 정보를 유지하지 못하는 문제점이 발견되었으나, 제안된 방법을 사용함으로써 입체 음향의 공간적 특성을 다채널 변환 과정에서 강건하게 유지할 수 있었다.

UCC 음원분류를 위한 연주악기 분류에 대한 연구 (Musical Instrument Recognition for the Categorization of UCC Music Source)

  • 권순일;박완주
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.107-114
    • /
    • 2010
  • 사용자가 직접 연주하여 제작한 콘텐츠에서 많이 사용되는 악기는 기타, 피아노, 그리고 바이올린 이다. 이중 기타와 피아노가 만들어 내는 오디오 신호의 특성이 비슷하여 구분하기가 어렵다. 하지만 시간에 따른 신호의 에너지 변화가 피크(Peak)들을 중심으로 서로 다른 패턴을 보이는 것으로 분석되었다. 누적 히스토그램을 이용하여 피크 존재 가능성의 확률적 분포를 구한 후, 피크를 중심으로 그 주변의 주파수 대역 별에너지 변화 패턴을 통계적 방법으로 모델링하여 실험한 결과 피아노와 기타의 구분 성공률이 최고 14% 정도의 향상을 보였다.

ATM 망에서 채널간 공평성 향상을 위한 문턱값 기반 버퍼 관리 알고리즘 (Threshold Based Buffer Management Algorithm for Fairness Improvement between Input Channels in ATM Networks)

  • 고유신;강은성;고성택
    • 융합신호처리학회논문지
    • /
    • 제5권1호
    • /
    • pp.79-83
    • /
    • 2004
  • ATM 트래픽 관리의 목적은 호 설정시 요구하는 QoS를 충족시키는 것과 최소한의 망 자원을 이용하면서 망을 보호하는 것이다 또한, 서로 다른 채널간 QoS을 공정하게 보장하는 것이 필요하다. 본 논문에서는 채널들간에 공정한 QoS 제공과 링크 이용률을 높이기 위하여 입력 버퍼에 문턱값을 기반으로 출력 셀율을 동적으로 조정하는 새로운 TBBM(threshold based buffer management) 알고리즘을 제안하였다. TBBM 알고리즘은 이론적인 등가용량에 비해 오디오 트래픽인 경우 14.3%, 비디오 트래픽인 경우 41.8% 대역폭 이용율이 향상되었다. 또한, 문턱값을 사용하지 않은 경우에 비해 TBBM 알고리즘을 사용한 경우에 채널간에 공평성이 크게 향상되었음을 보여주고 있다.

  • PDF

멀티미디어 데이터의 QoS 보장을 위한 디지털 워터마킹 기법 적용 (A Method of QoS Measurement of Multimedia Data based on Digital Watermarking)

  • 류경하;김민수;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.327-330
    • /
    • 2002
  • 디지털 워터 마킹은 일반적으로 지적 재산권의 보호를 위해서 컨텐츠 소유자가 자신의 컨텐츠에 저작권 정보를 나타내는 워터마크를 삽입하여 제 3자가 허가 없이 디지털 컨텐츠의 사용을 할 경우 불법적인 사용을 막아내는 데 사용된다. 본 논문에서는 워터마킹 기법의 새로운 적용 예로써 인터넷 또는 무선 환경을 통한 멀티미디어 데이터 전송 시 수신된 데이터의 품질을 사용자 측면에서 측정 할 수 있는 방안, 즉 디지털 워터마킹 기법의 새로운 적용 예에 대하여 고찰하였다. 제안하는 방법은 네트워크 상에서 발생하는 패킷 손실, 지연 등의 통계적 해석으로 수신 된 멀티미디어 데이터의 품질을 평가하는 척도로 사용하는 기존의 방법과는 달리 사용자 측면에서 눈으로 보이는 데이터의 일그러짐 정도나, 음질의 왜곡을 정량적인 측정치로 보여 줄 수 있음으로써, 오디오 데이터의 QoS(Quality of Service)를 보장하기 위한 수단이나 수신품질에 따른 차별화 된 과금 결정 등에 활용할 수 있을 것이다. 이를 위해 본 논문에서는 멀티미디어 데이터의 품질 측정을 위한 블라인드 워터마킹 기법을 적용하고 다양한 비트 에러율 (Bit Error Rate, BER)을 갖는 BSC(Binary Symmetric Channel)에 적용시켜 봄으로써 멀티미디어 데이터에 삽입된 워터마크 신호의 검출정도와 수신된 미디어 신호의 PSNR비가 선형적인 분포를 가지게 됨을 확인 할 수 있었다.

  • PDF

수면의 질을 측정하기 위한 안대형 생체신호 측정기기 개발 (Development of an Eye Patch-Type Biosignal Measuring Device to Measure Sleep Quality)

  • 안창선;임재관;정봉수;김영주
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권5호
    • /
    • pp.171-180
    • /
    • 2023
  • 우리나라 3대 수면 질환으로는 코골이, 수면무호흡증, 불면증이 있다. 수면 부족은 만병의 근원이며 수면 부족으로 인한 질병은 심혈관계 질환, 인지장애, 비만, 당뇨, 대장염, 전립선암에 이르기까지 다양하게 나타난다. 수면 관리 중요성을 인식한 정부도 2018년 7월부터 수면다원검사를 국민건강보험 혜택을 적용해서 작은 부담으로 검사를 받아볼 수 있도록 하고 있다. 그럼에도 불구하고 불면증 환자는 시간적·공간적·경제적 부담감을 해소하고 일상생활 속에서 수면의 질을 관리할 필요가 있다. 이러한 문제를 해결하기 위해서 본 논문에서는 병원이 아닌 일상생활 속에서 수면관리에 활용할 수 있는 안대형 생체신호 측정기기를 개발하였다. 측정기기에서는 6개 생체신호(안구동작, 뒤척임, 체온, 산소포화도, 심박수, 오디오)를 측정할 수 있다. 사용되는 센서로는 안구동작, 뒤척임은 자이로스코프센서(MPU9250, InvenSense, 미국)가 사용되었다. 센서값 입력 범위는 258~460°/sec 단위로 조정되며, 입력 범위값 내에서 작동상태를 확인하였다. 체온, 산소포화도, 심박수는 센서(MAX30102, Analog Devices, 미국)를 사용하였다. 체온은 30~45℃ 작동상태를 확인했으며, 산소포화도 사용범위는 미사용상태는 0%이고 사용상태는 20~90%의 작동상태를 확인하였다. 심박수의 범위는 40~180 bpm에서 작동상태를 확인하였다. 오디오 신호는 센서(AMM2742-T-R, PUIaudio, 미국)를 통해서 생체신호를 측정하며 감도는 -42±1 dB이며 주파수 범위는 20~20 kHz에서의 작동상태를 확인하였다. 시스템 구성은 생체신호 측정기기와 데이터수집 장치로 PC 및 모바일 애플리케이션으로 구성되었다. 측정된 데이터는 모바일과 PC로 수집되며 수집된 데이터는 수면의 단계를 판단하고 수면 유도와 수면장애에 대한 사전 선별기능을 진행할 수 있는 기초자료로 사용될 수 있다. 앞으로 간편하게 가정에서 불면증 환자들에게 수면의 질을 측정할 수 있게 되어 불면증 환자들의 치료에 도움이 될 것으로 예상한다.

자동차 잡음 및 오디오 출력신호가 존재하는 자동차 실내 환경에서의 강인한 음성인식 (Robust Speech Recognition in the Car Interior Environment having Car Noise and Audio Output)

  • 박철호;배재철;배건성
    • 대한음성학회지:말소리
    • /
    • 제62호
    • /
    • pp.85-96
    • /
    • 2007
  • In this paper, we carried out recognition experiments for noisy speech having various levels of car noise and output of an audio system using the speech interface. The speech interface consists of three parts: pre-processing, acoustic echo canceller, post-processing. First, a high pass filter is employed as a pre-processing part to remove some engine noises. Then, an echo canceller implemented by using an FIR-type filter with an NLMS adaptive algorithm is used to remove the music or speech coming from the audio system in a car. As a last part, the MMSE-STSA based speech enhancement method is applied to the out of the echo canceller to remove the residual noise further. For recognition experiments, we generated test signals by adding music to the car noisy speech from Aurora 2 database. The HTK-based continuous HMM system is constructed for a recognition system. Experimental results show that the proposed speech interface is very promising for robust speech recognition in a noisy car environment.

  • PDF

임베디드 프로세서를 이용한 범용 웹 모니터링 시스템 (Universal Web Monitoring System Using Embedded Processor)

  • 이성현;우종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (1)
    • /
    • pp.937-939
    • /
    • 2005
  • 본 논문에서는 임베디드 프로세서인 ATmega128과 W3100A 이더넷 칩을 이용하여 범용 웹 모니터링 시스템을 구현하였다. 카메라를 이용한 동영상 오디오, RS-422 통신, 디지털/아날로그 신호의 입출력 등 다양한 제어 모니터링 정보를 통합하여 범용으로 사용할 수 있고, 소형, 저가, 저전력 소모가 가능하도록 설계, 구현하였다. 클라이언트 프로그램은 Java Applet으로 개발 하여 별도의 소프트웨어 설치 없이 웹브라우저를 통하여 접속되고, 원격지의 영상 및 각종 기기들의 상태를 실시간으로 모니터링하여 GUI기반의 각종 메뉴를 사용하여 원격 시스템을 편리하게 제어 할 수 있다.

  • PDF

64kbit/s(7 kHz) Codec을 경유한 연속음성의 인식 (Recognition of Continuous speech via 64kbit/s(7 kHz) Codec)

  • 정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1993년도 학술논문발표회 논문집 제12권 1호
    • /
    • pp.125-127
    • /
    • 1993
  • 오디오 혹은 비디오화의, 방송 고품질전화 등의 음성신호의 전송을 위해 마련된 CCITT Recommendation G.722에 의거 Codec을 구성하고 이를 통과한 연속음성을 CMU의 불특정 화자 연속음성인식 시스템인 SPHINX에 입력하여 인식률을 조사 한 후 CODING전의 인식결과와 비교하였다. 이때 CODEC은 크게 네 부분(Trans Quarature Mirror Filter, Encoder, Decoder, Receive QMF)으로 구성하고 입력음성 데이터는 150화자에 의한 1018문장을 훈련용으로, 140문장을 테스트용으로 하였을 때의 단어 인식률을 인식률로 하였다. 또 이때 특징벡터로는 12차 Melcepstrum 계수를 사용하였다. 인식결과 코딩전(close talk Mic를 이용하여 직접입력)의 단어 인식률이 86.7%인데 비해 코딩후의 인식률은 85.6%로 나타나 약 1%의 인식률 저하를 가져와 코딩으로 인한 Error에 비해 비교적 양호한 결과를 얻을 수 있었다. 인식률 저하의 원인으로서는 코딩시의 BER(Bit Error Rate)에 의한 것으로 생각된다.

  • PDF

G.723.1 음성 부호화기의 LSE 계수 양자화를 위한 고속화 알고리즘 연구 (A study on a fast algorithm for the LSP coefficient quantization of G. 723.1 speech codec)

  • 송창용;성호상;강상원;성유나
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.153-156
    • /
    • 2000
  • 본 논문에서는 멀티미디어 서비스들 중에서 음성 또는 오디오 신호를 저속으로 압축할 때 사용되는 G.723.1 부호화기의 line spectral frequency(LSF) 계수 양자화 방식을 고속으로 처리하는 알고리즘을 제안하였다. 제안된 고속탐색 방법은 LSF 계수의 순서성질을 이용하여 코드북의 탐색 범위를 줄임으로써 계산량을 크게 감소시킨다. 제안된 고속탐색 방법을 predictive split VQ(PSVQ) 구조를 갖는 G.723.1 에 적용한 결과 spectral distortion(SD) 성능 감쇄 및 추가적인 메모리 증가 없이 최적 코드벡터를 찾기 위한 코드북 탐색 과정에서 코드북의 평균 탐색 범위가 $20.1\%$ 감소했으며, 이는 additions, subtractions, multiplies 및 comparisons 수가 각각 $19.1\%$, $20.1\%$, $19.4\%$$12.2\% 감소하는 결과를 얻었다.

  • PDF

오디오 신호의 적응 방법 (Audio Resource Adaptation)

  • 오은미
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1419-1422
    • /
    • 2003
  • Multimedia contents what we call Digital Items include various types of resources such as music, speech, text, video, graphics, and so on. The current Adaptation QoS described in the ISO/IEC 21000-7 CD-Part 7: Digital Item Adaptation, however, lacks adaptation methods for audio signals. The goal of this paper is to provide adaptation methods that are necessary to deal with audio signals. Two operations are introduced in order to adapt audio items. One method is to make use of the functionality of Fine Grain Scalability, and the other is intended to drop the channel of audio output channel. This paper provides a DIA description tool that associates the operators with the corresponding values of the constraint and the utility. Furthermore, the operations are evaluated and compared to alternative solutions.

  • PDF