Audio Transformation Filter for Multimedia I/O Server

멀티미디어 입출력 서버를 위한 오디오 변환 필터

  • Cho, Byoung-Ho (Dept.of Computer Engineering, Kyungpook National University) ;
  • Jang, Yu-Tak (Dept.of Computer Engineering, Kyungpook National University) ;
  • Kim, Woo-Jin (Dept.of Computer Information Technology, Youngjin College) ;
  • Kim, Ki-Jong (Dept.of Computer Information Technology, Youngjin College) ;
  • Yoo, Ki-Young (Dept.of Computer Engineering, Kyungpook National University)
  • 조병호 (경북대학교 컴퓨터공학과) ;
  • 장유탁 (경북대학교 컴퓨터공학과) ;
  • 김우진 (영진전문대학 컴퓨터정보기술계열) ;
  • 김기종 (영진전문대학 컴퓨터정보기술계열) ;
  • 유기영 (경북대학교 컴퓨터공학과)
  • Published : 2000.12.01

Abstract

In this paper, we present a design method of a digital filter converting humming voice melody into MIDI data and a method of adapting it to a distributed multimedia I/O server. MuX uses device-independent DLMs(Dynamic Linking Module) for the inteliace with various I/O devices, and has wave-form audio DLM and MIDI DLM for audio interfaces. In order to expand the audio device interfacing ability of MuX system, we have designed and implemented a filter transforming human voice into MIDI messages. As the methods to input MIDI data are expanded to human voice in addition to MIDI files and MIDI instrument, someone who is not good at playing instruments can also generate the MIDI data, which enables our media interfaces to be used in various applications.

본 논문에서는 음성 입력으로 받아들인 멜로디를 MIDI 데이타로 변환하는 필터의 설계 방법과 분산 멀티미디어 환경에서 동작하는 입출력 서버 시스템인 MuX 환경에 적용하는 방법에 관해 기술한다. MuX는 다양한 입출력 디바이스와의 인터페이스를 위해 장치 독립적인 DLM(Dynamic Linking Module)을 사용하는데, 현재 MuX 시스템의 입출력 디바이스 인터페이스로 사용되는 웨이브 형식의 오디오 DLM과 MIDI(Musical Instrument Digital Interface) DLM의 기능을 보강하기 위해서 사람의 음성을 MIDI 데이타로 변환해주는 필터를 설계하고 구현하였다. MIDI 데이타의 입력 방식이 파일이나 MIDI 악기 외에도 사람의 음성 데이타로도 가능하므로 악기 연구에 익숙하지 않은 사람들도 MIDI 데이타를 입력할 수 있고, 미디어의 표현력이 증가되어 다양한 응용에 활용될 수 있다.

Keywords

References

  1. 임영환, 김두현, Mux Multimedia I/O Server, ETRI Presentation Material, 1994.
  2. 임영환, 김두현, Mux : 분산 멀티미디어 처리 모델, ETRI Report, Feb, 1995.
  3. Doo-Hyun Kim, Young -Hwan Lim, 'An Object-Oriented, Client-Server Architecture for a Generalized Multimedia Processing Model in a Distributed Multimedia System,' KIPS Vol.3, No.1, 1996.1, pp.9-32.
  4. 임영환, 김두현, MuX User's Manual, MuX User's Group, 1995.
  5. 임영환, 김두현, Application program interface for MuX, ETRI Report, Feb. 1995.
  6. Ghias A, Logan J. Chamberlin D. and Smith B. C., 'Query by Humming : Musical Information Retrieval in an Audio Database,' Proc. ACM Multimedia '95, 1995.
  7. Shuzo Saito, Kazuo Nakata, Fundamentals of speech signal processing, Academinc Press, 1985.
  8. 조병호, 강태진, 유기영, '멀티미디어 입출력 서버를 위한 분산 MIDI 인터페이스의 설계 및 구현', 한국정보처리학회 논문지, 5권 7호, 1998.
  9. 배명진, '음성신호의 기본주파수 검출', SCAS Vol. 10, No.1, pp. 63-69, 1993.
  10. M. Bae, S. Ann, 'The High Speed Pitch Extraction of Speech Signals using the Area Comparison Method,' KIEE, Vol.22. No.2, pp.10l-105. Feb. 1985.
  11. M. Lahat, R. J. Niederjohn, and D.A Krubsack, 'A Spectral Autocorrelation Method for Measurement of the Fundamental Frequency for Noise-corrupted Speech,' IEEE Trans., Acoust., Speech, Signal Processing. Vol. ASSP-35, No.6, June, 1987.
  12. M. Bae and S. Ann, 'On the Time-Frequency Hybrid Technique for Detectiong the Pitch of Noise Corrupted Speech Signals,' J. Acoust. Soc. Korea, Vol.9, No.1, 1990.
  13. Myron J. Ross, Harry L. Shaffer, 'Average Magnitude Difference Function Pitch Extractor,' IEEE Trans. Acoust., Speech, and Signal Process., Vol. ASSP-22, pp. 353-362, Oct. 1974 https://doi.org/10.1109/TASSP.1974.1162598
  14. International MIDI association, 'The Standard MIDI File(SMF) specification,' 1988.
  15. Michael Boom, Music through MIDI, Microsoft Press, 1988.
  16. 지정규, 오해석, '선율을 이용한 음악정보 검색 시스템의 설계 및 구현', 한국정보처리학회 논문지, 5권 1호, 1998.