• 제목/요약/키워드: Audio recording

검색결과 79건 처리시간 0.026초

$\cdot$ 영 동시조음 데이터베이스의 구축 (Speech Coarticulation Database of Korean and English)

  • 김종미
    • 한국음향학회지
    • /
    • 제18권3호
    • /
    • pp.17-26
    • /
    • 1999
  • We present the first speech coarticulation database of Korean, English and Konglish/sup 3)/ named "SORIDA"/sup 4)/, which is designed to cover the maximum number of representations of coarticulation in these languages [1]. SORIDA features a compact database which is designed to contain a maximum number of triphones in a minimum number of prompts. SORIDA contains all consonantal triphones and vowel allophones in 682 Korean prompts of word length and in 717 English prompt words, spoken five times by speakers of balanced genders, dialects and ages. Korean prompts are synthesized lexicons which maximize their coarticulation variation disregarding any stress phenomena, while English prompts are natural words that fully reflect their stress effects with respect to the coarticulation variation. The prompts are designed differently because English phonology has stress while Korean does not. An intermediate language, Konglish has also been modeled by two Korean speakers reading 717 English prompt words. Recording was done in a controlled laboratory environment with an AKG Model C-100 microphone and a Fostex D-5 digital-audio-tape (DAT) recorder. The total recording time lasted four hours. SORIDA CD-ROM is available in one disk of 22.05 kHz sampling rate with a 16 bit sample size. SORIDA digital audio-tapes are available in four 124-minute-tapes of 48 kHz sampling rate. SORIDA′s list of phonetically-rich-words is also available in English and Korean.

  • PDF

악기별 분리처리를 통한 고음질 오디오 시스템 구현 (Implementation of the High-Quality Audio System with the Separately Processed Musical Instrument Channels)

  • 김태훈;이상학;김대경;이상찬
    • 한국음향학회지
    • /
    • 제32권4호
    • /
    • pp.346-353
    • /
    • 2013
  • 본 논문에서는 노래반주기를 위한 고음질 오디오 시스템 구현에 관한 내용을 담고 있다. 노래반주기의 중요한 기능인 키/템포 변환 음질의 개선을 위하여 악기별 채널 분리를 수행하였다. 악기별로 채널을 분리하여 처리함으로 고음질의 변환이 수행됨을 상관계수의 변화와 MOS 평가를 통하여 확인할 수 있었다. 구현된 오디오 시스템은 TI사의 32비트 부동 소수점과 고정 소수점 연산이 모두 가능한 DSP인 TMS320C6747를 이용하였으며 다채널의 WMA 복호화, MP3 부호화와 복호화, wav, EQ 및 템포/키 변환을 실시간으로 수행 가능하다. WMA 10채널로 구성되어 악기별 분리 처리가 가능도록 하였다. 또한 MP3 부호화/복호화는 녹음과 재생 기능으로 이용되고 wav 채널은 효과음 등으로 사용 가능하다.

항공용 인터콤의 백업 모드 운용을 위한 디지털 방식의 이중화 설계 (The Digital Redundancy Design for Back-up Mode Operation of Aviation Intercom)

  • 정성재;조경학;김동혁;이성우
    • 한국항행학회논문지
    • /
    • 제26권5호
    • /
    • pp.358-364
    • /
    • 2022
  • 항공용 인터콤 시스템은 정/부조종사 간 내부 통화 및 조종사와 승무원 간 내부 통화, 초고주파 무전기(U/VHF)와 같은 통신 장비를 통한 외부 통화, 초단파전방향거리탐지기/계기착륙장치(VOR/ILS), 전술 항법 장치(TACAN)와 같은 항법 및 임무 장비 오디오 신호 모니터링, 비행 데이터기록장치(FDR) 및 자료전송 시스템(DTS)으로의 음성 녹음용 오디오 신호 출력, 항공기의 상태와 위협 등에 대한 오디오 경고음/경고 음성 발생 등 항공기 내의 모든 음성 신호에 대한 처리를 담당하는 장비이다. 이러한 항공용 인터콤은 아날로그 오디오 신호의 경우 노이즈에 민감하기 때문에 조종사 및 승무원의 임무 수행을 위해 항공기 내/외부의 전자파 노이즈로부터 오디오 신호를 보호할 수 있는 이중화 설계가 필요하다. 본 논문에서는 항공용 디지털 인터콤의 이중화를 위한 정상/백업 운용모드 및 디지털 방식의 이중화 설계 방안과 제작 및 검증 결과에 대하여 기술한다.

오픈 소스 소프트웨어를 활용한 인터넷 전화 녹취 시스템 (An Internet Telephony Recording System using Open Source Softwares)

  • 하은용
    • 디지털융복합연구
    • /
    • 제9권5호
    • /
    • pp.225-233
    • /
    • 2011
  • 인터넷 전화는 IP 기반 인터넷에서 VoIP(Voice over IP) 기술을 이용해서 음성 전화를 지원하는 인터넷 서비스다. 인터넷 전화는 영상통화, 메시징과 같은 인터넷 멀티미디어 서비스를 융합한 음성전화 서비스를 지원할 수 있는 장점을 갖고 있다. 특히 스마트폰을 통한 인터넷 소셜 네트워크 서비스가 보급되면서 기존의 전화망을 대체하는 서비스로써 인터넷 전화에 대한 연구와 개발이 활발히 진행되고 있다. 본 논문에서는 SIP(Session Initiation Protocol) 기반 인터넷 전화의 음성 통화 내용을 녹취하는 시스템의 설계 및 구현에 대해 설명한다. 인터넷 전화 녹취 시스템은 리눅스 기반으로 양방향 음성 스트림을 믹싱하는 기능, 라이브 패킷 스니핑 기능, 녹취 음성 파일 송신 기능은 공개 소프트웨어를 사용해서 구현하였다. 향후 개발된 시스템은 VoIP 기반 콜센터 시스템 등과 같은 복합 시스템을 구축하는데 있어 기반 기술로 활용될 계획이다.

스마트폰 기반의 무인 영상 추적 시스템 연구 (A Study on Unmanned Image Tracking System based on Smart Phone)

  • 안병태
    • 융합정보논문지
    • /
    • 제9권3호
    • /
    • pp.30-35
    • /
    • 2019
  • 최근 스마트폰 기반의 영상 이미지 추적을 통한 무인 녹화 시스템은 급속히 발전하고 있다. 기존의 제품 중 적외선 신호를 이용하여 촬영 대상을 자동으로 추적 및 회전하여 녹화하는 시스템은 일반 사용자가 사용하기에는 매우 고가이다. 따라서 본 논문에서는 스마트폰을 사용하는 사용자라면 누구나 자동 녹화가 가능한 모바일용 무인 녹화 시스템을 제안한다. 본 시스템은 상용 Mobile 카메라, 좌우로 카메라를 움직이는 서보모터(Servo Motor), 모터를 제어하는 마이크로 컨트롤러 그리고 동영상 오디오 입력을 담당할 상용 무선 블루투스 이어셋(Wireless Bluetooth Earset)으로 구성된다. 본 논문에서는 스마트 폰을 이용하여 영상 추적을 통해 무인 녹화가 가능한 시스템을 설계하였다.

세션 레코딩과 리플레이를 지원하는 안드로이드 기반 동기식 모바일 원격 교육 시스템 (Android-Based Synchronous Mobile Distance Learning System with Session Recording and Replay Support)

  • 성대현;이장호
    • 한국정보통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1369-1380
    • /
    • 2011
  • 현재까지 모바일 원격 교육 분야에는 강의 동영상이나 강의 자료를 다운로드 받는 형태의 비동기식 모바일 원격 교육 시스템이 대부분을 차지하고 있다. 그러나 강사의 동영상뿐만 아니라 슬라이드 및 애노테이션, 그리고 학생으로부터의 피드백 등을 실시간으로 지원하는 동기식 모바일 원격 교육 시스템은 드문 실정이다. 이러한 모바일 원격 교육 시스템의 경우 강사와 학생간의 실시간 상호작용을 지원함으로써 강의에 대한 이해도를 높일 수 있는 장점이 있으나, 학생들이 과거의 강의를 다시 경험할 수 없는 단점이 있다. 이러한 단점은 강의가 이루어지는 동안의 이벤트들을 저장하는 세션 레코딩, 그리고 저장된 이벤트들을 다시 재수행하는 세션 리플레이 기능을 통하여 해결될 수 있다. 그러나 세션 레코딩과 리플레이를 실시간으로 지원하는 모바일 원격 교육 시스템은 아직까지 드문 실정이다. 본 논문에서는 강의자의 비디오 및 오디오, 슬라이드 및 애노테이션, 그리고 학생으로부터의 피드백 등을 실시간으로 지원할 뿐만 아니라, 기존의 모바일 원격 교육 시스템에서는 제공되지 않는 세션 레코딩과 리플레이를 지원하는 안드로이드 스마트폰 기반의 동기식 모바일 원격 교육 시스템을 설계하고 구현하였다. 본 논문에서 제안된 시스템에 대하여 학생들에게 만족도를 조사한 결과 긍정적인 답변이 61.3%로서 부정적인 답변인 3.2%보다 상당히 높았다.

Robust Music Identification Using Long-Term Dynamic Modulation Spectrum

  • Kim, Hyoung-Gook;Eom, Ki-Wan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권2E호
    • /
    • pp.69-73
    • /
    • 2006
  • In this paper, we propose a robust music audio fingerprinting system for automatic music retrieval. The fingerprint feature is extracted from the long-term dynamic modulation spectrum (LDMS) estimation in the perceptual compressed domain. The major advantage of this feature is its significant robustness against severe background noise from the street and cars. Further the fast searching is performed by looking up hash table with 32-bit hash values. The hash value bits are quantized from the logarithmic scale modulation frequency coefficients. Experiments illustrate that the LDMS fingerprint has advantages of high scalability, robustness and small fingerprint size. Moreover, the performance is improved remarkably under the severe recording-noise conditions compared with other power spectrum-based robust fingerprints.

VoiceXML기술을 이용한 홈네트워크 정보기기 원격 제어 시스템의 설계 및 구현 (Design and Implementation of Home Network Information Appliance Remote Control System Using Voice XML Technology)

  • 이진구;정문상
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(1)
    • /
    • pp.133-136
    • /
    • 2002
  • VoiceXML is designed for creating audio dialogs that feature synthesized speech, degitized audio, recognition of spoken and DTMF key input, recording of spoken input, telephony, and mixed-initiative conversations. Uses the VoiceXML and there is a Place objective which does information home appliance machinery and tools control. When it uses tile VoiceXML, il will be able to provide a bias characteristic to the user The XML base the gearing with different civil official system is possible. With studying YoiceXML and OSGi, this paper has designed and implemented the control architecture of Information home appliances.

  • PDF

A Personal Videocasting System with Intelligent TV Browsing for a Practical Video Application Environment

  • Kim, Sang-Kyun;Jeong, Jin-Guk;Kim, Hyoung-Gook;Chung, Min-Gyo
    • ETRI Journal
    • /
    • 제31권1호
    • /
    • pp.10-20
    • /
    • 2009
  • In this paper, a video broadcasting system between a home-server-type device and a mobile device is proposed. The home-server-type device can automatically extract semantic information from video contents, such as news, a soccer match, and a baseball game. The indexing results are utilized to convert the original video contents to a digested or arranged format. From the mobile device, a user can make recording requests to the home-server-type devices and can then watch and navigate recorded video contents in a digested form. The novelty of this study is the actual implementation of the proposed system by combining the actual IT environment that is available with indexing algorithms. The implementation of the system is demonstrated along with experimental results of the automatic video indexing algorithms. The overall performance of the developed system is compared with existing state-of-the-art personal video recording products.

  • PDF

모바일 학습을 위한 스마트폰의 사운드 레코딩과 플레이어 구현에 관한 연구 (A Study on Implementation of Sound Recording and Player of Smartphone for Mobile Learning)

  • 서정희;박흥복
    • 한국전자통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.847-854
    • /
    • 2013
  • 본 논문은 모바일 학습의 사운드 레코딩과 플레이어를 위한 스마트폰 애플리케이션을 구현한다. 스마트폰은 유비쿼터스로 언제 어디서나 사용 가능하고, 오디오를 지원하고 마이크로폰을 내장하고 있기 때문에 본 논문에서 제안하는 사운드 레코딩과 플레이어 애플리케이션의 개발은 추가적인 인프라가 필요없이 가격이 싸고 쉬운 방법으로 프로그래밍을 개발할 수 있다. 그리고 안드로이드 플랫폼에 내장된 DBMS인 SQLite를 이용하여 내장된 데이터베이스 기술에 기반한 노래의 가사 데이터 처리에 대한 기법을 설명한다. 따라서 스마트폰의 사운드 레코딩과 플레이어 앱을 개발하여 모바일 폰에 음원 파일만 있다면 언제 어디서나 음원에 맞춰 자신의 음성을 녹음할 수 있다. 따라서 본 논문은 학습자가 추가적인 인프라를 구성하지 않고 모바일 학습의 활성화를 기대할 수 있다.