• 제목/요약/키워드: Digital Audio

검색결과 623건 처리시간 0.024초

광대역ISDN상의 다지점 멀티미디어 통신서비스 I부:DAVIC 표준 STB에서의 대화형 멀티미디어통신 (Multipoint multimedia communcation service in broadband ISDN part I: a conversational communcation on DAVID STB environment)

  • 황대환;이종형;박영덕;조규섭
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.821-835
    • /
    • 1998
  • 유용한 멀티미디어 통신서비스를 제공하기 위한 목적으로 설립된 Digital Audio-Visual Council(DA VIC)은 Movie on Demand(MoD), Teleshopping과 같은 주문형 분배서비스와 인터넷 서비스를 포용한 시스템의 규격을 완료한 이후 현재 Plain Old Telephone Service(POTS) 및 영상전화, 영상회의와 갇은 대화형 통선서비스를 제공하기 위한 작업을 진행하고 있다. 본 논문은 분배형 위주의 서비스만이 가능한 DA VIC 표준 Set-Top Box(STB)에서 대화형 멀티미디어 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안한다. 제안한 통신단말은 기 구현된 표준 STB에 서비스에 따르는 기능모듈을 부가하는 형태로 설계, 구현하였다. 구현한 통신단말을 다지점 영상회의와 같은 통신서비스에 적용하기 위해서 본 논문은 다지점 통신의 서비스 품질을 결정하는 Quality of Servic$\xi$(QoS) 요구 사항을 분석하였다. 또한 대화형 통선서비스의 매우 중요한 QoS요소인 단-대-단 지연조건을 만족하고 화질의 열화를 수반하지 않는 새로운 MPEG 비디오 브리지를 이용한 단말의 다지점 멀티미디어통신의 연동방안 및 전체 시스템 구조에 대하여 설명하였다.

  • PDF

오픈 소스 소프트웨어를 활용한 인터넷 전화 녹취 시스템 (An Internet Telephony Recording System using Open Source Softwares)

  • 하은용
    • 디지털융복합연구
    • /
    • 제9권5호
    • /
    • pp.225-233
    • /
    • 2011
  • 인터넷 전화는 IP 기반 인터넷에서 VoIP(Voice over IP) 기술을 이용해서 음성 전화를 지원하는 인터넷 서비스다. 인터넷 전화는 영상통화, 메시징과 같은 인터넷 멀티미디어 서비스를 융합한 음성전화 서비스를 지원할 수 있는 장점을 갖고 있다. 특히 스마트폰을 통한 인터넷 소셜 네트워크 서비스가 보급되면서 기존의 전화망을 대체하는 서비스로써 인터넷 전화에 대한 연구와 개발이 활발히 진행되고 있다. 본 논문에서는 SIP(Session Initiation Protocol) 기반 인터넷 전화의 음성 통화 내용을 녹취하는 시스템의 설계 및 구현에 대해 설명한다. 인터넷 전화 녹취 시스템은 리눅스 기반으로 양방향 음성 스트림을 믹싱하는 기능, 라이브 패킷 스니핑 기능, 녹취 음성 파일 송신 기능은 공개 소프트웨어를 사용해서 구현하였다. 향후 개발된 시스템은 VoIP 기반 콜센터 시스템 등과 같은 복합 시스템을 구축하는데 있어 기반 기술로 활용될 계획이다.

발화구간 검출을 위해 학습된 CNN 기반 입 모양 인식 방법 (Lip Reading Method Using CNN for Utterance Period Detection)

  • 김용기;임종관;김미혜
    • 디지털융복합연구
    • /
    • 제14권8호
    • /
    • pp.233-243
    • /
    • 2016
  • 소음환경에서의 음성인식 문제점으로 인해 1990년대 중반부터 음성정보와 영양정보를 결합한 AVSR(Audio Visual Speech Recognition) 시스템이 제안되었고, Lip Reading은 AVSR 시스템에서 시각적 특징으로 사용되었다. 본 연구는 효율적인 AVSR 시스템을 구축하기 위해 입 모양만을 이용한 발화 단어 인식률을 극대화하는데 목적이 있다. 본 연구에서는 입 모양 인식을 위해 실험단어를 발화한 입력 영상으로부터 영상의 전처리 과정을 수행하고 입술 영역을 검출한다. 이후 DNN(Deep Neural Network)의 일종인 CNN(Convolution Neural Network)을 이용하여 발화구간을 검출하고, 동일한 네트워크를 사용하여 입 모양 특징 벡터를 추출하여 HMM(Hidden Markov Mode)으로 인식 실험을 진행하였다. 그 결과 발화구간 검출 결과는 91%의 인식률을 보임으로써 Threshold를 이용한 방법에 비해 높은 성능을 나타냈다. 또한 입모양 인식 실험에서 화자종속 실험은 88.5%, 화자 독립 실험은 80.2%로 이전 연구들에 비해 높은 결과를 보였다.

디지털 오디오 주관적 음향레벨 계측기 구현을 위한 ITU-R BS. 1387-1의 알고리즘 특성 분석 (Performance analysis of subjective Loudness meter with ITU-R BS. 1387-1 algorithm for digital audio)

  • 뉴엔 보 바오 느안;박성균;노승환;한찬규
    • 전기전자학회논문지
    • /
    • 제16권4호
    • /
    • pp.395-404
    • /
    • 2012
  • 본 논문에서는 객관적 오디오 품질 분석에 대한 권고안인 ITU-R BS.1387-1의 귀의 모델을 토대로 라우드니스를 객관적으로 측정할 수 있는 알고리즘을 구현하며, 그 성능을 23개의 순음과 9개의 샘플 디지털 사운드에 적용하여 평가하였다. 순음의 경우 ISO226:2003에서 제공하는 실험 데이터와 비교한 결과 5%이하의 오차를 보이며, 디지털 사운드 실험 결과도 Moore 모델의 측정결과와 비교할 때 4.7%이하의 편차와 0.96이상의 코릴레이션을 나타내어 좋은 성능을 보였다. 한편 구현 알고리즘에 적용한 청각필터 수에 따른 성능 변화를 분석하기 위해 21개의 별도의 샘플 디지털 사운드에 적용하였다. 그 결과를 분석하여 보면, 37개의 청각필터를 갖는 구현 알고리즘에 바이어스 보상값을 적용함으로써 109개 필터를 사용하는 경우에 대해 2%미만의 오차를 갖는 양호한 성능을 갖도록 할 수 있었다.

OFDM에서 혼합방법을 이용한 PAR 경감법의 성능 해석 (Performance Analysis of PAR Reduction Method using Combined Method in OFDM)

  • 변건식;장은영;김성곤;전제훈
    • 한국정보통신학회논문지
    • /
    • 제7권1호
    • /
    • pp.42-49
    • /
    • 2003
  • OFDM should be used for the fourth generation communication for high speed communication. Because of high spectral efficiency and high tolerance to fading channel, OFDM is applied to many high speed wire and wireless communication such as DAB (Digital Audio Broadcast), DVB(Digital Video Broadcast), IMT 2000 etc. Inter-modulation, however, is derived from PAR(Peak to Average Power Ratio) of OFDM signals. The paper describes PTS(Partial Transmit Sequence) and SLM(Select Mapping) of an existing methods which can reduce PAR. And then this papers proposed the new method that is called "Combine method". The method proposed in this paper is to combine PTS and SLM. As a result of the simulation, Combine PAR method is better than the existing methods.

Music summarization using visual information of music and clustering method

  • Kim, Sang-Ho;Ji, Mi-Kyong;Kim, Hoi-Rin
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.400-405
    • /
    • 2006
  • In this paper, we present effective methods for music summarization which summarize music automatically. It could be used for sample music of on-line digital music provider or some music retrieval technology. When summarizing music, we use different two methods according to music length. First method is for finding sabi or chorus part of music which can be regarded as the most important part of music and the second method is for extracting several parts which are in different structure or have different mood in the music. Our proposed music summarization system is better than conventional system when structure of target music is explicit. The proposed method could generate just one important segment of music or several segments which have different mood in the music. Thus, this scheme will be effective for summarizing music in several applications such as online music streaming service and sample music for Tcommerce.

  • PDF

An Implementation of Digital Crossover Network by using Perfect Linear Phase IIR Filters

  • Kanna, C.;Sookcharoenphol, D.;Janjitrapongvej, K.
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.965-969
    • /
    • 2003
  • In this paper, the implementation technique of digital crossover network using perfect linear phase IIR filters is presented. This system has various advantages which cannot be obtained from analog crossover network such as linear phase response, flat group delay and sharp cut-off at low-order over audio frequency band. The simulation results show that the group delay response is maximally flat and twice more attenuation in stop-band than the prototype elliptic IIR filter at all desired frequency.

  • PDF

데이터 분할방식 적용에 따른 DMB 비디오 스트림의 오류내성부호화 (Error resilience video coding of DMB video stream using Data partitioning method.)

  • 백선혜;나남웅;홍성훈;이봉호;함영권
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.275-278
    • /
    • 2003
  • Terrestrial DMB(Digital Multimedia Broadcasting) system is the standard that offers multimedia broadcasting services at mobile environment and is based on Eureka-147 DAB(Digital Audio Broadcasting) for transmission method. Also DMB provides the error protection method of convolution coding. In this paper, we study on the effective error resilience coding of MPEG-4 video stream over DMB system. To accomplish error resilience, we first partition one data into several data using the data partitioning, and we control the coding rate of the convolution coding according to the importance of the partitioned data. In this algorithm, we suggest and analyze the efficient rate control algorithm considering convolution code rate.

  • PDF

데이터 분할방식 적용에 따른 DMB 비디오 스트림의 오류내성부호화 (Error resilience video coding of DMB video stream using Data partitioning method.)

  • 백선혜;나남웅;홍성훈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.279-282
    • /
    • 2003
  • Terrestrial DMB(Digital Multimedia Broadcasting) system is the standard that offers multimedia broadcasting services at mobile environment and is based on Eureka-147 DAB(Digital Audio Broadcasting) for transmission method. Also DMB provides the error protection method of convolution coding. In this paper, we study on the effective error resilience coding of MPEG-4 video stream over DMB system. To accomplish error resilience, we first partition one data into several data using the data partitioning, and we control the coding rate of the convolution coding according to the importance of the partitioned data. In this algorithm, we suggest and analyze the efficient rate control algorithm considering convolution code rate.

  • PDF

CMOS Stereo 16-bit Δ$\Sigma$ DAC Analog단의 설계기법 (Design Methodology of Analog Circuits for a CMOS Stereo 16-bit Δ$\Sigma$ DAC)

  • 김상호;채정석;박영진;손영철;조상준;김상민;김동명;김대정
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(2)
    • /
    • pp.93-96
    • /
    • 2001
  • A design methodology of analog circuits for a CMOS stereo 16-bit Δ$\Sigma$ DAC which are suitable for the digital audio applications is described. The limitations of Δ$\Sigma$ DAC exist in the performance of the 1-bit DAC and that of the smoothing filter. The proposed architecture for analog circuits contains the buffer between the digital modulator and the following analog stage and adopts the SCF (switched capacitor filter) and DSC (differential-to-single converter) scheme. In this paper, a guide line for the selection of the filter type for the SCF design in the Δ$\Sigma$ DAC is suggested through the analytical approaches.

  • PDF