• 제목/요약/키워드: MPEG오디오

검색결과 276건 처리시간 0.02초

광대역 ISDN용 MPEG 오디오-비쥬열 대화형 통신단말의 설계 및 구현 (A MPEG Audio-Visual Conversational Communication Terminal on the B-ISDN Environment)

  • 황대환;조규섭
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1960-1971
    • /
    • 1998
  • 광대역 ISDN에서 사용될 수 있는 멀티미디어 통신서비스로서 Video on Demand(V0D)와 같은 검색형 분배서비스와 영상전화, 다지점 영상회의와 같은 실시간 대화형 서비스를 대상으로 활발한 연구, 개발이 이루어지고 있다. V0D 서비스에 대한 연구는 Digital Audio-Visual Council(DAVIC)에서 V0D 서버, 전달 망, 그리고 Set-Top Box(STB) 등을 포함한 전체 시스템에 대한 규격을 확정하였고 대화형 멀티미디어 통신단말은 ITU-T SG16에서 H.300 계열 단말의 표준을 대부분 완료한 상태이다. 그러나 이들 기구에서 권고하고 있는 멀티미디어 통신단말의 구조는 주 연구대상의 차이로 인해, 검색형 분배서비스와 대화형 통신서비스를 모두 제공할 수 있는 효율적인 구성 형태를 갖고 있지 못하다. 본 논문은 ITU-T, DAVIC, ATM Forum 등의 권고 및 규격을 면밀히 분석한 후, 동일한 멀티미디어 통신단말에서 V0D 및 대화형 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안하고 설계, 구현하였다. 광대역 ISDN을 대상으로 한 통신단말은 범용 PC에 탑재되는 두 개의 add-on 카드로 구현하였으며, ATM 접속을 통한 V0D 및 일-대-일 대화형 멀티미디어 통신 세션 설정와 실험을 통해 기능의 검증을 완료하였다.

  • PDF

A New Tempo Feature Extraction Based on Modulation Spectrum Analysis for Music Information Retrieval Tasks

  • 김형국
    • 한국ITS학회 논문지
    • /
    • 제6권2호
    • /
    • pp.95-106
    • /
    • 2007
  • 본 논문은 음악 정보검색에 사용되는 효과적인 템포 특징 추출방식을 제안한다. 제안된 템포 정보는 협소 밴드상의 일시적인 변조 성분에 의해 형성된다. 이러한 변조 성분은 시간 축 상의 음악 신호로부터 스펙트럼을 구한 후, 각 스펙트럼 성분에 대한 주파수 영역 분석을 통해 획득된 변조 스펙트럼으로 구성된다. 실제 구현에 있어서는 MP3 음악파일로부터 부분 디코딩에 의해 출력된 변형된 이산 코사인 변환 계수에 퓨리에 변환을 취하여 변조스펙트럼을 구하였다. 획득된 변조 스펙트럼의 진폭으로부터 고속으로 추출된 음악 템포 특징값은 다양한 음악 정보 검색에 적용되었다. 음악 무드 및 장르 분류에서는 로그 변조 주파수 계수를 적용하여 분류 성능을 개선시켰으며, 적응 변조 스펙트럼에서 유도된 비트 벡터는 오디오 핑거프린팅에 적용되어 잡음환경 하에서도 검색 성능을 크게 향상시켰다.

  • PDF

DOM update를 이용한 효율적인 멀티미디어 장면 구성 정보 변경 방안 (Effective Method to Change Multimedia Scene Configuration Information Using DOM Update)

  • 김규헌;박정욱;김병철
    • 방송공학회논문지
    • /
    • 제18권1호
    • /
    • pp.43-58
    • /
    • 2013
  • 리치미디어 서비스는 비디오, 오디오, 텍스트와 같은 다수의 멀티미디어 요소들을 동시에 소비할 수 있으며 시청자의 요구사항을 수용하여 개인화된 데이터에 대한 이용이 가능한 대화형 미디어 서비스를 뜻한다. MPEG(Moving Picture Expert Group)에서는 BIFS(Binary Format for Scenes)와 LASeR(Light Application Scene Representation)를 제정함으로써 리치미디어 서비스를 위한 방안을 제시하였다. 상기 두 표준은 다수의 미디어 콘텐츠간의 시간적, 공간적 배치에 대한 정보와 콘텐츠 간 상호작용을 기술한 장면 구성 정보를 이용함으로써 리치미디어 서비스를 가능하게 하였다. 그러나 기존의 리치미디어 서비스에서는 사용자 및 서비스에 의해서 장면 구성 정보가 변경될 때마다 매번 단말이 가진 기존의 장면 구성 정보를 삭제하고 새로운 장면 구성 정보를 생성 및 분석해야하는 비효율적인 방법으로 장면 전환이 이루어진다. 따라서 본 논문에서는 DOM(Document Object Model) update라는 웹문서 데이터 인터페이스 규격을 사용하여 보다 효율적이고 동적인 장면 구성 변경 방안을 제시하여 장면 전환의 시간적 단축 효과와 장면전환에 따른 화면의 정지 등의 불연속성을 제거하는 효과를 검증하였다.

멀티캐스팅 방식의 온라인 비디오 서비스를 위한 새로운 대역폭 완화기법 (A New Bandwidth Smoothing Technique for On-Line Video Services based on Multicasting)

  • 진성기;김진석;강석렬;윤현수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권8호
    • /
    • pp.939-948
    • /
    • 1999
  • 주문형 비디오나 원격 회의 그리고 원격 강의와 같은 멀티미디어 애플리케이션들은 비디오나 오디오와 같은 멀티미디어 트래픽을 유발한다. 이러한 멀티미디어 트래픽의 가장 큰 특성은 폭주성이다. 폭주성은 통신망의 효율을 떨어뜨리는 매우 중요한 요인이며, 따라서 폭주성에 대처할 수 있는 효율적인 대역폭 할당 정책이 통신망 관리에서 매우 중요하다. 본 논문에서는 멀티캐스팅 방식의 온라인 비디오 애플리케이션에 대해서 대역폭 완화 작업이라고 불리우는 효율적이고 유용한 대역폭 할당 방안을 설계하였다. 본 논문에서 제시하는 새로운 대역폭 완화 기법은 비디오 서버에서 이미 전송된 데이타의 특성을 이용하여 대역폭 완화창의 크기를 조절하는 동적인 기법이다. 몇 가지 MPEG 트레이스들로 실험했을 때 기존의 온라인 대역폭 완화 기법과 비슷한 성능을 보이고, 특히 멀티캐스팅 방식의 온라인 비디오 서비스에 대해서는 서버의 자원 효율성을 향상시킴을 알 수 있었다. Abstract All of the multimedia applications such as VOD, teleconferencing, and tele-lecturing invoke multimedia traffic like video or audio traffic. The most important characteristic of these multimedia traffic is the burstiness property. So, bandwidth management is becoming the major part of network management. In this paper, we propose a new and efficient bandwidth management technique called bandwidth smoothing for the multicasting on-line video applications. Our bandwidth smoothing technique reduces as much of the network bandwidth required to transmit on-line video traffic as previously proposed methods, and improves the server's resource utilization especially for the multicast on-line video services.

모듈화된 구조에 기반한 H.263 비디오 코덱 VLSI의 설계 (VLSI Design of H.263 Video Codec Based on Modular Architecture)

  • 김명진;이상희;김근배
    • 대한전자공학회논문지SP
    • /
    • 제39권5호
    • /
    • pp.477-485
    • /
    • 2002
  • 본 논문에서는 H.263 비디오 코덱 구현을 위한 효율적인 하드웨어 구조를 제안하고, 이에 기반한 VLSI 구현을 기술한다. 제안 구조는 부호화 및 복호화에 사용되는 내부 하드웨어 블록들간의 연결 및 이 블록들과 내부 RISC 프로세서간의 연결에 단일화된 인터페이스 방법을 사용한다. 이러한 단일화된 인터페이스의 사용은 블록들의 모듈화된 설계를 가능하게 하며, 하드웨어/소프트웨어의 적절한 분할 및 효과적인 파이프라인 동작을 가능하게 한다. 개발된 VLSI는 H.263 버전 2의 프로파일 3 @ 레벨 10을 지원하고, 제어용 프로토콜인 H.245와 다중화 프로토콜인 H.223을 지원한다. 따라서 외부에 오디오 코덱 칩을 추가함으로써 완전한 ITU-T H.324 또는 3GPP 3G-324M 멀티미디어 터미널 기능 구현에 사용될 수 있으며, 하드웨어 블록들을 최대한 활용하면서 소프트웨어적으로 H.263++와 MPEG4 코덱을 구현 할 수 있는 구조이다. 구현된 H.263 코덱은 40MHz의 동작 주파수에서 초당 15 프레임 이상의 성능으로 QCIF 크기의 영상의 부호화 및 복호화를 동시에 수행할 수 있다.

폭발장면 자동 검출을 위한 저급 수준 비디오 특징의 추상화 (Abstraction Mechanism of Low-Level Video Features for Automatic Retrieval of Explosion Scenes)

  • 이상혁;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.389-401
    • /
    • 2001
  • 본 논문에서는 MPEG형식의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다. 제안한 추상화 방법은 폭발시 발생하는 불꽃의 색이 노란색 톤을 가진다는 사실과, 불꽃이 나타나는 프레임은 같은 tit에 속하는 이웃한 프레임과는 화면 구성이 달라지게 되므로 움직임 에너지 값이 커지게 된다는 사실을 바탕으로 한다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프래임을 키 프레임으로 하다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프레임을 키 프레임으로 선택한 후 영역별 주 색깔(Dominant Color)를 추출한다. 이때 색 공간은 양자화를 통한 512색 중 노란색 톤을 가지는 48 색 범위로 정의한다. 이후 매 샷마다 첫 번째 프레임과 이웃한 프레임의 에지 이미지(Edge Image)를 추출하여 이들의 차이로써 움직임 에너지(Motion Energy)를 얻는다. 이 두 가지 정보, 즉 노란색 톤을 가지는 색 정보와, 같은 장면 내의 다른 샷의 움직임 에너지에 비해 큰 값의 움직임 에너지를 갖는 샷을 폭발장면이 포함된 장면으로 검출한다. 실험 결과에 의하면 검색 결과는 주어진 임계값에 의존적이나, Recall과 Precision에서 80% 이상의 검출률을 보이고 있다. 그러나 일반적인 폭발 장면은 찾기에는 노란색 불꽃을 보이지 않는 예외적인 경우가 발생하여 이를 추출하는데 어려움이 있었다. 앞으로 이러한 문제점등은 기존의 오디오 정보를 이용한 폭발 장면 검출 방법과 함께 이용함으로써 해결되어질 수 있을 것이다.

  • PDF