• 제목/요약/키워드: Mpeg

검색결과 2,784건 처리시간 0.03초

모바일 웹을 지원하는 응용 독립적 멀티미디어 적응 프레임워크 (An Application-Independent Multimedia Adaptation framework for the Mobile Web)

  • 전성미;임영환
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.139-148
    • /
    • 2005
  • 차세대 웹인 모바일 웹에 대한 멀티미디어 서비스 욕구는 PC수준이 될 것이며, 이를 지원할 수 있는 단말기 제작 기술, 통신 기술, 서비스 및 표준화 노력들이 진행되고 있다. 모바일 웹 환경에서는 다양한 단말기 종류, 네트워크 능력 및 사용자 선호등을 지원하여 멀티미디어 컨텐츠의 적응 서비스가 가능하도록 하여야 한다. 이것은 목적지인 단말기의 하드웨어 사양과 재생서비스 품질의 다양성으로 인하여 멀티미디어 컨텐츠의 재생 서비스 품질이 고정되어 있지 않음을 의미한다. 만일 새로운 사용자가 새로운 종류의 단말기를 통하여 서버의 멀티미디어 컨텐츠를 재생하려고 한다면, 기존 트랜스코더로 멀티미디어 적응이 가능한지 고려하여야 한다. 그런데 현재 사용되는 멀티미디어 적응 라이브러리들은 하나의 라이브러리에 모든 적응 기능을 넣은 중량 트랜스코더의(heavy transcoder) 형태이다. 이러한 중량 트랜스코더로 제한없는 접속(Universal Access)의 도전을 해결하는 것은 너무 복잡하다. 따라서 본 논문에서는 다양한 새로운 모바일 단말기의 서비스 품질을 만족하는 응용 독립적 멀티미디어 적응 프레임워크를 제안한다. 이것은 중량 트랜스코더대신 하나의 트랜스고딩 기능만을 갖는 단위 트랜스코더들의 집합을 갖는다. 또한 종단간 서비스 품질을 만족하도록 단위 트랜스코더들의 동적 연결을 지원하는 트랜스코더 관리자를 포함한다.

  • PDF

저대역 이동법과 다해상도 움직임 추정을 이용한 웨이블릿 동영상 부호화 (Wavelet Video Coding Using Low-Band-Shift Method and Multiresolution Motion Estimation)

  • 박영덕;서석용;고형화
    • 대한전자공학회논문지SP
    • /
    • 제41권3호
    • /
    • pp.17-24
    • /
    • 2004
  • 본 논문에서는 저대역 이동법과 다해상도 움직임 추정을 이용한 웨이블릿 동영상 부호화를 제안하였다. 저대역 이동법은 웨이블릿 계수들의 이동-변환 성질을 극복하기 위하여 제안된 방법이다. 이 방법은 일반적인 방법보다 압축대비 화질면에서 우수한 성능을 가지지만, 단점으로 메모리와 계산량이 일반적인 방법에 비해 많아지게 된다. 따라서 기존의 저대역 이동법을 이용한 동영상 부호화에서 계산량을 줄이기 위해 다해상도 움직임 추정의 개념을 도입하였다. 다해상도 움직임 추정만을 적용하여 부호화시 움직임 벡터가 각 부대역마다 존재하게 되므로 움직임 벡터의 개수가 7배 늘어나게 되지만, 저대역 이동법의 특성을 이용하면 늘어나는 움직임 벡터의 개수를 줄일 수 있다. 제안한 방법은 기존의 방법보다 움직임 벡터의 부호화량이 줄어들거나, 더 세밀한 움직일 추정을 할 수 있게 되어 움직임 보상 예측 오차의 부호화량이 줄어들게 됨으로써 부호화 효율이 기존의 방법보다 좋아지게 된다 또한 상위 해상토의 움직인 추정의 범위를 줄임으로써 계산량을 줄이게 되어 3단계 웨이블릿 변환시 기존의 LBS방법의 12.1%의 계산량으로 움직일 추정을 한다. 모의 실험 결과, 제안한 방식은 압축을 하지 않았을 경우평균 MAD면에서 약 0.2∼9.7% 가량 개선되었고, 압축을 한 때 동일한 비트율에서 PSNR이 약 0.1∼2.0㏈ 정도 개선되었다.

단일 엔코더 및 디코더를 이용하는 다시점 비디오 시스템 (Multi-View Video System using Single Encoder and Decoder)

  • 김수학;김윤;김만배
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.116-129
    • /
    • 2006
  • 인터넷을 통한 데이터 전송 기술의 발전은 다양한 실감 콘텐츠를 확산시키는 역할을 하고 있고, 이러한 실감 콘텐츠의 하나로 다시점 비디오가 연구되고 있다. 다시점 비디오는 여러 대의 카메라로부터 획득한 영상을 사용자에게 전달해 원하는 시점에서 영상을 시청할 수 있도록 하는 차세대 영상이다. 다시점 영상을 공급하기 위해서는 일반적으로 카메라 개수와 같은 개수의 엔코더와 디코더가 필요하며, 또한 상대적으로 큰 전송 대역폭을 필요로 한다. 본 논문에서는 상기 문제점을 해결하기 위해서 단일 엔코더와 디코더만을 이용하는 다시점 비디오 시스템을 제안한다. 부호화에서는 다시점 YUV 비디오를 GOP 단위로 믹싱하여 l 개의 YUV 스트립을 만든 후에, 단일 H.264/ AVC 엔코더로 부호화하여 압축 비트열을 생성한다. 또한 복호화도 단일 디코더 및 이를 제어하는 스케줄러로 구성된다. 스케줄러는 디코더 이용률과 프레임 스킵을 활용하여 각 시점 영상들이 동등한 복호화 프레임 개수를 가지게 한다. 또한 프레임 스킵에서는 비용 함수를 이용하여 H.264/AVC 프로화일에 따른 효율적인 프레임 선택 방법을 제안한다. 다양한 메인 및 베이스라인 프로화일 다시점 영상들을 활용하여 제안 방법의 성능을 검증하였다. 실험 결과는 각 시점 영상이 동등한 디코더 이용률을 얻는 것을 보여준다. 또한 rate-distortion 커브를 이용하여 제안한 방식과 동시 방식의 성능을 검증하였다.

멀티미디어 교실을 위한 윈도우 NT 기반 스트림 서버 구현 (Implementation of a Windows NT Based Stream Server for Multimedia School Systems)

  • 손주영
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.277-288
    • /
    • 1999
  • 개인화된 학습내용과 진도로 멀티미디어를 이용한 교재를 통해 학습 효과를 크게 제고할 수 있는 중등학교 멀티미디어 교실과 대학의 멀티미디어 센터를 위한 분산 스트림 서버 시스템을 구현하였다. 기존의 멀티미디어 정보 재생 시스템은 멀티미디어 교실에 적용하기에 적절하지 못한 제약점을 가지고 있다. 과다한 스트림당 비용이 요구되거나 그렇지 않으면 학습에 활용하기에는 저급한 재생 품질, 원활하지 못하는 시스템 및 서비스 확장성, 개별적 고유 클라이언트 환경에 의한 사용 이절감, 교사 조작 능력과 표현 의도가 전혀 고려되지 않은 일반적 저작 도구로 인한 교재 저작 어려움 그리고 구성 시스템간의 유기적 연동 부재로 인한 관리 어려움 등의 문제점을 극복한 시스댐을 구현하였다. 폐쇄되어 있는 교실에서뿐만 아니라 인터넷을 통한 광범 위한 원격 교육에 확장할 수 있도록 웹 기반 분산 시스댐으로 구성하였다. 전체 시스템의 구성 요소는 멀티미 디어 정보 저장 및 재생을 담당하는 스트림 서버 클라이언트 시스템, 분산되어 있는 서버의 통합 역할을 하는 서비스 게이트웨이, 그리고 클립 및 교재 저작을 위한 저작관리 시스템 등이다. 본 논문에서는 그 가운데 멀티미디어 정보를 저장, 전송하는스트립 서버의 설계 및 구현에 대해 설명한다. 윈도우NT서버에서 실행되는 한 대의 스트림 서버 시스템으로 한 학급의 클라이언트(50-60대)에서 MPEG~ 1 스트렴을 동시에 재생할 수 있는 성능을 아무런 시스템 변경 없이 응용 수준의 소프트웨어 엔진만으로 실현하였다. 그리고 타 구성 요소 시스템간의 유기적 연동을 통한 시스템의 확장성과 서비스의 유연성을 확보할 수 있었다.

  • PDF

A Novel Query-by-Singing/Humming Method by Estimating Matching Positions Based on Multi-layered Perceptron

  • Pham, Tuyen Danh;Nam, Gi Pyo;Shin, Kwang Yong;Park, Kang Ryoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권7호
    • /
    • pp.1657-1670
    • /
    • 2013
  • The increase in the number of music files in smart phone and MP3 player makes it difficult to find the music files which people want. So, Query-by-Singing/Humming (QbSH) systems have been developed to retrieve music from a user's humming or singing without having to know detailed information about the title or singer of song. Most previous researches on QbSH have been conducted using musical instrument digital interface (MIDI) files as reference songs. However, the production of MIDI files is a time-consuming process. In addition, more and more music files are newly published with the development of music market. Consequently, the method of using the more common MPEG-1 audio layer 3 (MP3) files for reference songs is considered as an alternative. However, there is little previous research on QbSH with MP3 files because an MP3 file has a different waveform due to background music and multiple (polyphonic) melodies compared to the humming/singing query. To overcome these problems, we propose a new QbSH method using MP3 files on mobile device. This research is novel in four ways. First, this is the first research on QbSH using MP3 files as reference songs. Second, the start and end positions on the MP3 file to be matched are estimated by using multi-layered perceptron (MLP) prior to performing the matching with humming/singing query file. Third, for more accurate results, four MLPs are used, which produce the start and end positions for dynamic time warping (DTW) matching algorithm, and those for chroma-based DTW algorithm, respectively. Fourth, two matching scores by the DTW and chroma-based DTW algorithms are combined by using PRODUCT rule, through which a higher matching accuracy is obtained. Experimental results with AFA MP3 database show that the accuracy (Top 1 accuracy of 98%, with an MRR of 0.989) of the proposed method is much higher than that of other methods. We also showed the effectiveness of the proposed system on consumer mobile device.

실시간 MP3 파일 검색 엔진을 위한 지원 시스템의 설계와 구현

  • 김우진;최문기
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 춘계정기학술대회 e-Business를 위한 지능형 정보기술 / 한국지능정보시스템학회
    • /
    • pp.307-316
    • /
    • 2000
  • MP3(MPEG 1 layer 3) 파일 형식(file format)은 최근 높은 압축율과 뛰어난 음질 복원 능력으로 주목을 받고 있다. 실제로 MP3의 압축율은 CD의 약 50분의 1 정도이고 음질은 CD 음질을 동일한 수준으로 유지할 수 있다.한편, 이러한 MP3의 장점 때문에 web을 통해 MP3 파일을 찾으려는 수요는 폭발적으로 증가하고 있지만 기존의 검색 엔진들이 가지고 있는 프로세스는 급속하게 update되고 있는 MP3 컨텐츠에 효과적으로 대응하지 못하고 있는 실정이다. 특히, 기존의 검색 엔진들은 미디어 파일을 위한 검색이 아닌 문자 기반의 검색 기능을 위해 개발되어 MP3 검색에는 부적절하거나, 파일 중심이 아닌 사이트 중심의 링크 변동에 대하여 수동적인 업데이트만을 수행하여 빠른 변화에 능동적으로 대응하기 어려운 경우가 많다.현재 미디어 파일을 위한 검색 엔진들은 여럿 서비스 중이지만, 텍스트 중심의 탐색 방법을 사용하고, 정기적인 DB update 방법에 관해서도 문자 기반의 검색 엔진과 동일한 방법을 사용하고 있다. 또한, 국내에서는 web 서비스를 위한 미디어 파일 탐색 알고리즘과 지능형 탐색 방법에 등에 관한 연구 역시 거의 전무한 상태이다.본 논문은 MP3 파일 전문 검색을 위한 지능형 프로세스를 설계와 구현 결과에 관한 것으로, 기존의 미디어 검색 엔진들이 가지는 문제점을 지적하고 보다 효율적이고 능동적인 미디어 파일 탐색을 위한 방법을 제시한다. 특히, MP3 파일에 대한 미디어 파일 검증 알고리즘과 verification method을 제안하고, 이러한 메커니즘에 따라 구현된 지능형 robot과 spider 등으로 구성된, 신뢰성 있고 지능적인 MP3 검색 엔진 지원 시스템의 설계와 구현 결과 그리고 성능 등을 종합적으로 요약한다.실어증 환자들은 화시적 대명사를 조응적 대명사보다 더 잘 처리하는 동일한 결과를 보였다. 이러한 실험 결과들은 실어증 환자들이 뇌손상으로 인해 문법적 언어처리에는 어려움을 보이지만 비언어적인, 세상 지식과 관련된 화시적 대명사의 처리는 가능할 것이라는 가설을 뒷받침 해준다. 또한 이러한 실험 결과를 통해 대명사의 기능적인 측면에서 화시와 조응의 처리가 구분되어 있음을 보여준다.l mechanism is concentrate on only the reaction zone. As strain rate and CO2 quantity increase, NO production is remarkably augmented.our 10%를 대용한 것이 무첨가한 것보다 많이 단단해졌음을 알 수 있었다. 혼합중의 반죽의 조사형 전자현미경 관찰로 amarans flour로 대체한 gluten이 단단해졌음을 알수 있었다. 유화제 stearly 칼슘, 혹은 hemicellulase를 amarans 10% 대체한 밀가루에 첨가하면 확연히 비용적을 증대시킬 수 있다는 사실을 알 수 있었다. quinoa는 명아주과 Chenopodium에 속하고 페루, 볼리비아 등의 고산지에서 재배 되어지는 것을 시료로 사용하였다. quinoa 분말은 중량의 5-20%을 quinoa를 대체하고 더욱이 분말중량에 대하여 0-200ppm의 lipase를 lipid(밀가루의 2-3배)에 대하여 품질개량제로서 이용했다. 그 결과 quinoa 대량 7.5%에서 비용적, gas cell이 가장 긍정적 결과를 산출했고 반죽의 조직구조가 강화되었다. 또 quinoa 대체에 의해 전분-지질 복합제의 흡열량이 증대된 것으로부터 전분-지질복합제의 형성 촉진이 시사되었다.이것으로 인하여 호화억제에 의한 노화 방지효과가 기대되었지만

  • PDF

히스토그램 기반의 비트율-왜곡 특성을 이용한 비트율 제어 (Bit-Rate Control Using Histogram Based Rate-Distortion Characteristics)

  • 홍성훈;유상조;박수열;김성대
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1742-1754
    • /
    • 1999
  • 본 논문에서는 히스토그램 기반의 비트율-왜곡 (R-D) 추정 결과를 이용하여 이웃한 영상들간에 일관된 화질을 제공하는 비트율 제어방식을 제안한다. 히스토그램 기반의 R-D 추정 방식은 부호화에 사용되는 양자화 파라미터(QP)에 따라 한 영상에서 발생하는 비트량과 왜곡을 예측하거나, 역으로 발생하는 비트량이나 왜곡에 대한 QP 값을 예측할 수 있는 수학적 모델을 제공한다. 이 추정 방식의 가장 큰 장점은 추정을 위한 주 연산이 양자화기에 입력되는 DCT 계수에 대한 히스토그램 또는 가중 히스토그램을 구하는 것이므로 계산량이 적은 것이다. 또 실제 비디오 부호화에 적용할 수 있을 만큼 정확하다. 따라서 이 추정 모델을 이용하는 제안된 비트율 제어 방식은 저 지연과 저 복잡도를 요구하는 응용 분야에 적합하고, 정확한 제어를 수행한다. 제안된 비트율 제어방식은 비디오 버퍼 제한 조건을 만족시킴으로써 버퍼의 넘침이나 고갈이 발생하지 않도록 하고, 추가적으로 왜곡 제한에 의하여 이웃한 영상들간에 화질차이가 일정 범위를 벗어나지 않도록 한다. 그리고 하나의 영상에 대하여 하나의 QP를 사용하여 영상 내에서도 일관된 화질을 유지하며, 誰?영상과 비 기준 영상에 대한 버퍼 제한 조건을 차별화함으로써 기준 영상의 화질 열화에 의한 오류 전파를 감소시킨다. 제안된 방식과 MPEG-2의 TM5 (Test Model 5)에서 제안한 비트율 제어 방식의 성능을 비교한 실험으로부터 제안된 방식이 평균 PSNR을 0.521.84 dB 정도 향상시키고, 영상간 그리고 영상 내에서도 일관된 화질을 유지함을 확인하였다.

  • PDF

효율적인 스테레오 영상 압축을 위한 밝기차 보상 (Intensity Compensation for Efficient Stereo Image Compression)

  • 전영탁;전병우
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.101-112
    • /
    • 2005
  • 사람이 두 눈을 통하여 3차원 공간을 지각하는 것과 같이 두 대의 카메라로부터 얻어진 스테레오 영상을 이용하여 3차원 정보를 얻을 수 있다. 스테레오 영상은 많은 데이터량을 가지기 때문에 최근 수년간 디지털 비디오 압축 기술의 발전과 함께 스테레오 영상을 효율적으로 압축하기 위한 기술이 개발되고 있다. 스테레오 영상을 압축하고 3차원 정보를 추출하는데 이용되는 양안차 추정은 일반적으로 두 스테레오 영상의 화소 간의 밝기 차이를 이용한다. 하지만 두 카메라의 초점거리, 방향, 상대적 위치, 조리개에 의해 입사되는 빛의 양 등의 미세한 차이에도 스테레오 영상 간의 밝기차가 발생한다. 밝기차가 있는 스테레오 영상은 부정확한 양안차 벡터와 이에 따른 낮은 압축 효율과 같은 문제점을 발생시킬 수 있다. 따라서 이런 스테레오 영상 간의 밝기차를 사전에 보상한 후 압축함으로써 압축의 효율을 높이고, 또한 재생 시 두 눈을 통하여 들어오는 서로 다른 시각 정보로 인한 눈과 두뇌의 피로를 덜어 줄 수 있다. 본 논문에서는 간단하면서도 효율적인 전처리 방법으로 전역 밝기 보상과 국부지역 밝기 보상 및 계층적 밝기 보상을 제안한다 실험결과는 제안된 보상 방법이 효율적으로 스테레오 영상을 압축하는 것을 보여준다.

다중연산구조기반의 고밀도 성능향상을 위한 움직임추정의 디인터레이싱 방법 (Deinterlacing Method for improving Motion Estimator based on multi arithmetic Architecture)

  • 이강환
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.49-55
    • /
    • 2007
  • 본 논문에서는 필드/프레임의 공간적, 시간적 움직임 특성을 활용한 디인터레이스드 기법을 이용해 재구성된 영상프레임으로부터 넓은 탐색영역에서의 움직임추정이 가능한 이중연산구조 기반의 다해상도 계층적 움직임 추정 방식(multi- resolution hierarchical motion estimation, MHME)의 효율적인 다중연산구조 기반의 움직임 추정을 제안한다. 공간적, 시간적 움직임 특성으로부터 디인터레이스드 기법을 적용하여 재구성된 영상프레임으로부터는 계층적 움직임 추정방식을 적용하여 빠른 움직임 영역에서도 화질의 열화가 거의 없는 다해상도 계층적 움직임 추정(MHME) 영상처리를 구현하였고, 비교적 높은 PSNR을 얻을 수 있었다. 다양한 모드 M=2 또는 M=3의 여러 가지 모의실험을 통해 제안된 구조가 전역탐색 블록정합 알고리듬(Full-search Block Matching Algorithm, FBMA)에 대하여 예측성능에 있어 최고 1.49dB(CAR), 최저0.421dB(Mobile & Calendar)의 모의실험결과 평균 -0.7dB 정도의 미소한 평균 PSNR 저하를 나타내었다. 이의 구현을 위해 제안된 전역/후역 탐색방식의 연산처리방식은 하나의 처리기소자(Processor Element, PE)에 이중연산처리기(DAPE) 구조를 채택하여 제한된 PE로부터 넓은 탐색영역에서의 움직임 추정이 가능한 전역/후역 탐색방식(Foreground & Background Search Algorithm, FBSA)의 비트 처리열 탐색 알고리듬을 제안 적용하여 움직임추정 연산의 성능을 구조적으로 향상시키는 다중프로세서 어레이 구조(Multiple Processor Array Unit, MPAU)를 개발 제안하였다.

H.264/AVC에서의 최고 확률 모드를 이용한 고속 화면 내 예측 모드 결정 (Fast Intra Prediction Mode Decision using Most Probable Mode for H.264/AVC)

  • 김대연;김정필;이영렬
    • 방송공학회논문지
    • /
    • 제15권3호
    • /
    • pp.380-390
    • /
    • 2010
  • 가장 최근에 표준화가 완료된 동영상 압축 코덱인 H.264/AVC는 율-왜곡 최적화를 사용하여 압축률이 상당히 향상되었다. 율-왜곡 최적화는 다수의 후보 모드들 중에서 최적의 모드를 결정하기 위한 수단이며, 모든 모드에 대하여 라그랑지안 비용을 계산하여 그 비용이 가장 적은 모드를 최적의 모드로 결정한다. 하지만 이 방법의 사용으로 인하여 H.264/AVC 부호기의 계산 복잡도가 상당히 증가하였다. 본 논문에서는 H.264/AVC의 화면 내 예측 부호화의 율-왜곡 최적화의 사용으로 인한 계산 복잡도를 감소시키는 고속 화면 내 예측 모드 결정 방법을 제안한다. 제안된 방법은 Intra$4{\times}4$와 Chroma Intra의 부호화 속도를 향상시키기 위하여 최고 확률 모드(MPM)가 가장 최적의 예측 모드인 경우를 미리 판단하여, 이 경우에는 율-왜곡 최적화 과정을 생략하고 최고 확률 모드를 사용하여 부호화한다. 또한 이 방법을 색차 화면 내 예측 모드에 유사하게 적용하였다. 실험 결과, 제안된 방법은 PSNR (Peak Signal-to-Noise Ratio) 손실이 거의 없이 평균 약 63%의 부호화 시간을 절약하였다.