• 제목/요약/키워드: MPEG4

검색결과 1,149건 처리시간 0.028초

움직임 벡터의 변화량을 이용한 인터 예측 모드 결정에 관한 연구 (A Study on Inter Prediction Mode Determination using the Variance in the Motion Vectors)

  • 김준;김영섭
    • 반도체디스플레이기술학회지
    • /
    • 제13권1호
    • /
    • pp.109-112
    • /
    • 2014
  • H.264/AVC is an international video coding standard that is established in cooperation with ITU-T VCEG and ISO/IEC MPEG, which shows improved code and efficiency than the previous video standards. Motion estimation using various macroblock from 44 to 1616 among the compression techniques of H.264/AVC contributes much to high compression efficiency. Generally, in the case of small motion vector or low complexity about P slice is decided $P16{\times}16$ mode encoding method. But according to circumstances, macroblock is decided $P16{\times}16$ mode despite large motion vector. If the motion vector variance is more than threshold and final select mode is $P16{\times}16$ mode, it is switched to $P8{\times}8$ mode, so this paper shows that the storage capacity is reduced. The results of experiment show that the proposed algorithm increases the compression efficiency of the H.264/AVC algorithm to 0.4%, even reducing the time and without increasing complexity.

모바일 단말에서 H.264/AVC기반 소프트웨어 디코더 적용방안 (Application of Software Decoder Based on H.264/AVC in Mobile Device)

  • 정사균;장옥배;유철중;김은미
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 춘계종합학술대회
    • /
    • pp.800-803
    • /
    • 2005
  • 모바일 단말 기반 동영상 서비스 기술에 관한 연구는 최근에 이르기까지 활발히 수행되고 있으며, 인터넷 기반에서 상용화가 가능한 기술 분야를 모바일에 응용하는 시도가 계속되고 있다. 모바일 단말 기반 영상서비스와 관련하여 최신형 모바일 단말에서는 관련기술을 하드웨어적으로 구현하거나 독자적 동영상 압축기술을 적용한 소프트웨어적 구현을 통하여 동영상 서비스를 제공하고 있다. 그러나 상당한 비율을 점하고 있는 기존 모바일 단말에서는 이들 하드웨어 칩이 없거나 추가적으로 애드온(add-on) 할 수 있는 표준적인 방법이 정해지지 않아 최신의 동영상 서비스 기술을 제공받을 수 없다. 따라서 시시각각으로 변화하는 모바일 동영상 서비스 환경에 적극적으로 대처하기 위해서는 소프트웨어적 해결방안이 필수적이라는 인식이 대두되고 있다. 본 연구에서는 모바일 단말에서 소프트웨어 디코더를 이용하여 기존 단말에서 뿐만 아니라 향후 최신단말에서도 적극적으로 대처하기 위하여 H.264/AVC 기반 소프트웨어 디코더를 모바일 단말에 적용하는 방안에 대하여 제안한다.

  • PDF

WCDMA망상에서 영상통화의 품질향상 기법 (Quality-Enhancement Technique on Video telephony over WCDMA Network)

  • 김요한;곽형원;신지태
    • 방송공학회논문지
    • /
    • 제13권1호
    • /
    • pp.25-33
    • /
    • 2008
  • 영상통화는 3G 이동통신망에서 가장 대표적인 서비스이며, 많은 여러 분야에서 영상통화의 품질을 향상시키기 위한 노력이 있다. 국내에서도 SKT와 KTF에서 3G와 3.5G망으로 WCDMA 방식을 채택해 전국서비스를 시작하였고, 이미 백만 명 이상의 많은 사용자를 확보한 상태이다. 본 논문에서는 WCDMA 망에서의 영상통화방법에 대해 알아보고, 영상품질을 향상시키기 위해 회선망의 물리계층 정보를 이용하여 영상코덱에서 손실확산을 최소화 할 수 있는 슬라이스 그룹을 만드는 새로운 전송기법에 대해 제안하고 실험을 통해 성능을 평가해 보았다. 실험결과, 기존의 방법들보다 좀 더 회선 망과 영상코덱 사이의 동기화가 잘 이루어지고, 이를 통해 손실의 확산을 줄일 수 있는 결과를 보여준다.

A Scalable Audio Coder for High-quality Speech and Audio Services

  • 이길호;이영한;김홍국;김도영;이미숙
    • 대한음성학회지:말소리
    • /
    • 제61호
    • /
    • pp.75-86
    • /
    • 2007
  • In this paper, we propose a scalable audio coder, which has a variable bandwidth from the narrowband speech bandwidth to the audio bandwidth and also has a bit-rate from 8 to 320 kbits/s, in order to cope with the quality of service(QoS) according to the network load. First of all, the proposed scalable coder splits bandwidth of the input audio into narrowband up to around 4 kHz and above. Next, the narrowband signals are compressed by a speech coding method compatible to an existing standard speech coder such as G.729, and the other signals whose bandwidth is above the narrowband are compressed on the basis of a psychoacoustic model. It is shown from the objective quality tests using the signal-to-noise ratio(SNR) and the perceptual evaluation of audio quality(PEAQ) that the proposed scalable audio coder provides a comparable quality to the MPEG-1 Layer III (MP3) audio coder.

  • PDF

3차원 객체를 사용하는 모바일 DMB 콘텐츠 및 템플릿의 제작을 지원하는 저작도구 개발 (Development of Authoring Tool for Mobile DMB Contents and Templates with 3D Objects)

  • 공신;박태진;임순범;최윤철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.178-183
    • /
    • 2007
  • 디지털 방송 기술의 비약적인 발전은 그 수요와 공급을 늘려가며 디지털 컨버전스 시대의 매력적인 산업으로 디지털 방송을 급부상시키고 있다. 이러한 발전 추세를 반영하듯 국내 아날로그 방송 서비스는 2012년을 기점으로 종료해야 하는 운명을 맞아 그 가속화는 더욱 빨라질 것으로 예상된다. 한편, 디지털 방송의 한 분야인 지상파 이동 멀티미디어 방송(Digital Multimedia Broadcasting, DMB) 역시 시류에 발맞추어 디지털 방송과 모바일 환경의 결합이라는 추가적인 이점을 안고, 몇 가지 서비스를 선보이고 있다. 하지만 이와 같은 이점에도 불구하고, DMB 서비스는 교육 혹은 광고 분야 등의 뚜렷한 수요의 증가를 가져오는 콘텐츠에 대한 제작과 배포가 쉽지 않고, 그 방법과 기준이 혼재하는 어려움으로 인하여 DMB가 지닌 무한한 가능성에 비해 크게 이슈화가 되지 못하고 있는 실정이다. 본 연구에서는 이러한 점에 착안하여, 지난 연구들에서 얻은 경험을 밑거름 삼아 기본적인 콘텐츠의 제작 및 배포는 물론 DMB 서비스에서 특화될 수 있는 콘텐츠를 더욱 쉴게 생성할 수 있으며, 기술적으로는 3차원 객체를 지원하는 부분을 보강하며, 편리한 인터페이스 등을 포함하는 저작 도구를 개발한다. 이를 위해 기존 연구들에서 다루어온 MPEG-4 Part 11 : BIFS(Binary Format for Scenes)를 기반으로 국내외에서 연구된 기존의 저작도구들을 비교하며, 새로운 아이디어들을 접목시켜 향후 DMB 서비스에서 효율적으로 쓰여 질 수 있는 저작도구를 개발한다.

  • PDF

Shape Description and Retrieval Using Included-Angular Ternary Pattern

  • Xu, Guoqing;Xiao, Ke;Li, Chen
    • Journal of Information Processing Systems
    • /
    • 제15권4호
    • /
    • pp.737-747
    • /
    • 2019
  • Shape description is an important and fundamental issue in content-based image retrieval (CBIR), and a number of shape description methods have been reported in the literature. For shape description, both global information and local contour variations play important roles. In this paper a new included-angular ternary pattern (IATP) based shape descriptor is proposed for shape image retrieval. For each point on the shape contour, IATP is derived from its neighbor points, and IATP has good properties for shape description. IATP is intrinsically invariant to rotation, translation and scaling. To enhance the description capability, multiscale IATP histogram is presented to describe both local and global information of shape. Then multiscale IATP histogram is combined with included-angular histogram for efficient shape retrieval. In the matching stage, cosine distance is used to measure shape features' similarity. Image retrieval experiments are conducted on the standard MPEG-7 shape database and Swedish leaf database. And the shape image retrieval performance of the proposed method is compared with other shape descriptors using the standard evaluation method. The experimental results of shape retrieval indicate that the proposed method reaches higher precision at the same recall value compared with other description method.

An Efficient Feature Point Extraction and Comparison Method through Distorted Region Correction in 360-degree Realistic Contents

  • Park, Byeong-Chan;Kim, Jin-Sung;Won, Yu-Hyeon;Kim, Young-Mo;Kim, Seok-Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.93-100
    • /
    • 2019
  • One of critical issues in dealing with 360-degree realistic contents is the performance degradation in searching and recognition process since they support up to 4K UHD quality and have all image angles including the front, back, left, right, top, and bottom parts of a screen. To solve this problem, in this paper, we propose an efficient search and comparison method for 360-degree realistic contents. The proposed method first corrects the distortion at the less distorted regions such as front, left and right parts of the image excluding severely distorted regions such as upper and lower parts, and then it extracts feature points at the corrected region and selects the representative images through sequence classification. When the query image is inputted, the search results are provided through feature points comparison. The experimental results of the proposed method shows that it can solve the problem of performance deterioration when 360-degree realistic contents are recognized comparing with traditional 2D contents.

An Efficient Feature Point Extraction Method for 360˚ Realistic Media Utilizing High Resolution Characteristics

  • Won, Yu-Hyeon;Kim, Jin-Sung;Park, Byuong-Chan;Kim, Young-Mo;Kim, Seok-Yoon
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.85-92
    • /
    • 2019
  • In this paper, we propose a efficient feature point extraction method that can solve the problem of performance degradation by introducing a preprocessing process when extracting feature points by utilizing the characteristics of 360-degree realistic media. 360-degree realistic media is composed of images produced by two or more cameras and this image combining process is accomplished by extracting feature points at the edges of each image and combining them into one image if they cover the same area. In this production process, however, the stitching process where images are combined into one piece can lead to the distortion of non-seamlessness. Since the realistic media of 4K-class image has higher resolution than that of a general image, the feature point extraction and matching process takes much more time than general media cases.

A 3D Audio-Visual Animated Agent for Expressive Conversational Question Answering

  • Martin, J.C.;Jacquemin, C.;Pointal, L.;Katz, B.
    • 한국정보컨버전스학회:학술대회논문집
    • /
    • 한국정보컨버전스학회 2008년도 International conference on information convergence
    • /
    • pp.53-56
    • /
    • 2008
  • This paper reports on the ACQA(Animated agent for Conversational Question Answering) project conducted at LIMSI. The aim is to design an expressive animated conversational agent(ACA) for conducting research along two main lines: 1/ perceptual experiments(eg perception of expressivity and 3D movements in both audio and visual channels): 2/ design of human-computer interfaces requiring head models at different resolutions and the integration of the talking head in virtual scenes. The target application of this expressive ACA is a real-time question and answer speech based system developed at LIMSI(RITEL). The architecture of the system is based on distributed modules exchanging messages through a network protocol. The main components of the system are: RITEL a question and answer system searching raw text, which is able to produce a text(the answer) and attitudinal information; this attitudinal information is then processed for delivering expressive tags; the text is converted into phoneme, viseme, and prosodic descriptions. Audio speech is generated by the LIMSI selection-concatenation text-to-speech engine. Visual speech is using MPEG4 keypoint-based animation, and is rendered in real-time by Virtual Choreographer (VirChor), a GPU-based 3D engine. Finally, visual and audio speech is played in a 3D audio and visual scene. The project also puts a lot of effort for realistic visual and audio 3D rendering. A new model of phoneme-dependant human radiation patterns is included in the speech synthesis system, so that the ACA can move in the virtual scene with realistic 3D visual and audio rendering.

  • PDF

저전력 환경에서 멀티미디어 자료 재생을 위한 디스크 스케줄링 기법 (Power Conscious Disk Scheduling for Multimedia Data Retrieval)

  • 최정완;원유집;정원민
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권4호
    • /
    • pp.242-255
    • /
    • 2006
  • 최근에, 휴대용 컴퓨터와 모바일 장치(Smart Phone, PDA, MP3 Player 등)의 보급 증가로 인하여 모바일 환경에서의 전력 관리 기술의 필요성은 매우 증가하고 있다. 왜냐하면, 전력 관리 기술은 모바일 장치에서 가장 중요한 요소 중 하나이기 때문이다. 한편, 하드 디스크는 가격에 비하여 용량이 크고 속도가 빠르며 최근에는 모바일 장치에서 사용하기에 충분하게 작게 만들 수도 있으므로 모바일 기기에 사용하기 적당하나, 모바일 장치에 사용하기에는 소모 전력이 너무 크다는 단점이 있다. 이러한 이유들로 인하여 본 논문에서는 디스크에 저장된 연속적인 멀티미디어 자료를 실시간으로 재생하는데 소모되는 전력을 최소화하기 위한 방법을 제안하고 평가하였다. 모바일 장치에서 소모되는 전력을 엄격히 제한하는 것은 모바일 장치들의 하드웨어와 소프트웨어 디자인에 지대한 영향을 준다. 실시간 멀티미디어 재생이 기존의 텍스트 서비스와 다른 점은 디스크가 저장된 데이타 블록을 연속적으로 공급한다는 것이다. 이것은 디스크 드라이브가 멀티미디어 데이타 전체를 재생할 동안 활성화 상태를 유지해야 하게 하므로, 전력 관리 측면에서는 매우 큰 부담으로 작용한다. 전형적인 모바일 디스크 드라이브의 전력 관리 기능은 디스크가 대기 상태에 있을 때의 과도한 입출력 요청으로 인하여 멀티미디어 재생의 품질 측면에서는 부정적인 영향을 준다. 따라서, 본 논문에서는 디스크 드라이브의 전력 소모 형태를 세밀히 분석하고, 저장된 멀티미디어 데이타를 보다 효율적으로 전력을 덜 사용해 재생할 수 있는 알고리즘을 개발하였다. 이 알고리즘은 읽어야 할 데이타 블록의 수와 활성화/대기 상태의 길이를 계산한다. 이로써 본 논문에서 제안한 알고리즘은 모바일 디스크 드라이브에 저장된 데이타 블록의 연속적인 재생을 보장하는 최적의 스케줄링을 한다. 기존에 공개된 MPEG 재생기에 본 알고리즘을 적용한 멀티미디어 재생기를 만들었다. 이 재생기는 전체 재생동안 활성화 상태를 유지하는 경우와 비교하여 60%의 전력 소모량을 절약하였고, 전력 관리 모듈이 있는 디스크 드라이브에서 재생할 경우에 기존외 재생기와 비교하여 38%의 전력 소모량을 절약하였다.