• Title/Summary/Keyword: 객체 기반 부호화

Search Result 89, Processing Time 0.024 seconds

Feature map channel reordering and compression for Neural Network feature map coding (신경망 특징맵 부호화를 위한 특징맵 재배열 및 압축 방법)

  • Han, Heeji;Kwak, Sangwoon;Yun, Joungil;Cheong, Won-Sik;Seo, Jeongil;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.39-42
    • /
    • 2021
  • 최근 영상 혹은 비디오를 이용한 신경망 기반 기술들이 활발히 응용되고 있으며, 신경망이 처리하는 임무도 다양하고 복잡해지고 있다. 이러한 신경망 임무의 다양성과 복잡성은 더욱 많은 비디오 데이터를 요구하기 때문에 비디오 데이터를 효과적으로 전송할 방법이 필요하다. 이에 따라 국제 표준화 단체인 MPEG 에서는 신경망 기계 소비에 적합한 비디오 부호화 표준 개발을 위해서 Video Coding for Machines 표준화를 진행하고 있다. 본 논문에서는 신경망의 특징 맵 부호화 효율을 개선하기 위해 특징 맵 채널 간의 유사도가 높도록 특징맵 채널을 재배열하여 압축하는 방법을 제안한다. 제안 방법으로 VCM 의 OpenImages 데이터셋의 5000 개 검증 영상 중 임의 선택된 360 개 영상에 대해 부호화 효율을 평가한 결과, 객체 검출 임무의 정확도가 유지되면서 모든 양자화 값에 대해 화소당 비트수가 감소했으며, BD-rate 측면에서 2.07%의 부호화 이득을 얻었다.

  • PDF

Comparison and Analysis of Library RFID Data Model for Major National Standards (주요 국가별 표준 도서관 RFID 데이터 모델의 비교 및 분석)

  • Choi, Jae-Hwang
    • Journal of Korean Library and Information Science Society
    • /
    • v.40 no.2
    • /
    • pp.87-110
    • /
    • 2009
  • This study examined and compared existing national library RFID data models, especially for Denmark, Finland, Netherlands, France, the U.S., Australia and South Korea. Four European country models(i.e., Danish, Finnish, Dutch, and French models) and South Korea use prescriptive data model(fixed encoding approach), while The U.S. and Australia adopt object-based data model, which is based on the data encoding rules of ISO/IEC 15962. This study expects to allow fertile ground for discussion on RFID data models in South Korean library environment.

  • PDF

Improved changed region detection and motion estimation for object-oriented coding (객체기반 부호화에서의 개선된 움직임 영역 추출 및 추정 기법)

  • 정의윤;박영식;송근원;한규필;하영호
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.22 no.9
    • /
    • pp.2043-2052
    • /
    • 1997
  • The object-oriented coding technique which is one of the coding methods in very low bit rate environment is suitable for videophone image sequence. The selection of source model affect image analysis. In this paper, an image analysis method for the object-oriented coding is presented. The process is composed of changed region detection andmotion estimateion. First, we use the standard deviation of frame difference as thrreshold to extract themoving area. If thesum of gray values in mask is greater than the threshold, the center pixel of the mask is regarded as moving region. After moving is detected in changed region by edge operator, observation point is determined from moving region. The motion is estimated by 6-parameter mapping method with determined observation point. The experimantal resutls show that the proposed method can significantly improve the image quality.

  • PDF

Design and Implementation of Multiple Objects Localization System using Ultrasound for the Ubiquitous Computing (유비쿼터스 컴퓨팅 환경에서 초음파를 이용한 다중 객체 위치 인식 시스템 설계 및 구현)

  • Seong, dong-ook;Park, jun-ho;Lee, Ji-hee;Bao, weiwei;Kang, gwang-goo;Jang, yong-jin;Lim, jong-tae;Yoo, jae-soo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2010.05a
    • /
    • pp.387-389
    • /
    • 2010
  • 유비쿼터스 컴퓨팅 환경에서 다양한 위치 기반 서비스(LBS)를 위해 객체 위치 인식은 필수적인 기술이다. 객체의 위치를 판별하기 위해서 GPS 시스템, 다수의 RF 신호 세기를 이용한 시스템이 이용되고 있다. GPS 시스템의 경우 고가의 수신기가 필요하며 실내 측위 환경에서 활용될 수 없으며, RF 신호를 이용한 위치 인식 시스템의 경우 빠른 신호 속도와 페이딩의 영향으로 충분한 신호의 해상도확보하기 어렵다. 하지만 상대적으로 느린 초음파를 이용한 경우 신호의 해상도가 높아 RF 기반 위치 측위 시스템보다 높은 정확도의 위치 인식이 가능하다. 초음파를 이용한 위치 인식 기술은 RF 통신을 통해 해당 초음파의 정보를 식별하고, 초음파와 RF 신호의 도달 시간의 차를 이용해 위치를 판별한다. 본 논문에서는 초음파 신호 부호화 기법을 통해 RF 통신 모듈 없이 다중 객체의 위치를 인식하는 시스템을 설계하고 구현한다.

  • PDF

MPEG-4 based XMT APIs for Scene Description (장면 기술을 위한 MPEG-4 기반 XMT API 구현)

  • 정예선;김규헌;기명석
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2001.11b
    • /
    • pp.91-94
    • /
    • 2001
  • MPEG-4 시스템은 장면 자체를 하나의 구성 요소로 여기는 기존의 시스템과는 달리, 그 장면을 구성하는 부호화 또는 복호화된 A/V 객체(Audio/visual Objects)들을 하나의 단위로 인식하여, 다양한 멀티미디어 컨텐츠의 장면을 구성(Scene Composition)하고 표현 하는 것에 그 특징이 있다. 이러한 MPEG-4 시스템의 객체 기반 특징은 다양한 사용자와의 대화성(Interactivity)을 가능하게 하며 , 또한 편리한 컨텐츠 편집 및 재사용 등이 가능하기에 차세대 디지털 방송 컨텐츠 제작에 중요하게 활용될 전망이다. 객체 기반 A/V 편집 도구는 MPEG-4를 기반으로 차세대 디지털 방송 컨텐츠 제작을 용이하게 하기 위한 제작/편집 도구로써 , 장면을 표현하기 위하여 BIFS(Binary Format for Scene description)와 XMT(eXtensible MPEG-4 Textual format) 포맷을 모두 사용하고 있다. BIFS 포맷은 저작된 결과물을 바이너리 형태로 표현하기 때문에, 저작된 결과물을 전송하는 데에는 용이하나, 중간에 저작된 결과물을 확인하기 어렵고, 또한 기존의 다른 어플리케이션과의 상호 작용(Interoperability)과 교환(Exchange)에도 어려움이 따른다. 이에 반해, XMT는 차세대 마크업 언어로 각광 받고 있는 XML 에 그 기반을 두고 있기에 저작된 결과물을 제작자가 쉽게 저작물을 이해할 수 있으며, SMIL 과 X3D 같은 다른 어플리케이션과의 상호작용과 교환 또한 용이하게 한다 XMT는 기술 방법에 따라 XMT-A 와 XMT-0 두 가지 형태가 있으며, XMT-A 포맷은 VRML에서 발전한 X3D(extensible 3D)를 바탕으로 MPEG-4 시스템의 특징들을 수용하여 구성되고 BIFS와 일대일로 대응된다. 반면에 XMT-0는 멀티미디어 문서를 웹문서로 표현하는 SMIL 2.0 을 그 기반으로 하였기에 MPEG-4 시스템의 특징보다는 컨텐츠를 저작하는 제작자의 초점에 맞추어 개발된 형태이다. XMT를 이용하여 컨텐츠를 저작하기 위해서는 사용자 인터페이스를 통해 입력되는 저작 정보들을 손쉽게 저장하고 조작할 수 있으며, 또한 XMT 파일 형태로 출력하기 위한 API 가 필요하다. 이에, 본 논문에서는 XMT 형태의 중간 자료형으로의 저장 및 조작을 위하여 XML 에서 표준 인터페이스로 사용하고 있는 DOM(Document Object Model)을 기반으로 하여 XMT 문법에 적합하게 API를 정의하였으며, 또한, XMT 파일을 생성하기 위한 API를 구현하였다. 본 논문에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.

  • PDF

Non-uniform Linear Microphone Array Based Source Separation for Broadcasting Audio Content Production (방송용 오디오 콘텐츠 제작을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법)

  • Chun, Chan Jun;Kim, Hong Kook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.11a
    • /
    • pp.21-22
    • /
    • 2015
  • 현재 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화로 MPEG-H를 표준화로 진행하고 있다. 향후 방송용 오디오 콘텐츠는 채널 오디오 콘텐츠에서 진화하여 객체 오디오 콘텐츠까지도 필요하게 된다. 이에 따라, 본 논문에서는 고품질의 방송용 오디오 콘텐츠를 제작하기 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법을 제안한다. 제안된 방법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 이에 따른 객체 오디오 생성을 위한 음원분리 기술을 적용한다. 제안된 기법의 성능을 검증하기 위하여 음원분리도를 측정하였고, MVDR (Minimum Variance Distortionless Response) 빔형성기와 성능을 비교하였다. 비교 결과, 제안된 기법이 MVDR 빔형성기에 비하여 12.8% 높은 음원분리도 수치를 나타낸 것을 확인하였다.

  • PDF

Content-based MPEG-4 Object Extraction (내용기반의 MPEG-4 객체 추출 연구)

  • 권기호;최석림
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 1999.06b
    • /
    • pp.115-120
    • /
    • 1999
  • 본 논문에서는 연속적인 입력화상에서 움직임을 나타내는 객체(Object)를 적은 연산량을 사용하여 추출해 내는 알고리즘을 소개한다. 본 알고리즘은 두 가지 단계로 이루어진다. 첫번째 단계로, 이전의 영상과 현재의 영상을 비교하여 움직임의 변화를 보이는 영역을 찾는다. 이 단계에서는 영상을 비교하여 움직임을 추출하기 위하여 창조영상과 현재의 영상, 그리고 영상의 데이터로서 edge정보를 사용한다. 두 번째 단계에서는, 첫번째 단계에서 움직임으로 판단된 Object mask(변화를 가지는 영역)를 가지고 background 제거 및 Object의 정확한 shape을 만들기 위한 post-processing과정을 가지게 된다. 이 두 단계를 거친 후 입력영상에서 background를 떼어낸 최종적인 Object의 shape정보가 추출되게 된다. 이 알고리즘은 object를 기반으로 부호화함으로써 데이터의 압축률을 극대화 시키는 MPEG-4뿐만 아니라, video database, 무선 통신등과 같은 다양한 범위의 application에 적절하게 사용될 수 있을 것이다.

  • PDF

A Design and Implementation of FBA 3-Dimensional animation Software with VRML (VRML을 이용한 FBA 3차원 애니메이션 소프트웨어 설계와 구현)

  • Lim, Jeong-Yon;Seong, Won;Park, Min-Sik;Park, Jong-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.613-615
    • /
    • 2000
  • 최근 인터넷 상의 3D 게임이나 가상 세계 등의 증가로 3차원 애니메이션에 대한 필요성이 고조되고 있다. 하지만 상당한 메모리와 전송 시간 및 데이터 전송, 처리에 대한 문제가 해결돼야 한다. 이러한 문제점을 해결하기 위해 새롭고 효율적인 3차원 애니메이션 부호화 기술 개발이 필요하다. 현재, MPEG-4는 BIFS와 FBA에 기반하여 애니메이션 애플리케이션들의 다양한 변형들을 구현할 수 있다. BIFS는 인터폴레이터, 스크립트, 센서 노드들 같은 몇 가지 애니메이션 노드들을 지원한다. 그리고 FBA는 인간 모형에 흡사한 객체를 생성하고 움직임을 주는데 유용하게 쓰이는 애니메이션 방법이다. 이 방법들 중 본 논문은 FBA 애니메이션을 VRML 2.0을 사용하여 구현하였고, 이 FBA 객체의 구성과 특징을 관찰하여 FBA 객체의 움직임을 생성하는데 필요한 데이터들을 압축해 데이터양을 줄이는 알고리즘을 구현하였다.

  • PDF

The methods intercepting injurious informations by using the information from clients and MPEG-4 object (클라이언트의 수집 정보 및 MPEG-4 객체를 이용한 정보 차단 방안)

  • An Won-Young;Park Jung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.253-256
    • /
    • 2004
  • 오늘날 멀티미디어 기술 발달과 더불어 멀티미디어의 활용 범위가 점차 넓어지고 있으며, 인터넷과 모바일 서비스를 이용하여 실시간으로 영상 및 정지영상을 재생할 수 있다. 그러나 이러한 멀티미디어 발달과 함께 유해정보 규제 방안이 사회적 문제로 대두되고 있다. 본 논문에서는 기존 방식과 다른 유해사이트 정보 수집의 한계성을 극복하는 방법으로 클라이언트에서 수집된 정보를 이용하여 유해 정보를 차단하는 알고리즘을 제안한다. 또한 MPEG-4 객체 기반을 이용한 방법으로써 영상을 객체 단위로 구분하고 부호화 정보를 이용하여 유해정보를 차단하는 알고리즘을 제안한다.

  • PDF

A Study on Video Object Segmentation using Nonlinear Multiscale Filtering (비선형 다중스케일 필터링을 사용한 비디오 객체 분할에 관한 연구)

  • 이웅희;김태희;이규동;정동석
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.28 no.10C
    • /
    • pp.1023-1032
    • /
    • 2003
  • Object-based coding, such as MPEG-4, enables various content-based functionalities for multimedia applications. In order to support such functionalities, as well as to improve coding efficiency, each frame of video sequences should be segmented into video objects. In this paper. we propose an effective video object segmentation method using nonlinear multiscale filtering and spatio-temporal information. Proposed method performs a spatial segmentation using a nonlinear multiscale filtering based on the stabilized inverse diffusion equation(SIDE). And, the segmented regions are merged using region adjacency graph(RAG). In this paper, we use a statistical significance test and a time-variant memory as temporal segmentation methods. By combining of extracted spatial and temporal segmentations, we can segment the video objects effectively. Proposed method is more robust to noise than the existing watershed algorithm. Experimental result shows that the proposed method improves a boundary accuracy ratio by 43% on "Akiyo" and by 29% on "Claire" than A. Neri's Method does.