• 제목/요약/키워드: 객체 기반 부호화

검색결과 89건 처리시간 0.023초

신경망 특징맵 부호화를 위한 특징맵 재배열 및 압축 방법 (Feature map channel reordering and compression for Neural Network feature map coding)

  • 한희지;곽상운;윤정일;정원식;서정일;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.39-42
    • /
    • 2021
  • 최근 영상 혹은 비디오를 이용한 신경망 기반 기술들이 활발히 응용되고 있으며, 신경망이 처리하는 임무도 다양하고 복잡해지고 있다. 이러한 신경망 임무의 다양성과 복잡성은 더욱 많은 비디오 데이터를 요구하기 때문에 비디오 데이터를 효과적으로 전송할 방법이 필요하다. 이에 따라 국제 표준화 단체인 MPEG 에서는 신경망 기계 소비에 적합한 비디오 부호화 표준 개발을 위해서 Video Coding for Machines 표준화를 진행하고 있다. 본 논문에서는 신경망의 특징 맵 부호화 효율을 개선하기 위해 특징 맵 채널 간의 유사도가 높도록 특징맵 채널을 재배열하여 압축하는 방법을 제안한다. 제안 방법으로 VCM 의 OpenImages 데이터셋의 5000 개 검증 영상 중 임의 선택된 360 개 영상에 대해 부호화 효율을 평가한 결과, 객체 검출 임무의 정확도가 유지되면서 모든 양자화 값에 대해 화소당 비트수가 감소했으며, BD-rate 측면에서 2.07%의 부호화 이득을 얻었다.

  • PDF

주요 국가별 표준 도서관 RFID 데이터 모델의 비교 및 분석 (Comparison and Analysis of Library RFID Data Model for Major National Standards)

  • 최재황
    • 한국도서관정보학회지
    • /
    • 제40권2호
    • /
    • pp.87-110
    • /
    • 2009
  • 본 연구의 목적은 이미 국가적으로 도서관 RFID 데이터 모델을 발표한 덴마크, 핀란드, 네덜란드, 프랑스, 미국, 호주, 우리나라의 도서관 RFID 데이터 모델을 분석하고, 비교하는 것이다. 유럽의 4개국 즉, 덴마크, 네덜란드, 핀란드, 프랑스와 우리나라는 고정길이 부호화 방식인 규정 데이터 모델을 채택하고 있고, 미국과 호주는 ISO 15962에 기반 하는 부호화 방식인 객체기반 데이터 모델을 따르고 있다. 본 연구는 앞으로 우리나라 도서관계에서 RFID 데이터 모델을 재정립할 때 토론의 중요한 발판이 될 것으로 기대한다.

  • PDF

객체기반 부호화에서의 개선된 움직임 영역 추출 및 추정 기법 (Improved changed region detection and motion estimation for object-oriented coding)

  • 정의윤;박영식;송근원;한규필;하영호
    • 한국통신학회논문지
    • /
    • 제22권9호
    • /
    • pp.2043-2052
    • /
    • 1997
  • 차세대 부호화 기법중 객체기반 영상부호화 기법은 전형적인 화상전화용 영상에 적합하다. 이 방법에서는 어떤 움직임 모델일 설정하여 영상분석을 하는가에 따라 성능에 큰 영향을 미친다. 본 연구에서는 효율적인 영상분석 알고리즘을 제안하였다. 이전 영상과 현재 영상의 차 영상(frame difference)의 표준편차를 구하여 그 값을 기준으로 배경과 움직임 영역을 추출한다. 창내에서 화소값의 합이 문턱값 이상이며 그 창내의 가운데 점을 움직임 영역으로 간주한다. 추출한 움직임 영역으로부터 움직임 내개변수 구할 때 움직임 영역에서 에지연산자를 사용하여 물체의 영역을 구하여 관찰점(observation point)을 선택하면 올바른 움직임 매개변수를 추정 할 수 있다. 또한, 이전 영상과 현재 영상의 관찰점에서의 변화량 및 인접화소의 변화량을 같이 고려함으로써 잡음의 영향을 줄였다. 그 결과 물체 중심의 관찰점 선택과 잡음의 영향 제거로 움직임 매개변수를 좀더 정확하고 빠르게 구할 수 있었다. 실험결과 제안한 방법이 기존의 방법보다 더 나은 화질을 얻을 수 있었다.

  • PDF

유비쿼터스 컴퓨팅 환경에서 초음파를 이용한 다중 객체 위치 인식 시스템 설계 및 구현 (Design and Implementation of Multiple Objects Localization System using Ultrasound for the Ubiquitous Computing)

  • 성동욱;박준호;이지희;포미미;강광구;장용;임종태;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.387-389
    • /
    • 2010
  • 유비쿼터스 컴퓨팅 환경에서 다양한 위치 기반 서비스(LBS)를 위해 객체 위치 인식은 필수적인 기술이다. 객체의 위치를 판별하기 위해서 GPS 시스템, 다수의 RF 신호 세기를 이용한 시스템이 이용되고 있다. GPS 시스템의 경우 고가의 수신기가 필요하며 실내 측위 환경에서 활용될 수 없으며, RF 신호를 이용한 위치 인식 시스템의 경우 빠른 신호 속도와 페이딩의 영향으로 충분한 신호의 해상도확보하기 어렵다. 하지만 상대적으로 느린 초음파를 이용한 경우 신호의 해상도가 높아 RF 기반 위치 측위 시스템보다 높은 정확도의 위치 인식이 가능하다. 초음파를 이용한 위치 인식 기술은 RF 통신을 통해 해당 초음파의 정보를 식별하고, 초음파와 RF 신호의 도달 시간의 차를 이용해 위치를 판별한다. 본 논문에서는 초음파 신호 부호화 기법을 통해 RF 통신 모듈 없이 다중 객체의 위치를 인식하는 시스템을 설계하고 구현한다.

  • PDF

장면 기술을 위한 MPEG-4 기반 XMT API 구현 (MPEG-4 based XMT APIs for Scene Description)

  • 정예선;김규헌;기명석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.91-94
    • /
    • 2001
  • MPEG-4 시스템은 장면 자체를 하나의 구성 요소로 여기는 기존의 시스템과는 달리, 그 장면을 구성하는 부호화 또는 복호화된 A/V 객체(Audio/visual Objects)들을 하나의 단위로 인식하여, 다양한 멀티미디어 컨텐츠의 장면을 구성(Scene Composition)하고 표현 하는 것에 그 특징이 있다. 이러한 MPEG-4 시스템의 객체 기반 특징은 다양한 사용자와의 대화성(Interactivity)을 가능하게 하며 , 또한 편리한 컨텐츠 편집 및 재사용 등이 가능하기에 차세대 디지털 방송 컨텐츠 제작에 중요하게 활용될 전망이다. 객체 기반 A/V 편집 도구는 MPEG-4를 기반으로 차세대 디지털 방송 컨텐츠 제작을 용이하게 하기 위한 제작/편집 도구로써 , 장면을 표현하기 위하여 BIFS(Binary Format for Scene description)와 XMT(eXtensible MPEG-4 Textual format) 포맷을 모두 사용하고 있다. BIFS 포맷은 저작된 결과물을 바이너리 형태로 표현하기 때문에, 저작된 결과물을 전송하는 데에는 용이하나, 중간에 저작된 결과물을 확인하기 어렵고, 또한 기존의 다른 어플리케이션과의 상호 작용(Interoperability)과 교환(Exchange)에도 어려움이 따른다. 이에 반해, XMT는 차세대 마크업 언어로 각광 받고 있는 XML 에 그 기반을 두고 있기에 저작된 결과물을 제작자가 쉽게 저작물을 이해할 수 있으며, SMIL 과 X3D 같은 다른 어플리케이션과의 상호작용과 교환 또한 용이하게 한다 XMT는 기술 방법에 따라 XMT-A 와 XMT-0 두 가지 형태가 있으며, XMT-A 포맷은 VRML에서 발전한 X3D(extensible 3D)를 바탕으로 MPEG-4 시스템의 특징들을 수용하여 구성되고 BIFS와 일대일로 대응된다. 반면에 XMT-0는 멀티미디어 문서를 웹문서로 표현하는 SMIL 2.0 을 그 기반으로 하였기에 MPEG-4 시스템의 특징보다는 컨텐츠를 저작하는 제작자의 초점에 맞추어 개발된 형태이다. XMT를 이용하여 컨텐츠를 저작하기 위해서는 사용자 인터페이스를 통해 입력되는 저작 정보들을 손쉽게 저장하고 조작할 수 있으며, 또한 XMT 파일 형태로 출력하기 위한 API 가 필요하다. 이에, 본 논문에서는 XMT 형태의 중간 자료형으로의 저장 및 조작을 위하여 XML 에서 표준 인터페이스로 사용하고 있는 DOM(Document Object Model)을 기반으로 하여 XMT 문법에 적합하게 API를 정의하였으며, 또한, XMT 파일을 생성하기 위한 API를 구현하였다. 본 논문에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.

  • PDF

방송용 오디오 콘텐츠 제작을 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법 (Non-uniform Linear Microphone Array Based Source Separation for Broadcasting Audio Content Production)

  • 전찬준;김홍국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.21-22
    • /
    • 2015
  • 현재 UHDTV (Ultra-High-Definition TV) 시대에 사용될 멀티미디어 부호화로 MPEG-H를 표준화로 진행하고 있다. 향후 방송용 오디오 콘텐츠는 채널 오디오 콘텐츠에서 진화하여 객체 오디오 콘텐츠까지도 필요하게 된다. 이에 따라, 본 논문에서는 고품질의 방송용 오디오 콘텐츠를 제작하기 위한 비균등 선형 마이크로폰 어레이 기반의 음원분리 방법을 제안한다. 제안된 방법은 주어진 어레이 배치에 따라 채널간의 시간차를 분석하고, 이에 따른 객체 오디오 생성을 위한 음원분리 기술을 적용한다. 제안된 기법의 성능을 검증하기 위하여 음원분리도를 측정하였고, MVDR (Minimum Variance Distortionless Response) 빔형성기와 성능을 비교하였다. 비교 결과, 제안된 기법이 MVDR 빔형성기에 비하여 12.8% 높은 음원분리도 수치를 나타낸 것을 확인하였다.

  • PDF

내용기반의 MPEG-4 객체 추출 연구 (Content-based MPEG-4 Object Extraction)

  • 권기호;최석림
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.115-120
    • /
    • 1999
  • 본 논문에서는 연속적인 입력화상에서 움직임을 나타내는 객체(Object)를 적은 연산량을 사용하여 추출해 내는 알고리즘을 소개한다. 본 알고리즘은 두 가지 단계로 이루어진다. 첫번째 단계로, 이전의 영상과 현재의 영상을 비교하여 움직임의 변화를 보이는 영역을 찾는다. 이 단계에서는 영상을 비교하여 움직임을 추출하기 위하여 창조영상과 현재의 영상, 그리고 영상의 데이터로서 edge정보를 사용한다. 두 번째 단계에서는, 첫번째 단계에서 움직임으로 판단된 Object mask(변화를 가지는 영역)를 가지고 background 제거 및 Object의 정확한 shape을 만들기 위한 post-processing과정을 가지게 된다. 이 두 단계를 거친 후 입력영상에서 background를 떼어낸 최종적인 Object의 shape정보가 추출되게 된다. 이 알고리즘은 object를 기반으로 부호화함으로써 데이터의 압축률을 극대화 시키는 MPEG-4뿐만 아니라, video database, 무선 통신등과 같은 다양한 범위의 application에 적절하게 사용될 수 있을 것이다.

  • PDF

VRML을 이용한 FBA 3차원 애니메이션 소프트웨어 설계와 구현 (A Design and Implementation of FBA 3-Dimensional animation Software with VRML)

  • 임정연;성원;박민식;박조원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.613-615
    • /
    • 2000
  • 최근 인터넷 상의 3D 게임이나 가상 세계 등의 증가로 3차원 애니메이션에 대한 필요성이 고조되고 있다. 하지만 상당한 메모리와 전송 시간 및 데이터 전송, 처리에 대한 문제가 해결돼야 한다. 이러한 문제점을 해결하기 위해 새롭고 효율적인 3차원 애니메이션 부호화 기술 개발이 필요하다. 현재, MPEG-4는 BIFS와 FBA에 기반하여 애니메이션 애플리케이션들의 다양한 변형들을 구현할 수 있다. BIFS는 인터폴레이터, 스크립트, 센서 노드들 같은 몇 가지 애니메이션 노드들을 지원한다. 그리고 FBA는 인간 모형에 흡사한 객체를 생성하고 움직임을 주는데 유용하게 쓰이는 애니메이션 방법이다. 이 방법들 중 본 논문은 FBA 애니메이션을 VRML 2.0을 사용하여 구현하였고, 이 FBA 객체의 구성과 특징을 관찰하여 FBA 객체의 움직임을 생성하는데 필요한 데이터들을 압축해 데이터양을 줄이는 알고리즘을 구현하였다.

  • PDF

클라이언트의 수집 정보 및 MPEG-4 객체를 이용한 정보 차단 방안 (The methods intercepting injurious informations by using the information from clients and MPEG-4 object)

  • 안원영;박정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.253-256
    • /
    • 2004
  • 오늘날 멀티미디어 기술 발달과 더불어 멀티미디어의 활용 범위가 점차 넓어지고 있으며, 인터넷과 모바일 서비스를 이용하여 실시간으로 영상 및 정지영상을 재생할 수 있다. 그러나 이러한 멀티미디어 발달과 함께 유해정보 규제 방안이 사회적 문제로 대두되고 있다. 본 논문에서는 기존 방식과 다른 유해사이트 정보 수집의 한계성을 극복하는 방법으로 클라이언트에서 수집된 정보를 이용하여 유해 정보를 차단하는 알고리즘을 제안한다. 또한 MPEG-4 객체 기반을 이용한 방법으로써 영상을 객체 단위로 구분하고 부호화 정보를 이용하여 유해정보를 차단하는 알고리즘을 제안한다.

  • PDF

비선형 다중스케일 필터링을 사용한 비디오 객체 분할에 관한 연구 (A Study on Video Object Segmentation using Nonlinear Multiscale Filtering)

  • 이웅희;김태희;이규동;정동석
    • 한국통신학회논문지
    • /
    • 제28권10C호
    • /
    • pp.1023-1032
    • /
    • 2003
  • MPEG-4와 같은 객체 기반 부호화는 멀티미디어 응용을 위한 다양한 내용 기반 기능들을 제공한다. 압축 효율의 향상과 더불어 이러한 기능들이 지원되도록 하기 위해서는 비디오 데이터의 각 프레임은 비디오 객체로 분할되어야 한다. 본 논문에서는 비선형 다중스케일 필터링과 시공간 정보를 사용한 효과적인 비디오 객체 분할 기법을 제안한다. 제안된 방법은 안정화된 역 확산 방정식(Stabilized Inverse Diffusion Equation : SIDE)에 기반한 비선형 다중스케일 필터링을 사용하여 공간적 분할을 수행한다. 또한 구해진 초기 분할된 영역들은 인접 영역 그래프 (Region Adjacency Graph : RAG)를 사용하여 병합된다. 본 논문에서는 통계적 유의성 검사(Statistical significance test)와 시변 메모리(Time-variant memory)를 시간적 분할 방법으로 사용하며 구해진 공간적 분할과 시간적 분할을 결합하여 최종 객체 영역을 효과적으로 분할한다. 본 논문에서 제안된 공간적 분할 방법은 기존의 형태학적 Watershed 알고리즘에 비해 잡음에 강인한 분할 특성을 나타내었으며 기존의 A. Neri의 방법과 비교하였을 때, 최종 분할된 객체 영역의 정확도 비율이 Akiyo는 43%, Claire는 29% 정도 향상됨을 확인할 수 있었다.