• 제목/요약/키워드: 비디오 데이터의 표현

검색결과 158건 처리시간 0.032초

영상과 음성 정보를 이용한 비디오 편집 및 검색 시스템 (Video Editing and Retrieval System Using Speech Recognition Technique)

  • 조현철;윤인구;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.228-230
    • /
    • 1998
  • 동영상 데이터가 갖는 복잡하고 다양한 관계성 때문에 기존의 키워드 기반 정보 검색 방법에는 한계가 있으면 비디오 내용에 기반해 검색을 하는 내용기반 검색기법이 요구된다. 현재 MPEG-7에서도 비디오 내용 표현 방식에 관한 국제 표준화 작업이 시작되고 있다. 본 논문에서는 영상정보와 음성정보를 사용해 비디오의 원하는 부분을 내용에 기반해 검색할 수 있는 비디오 편집 및 검색 시스템을 개발하였다.

  • PDF

BCS 최대 매칭을 이용한 유사 비디오 클립 랭킹 (Video Clip Ranking using Bounded Coordinate System Matching)

  • 정의석;심규석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.716-719
    • /
    • 2010
  • 비디오 클립은 최근 온라인 상에서 흔히 볼 수 있는 짧은 동영상으로 이러한 동영상 클립의 대규모 유입으로 유사한 비디오 클립을 검색하는 동영상 검색 엔진의 필요성이 크게 증가하였다. BCS은 최초의 단일 비디오 클립 표현 모델로 비디오 클립을 주성분 분석을 통해 얻어진 좌표축들을 그 위로 사상된 데이터들로 제한한 것들로 이루어진 좌표계로 요약한다. 그러나 BCS 은 영상의 순서를 무시한 벡터로 표현되므로 세밀한 유사도 구별이 불가능하다. 본 논문에서는 유사한 동영상에 대한 사람의 판단은 서로 유사한 일부분이 많이 존재하는 것을 기반으로 하는 점에 착안하여 하나의 동영상 클립을 샷 단위로 나누어 여러 개의 BCS 으로 나타낸 다음, 이들간의 유사도 측정을 통해 검색의 성능을 높이고자 하였다. 실험 결과 만족할 만한 정확도로 유사한 동영상 클립을 검색해 내는 것을 확인할 수 있다.

장면 검색을 지원하는 XML 기반 멀티미디어 검색 시스템 (XML Based Multimedia Retrieval System supporting Scene Search)

  • 정미라;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.133-136
    • /
    • 2001
  • 오디오 비디오 데이터의 활용이 증가함에 따라 멀티미디어 데이터의 내용에 대해 표현하려는 연구와 함께 멀티미디어 데이터의 내용이나 메타데이터를 저장하고, 검색하고, 조작하는 연구의 필요성이 증가하였다. 멀티미디어 데이터의 표현은 사용자가 원하는 내용만을 쉽게 검색하고, 접근한 수 있도록 표현되고 저장되어야 한다. 그러나 기존의 멀티미디어 검색 시스템들은 특정 객체에 중점을 두고 색상, 위치, 모양 등의 정보를 가지고 유사 객체를 찾는 방식을 취하고 있으므로 특정 사건이나 구체적인 인물 정보나 에피소드의 정보를 검색하고자 한 때는 키워드에 의한 검색을 해야하므로 불필요한 정보가 다량으로 검색되며 여러 번의 검색이 이루어져야 하는 단점이 있다. 또한 일반 사용자들은 주로 특정 장면에서 특정 객체의 특징이나 행동, 장소, 사건 등의 정보에 대해 관심을 갖고, 이에 따른 질의를 하는 경향이 있다. 따라서 본 논문에서는 "장면"이라는 계층 구조에 중점을 두고 멀티미디어 데이터의 내용 정보와 구조 정보를 표현 및 저장을 하며, 사용자는 특정 사건이나 객체들의 특징 정보를 가지고 장면이나 전체 구조를 검색찬 수 있는 시스템을 설계하고 구현한다. 멀티미디어 데이터의 표현 및 저장 검색의 모든 과정은 데이터의 재사용성과 접근 용이성을 위해 XML을 기반으로 하여 처리된다. 이렇게 XML로 표현된 데이터는 사용자들에게 구조 정보나 내용 정보에 있어서 다양한 검색 결과를 제공할 수 있는 장점이 있다.

  • PDF

공간 관계 그래프를 이용한 움직임 객체의 의미 표현 (Semantic Representation of Moving Object Using Spatial Relationship Graph)

  • 조미영;최준호;신주현;윤미진;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.81-84
    • /
    • 2003
  • 비디오 데이터는 미디어의 특성상 시간의 흐름에 따라 객체의 위치가 변하는 움직임 객체(Moving Object)를 가지며, 이러한 움직임으로부터 어떤 개념 혹은 의미(Semantic) 정보를 추출해 낼 수 있다. 본 논문에서는 Egenhofer에 의해 정의된 공간 관계 표현을 이용하여 공간 관계 그래프를 정의하고 이 그래프를 통하여 움직임 객체의 의미를 표현하고자 한다. 이를 이용하면 사용자는 비디오 데이터에서 객체의 움직임을 이용한 내용 기반 검색뿐만 아니라 움직임의 의미를 이용하여 개념 기반 검색을 수행 할 수 있다.

  • PDF

비디오 검색 시스템을 위한 데이터 시퀀스 패턴 유사성 검색 (Pattern Similarity Retrieval of Data Sequences for Video Retrieval System)

  • 이석룡
    • 정보처리학회논문지D
    • /
    • 제13D권3호
    • /
    • pp.347-356
    • /
    • 2006
  • 비디오 스트림은 다차원 공간에서 데이터 포인트의 시퀀스로 표현될 수 있다. 본 논문에서는 시퀀스 내의 데이터 포인트들의 값들의 근사치에 대한 정보와 시퀀스 내의 포인트들의 방향성에 대한 정보를 내포하고 있는 트랜드 벡터(trend vector)에 대한 소개와 이 벡터를 이용하여 데이터 시퀀스를 위한 유사 패턴 검색 기법을 제안한다. 시퀀스는 복수 개의 세그먼트로 분할되며 각 세그먼트는 트랜드 벡터로 표현된다. 질의처리는 시퀀스 내의 각각의 포인트들에 대하여 수행되는 대신, 트랜드 벡터들에 대하여 처리된다. 제안한 기법은 이 벡터를 사용하여 질의와 무관한 데이터 시퀀스들을 데이터베이스로부터 여과하고 질의 시퀀스와 유사한 시퀀스들을 검색하도록 설계되었다. 제안한 기법을 검증하기 위하여 비디오 스트림과 가상으로 생성된 데이터에 관하여 실험을 수행하였으며, 실험 결과 제안한 기법의 정밀도(precision)는 기존의 방법에 비하여 2.1배까지 향상되었으며 처리시간은 45%까지 감소되었음을 보여주고 있다.

감정에 관련된 비디오 셧의 특징 표현 및 검출 (Representation and Detection of Video Shot s Features for Emotional Events)

  • 강행봉;박현재
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.53-62
    • /
    • 2004
  • 인간과 컴퓨터간의 상호작용에 있어서 감정처리는 매우 중요한 부결이다. 특히, 비디오 정보처리에 있어서 사용자의 감정을 처리할 수 있다면 비디오 검색이나 요약본 추출 등 다양한 응용분야에 활용이 가능하다. 비디오 데이터로부터 이러한 감정 처리를 하기 위해서는 감정에 관련된 특징들을 표현하고, 검출하는 것이 필요하다. 쉽게 추출이 가능한 색상이나 모션 등의 저급 특징들로부터 고급 개념인 감정을 검출하는 것은 매우 어려운 일이지만, 감정에 관련된 여러 장면으로부터 LDA(Linear Discriminant Analysis)와 같은 통계적인 분석을 통해 감정에 관련된 특징들을 검출하는 것은 가능하다. 본 논문에서는 색상, 모션 및 셧 길이 정보로부터 감정과의 관련된 특징을 표현하고 검출하는 방법을 제안한다. 제안된 특징을 사용하여 감정 검출에 관련된 실험을 한 결과 바람직한 결과를 얻었다.

비디오와 동기화된 물체의 위치정보 표현 data stream 생성 및 해석기 구현 (Generation and Interpretation of data stream for position data of objects synchronized with video)

  • 나희주;김정환;정문열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2005년도 학술대회
    • /
    • pp.249-254
    • /
    • 2005
  • 본 논문은 디지털 방송 프로그램 진행 중 비디오의 특정 시점에 동기화된 특정 객체의 위치정보를 표현하는 data stream을 생성하고, 그 시점에 해당 위치 정보를 해석하는 해석기에 관한 것이다. 현재의 상용 스트림 생성기는 디지털 방송 표준에서 권고하는 스트림 이벤트의 발생 시각과 셋톱박스에서 디코딩 시에 사용할 참조값을 적절하게 생성하지 못하고 있다. 또한, 셋톱박스에서 동작하는 애플리케이션(Xlet) 역시 STC(System Time Clock), PCR(Program Clock Reference), NPT(Normal Play Time) 등의 시간값을 적절하게 읽어내지 못하고 있다. 더욱이, 현재의 디지털 방송 표준에서는 영상 내 특정 객체를 위해 정보를 제공하는 데에는 한계가 있다. 따라서, 본 논문에서는 다양한 연동형 디지털 방송 프로그램 제작을 위해 비디오의 특정 시점에 동기화된 객체의 위치정보를 표현하는 data stream을 생성하는 방법과, 동기화된 데이터를 처리하는 애플리케이션에 대해서 설명한다.

  • PDF

모바일 리치미디어 서비스 기술 특허 동향 분석 (Analysis on Patent Trends for Mobile Richmedia Service Technology)

  • 최진수;정세윤;차지훈;이태진;강경옥;문경애;이용일
    • 전자통신동향분석
    • /
    • 제23권1호통권109호
    • /
    • pp.130-144
    • /
    • 2008
  • 최근 초고속 인터넷, WiBro, HSDPA 등의 통신 환경과 지상파, 케이블, 위성, DMB 망등의 디지털 방송 환경의 발전으로 인해 음성, 영상, 이미지, 텍스트 등의 다양한 멀티미디어 서비스 제공이 휠씬 용이하게 됨에 따라 IPTV, 디지털 TV, DMB 방송, DVD, 영상 회의 등과 같은 응용분야가 각광을 받고 있다. 이러한 응용 분야에서 멀티미디어 데이터를 효율적으로 저장하거나 전송하기 위해서는 음성 및 영상의 압축부호화가 필수적으로 요구되며, 또한 대화형 데이터 서비스를 제공하기 위해서는 데이터 표현, 전송 및 처리가 아주 중요하다. 특히 제한된 대역폭과 낮은 성능의 단말과 같은 모바일 방송통신 환경에서 오디오, 비디오, 이미지 등의 다양한 멀티미디어 서비스를 제공 받기 위해서는 높은 압축률의 고효율 오디오/비디오 부호화 기술과 초경량의 데이터 서비스 기술이 필수적으로 요구된다. 본 고에서는 최신 고효율 오디오/비디오 부호화 기술 및 초경량 데이터 서비스 기술 동향을 살펴보고, 관련 기술의 특허 동향을 살펴본다.

교량의 3차원 측정을 위한 UAV 비디오와 사진의 표정 분석 (Orientation Analysis between UAV Video and Photos for 3D Measurement of Bridges)

  • 한동엽;박재봉;허정원
    • 한국측량학회지
    • /
    • 제36권6호
    • /
    • pp.451-456
    • /
    • 2018
  • 시설물의 유지 관리 및 모니터링에 UAVs (Unmanned Aerial Vehicles)의 활용이 확대되고 있다. 안전 점검을 위한 시설물의 외관 상태 평가를 위하여 고해상도 영상을 취득하는 것이 필요하며, 넓은 지역을 빠르게 취득하기 위하여 비디오 데이터로 취득할 필요가 있다. 일반적으로 비디오 데이터에는 위치 정보가 포함되지 않아, 검사 개체의 실제 크기에 대한 정량적 분석이 어렵다. 본 연구에서는 교량 시설물을 대상으로 비디오 프레임과 기준 사진의 정합을 이용하여 교량의 3차원 점군(point cloud) 데이터의 활용성을 평가하고자 한다. 드론을 이용하여 비디오와 사진을 취득하고, 기준 사진과의 특징점 정합을 통하여 비디오 프레임의 외부 표정 요소를 생성하였다. 실험 결과 비디오 프레임 데이터는 기준 사진과 유사한 표정 정확도를 얻었으며, 표정된 프레임 데이터를 이용하여 생성된 점군 데이터는 교량의 형상 및 크기를 잘 표현하였다. 향후 다양한 조건의 정합 실험을 통하여 결과물의 안정성이 확인되면, 비디오 기반의 시설물 모델링 및 점검에 효과적으로 적용될 것으로 기대된다.

JMVC에서의 효율적인 예측구조 (Efficient Prediction Structure on Joint Multi-view Video Coding)

  • 김미영;윤효순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.386-389
    • /
    • 2012
  • 다시점 비디오는 3차원 정보를 표현하기 위한 영상으로 하나의 3차원 장면을 여러 시점에서 다수의 카메라로 촬영한 동영상이다. 영상들 사이에 존재하는 시간적 상관성과 화면간 상관성을 이용하는 다시점 비디오 부호화는 카메라의 수에 비례하여 데이터의 양이 늘어나기 때문에 계산량을 줄일 수 있는 다시점 비디오 부호화 기술이 필요하다. 본 논문에서는 다시점 비디오의 부호화 성능을 향상시키기 위한 효율적인 예측구조를 제안한다. 제안한 예측 구조는 다시점 비디오의 부호화 효율을 높이기 위하여 부호화되는 현재 화면과 현재 화면이 참조하는 참조 화면들과의 평균 거리, B계층 최대 인덱스 그리고 각 B계층의 화면 수를 고려하였다. 제안한 예측 구조의 성능을 참조 예측 구조의 성능과 비교하였을 때 영상 화질 면에 있어서 제안한 예측 구조가 참조 예측 구조보다 약 0.07~0.13 (dB) 성능 향상을 보였다. 발생되는 평균 초당 비트량에 있어서 제안한 예측 구조가 참조 예측 구조보다약 +3 ~ -6.5(Kbps) 감소하였다.