• 제목/요약/키워드: video similarity measure

검색결과 41건 처리시간 0.038초

커쉬함수를 이용한 효율적인 비디오 클립 정합 알고리즘 (An Efficient Video Clip Matching Algorithm Using the Cauchy Function)

  • 김상현
    • 융합신호처리학회논문지
    • /
    • 제5권4호
    • /
    • pp.294-300
    • /
    • 2004
  • 디지털 미디어의 증가로 비디오 클립을 효율적으로 정합하기 위한 다양한 알고리즘이 제안되었다. 기존의 비디오 검색 알고리즘에서는 주로 프레임 단위의 질의에 관한 검색 알고리즘이 연구되었으나 비디오 클립 단위의 질의에 관한 정합 알고리즘 연구는 미진하였다. 본 논문에서는 비디오 클립 질의에 관한 효율적인 비디오 색인과 검색 알고리즘을 제안한다. 시퀀스 정합의 정확도와 성능 향상을 위하여 연속되는 프레임의 히스토그램간의 유사도 함수로 커쉬함수를 사용하였으며 기존의 방법에 비해 높은 성능을 나타내었다. 비디오 샷들로부터 추출된 키프레임들은 샷묶음 뿐만 아니라 비디오 시퀀스 정합이나 브라우징에도 사용되며 여기서 키프레임은 이전 프레임들과 중요한 차이를 보이는 프레임을 나타낸다. 실험 영상을 이용한 실험결과 제안한 방법은 기존의 방법에 비해 적은 계산량으로 높은 정합 성능을 보였다.

  • PDF

The Methodology of the Golf Swing Similarity Measurement Using Deep Learning-Based 2D Pose Estimation

  • Jonghyuk, Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.39-47
    • /
    • 2023
  • 본 논문에서는 골프 동영상 속 스윙 자세 사이의 유사도를 측정할 수 있는 방법을 제안한다. 딥러닝 기반 인공지능 기술이 컴퓨터 비전 분야에 효과적인 것이 알려지면서 동영상을 기반으로 한 스포츠 데이터 분석에 인공지능을 활용하기 위한 시도가 증가하고 있다. 본 연구에서는 딥러닝 기반의 자세 추정 모델을 사용하여 골프 스윙 동영상 속 사람의 관절 좌표를 획득하였고, 이를 바탕으로 각 스윙 구간별 유사도를 측정하였다. 제안한 방법의 평가를 위해 GolfDB 데이터셋의 Driver 스윙 동영상을 활용하였다. 총 36명의 선수에 대해 스윙 동영상들을 두 개씩 짝지어 스윙 유사도를 측정한 결과, 본인의 또 다른 스윙이 가장 유사하다고 평가한 경우가 26명이었으며, 이때의 유사도 평균 순위는 약 5위로 확인되었다. 이로부터 비슷한 동작을 수행하고 있는 경우에도 면밀히 유사도를 측정하는 것이 가능함을 확인할 수 있었다.

Efficient Use of MPEG-7 Edge Histogram Descriptor

  • Won, Chee-Sun;Park, Dong-Kwon;Park, Soo-Jun
    • ETRI Journal
    • /
    • 제24권1호
    • /
    • pp.23-30
    • /
    • 2002
  • MPEG-7 Visual Standard specifies a set of descriptors that can be used to measure similarity in images or video. Among them, the Edge Histogram Descriptor describes edge distribution with a histogram based on local edge distribution in an image. Since the Edge Histogram Descriptor recommended for the MPEG-7 standard represents only local edge distribution in the image, the matching performance for image retrieval may not be satisfactory. This paper proposes the use of global and semi-local edge histograms generated directly from the local histogram bins to increase the matching performance. Then, the global, semi-global, and local histograms of images are combined to measure the image similarity and are compared with the MPEG-7 descriptor of the local-only histogram. Since we exploit the absolute location of the edge in the image as well as its global composition, the proposed matching method can retrieve semantically similar images. Experiments on MPEG-7 test images show that the proposed method yields better retrieval performance by an amount of 0.04 in ANMRR, which shows a significant difference in visual inspection.

  • PDF

결합 유사성 척도를 이용한 시공간 영상 분할 (Spatio-temporal video segmentation using a joint similarity measure)

  • 최재각;이시웅;조순제;김성대
    • 한국통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.1195-1209
    • /
    • 1997
  • This paper presents a new morphological spatio-temporal segmentation algorithm. The algorithm incorporates luminance and motion information simultaneously, and uses morphological tools such as morphological filtersand watershed algorithm. The procedure toward complete segmentation consists of three steps:joint marker extraction, boundary decision, and motion-based region fusion. First, the joint marker extraction identifies the presence of homogeneours regions in both motion and luminance, where a simple joint marker extraction technique is proposed. Second, the spatio-temporal boundaries are decided by the watershed algorithm. For this purposek, a new joint similarity measure is proposed. Finally, an elimination ofredundant regions is done using motion-based region function. By incorporating spatial and temporal information simultaneously, we can obtain visually meaningful segmentation results. Simulation results demonstratesthe efficiency of the proposed method.

  • PDF

퍼지 클러스터링 기법을 이용한 MPEG 비디오의 장면 전환 검출 (Shot Change Detection Using Fuzzy Clustering Method on MPEG Video Frames)

  • 임성재;김운;이배호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.159-162
    • /
    • 2000
  • In this paper, we propose an efficient method to detect shot changes in compressed MPEG video data by using reference features among video frames. The reference features among video frames imply the similarities among adjacent frames by prediction coded type of each frame. A shot change is detected if the similarity degrees of a frame and its adjacent frames are low. And the shot change detection algorithm is improved by using Fuzzy c-means (FCM) clustering algorithm. The FCM clustering algorithm uses the shot change probabilities evaluated in the mask matching of reference ratios and difference measure values based on frame reference ratios.

  • PDF

MPEG 비디오 프레임에서 FCM 클러스터링 기법을 이용한 효과적인 장면 전환 검출 (Efficient Shot Change Detection Using Clustering Method on MPEG Video Frames)

  • 임성재;이배호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.751-754
    • /
    • 2000
  • In this paper, we propose an efficient method to detect abrupt shot changes in compressed MPEG video data by using reference ratios among video frames. The reference ratios among video frames imply the degree of similarities among adjacent frames by prediction coded type of each frames. A shot change is detected if the similarity degrees of a frame and its adjacent frames are low. This paper proposes an efficient shot change detection algorithm by using Fuzzy c-means(FCM) clustering algorithm. The FCM clustering uses the shot change probabilities evaluated in the mask matching of reference ratios and difference measure values based on frame reference ratios.

  • PDF

대용량 비디오 데이터베이스 구축을 위하여 장면전환 검출과 샷 클러스터링을 이용한 비디오 개요 추출 (Video Abstracting Using Scene Change Detection and Shot Clustering for Construction of Efficient Video Database)

  • 신성윤;표성배
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.111-119
    • /
    • 2006
  • 본 대부분의 비디오는 대용량의 장시간 데이터로서 비디오 시청자들이 전반적인 내용을 이해하기에는 충분하지 못하다. 본 논문에서는 이러한 문제점을 해결하기 위하여 효율적인 장면 전환 검출 방법과 새로운 샷 클러스터링을 이용한 비디오 개요 추출 방법을 제시한다. 장면전환 검출 방법은 컬러 히스토그램과 $\chi2$ 히스토그램을 합성한 방법을 이용하여 추출하도록 한다. 클러스터링은 지역적 히스토그램의 차이값을 이용한 유사성 측정과 새로운 샷 병합 알고리즘을 통해 수행하도록 한다. 또한 실제 TV 방송 프로그램을 대상으로 비디오 개요 추출 실험 결과를 제시한다.

  • PDF

대용량 비디오 데이터베이스 구축을 위한 비디오 개요 추출 (Video Abstracting Construction of Efficient Video Database)

  • 신성윤;표성배;이양원
    • 한국컴퓨터정보학회지
    • /
    • 제14권1호
    • /
    • pp.255-264
    • /
    • 2006
  • 대부분의 비디오는 대용량의 장시간 데이터로서 비디오 시청자들이 전반적인 내용을 이해하기에는 충분하지 못하다. 본 논문에서는 이러한 문제점을 해결하기 위하여 효율적인 장면 전환 검출 방법과 새로운 샷 클러스터링을 이용한 비디오 개요 추출 방법을 제시한다. 장면전환 검출 방법은 컬러 히스토그램과 ${\chi}^2$ 히스토그램을 합성한 방법을 이용하여 추출하도록 한다. 클러스터링은 지역적 히스토그램의 차이값을 이용한 유사성 측정과 새로운 샷 병합 알고리즘을 통해 수행하도록 한다. 또한 실제 TV 방송 프로그램을 대상으로 비디오 개요 추출 실험 결과를 제시한다.

  • PDF

동영상에서 추출한 키포인트 정보의 동적 시간워핑(DTW)을 이용한 인체 동작 유사도의 정량화 기법 (A Quantification Method of Human Body Motion Similarity using Dynamic Time Warping for Keypoints Extracted from Video Streams)

  • 임준석;김진헌
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1109-1116
    • /
    • 2020
  • 사람이 따라 하는 능력을 평가하는 스코어는 아동의 발달 단계 혹은 골프, 무용 동작 등을 점검하는 좋은 수단이 될 수 있다. 또한, 이는 AR, VR 응용에서 HCI로도 활용될 수 있다. 본 논문에서는 동작을 주도해서 수행하는 시범자와 그 동작을 따라 하는 참여자 간의 동작 유사도를 평가하는 방안을 제시하고, 여기서 우리는 Openpose의 키포인트 벡터 유사도의 유클리디안 L2 거리를 활용하는 동작 유사도를 제안한다. 제안된 기법은 DTW를 사용하기 때문에 시간 지연차가 있는 동작에 유연하게 대처할 수 있다.

MSSSIM 및 쿨백-라이블러 발산 기반 의사 율-왜곡 평가 함수와 복수개의 영상처리 필터를 이용한 동영상 전처리 방법 (Image Processing of Pseudo-rate-distortion Function Based on MSSSIM and KL-Divergence, Using Multiple Video Processing Filters for Video Compression)

  • 석진욱;조승현;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.768-779
    • /
    • 2018
  • 본 논문에서는 동영상 화질을 최대한 유지하면서 압축 비트량 절감을 효율적으로 이루기 위해 복수개의 영상처리 필터를 영상의 블록에 따라 선택적으로 적용하고, 영상처리 필터의 선택을 위한 MSSSIM(Multi-Scale Structural SIMilarity) 및 쿨백-라이블러 발산(Kullback-Leibler divergence: KL-Divergence) 기반의 영상 처리 평가 함수를 제안한다. 영상압축의 경우, 영상 내 특징에 따라 화질과 비트량 절감의 특성이 다르며, 이에 따라 단일 목적을 가진 영상처리 필터로서는 화질을 유지하면서, 비트량 절감이라는 목적을 동시에 만족 시키기 어렵다. 이에 따라, 주관적 화질을 최대한 유지하면서, 비트량을 절감시키기 위해 주관적 화질 측도로서 MSSSIM를 사용하고 비트 량 측도를 위하여 쿨백-라이블러 발산을 사용함과 동시에 두 가지 척도를 하나의 척도로 결합시키기 위한 방법을 제안한다. 아울러 제안한 측도를 사용하여 서로 다른 특성을 가진 영상처리 필터를 전처리 필터로 사용할 경우, 주관적 화질을 최대한 유지하면서 비트량 절감을 유지할 수 있도록 동영상 압축이 가능함을 확인할 수 있었다.