• 제목/요약/키워드: Video Index

검색결과 195건 처리시간 0.022초

Discrete Multiwavelet-Based Video Watermarking Scheme Using SURF

  • Narkedamilly, Leelavathy;Evani, Venkateswara Prasad;Samayamantula, Srinivas Kumar
    • ETRI Journal
    • /
    • 제37권3호
    • /
    • pp.595-605
    • /
    • 2015
  • This paper proposes a robust, imperceptible block-based digital video watermarking algorithm that makes use of the Speeded Up Robust Feature (SURF) technique. The SURF technique is used to extract the most important features of a video. A discrete multiwavelet transform (DMWT) domain in conjunction with a discrete cosine transform is used for embedding a watermark into feature blocks. The watermark used is a binary image. The proposed algorithm is further improved for robustness by an error-correction code to protect the watermark against bit errors. The same watermark is embedded temporally for every set of frames of an input video to improve the decoded watermark correlation. Extensive experimental results demonstrate that the proposed DMWT domain video watermarking using SURF features is robust against common image processing attacks, motion JPEG2000 compression, frame averaging, and frame swapping attacks. The quality of a watermarked video under the proposed algorithm is high, demonstrating the imperceptibility of an embedded watermark.

구조화된 비디오 문서의 데이터 모델 및 질의어와 색인 기법 (Data Model, Query Language, and Indexing Scheme for Structured Video Documents)

  • 류은숙;이규철
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.1-17
    • /
    • 1998
  • 비디오 정보는 전자 도서관이나 WWW 및 주문형 비디오 (VOD) 시스템과 같은 다양한 응용분야에서 중요한 요소로 부각되고 있다. 비디오 정보는 특성상 계층적으로 구조화된 문서 형태를 가지기 때문에 본 논문에서는 이를 “구조화된 비디오 문서”라 부른다. 본 논문에서는 구조화된 비디오 문서를 데이터베이스에 효율적으로 저장하고, 검색하기 위한 데이터 모델과 질의어 및 색인 기법을 제안한다. 구조화된 비디오 문서는 논리적인 계층 구조 특성을 지니기 때문에, 본 논문에서는 객체 지향 데이터 모델을 이용하여 비디오 문서를 복합 객체로 모델링하고, 이를 저장하기 위한 객체 타입들을 정의한다. 또한 본 논문에서는 비디오 데이터의 캡션이나 주석을 기반으로 한 내용 기반 검색과 비디오 문서의 논리적 구조를 기반으로 한 구조 기반 검색을 제공하며, 비디오 문서의 시공간 관계 연산을 이용한 검색도 지원한다. 그리고, 구조화된 비디오 문서의 효율적인 질의와 색인 공간의 오버헤드를 줄이기 위해 최적화된 역 색인 기법을 제시한다.

  • PDF

시간적 예측 구조와 움직임 벡터의 특성을 이용한 움직임 추정 기법 (Temporal Prediction Structure and Motion Estimation Method based on the Characteristic of the Motion Vectors)

  • 윤효순;김미영
    • 한국멀티미디어학회논문지
    • /
    • 제18권10호
    • /
    • pp.1205-1215
    • /
    • 2015
  • Efficient multi-view coding techniques are needed to reduce the complexity of multi-view video which increases in proportion to the number of cameras. To reduce the complexity and maintain image quality and bit-rates, an motion estimation method and temporal prediction structure are proposed in this paper. The proposed motion estimation method exploits the characteristic of motion vector distribution and the motion direction and motion size of the block to place search points and decide the search patten adaptively. And the proposed prediction structure divides every GOP to decide the maximum index of hierarchical B layer and the number of pictures of each B layer. Experiment results show that the complexity reduction of the proposed temporal prediction structure and motion estimation method over hierarchical B pictures prediction structure and TZ search method which are used in JMVC(Joint Multi-view Video Coding) reference model can be up to 45∼70% while maintaining similar video quality and bit rates.

Floop: An efficient video coding flow for unmanned aerial vehicles

  • Yu Su;Qianqian Cheng;Shuijie Wang;Jian Zhou;Yuhe Qiu
    • ETRI Journal
    • /
    • 제45권4호
    • /
    • pp.615-626
    • /
    • 2023
  • Under limited transmission conditions, many factors affect the efficiency of video transmission. During the flight of an unmanned aerial vehicle (UAV), frequent network switching often occurs, and the channel transmission condition changes rapidly, resulting in low-video transmission efficiency. This paper presents an efficient video coding flow for UAVs working in the 5G nonstandalone network and proposes two bit controllers, including time and spatial bit controllers, in the flow. When the environment fluctuates significantly, the time bit controller adjusts the depth of the recursive codec to reduce the error propagation caused by excessive network inference. The spatial bit controller combines the spatial bit mask with the channel quality multiplier to adjust the bit allocation in space to allocate resources better and improve the efficiency of information carrying. In the spatial bit controller, a flexible mini graph is proposed to compute the channel quality multiplier. In this study, two bit controllers with end-to-end codec were combined, thereby constructing an efficient video coding flow. Many experiments have been performed in various environments. Concerning the multi-scale structural similarity index and peak signal-to-noise ratio, the performance of the coding flow is close to that of H.265 in the low bits per pixel area. With an increase in bits per pixel, the saturation bottleneck of the coding flow is at the same level as that of H.264.

VVC의 화면 내 예측에서 적응적 TBC를 사용하는 방법 (Adaptive TBC in Intra Prediction on Versatile Video Coding)

  • 이원준;박광훈
    • 방송공학회논문지
    • /
    • 제25권1호
    • /
    • pp.109-112
    • /
    • 2020
  • VVC는 화면 내 예측에서 67가지의 모드를 사용한다. 이때 화면 내 예측 모드 표현을 위한 데이터를 감소시키기 위하여 MPM(Most Probable Mode)을 사용한다. 시그널링 되는 모드가 MPM 후보 내에 존재하는 경우 MPM 리스트의 해당 index를 송신하는 방법을 사용하고 MPM 후보 내에 존재하지 않는 경우에는 TBC 부호화를 적용한다. 화면 내 예측에서 TBC가 적용될 때 MPM 후보를 제외하고 낮은 번호의 모드 순서대로 3가지가 선택되어 5비트로 부호화되고 나머지 모드는 6비트로 부호화된다. 본 논문에서는 VVC의 화면 내 예측에서 사용하는 TBC 기술의 한계점을 알아보고 화면 내 예측에서 TBC를 사용할 때 기존의 방법보다 효율적으로 부호화 할 수 있는 적응적인 방법을 제안한다. 그 결과 기존의 부호화 방법과 비교해서 overall 부호화 성능이 AI와 RA에서 각각 0.01%, 0.04%의 부호화 효율이 증대되었다.

Effect of Dental Practicality Index training using an online video on decision-making and confidence level in treatment planning by dental undergraduates

  • Zhai Wei See;Ming Sern Lee;Abhishek Parolia;Shalini Kanagasingam;Shilpa Gunjal;Shanon Patel
    • Restorative Dentistry and Endodontics
    • /
    • 제49권1호
    • /
    • pp.8.1-8.12
    • /
    • 2024
  • Objectives: The purpose of this study was to evaluate the effect of Dental Practicality Index (DPI) training using an online video on the treatment planning decisions and confidence level of dental undergraduates (DUs). Materials and Methods: Ninety-four DUs were shown 15 clinical case scenarios and asked to decide on treatment plans based on 4 treatment options. The most appropriate treatment plan had been decided by a consensus panel of experienced dentists. DUs then underwent DPI training using an online video. In a post-DPI-training test, DUs were shown the same clinical case scenarios and asked to assign the best treatment option. After 6 weeks, DUs were retested to assess their knowledge retention. In all 3 tests, DUs completed the confidence level scale questionnaire. Data were analyzed using the related-samples Wilcoxon signed rank test and the independent-samples Mann-Whitney U test with the level of significance set at p < 0.05. Results: DPI training significantly improved the mean scores of the DUs from 7.53 in the pre-DPI-training test to 9.01 in the post-DPI-training test (p < 0.001). After 6 weeks, the mean scores decreased marginally to 8.87 in the retention test (p = 0.563). DPI training increased their confidence level from 5.68 pre-DPI training to 7.09 post-DPI training. Conclusions: Training DUs using DPI with an online video improved their decision-making and confidence level in treatment planning.

고유성분 분석과 휘도성분 흐름 특성을 이용한 내용기반 비디오 검색 (Content-Based Video Search Using Eigen Component Analysis and Intensity Component Flow)

  • 전대홍;강대성
    • 융합신호처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.47-53
    • /
    • 2002
  • 본 논문은 동영상의 대표프레임에서 eigen value와 휘도 성분을 이용한 내용기반 검색 기법에 관한 연구이다. video를 shot단위로 분할하여 shot을 대표하는 대표프레임을 얻어내고, 그 대표프레임을 Eigen Component Analysis(ECA)를 이용하여 데이터베이스를 생성하여 shot들의 휘도값 분포를 구한다. 생성된 코드북과 각 대표 프레임에 대한 코드북 인덱스 값, 휘도값을 database화하여 질의 영상과 video database간의 저장된 비디오들의 코드북과 코드워드간의 유클리디안 거리를 이용하여 유사도 높은 비디오를 찾고, 검색되어진 video에 포함된 대표프레임들의 코드북 인덱스 값과 입력 영상의 코드북 인덱스 값을 비교하여 입력 영상의 특징과 가장 유사한 대표프레임을 얻어낸다. 실험결과 제안된 방법이 검색에 있어서 영상의 형태에 대한 전체적인 특징을 제공하는 대표프레임의 eigen value와 휘도 성분을 이용함으로서 보다 검색 결과가 우수하며, 영상의 통계적인 특성을 이용함으로서 시간과 메모리 공간을 줄일 수 있음을 확인하였다.

  • PDF

영화의 쇼트리스트 데이터를 기반한 클라이맥스 표현 분석 (The Climax Expression Analysis Based on the Shot-list Data of Movies)

  • 임양미
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.965-976
    • /
    • 2016
  • 최근 디지털영상의 발달로 시청각 몰입에 대한 정량적 연구는 진행되고 있으나, 영화에서 내용이나 클라이맥스 부분의 영상을 정량적으로 분석하는 것은 거의 연구되지 않았다. 본 연구에서는 일반적인 영상표현 구성요소들인 쇼트사이즈(shot size), 카메라 앵글(camera angle), 카메라의 움직임의 방향(camera direction), 카메라 위치(camera position), 배우들의 대립 구도(objective & subjective) 등을 사용하여 정량적 분석을 진행하였다. 이들 사용에는 규칙이 있어 원칙을 파괴하는 부분의 영상 쇼트에서 주로 클라이맥스 효과를 볼 수 있다. 본 연구는 기존에 있는 영화들을 영상표현 구성 요소 기반으로 쇼트리스트 (shot-list)분석하여 클라이맥스 효과를 내기 위해 공통적으로 사용되는 몇 가지 방법들을 정량적으로 분석한다. 이와 같은 쇼트리스트 분석 기반의 클라이맥스 부분을 찾는 방법 제안은 영화와 같은 긴 영상에서 특정 부분만 검색하고 싶을 때, 영화의 장르를 검색하거나 색인화할 때 사용될 수 있다. 또한 검색된 일부 클라이맥스 영상과 유사 관련 정보를 제공하는 등의 다양한 정보 제공 서비스 분야에서 효용성이 높다고 할 수 있다.

컷 검출을 위한 동적 임계값 기법 (Dynamic Threshold Method For Cut Detection)

  • 윤인구;김우생
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1955-1961
    • /
    • 1999
  • 비디오 데이터는 비정형 데이터이고 정보의 양이 방대하기 때문에 내용기반 검색 방법이 필요하다. 비디오 데이터의 내용기반 검색을 위해서는 동영상 데이터의 색인이 필요한데, 일반적으로 비디오 색인을 하기 위한 시작점은 컷 검출이다. 본 논문에서는 컷 검출의 효율성을 향상시키기 위해서 컷 검출 과정 중 임계값이 동적으로 변화하는 동적 임계값 기법을 제안한다. 구현과 실험을 통하여 제안하는 방법이 기존의 방법보다 효율적임을 보였다. 6a A content-based search method is required for video which has an unformatted and huge size of data. The index technique is necessary for the content-based search of the video data. The first step of the video indexing is a cut detection. We propose a dynamic threshold method which changes a threshold value during the cut detection process. We demonstrate that the proposed method is more efficient than the existing methods.

  • PDF

Indexing and Retrieval of Human Individuals on Video Data Using Face and Speaker Recognition

  • Y.Sugiyama;N.Ishikawa;M.Nishida;Y.Ariki
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 Proceedings of International Workshop on Advanced Image Technology
    • /
    • pp.122-127
    • /
    • 1998
  • In this paper, we focus on the information retrieval of human individuals who are recorded on the video database. Our purpose is to index persons by their faces or voice and to retrieve their existing time sections on the video data. The database system can track as well as extract a face or voice of a certain person and construct a model of the individual person in self-organization mode. If he appears again at different time, the system can put the mark of the same person to the associated frames. In this way, the same person can be retrieved even if the system does not know his exact name. As the face and speaker modeling, a subspace method is employed to improve the indexing accuracy.

  • PDF