• 제목/요약/키워드: picture search

검색결과 110건 처리시간 0.023초

CNN-based Fast Split Mode Decision Algorithm for Versatile Video Coding (VVC) Inter Prediction

  • Yeo, Woon-Ha;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제8권3호
    • /
    • pp.147-158
    • /
    • 2021
  • Versatile Video Coding (VVC) is the latest video coding standard developed by Joint Video Exploration Team (JVET). In VVC, the quadtree plus multi-type tree (QT+MTT) structure of coding unit (CU) partition is adopted, and its computational complexity is considerably high due to the brute-force search for recursive rate-distortion (RD) optimization. In this paper, we aim to reduce the time complexity of inter-picture prediction mode since the inter prediction accounts for a large portion of the total encoding time. The problem can be defined as classifying the split mode of each CU. To classify the split mode effectively, a novel convolutional neural network (CNN) called multi-level tree (MLT-CNN) architecture is introduced. For boosting classification performance, we utilize additional information including inter-picture information while training the CNN. The overall algorithm including the MLT-CNN inference process is implemented on VVC Test Model (VTM) 11.0. The CUs of size 128×128 can be the inputs of the CNN. The sequences are encoded at the random access (RA) configuration with five QP values {22, 27, 32, 37, 42}. The experimental results show that the proposed algorithm can reduce the computational complexity by 11.53% on average, and 26.14% for the maximum with an average 1.01% of the increase in Bjøntegaard delta bit rate (BDBR). Especially, the proposed method shows higher performance on the sequences of the A and B classes, reducing 9.81%~26.14% of encoding time with 0.95%~3.28% of the BDBR increase.

선행조직자의 유형이 초등학생들의 과학개념 획득에 미치는 영향 (The Effects of Shape of Advance Organizers on Scientific Concept Attainment of Elementary School Students)

  • 김순식;이용섭
    • 대한지구과학교육학회지
    • /
    • 제5권2호
    • /
    • pp.197-203
    • /
    • 2012
  • The main purpose of this research is to search the effect of different types of advance organizers in elementary science classes, to the students in acquiring scientific concepts and its retentions. In order to proceed with the research, We have chosen 93 students of three different classes of fifth graders, studying in M elementary school in U metropolitan city. We have randomly chosen two classes as an experimental group and one class as a comparative group. In the first experimental group (Group1), advance organizer was put in a form of a sentence., and the second experimental group (Group2), advance organizer was put in a form of a picture. For the comparative group, We have not put any advance organizer, and the method of class was proceeded as it was before. The result of this research are as follows. Firstly, the result of 'One-way analysis of variance' on scientific concept grade, right after the experiment on three groups, has shown a meaningful difference that, the shape of advance organizer does affect the acquisition of elementary school students' scientific concept. Secondly, even though Group1, who was given with a sentence as an advance organizer, got higher scientific concept scores after the experiment than that of comparative group, However, there was not a meaningful difference between Group1 and comparative group. Thirdly, Group2, who was given with a picture as an advance organizer, has shown a meaningful difference from comparative group. Judging from the facts above, utilizing an advance organizer of a picture in elementary science class, will be very affective on students' acquiring scientific concept.

MPACS 시스템에서 Scalable 구조를 이용한 심장 조영상의 계층적 부호화에 관한 연구 (A Study on the Hierachical Coding of the Angiography by Using the Scalable Structure in the MPACS System)

  • 한영오;정재우;안진호;박종관;신중인;박상희
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1995년도 춘계학술대회
    • /
    • pp.235-238
    • /
    • 1995
  • In this paper, we propose an effective coding method of the angiography by using the scalable structure in the frequency domain for MPACS(Medical Picture Archiving and Communication System). We employed the subband decomposition method and MPEG-2 system which is the international standard coding method of the general moving picture. After the subband decomposition is applied to split an input image into 4 bands in the spatial frequency domain, the motion compensated DPCM coding method of MPEG-2 is carried out for each subband. As a result, an easily controllable coding Structure is accomplished by composing the compound hit stream for each subband group. Follows are the simulation results of the proposed sheme for the angiography. A scalable structure which can be easily controlled for a loss of transmission or the band limit can be accomplisbed in the MPEG-2 stucture by the subband decomposition minimizing the side information. And by reducing the search area of the motion vector between -4 and 3, the processing speed of a codec is enhanced by more than two times without a loss of the picture quality compare with the conventional DCT coefficients decompositon method. And the processing speed is considerably improved in the case of the parallel construction of each subband in the hardware.

  • PDF

이전 프레임의 시공간 모션 정보에 의한 예측 탐색 알고리즘 (A Prediction Search Algorithm by using Temporal and Spatial Motion Information from the Previous Frame)

  • 곽성근;위영철;김하진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제9권3호
    • /
    • pp.23-29
    • /
    • 2003
  • 비디오 시퀀스의 현재 블록의 모션 벡터와 이전 블록의 모션 백터는 시간적 상관성을 갖고 있다. 따라서 이전 프레임 블록들로부터 많은 정보를 얻을 수 있다면 현재 블록의 오션 추정에 대한 성능을 높일 수 있고 또한 탐색 횟수를 줄임으로써 계산 복잡도를 크게 줄일 수 있다. 본 논문에서는 이전 프레임 블록과 주위 블록들의 모션 벡터로부터 예측된 모션 정보를 구하여, 이를 탐색 원점으로 사용하지 않고, 탐색 구간에 따라 적응적으로 해당 초기점으로 탐색 원점을 이동시켜 고속 탐색 패턴을 이용하여 블록 정합을 수행하는 블록 정합 모션 추정 방식을 제안한다. 실험 결과 제안된 방식은 기존의 예측 탐색 방식들에 비해 PSNR 값에 있어서 평균적으로 0.33~0.37[dB] 개선되고 영상에 따라 최고 1.05[dB] 정도 우수한 결과를 나타내었다. 또한 탐색 횟수에서는 기존의 탐색 알고리즘보다 29~97%를 줄일 수 있었고, 정확한 모션 벡터를 찾는 비교에 있어서도 월등히 우수한 결과를 나타내었다. 제안된 방식은 정량적인 결과뿐만 아니라 부호화후 복호화한 영상의 화질에 있어서도 다른 고속 탐색 알고리즘보다 월등히 우수한 화질을 제공한다.

  • PDF

다중연산구조기반의 고밀도 성능향상을 위한 움직임추정의 디인터레이싱 방법 (Deinterlacing Method for improving Motion Estimator based on multi arithmetic Architecture)

  • 이강환
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.49-55
    • /
    • 2007
  • 본 논문에서는 필드/프레임의 공간적, 시간적 움직임 특성을 활용한 디인터레이스드 기법을 이용해 재구성된 영상프레임으로부터 넓은 탐색영역에서의 움직임추정이 가능한 이중연산구조 기반의 다해상도 계층적 움직임 추정 방식(multi- resolution hierarchical motion estimation, MHME)의 효율적인 다중연산구조 기반의 움직임 추정을 제안한다. 공간적, 시간적 움직임 특성으로부터 디인터레이스드 기법을 적용하여 재구성된 영상프레임으로부터는 계층적 움직임 추정방식을 적용하여 빠른 움직임 영역에서도 화질의 열화가 거의 없는 다해상도 계층적 움직임 추정(MHME) 영상처리를 구현하였고, 비교적 높은 PSNR을 얻을 수 있었다. 다양한 모드 M=2 또는 M=3의 여러 가지 모의실험을 통해 제안된 구조가 전역탐색 블록정합 알고리듬(Full-search Block Matching Algorithm, FBMA)에 대하여 예측성능에 있어 최고 1.49dB(CAR), 최저0.421dB(Mobile & Calendar)의 모의실험결과 평균 -0.7dB 정도의 미소한 평균 PSNR 저하를 나타내었다. 이의 구현을 위해 제안된 전역/후역 탐색방식의 연산처리방식은 하나의 처리기소자(Processor Element, PE)에 이중연산처리기(DAPE) 구조를 채택하여 제한된 PE로부터 넓은 탐색영역에서의 움직임 추정이 가능한 전역/후역 탐색방식(Foreground & Background Search Algorithm, FBSA)의 비트 처리열 탐색 알고리듬을 제안 적용하여 움직임추정 연산의 성능을 구조적으로 향상시키는 다중프로세서 어레이 구조(Multiple Processor Array Unit, MPAU)를 개발 제안하였다.

대용량 멀티미디어 데이터의 내용 기반 검색을 위한 고확장 지원 색인 기법 (A Scalable Index for Content-based Retrieval of Large Scale Multimedia Data)

  • 최현화;이미영;이규철
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.726-730
    • /
    • 2009
  • 카메라 기술의 발전 및 사용자 중심의 인터넷 패러다임인 웹 2.0을 토대로 멀티미디어 데이터가 급증하면서, 멀티미디어 검색은 인터넷 서비스로서 그 중요성이 날로 증가되고 있다. 현재 멀티미디어 검색은 단순한 키워드(keyword) 검색에 의존하고 있는 실정으로, 정보 검색의 정확도 및 사용자의 만족도를 충족시키기 위해서는 내용 기반 검색 지원이 필요하다. 본 논문에서는 대용량의 멀티미디어 데이터의 내용 기반 검색을 지원하기 위하여, 데이터의 분포에 따른 다중 길이의 시그니처를 기반으로 한 새로운 분산 인덱스 구조를 제안한다. 제안하는 인덱스 구조는 고차원 데이터의 클러스터링에 따라 데이터의 분포를 분석하여 서로 다른 요약 파일을 분산 생성하고, 이를 기반으로 유사 검색을 병렬로 수행할 수 있도록 설계되었다. 그리하여, 클러스터 환경 하에서 고차원 데이터의 분산 저장이 용이하고, 각 노드들은 서로 다른 시그니처 파일을 기반으로 검색을 병렬 수행함으로써 효율적인 검색을 지원한다.

  • PDF

고속 움직임 예측기 구현에 관한 연구 (A Study on Implementation of the Fast Motion Estimation)

  • 김진연;박상봉;진현준;박노경
    • 한국통신학회논문지
    • /
    • 제27권1C호
    • /
    • pp.69-77
    • /
    • 2002
  • 오늘날 통신 기술이 나날이 발전하고 있지만 디지털 영상신호가 방대한 데이터를 가지고 있기 때문에 데이터의 저장, 처리 및 전송을 위해서는 보다 많은 데이터 압축이 필요하게 되었다. 이에 따라 ITU-T에서는 디지털 영상신호의 압축 표준을 위해서 H.26x 등을 제정하였다. 일반적으로 영상처리에서는 픽쳐간 상관 관계를 이용하여, 픽쳐간의 움직임 예측을 통한 시간적 중복성을 제거하여 데이터를 크게 압축하는 것이 많이 사용되고 있다. 대부분의 비디오 코팅 시스템에서 움직임 예측/보상(Motion Estimation/Compensation)방법으로 블록 정합 알고리즘을 사용하는데 이는 특정한 비용 함수의 최소 값을 기반으로 사용되고 있다. 그러나 이 방법은 많은 수의 계산을 필요로 하여 탐색 시간이 오래 걸리는 단점이 있다. 따라서 H.26x에서와 같은 실시간 저비트율 부호화를 위해서는 전역 탐색법 보다는 효율적인 고속 탐색 알고리즘이 효과적이다. 본 논문에서는 움직임 예측에 소요되는 탐색 시간을 줄이기 위해서 고속 탐색 알고리즘 중에서 Nearest-Neighbors 탐색 알고리즘을 이용하여 움직임 예측기를 FPGA로 설계하였으며, VHDL로 코딩(Coding)하고, Xilinx Foundation을 이용하여 설계 및 검증하였다.

Web을 기반으로 한 대학교 도서관 시스템에 있어서 용이한 인터페이스에 관한 연구 (Study on the Convenient Interface to the University Web-based Library System)

  • 이현정;정재욱
    • 디자인학연구
    • /
    • 제15권1호
    • /
    • pp.93-100
    • /
    • 2002
  • 대학 web도서관은 web으로 도서관에 소장된 서지나 기타 자료의 검색, 대출, 반납에 관한 정보의 처리가 가능하도록 되어 있는 도서관의 형태이다. 정보화 사회에 진입 한 이후 네트워크와 멀티미디어란 것의 등장으로 인해 정보전달 및 획득의 수단과 과정에 있어서 엄청난 변화를 겪고 있다. 이미지 화, 동영상 화 된 방대한 멀티미디어 정보들이 네트 워크를 통해 정보 제공자와 정보 사용자간의 물리적 거리에 대한 한계를 느끼지 못하게 되었다. 하지만, 이에 따르는 문제점으로는 저작잔 인식부족, 인프라의 미비, 기술적, 신뢰성 등으로 인해 발전이 요구되는 상태이다. 본 논문에서는 국정 대학 평가 기준에 근거하여 20개 대학의 web기반 도서관 site에서, 각 시스템별 검색 형식과 user interface를 비교, 분석하였다. 이에 기초하여 web기반 대학 도서관의 실험적 user interface를 제작하고, 이 interface에 대한 설문조사 및 데이터를 수집, 정리, 분석하였다. 이 결과를 현재web기반 대학도서관의 일반검색 시스템의 인터페이스에 적용하여 도서의 위치, 도서의 대출 및 검색회수, 대학 web도서관 내에서의 도서구입에 대한 기능을 포함하는 새로운 user interface를 제안하였다.

  • PDF

객체지향형 처방 데이터베이스의 구축과 처방 검색 프로그램의 설계 및 개발 (Construction of Object-oriented Prescription Database and Design/Development of Prescription Search Program)

  • 김현호;홍효신;유제혁;권오민;차웅석
    • 한국한의학연구원논문집
    • /
    • 제17권2호
    • /
    • pp.73-83
    • /
    • 2011
  • The first medical text in which detailed treatments of diseases by combinations of materia medica are mentioned is the "Shanghanzabinglun(傷寒雜病論)". True meaning of the combinations of materia medica used in this text lies in the fact that the efficacy of a prescription transcends that of the linear sum of each materia medica. This kind of concept regarding the composition of a prescription has come to contribute to the formation of theories in prescriptionology; However, it is difficult to analyze and interpret the meaning of each prescription separately because of differences in interpreting methods, points of view, and terminologies used by members of different academical branches. Therefore, it is desirable that one should understand a prescription as having been modified from a basic prescription, and then bring the interactions of ingredients into the picture, finally understanding the efficacy and chief virtues of the targeted prescription. Nevertheless, with the massive information of prescriptions, which exist in the format of texts, it is impossible to efficiently take advantage of prescription analyzing methods, and therefore the range of analysis extremely restricted. In order to overcomes these weaknesses, this paper suggests that object-oriented prescription database be constructed and that a search program for education and research that could facilitate an efficient access to the database be developed as well.

가산 투영을 이용한 2단계 고속 블록정합 알고리즘 (Two-Stage Fast Block Matching Algorithm Using Integral Projections)

  • 김준식;박래홍;이병욱
    • 전자공학회논문지B
    • /
    • 제30B권1호
    • /
    • pp.45-55
    • /
    • 1993
  • In this paper, a two-stage block matching algorithm (BMA), which can reduce greatly the computational complexity of the conventional BMAs, is proposed, in which the onedimensional distortion measure based on the integral projection is introduced to determine the candidate motion vectors and then among them a final motion vector is detected based on the conventional two-dimensional distortion measure. Due to the one-dimensional calculation of a distortion measure, the proposed algorithm can reduce the computational complexity of the conventional BMA (full search method with a 16$\times$16 block) by a factor of 4, with its performance comparable to those of the conventional ones. Simulation results based on the original and noisy image sequences are shown. Also the simulation of the proposed method combined with the MPEG (Moving Picture Experts Group) SM3 (Simulation Model Three) is presented. Computer simulation shows that the proposed algorithm is fast with its performance comparable to those of the conventional ones.

  • PDF