• 제목/요약/키워드: 영상 복잡도

검색결과 1,878건 처리시간 0.025초

효율적인 Pruning 기법을 이용한 부분 영상 검색 (Partial Image Retrieval Using an Efficient Pruning Method)

  • 오석진;오상욱;김정림;문영식;설상훈
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.145-152
    • /
    • 2002
  • 디지털 기술의 급속한 발전에 힘입어 사용자에게 유용한 디지털 영상들이 지수적으로 증가함에 따라, 내용 기반 영상 검색(CBIR ; Content-based Image Retrieval)은 가장 활발한 연구 분야 중 하나가 되었다 다양한 영상 검색 방법은 입력 질의 영상이 주어졌을 때, 질의와 유사한 영상들이 칼라(color)나 질감(texture) 같은 저 수준 특징을 기반으로 영상 데이터베이스에서 검색되도록 제안되어져 왔다. 그러나, 기존 검색 방법의 대부분은 부분 정합에 필요한 복잡도(complexity) 때문에 데이터베이스 내 전체 영상의 부분 영상을 입력 질의 영상으로 했을 경우를 고려하지 않았다. 이 논문에서 우리는 두 영상 사이의 칼라 히스토그램 관계를 이용함으로써 부분 영상 정합에 대한 효율적인 방법을 제시한다. 제안된 접근 방법은 두 단계로 구성되어 있다. 첫 번째 단계는 검색 공간을 pruning시키는 것이고 두 번째 단계는 부분 영상 정합을 통해 후보 영상들의 순위를 정하는 블록 기반 검색을 수행한다. 실험 결과는 pruning없이 부분 영상 정합만 사용하여 검색했을 때 시스템의 응답 시간이 높다고 가정을 하고 제안된 알고리즘의 실현 가능성을 보여준다.

H.264/AVC를 위한 영상 내용 기반 인트라 예측 부호화 (Image Contents Based Intra predictive Coding for H.264/AVC)

  • 신세일;김진태;오정수
    • 한국통신학회논문지
    • /
    • 제34권7C호
    • /
    • pp.681-686
    • /
    • 2009
  • H.264/Ave에서 p-프레임 부호화에 추가된 인트라 예측은 화질과 비트율 모두를 다소 개선시키고 있으나, 계산량을 크게 증가시키고 있다. 계산량의 증가를 줄이기 위해 본 논문은 최적 인트라 블록 모드가 매크로 블록의 영상 내용에 의존하는 특성을 이용한 영상 내용 기반 인트라 예측 부호화를 제안한다. 제안된 알고리즘은 영상 복잡도와 최적 인터 블록 모투로 매크로블록외 영상 내용을 평가하고, 영상 내용을 근거로 인트라 블록 모드를 선택하거나 배제한다. 모의실험 결과는 기존 알고리즘과 비교하여 제안된 알고리즘이 화질에서 평균 0.01 dB가 감소하교 비트휩l서 평균 0.38%가 증가하나, 부호화 계산 시간에서 평균 37.02% 의 큰 감소를 보여주고 있다.

시.공간적 상관도를 이용한 고속 H.264/AVC 전 영역 탐색 방법 (Fast H.264/AVC Full Search Algorithm using Spatial and Temporal Correlation)

  • 문지희;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.67-70
    • /
    • 2009
  • H.264/AVC 동영상 표준은 기존의 동영상 표준과 비교했을 때 뛰어난 압축률을 보인다. 특히 세밀한 움직임 예측을 통해 영상을 효율적으로 압축하지만 움직임 예측은 H.264/AVC 동영상 표준의 높은 복잡도의 원인 중 하나이다. 따라서 H.264/AVC의 부호화 시간을 단축하기 위해서는 고속 움직임 추정 기법이 필수적이다. 일반적으로 영상 신호는 인접한 화면과 매크로블록 사이에서 상관관계가 높고 부호화하고자 하는 매크로블록의 움직임벡터는 인접한 매크로블록에서 결정된 최적의 움직임 벡터와 유사한 방향성을 가진다. 그러므로 고정된 탐색 영역의 크기를 이용하면 불필요한 영역까지 움직임 예측 과정이 수행되어 계산량이 증가한다. 본 논문에서는 영상의 공간적, 시간적 상관도를 이용하여 탐색 영역의 크기를 결정하는 방법을 제안한다. 인접하는 블록들의 움직임 벡터의 표준편차를 이용하여 움직임이 작은 영역에서는 작은 탐색 영역을 이용하여 움직임 예측을 수행하고 반대로 움직임이 큰 영역에서는 큰 탐색 영역을 이용하여 움직임 예측을 수행한다. 또한 현재 화면과 참조 화면의 거리차가 클수록 참조 화면으로 선택되는 확률이 낮다는 사실을 이용하여 적응적으로 탐색 영역의 크기를 조절한다. 제안한 방법은 기존의 전 영역 탐색 방법과 유사한 부호화 성능을 보이면서 움직임 예측 시간이 평균 약 58.93% 감소하는 것을 확인할 수 있다.

  • PDF

다중 블록 크기의 움직임 예측과 SPECK을 이용한 고정 화질 움직임 보상 시간영역 필터링 동영상 압축 (Constant Quality Motion Compensated Temporal Filtering Video Compression using Multi-block size Motion Estimation and SPECK)

  • 박상주
    • 방송공학회논문지
    • /
    • 제11권2호
    • /
    • pp.153-163
    • /
    • 2006
  • 움직임 보상을 적용한 시간 영역 필터링(MCTF)을 이용한 화질 보장형의 새로운 동영상 압축 방식을 제안한다. SPECK은 그 자체의 단순한 알고리즘으로 인하여 빠른 동작 속도를 가지면서도 동시에 고주파 성분이 많은 영상의 압축에 탁월한 성능을 보여주는 우수한 웨이블릿 변환 기반의 영상 압축기법이다. 또한 제안한 계층적 구조의 다중 크기 블록 움직임 예측은 비교적 낮은 연산량에도 불구하고 기존의 고정 블록 크기의 움직임 예측기보다 우수한 성능을 보인다. 본 논문에서는 이러한 낮은 복잡도의 기술을 MCTF 기반 동영상 압축에 적용하여, 다중 재생률까지 지원이 가능한 동영상 압축 방식을 구현하였으며 H.263 압축방식에 비해 우수한 압축 성능을 보임을 확인하였다.

H.264/AVC 복호화기에서 복호된 인트라 모드 정보를 이용한 화면 해상도 변환 방법 (Image scaling scheme using the intra mode information in H.264/AVC decoder)

  • 채진기;한종기
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.296-299
    • /
    • 2013
  • 디스플레이 기술이 발전함에 따라 다양한 크기의 디스플레이를 탑재한 장치들이 등장하게 되었고, 다양한 디스플레이 크기만큼 다양한 해상도를 사용하고 있다. 때문에 비디오 코덱과 scaler는 보편적으로 함께 사용된다. 그러나 기존의 scaler는 비디오 코덱의 복호화기와 화면 해상도 변환 모듈이 독립적으로 구성되고, 서로 간에 정보를 이용하지 않으므로 시스템의 성능 개선에 한계가 존재하였다. 즉, 비디오 코덱의 복호화기는 비트스트림으로부터 복호한 정보를 바탕으로 영상을 복원하고, 복원영상은 up/down scaler에서 확대/축소를 수행한다. 하지만 비디오 코덱의 비트스트림에 존재하는 정보는 영상의 특성을 반영하기 때문에 up/down scaler에서 비디오 코덱의 복호화기에서 복호된 정보를 이용하면 복잡도의 증가 없이 효율적인 확대/축소를 수행할 수 있다. 이에 본 논문에서는 비디오 코덱 중 차세대 비디오 코덱인 H.264/AVC 복호화기에서 생성된 복원 영상에 대해서 별도로 영상의 특성을 계산하는 모듈 없이 H.264/AVC 복호화기에서 복원된 정보 중 인트라 모드 정보를 바탕으로 영상의 특성에 맞는 up/down scaler를 구현하는 방법을 제안한다. 이 방법은 기존의 scaler들보다 물체의 경계영역을 더 선명하게 확대하는 효과를 보인다.

  • PDF

CAD 정보를 잉용한 PCB 자동 시각 검사 시스템 (Automated Visual Inspection System of PCB using CAD Information)

  • 박병준;한광수
    • 한국멀티미디어학회논문지
    • /
    • 제12권3호
    • /
    • pp.397-408
    • /
    • 2009
  • 영상 학습은 컴퓨터를 이용한 자동 시각 검사에서 매우 중요하고 어려운 문제이다. 최근 생산되는 인쇄회로 기판(PCB : Printed Circuit Board)은 부품의 크기가 작아지고 회로 패턴이 점점 복잡해져서 신제품의 개발 주기가 짧고 다양한 제품들을 검사해야 하는 분야에서 어렵고 복잡한 학습 과정은 큰 문제가 되고 있다. 본 논문은 CAD(Gerber: 거버)파일을 이용하여 PCB 자동 시각 검사의 기준이 되는 참조 영상을 생성하였다. Gerber 파일로 생성된 참조 영상은 결함이 없는 PCB 패턴을 보장한다. 시스템의 구현과 실험을 통하여 Gerber 파일을 이용하여 PCB 자동 시각 검사 시스템의 학습 과정을 손쉽게 할 수 있는 방안을 제시하였다.

  • PDF

멀티미디어 시스템을 위한 영상내의 손 인식에 관한 연구 (A Study on Hand Recognition in Image for Multimedia System)

  • 정혜원;양환석
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.267-274
    • /
    • 2005
  • 본 논문에서는 별도의 센서 없이 영상만을 이용하여 실시간으로 손 영상을 인식하는 알고리즘을 제안한다. 손은 모양이 매우 복잡하기 때문에 2차원 모양의 불변량에 해당하는 에지의 방향성 히스토그램을 이용하여 인식을 행한다. 이 방법은 복잡한 배경에서 색상정보를 이용하여 손 영역이 정확히 추출되며 계산량이 적고 조명변화에 덜 민감하기 때문에 실시간 손 영상 인식에 적합하다. 본 논문에서는 손의 모양제시 방향이 변하는 경우에도 인식을 가능하게 하기 위해 주성분 분석법을 사용하여 인식오차를 줄이는 방법을 기술한다. 이 방법을 사용함으로써 손 영상이 3차원적으로 회전에 의해 변하는 경우도 인식가능하게 되었다. 또한 에지방향성 데이터를 이용하기에 주성분 공간 생성 시간을 현저히 줄이게 되었다.

  • PDF

다시점 콘텐츠 생성을 위한 PMD 카메라 및 Kinect 비교 (Comparison with PMD depth camera and Kinect camera for Multi-View contents)

  • 송혁;최병호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.240-241
    • /
    • 2011
  • 자연스러운 3D 실감영상을 감상하기 위해서는 많은 시점의 영상이 필요하며 과거 스테레오 디스플레이 장치로부터 최근 그 시점 수가 크게 늘어난 디스플레이 장치로 기술 발전이 이뤄지고 있으며 이에 따라 다시점 콘텐츠를 생성하기 위한 다양한 기술이 개발되어 있다. 다시점 콘텐츠를 생성하기 위하여 ToF 카메라 및 적외선 패턴을 이용한 방법이 주로 이용되고 있으며 이를 활용한 다시점 콘텐츠 생성을 하는 시도가 이뤄지고 있다. ToF 카메라는 PMD사의 제품 및 SwissRanger 사의 제품이 대표적이며 적외선 패턴을 이용한 방식은 MS사의 Kinect가 대표적이며 본 제품들을 활용한 기술 비교를 통하여 다시점 콘텐츠 생성의 결과 및 이를 비교한 장단점을 구분하였다. PMD사의 ToF 카메라는 두 개 이상의 광원을 사용하여 Depth 추출시에 Hole 영역의 크기가 작으나 ToF 영상의 해상도가 매우 작아 고화질의 콘텐츠를 생성하기 위하여 별도의 영상처리 알고리즘이 요구되었다. 반면 MS사의 Kinect는 Depth 영상의 해상도가 상대적으로 커서 영상처리 알고리즘의 복잡도가 작아지나 Depth 추출을 위한 카메라와 RGB 카메라의 위치가 공간적으로 떨어져 있어 이를 보정하기 위한 알고리즘이 요구되며 다시점 변환시 화질에 있어 상대적으로 떨어지는 것으로 나타났다.

  • PDF

$\pm$1LSB 이하의 오차를 가지는 복합 영상 부호화기의 설계 및 구현 (Design and Implementation of Video Encoder with Error less than $\pm$1 LSB)

  • 김주현;강봉순
    • 한국정보통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.1147-1152
    • /
    • 2004
  • 논문에서는 다양한 표준을 지원하는 NTSC, PAL 복합 영상 부호화기의 설계 및 구현에 관한 내용이다. 복합 영상 부호화기는 ITU-R BT.601 4:2:2, ITU-R BT.656, RGB중 하나의 입력을 받아서 NTSC, PAL등의 S-video 신호와 복합 영상 신호로 바꾸어 준다. 하드웨어 복잡도를 줄이기 위해서 곱셈기를 사용하지 않는 구조로 설계하였다. 명암 신호와 색차 신호를 위한 디지털 필터의 bit width는 하드웨어 설계 시 발생할 수 있는 오차를 1 least significant bit (LSB) 이하가 되도록 정하여 양질의 복합 영상 신호를 만들 수 있도록 하였다. 제안된 영상 부호화기는 Altera FPGA인 APEX20K600EBC652-3을 이용하여 실시간 검증을 수행하였다.

다중 참조 영상을 이용한 고속 H.264의 움직임 예측 모드 선택 기법 (Spatio-temporal Mode Selection Methods of Fast H.264 Using Multiple Reference Frames)

  • 권재현;강민정;류철
    • 한국통신학회논문지
    • /
    • 제33권3C호
    • /
    • pp.247-254
    • /
    • 2008
  • ITU-T와 MPEG에 의해 최근 표준화가 완성된 H.264는 가변 블록 크기 움직임 예측, 다중 참조 영상, 1/4화소단위 움직임 예측 및 보상, $4{\times}4$ 정수 단위 DCT, 비트율-왜곡 최적화(Rate-Distortion Optimization)등의 새로운 부호화 기술로 H.263, MPEG-4 등 기존 비디오 표준에 비해 더 좋은 부호화 효율을 제공하고 있다. 그러나 새로운 부호화 기술들은 H.264의 전반적인 복잡도를 심화시키는 주된 요인이므로, H.264의 실제 응용을 용이하게 하기 위해서는 이러한 기술에 대한 고속 알고리즘이 요구된다. 제안하는 방식은 부호화기의 복잡도에서 가장 큰 비중을 차지하는 가변 블록 크기 움직임 예측 부호화에서 부호화 모드를 효율적으로 생략함으로써 모드 결정을 빠르게 수행하는 고속 모드 결정법으로, 참조 영상의 수를 줄이는 방법과 예측 모드를 생략하는 방법으로 구분될 수 있다. 참조 영상의 수를 줄이는 방법의 경우 상위 $16{\times}16$ 매크로블록에서 최소의 SAD를 갖는 참조 영상을 선택하여 $16{\times}8$$8{\times}16$ 모드의 움직임을 예측하고, 이 중 다시 최적의 참조 영상을 선택하여 하위 모드의 움직임을 예측한다. 예측 모드를 생략하는 방법에서는 매크로블록의 가로와 세로 세분화 방향성을 이용하여 만약 $16{\times}16$ 모드가 선택될 경우, $8{\times}8$$4{\times}4$ 하위 모드만 수행하고, $16{\times}8$ 모드가 선택되면 $8{\times}4$, $8{\times}16$ 모드가 선택되면 $4{\times}8$ 모드에서만 움직임 예측을 수행할 수 있다. 실험 결과 모든 참조 영상을 사용하는 방식에 비해 평균 65%가량 속도가 향상된 반면 영상의 화질은 H.264 표준 및 기존 방식과 유사함을 PSNR을 통하여 증명한다.