• 제목/요약/키워드: Image description

검색결과 340건 처리시간 0.028초

객체 위치 관계의 8AB 표현을 이용한 내용 기반 영상 검색 기법 (Content Based Image Retrieval using 8AB Representation of Spatial Relations between Objects)

  • 주찬혜;정진완;박호현;이석룡;김상희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권4호
    • /
    • pp.304-314
    • /
    • 2007
  • 내용 기반 영상 검색(CBIR)은 영상 내용의 특성 기술을 이용하여 영상을 저장하고 검색하는 기법이다. 좀더 정확한 영상 검색을 지원하기 위하여 영상 내용을 좀 더 효과적으로 기술할 수 있는 특성의 개발이 필요하게 되었다. 현재 주로 사용되고 있는 낮은 레벨의 색상, 질감, 형태 등의 특성은 인간의 인지와 직접적으로 연관이 되지 않으며, 여러 개의 객체가 포함되어 있는 영상은 잘 기술하지 못한다는 단점을 가진다. 이러한 단점을 보완하기 위하여 영상 검색 분야의 연구는 높은 레벨의 특성에 대한 연구로 진행되게 되었다. 높은 레벨의 특성은 좀 더 인간의 인지와 유사한 형식으로 영상을 기술하며, 대표적인 특성으로는 객체간의 위치 관계 표현 등이 있다. 하지만 객체간의 위치 관계 표현에 대한 이전의 연구들은 회전된 영상은 검색하지 못한다는 단점이 있다. 하지만 회전 불변(rotation invariant)은 정확한 영상 검색을 위한 특성 기술에 있어 중요하다. 본 논문에서는 객체간의 위치 관계를 효과적으로 표현하기 위한 높은 레벨의 특성인 8AB(8 Angular Bin)라는 새로운 기법을 제안한다. 8AB 기법은 회전 불변을 지원한다. 제안한 기법을 이용한 유사도 계산 및 검색 기법 역시 제안되었다. 또한 본 논문에서는 검색 시간을 단축하기 위한 검색 공간 축소 기법을 제안하였다. 이러한 기법들을 이용하여 실제 데이타와 합성 데이타를 사용한 실험을 행하여 제안된 기법의 유효성 및 검색 공간 축소 기법의 성능을 보였다.

효율적인 불량화소 검출 알고리듬 및 하드웨어 구현 (An Efficient Dead Pixel Detection Algorithm and VLSI Implementation)

  • 안지훈;이원재;김재석
    • 대한전자공학회논문지SD
    • /
    • 제43권9호
    • /
    • pp.38-43
    • /
    • 2006
  • CMOS image sensor는 집적회로 구현이 가능하여 사이즈를 줄일 수 있고 저전력으로 구현이 가능하며 효율적인 영상처리를 할 수 있다는 장점을 갖고 있다. 그러나 불량화소의 발생은 곧 화질의 저하로 연결되기 때문에 불량화소를 검출하는 방법에 대한 연구가 필요하다. 본 논문에서는 CMOS image sensor에 사용되는 효율적인 불량화소 검출 알고리듬과 그 하드웨어를 제안하였다. 불량화소를 검출하기 위하여 본 논문에서 제안한 방법은 Scan, Trace, Detection의 단계를 거친다. 시뮬레이션 결과 특정 조건에서는 99.99%의 불량화소 걸출 성공률을 나타냈다. 제안된 알고리듬은 Verilog HDL로 구현되었으며, 0.25 CMOS standard cell library에서 3.2k개의 게이트 수를 갖는다.

Multicasting Multiple Description Coding Using p-cycle Network Coding

  • Farzamnia, Ali;Syed-Yusof, Sharifah K.;Fisal, Norsheila
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권12호
    • /
    • pp.3118-3134
    • /
    • 2013
  • This paper deliberates for a multimedia transmission scheme combining multiple description coding (MDC) and network coding (NC). Our goal is to take advantage from the property of MDC to provide quantized and compressed independent and identically distributed (iid) descriptions and also from the benefit of network coding, which uses network resources efficiently to recover lost data in the network. Recently, p-cycle NC has been introduced to recover and protect any lost or distorted descriptions at the receiver part exactly without need of retransmission. So far, MDC have not been explored using this type of NC. Compressed and coded descriptions are transmitted through the network where p-cycle NC is applied. P-cycle based algorithm is proposed for single and multiple descriptions lost. Results show that in the fixed bit rate, the PSNR (Peak Signal to Noise Ratio) of our reconstructed image and also subjective evaluation is improved significantly compared to previous work which is averaging method joint with MDC in order to conceal lost descriptions.

Image classification and captioning model considering a CAM-based disagreement loss

  • Yoon, Yeo Chan;Park, So Young;Park, Soo Myoung;Lim, Heuiseok
    • ETRI Journal
    • /
    • 제42권1호
    • /
    • pp.67-77
    • /
    • 2020
  • Image captioning has received significant interest in recent years, and notable results have been achieved. Most previous approaches have focused on generating visual descriptions from images, whereas a few approaches have exploited visual descriptions for image classification. This study demonstrates that a good performance can be achieved for both description generation and image classification through an end-to-end joint learning approach with a loss function, which encourages each task to reach a consensus. When given images and visual descriptions, the proposed model learns a multimodal intermediate embedding, which can represent both the textual and visual characteristics of an object. The performance can be improved for both tasks by sharing the multimodal embedding. Through a novel loss function based on class activation mapping, which localizes the discriminative image region of a model, we achieve a higher score when the captioning and classification model reaches a consensus on the key parts of the object. Using the proposed model, we established a substantially improved performance for each task on the UCSD Birds and Oxford Flowers datasets.

큐브맵을 사용한 구면 영상에서의 평면 텍스처 대치 (Planar Texture Replacement in Spherical Images using Cubemap)

  • 박정현;박종승
    • 한국게임학회 논문지
    • /
    • 제17권6호
    • /
    • pp.153-164
    • /
    • 2017
  • 구면 파노라마 영상에서는 심한 구면 왜곡으로 인하여 기존의 평면 패턴의 탐색 방법인 SURF가 올바르게 작동되지 않는다. 평면 패턴은 구면 영상에서 왜곡되어 나타나므로 구면 파노라마 영상에서의 패턴 탐색 및 다른 텍스처로의 대치는 평면 영상의 경우와 다르게 처리되어야 한다. 본 논문에서는 구면 파노라마 영상을 큐브맵 영상으로 변환하고 구면 왜곡이 제거된 평면 영상에서 SURF를 사용하여 패턴을 탐색하고 해당 평면 텍스처를 대치한 후 다시 구면 파노라마 영상으로 변환하는 구면 파노라마 영상에서의 평면 대치 방법을 제안한다.

PLI를 이용한 OLED 드라이버 IC의 기능 검증 방법 (Functional verification method of OLED driver IC using PLI)

  • 김정학;김석윤
    • 대한전자공학회논문지SD
    • /
    • 제44권6호
    • /
    • pp.83-88
    • /
    • 2007
  • 본 논문에서는 유기발광다이오드 구동 IC의 기능을 검증하기 위하여 PLI(Programing Language Interface)를 이용한 검증방법을 제안한다. 기능 검증을 하기 위하여 HDL(Hardware Description Language) 시뮬레이터와 PLI, GUI(Graphic User Interface) 환경의 이미지 뷰어를 이용한다. 본 논문에서 제안하는 유기발광다이오드 구동 IC의 기능 검증 방법을 이용 할 경우 종래의 기능 검증 방법을 이용 할 때 보다 40배의 실행 시간 이득을 얻을 수 있다. 제안한 방법을 이용할 경우 디스플레이 구동 IC의 설계 단계에서 기능 검증을 효율적으로 할 수 있을 것이다.

Signature 기법을 이용한 면의 특징 표현 및 분할 기법 (Surface Segmentation and Feature Description using the Signature Technique)

  • 이보형;한헌수
    • 전자공학회논문지S
    • /
    • 제34S권12호
    • /
    • pp.90-97
    • /
    • 1997
  • This paper presents a new algorithm for surface segmentation and feature description. The algorithm extracts the signature of an edge image based on the signature technqique[12] in the first stage. If there exists a range in the angle axis where more than two signatures form a closed curve, we can conclude there is a surface inside the range. Using this feature of the signature, surfaces can be segmented. The surface features such as number of vertices, number of edges, and type of surfaces can also be extracted by finding the signatures of individual surfaces. This algorithm has distinguished advantages: it can easily recover the lost part occuring in the edge iage using the curve fitting method and it can extract surface features even when surfaces are rotated in 3-D space.

  • PDF

멀티미디어 데이터 검색 기법

  • 김경창
    • 정보과학회지
    • /
    • 제10권5호
    • /
    • pp.32-41
    • /
    • 1992
  • 멀티미디어 데이터베이스에서는 영상(image), 음향(sound) 등과 같은 멀티미디어 데이터의 복잡한 구조로 인해 데이터 조작이 기존의 데이터베이스에서 처럼 단순하지 않다. 데이터베이스로부터 멀티미디어 데이터를 검색하는 데 있어서 중요한 것은 사용자의 질의와 멀티미디어 데이터의 내용(content)를 매칭하는 것이다. 일반적인 해결책은 키워드를 사용하거나 멀티미디어 데이터의 내용과 사용자 질의를 묘사하고 있는 텍스트 묘사(text description)를 사용하는 것이다. 이 때의 주된 문제점은 사용자나, 다른 시점의 같은 사용자가 동일한 개체(entity)를 다르게 서술하여 멀티미디어 데이터 내용의 묘사 (description) 와 사용자 질의의 묘사가 정확하게 매치되지 못한 데 있다. 그러므로 멀티미디어 데이터를 검색하는 동안에, 저장된 멀티미디어 데이터와 사용자 질의의 묘사들간에 근사(approximate) 매치가 통상 요구된다. 본 논문에서는 객체지향 및 자연어 인식 기법을 통하여 근사매치에 지능적(intelligent) 으로 접근하는 방법을 제안한다.

  • PDF

환자 정보 통합 관리 시스템의 개발 (Integrated Patient Information Management System)

  • 정석희;박승훈;우응제
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 추계학술대회
    • /
    • pp.45-47
    • /
    • 1996
  • we developed an information management system that manages various types of medical information such as text, image, sound, and laboratory data. We also developed a multimedia description system, in which medical doctors can describe his findings and interpretations with text and speech. The descriptions include the references to the data items stored in the information management systems. The communication between the description system and the information management systems is carried out using OLE/COM mechanism. The information management system was implemented by using Microsoft Open Data Base Connectivity(ODBC).

  • PDF

A Real-Time Histogram Equalization System with Automatic Gain Control Using FPGA

  • Cho, Jung-Uk;Jin, Seung-Hun;Kwon, Key-Ho;Jeon, Jae-Wook
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제4권4호
    • /
    • pp.633-654
    • /
    • 2010
  • High quality camera images, with good contrast and intensity, are needed to obtain the desired information. Images need to be enhanced when they are dark or bright. The histogram equalization technique, which flattens the density distribution of an image, has been widely used to enhance image contrast due to its effectiveness and simplicity. This technique, however, cannot be used to enhance images that are either too dark or too bright. In addition, it is difficult to perform histogram equalization in real-time using a general-purpose computer. This paper proposes a histogram equalization technique with AGC (Automatic Gain Control) to extend the image enhancement range. It is designed using VHDL (VHSIC Hardware Description Language) to enhance images in real-time. The system is implemented with an FPGA (Field Programmable Gate Array). An image processing system with this FPGA is implemented. The performance of this image processing system is measured.