• Title/Summary/Keyword: Vector Image

검색결과 1,576건 처리시간 0.034초

Bi-GRU 이미지 캡션의 서술 성능 향상을 위한 Parallel Injection 기법 연구 (Parallel Injection Method for Improving Descriptive Performance of Bi-GRU Image Captions)

  • 이준희;이수환;태수호;서동환
    • 한국멀티미디어학회논문지
    • /
    • 제22권11호
    • /
    • pp.1223-1232
    • /
    • 2019
  • The injection is the input method of the image feature vector from the encoder to the decoder. Since the image feature vector contains object details such as color and texture, it is essential to generate image captions. However, the bidirectional decoder model using the existing injection method only inputs the image feature vector in the first step, so image feature vectors of the backward sequence are vanishing. This problem makes it difficult to describe the context in detail. Therefore, in this paper, we propose the parallel injection method to improve the description performance of image captions. The proposed Injection method fuses all embeddings and image vectors to preserve the context. Also, We optimize our image caption model with Bidirectional Gated Recurrent Unit (Bi-GRU) to reduce the amount of computation of the decoder. To validate the proposed model, experiments were conducted with a certified image caption dataset, demonstrating excellence in comparison with the latest models using BLEU and METEOR scores. The proposed model improved the BLEU score up to 20.2 points and the METEOR score up to 3.65 points compared to the existing caption model.

칼라 히스토그램 정제를 이용한 특징벡터 기반 영상 검색 알고리즘 (Image retrieval algorithm based on feature vector using color of histogram refinement)

  • 강지영;박종안;백정욱
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.376-379
    • /
    • 2008
  • 내용기반 영상검색(CBIR)에서 보다 효율적이고 빠른 영상검색을 위하여 본 논문에서는 칼라 히스토그램 정제를 이용한 특정벡터 기반 영상검색 알고리즘을 제안한다. RGB 칼라 이미지에서 각각의 R, G, B를 분할하고 히스토그램을 추출하여 16개의 영역(bin)으로 균일하게 분할한 다음 R, G, B 각각의 히스토그램에서 영역의 픽셀값을 계산하여 비교, 분석하고 그중 최고값을 추출한다. 그리고 R, G, B 각각의 영역의 최고값들을 이용하여 칼라 정보를 인덱스화 한 후 그 특정값을 이용한 영상 검색 기술을 수행한다. 본 논문에서 제안한 알고리즘은 효과적인 특정 추출을 위하여 각각의 R, G, B에서 추출 된 특정값을 특정벡터 테이블로 구성하여 입력 영상과 데이터베이스 영상을 비교하고 매칭도와 순위를 구하여 기존의 히스토그램만을 이용한 알고리즘 보다 더 나은 검색 결과를 확인하였다.

  • PDF

데이터 의존성과 벡터왜곡척도를 이용한 개선된 프랙탈 칼라영상 복호화 (An Improved Fractal Color Image Decoding Based on Data Dependence and Vector Distortion Measure)

  • 서호찬;정태일;류권열;권기룡;문광석
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.289-296
    • /
    • 1999
  • 본 논문에서는 데이타 의존성과 벡터왜곡척도를 이용하여 개선된 칼라영상을 복호화하였다. 프랙탈칼라영상의 복원방법은 Zhang과 Po의 벡터왜곡척도를 이용한 RGB 칼라 성분간의 상관관계를 고려하여 부호화한 압축파일을 사용하여 수렴 될 복원영상을 부호화시 만들어진 변환표의 정보를 바탕으로 참조된 정 의 역 부분이 기존의 독립적인 반복변환에 의해 수렴되었고 참조되지 않은 부분의 정의역은 데이타의존성을 갖는 영역으로 이미 수렴된 부분에 존재하므로 마지막 반복변환시 한번만에 복호화가 가능하다. 데이타의존성 부분이 차지 하는 만큼 복호화 과정에서 불필요한 계산량이 제거되었고, R영역에서 검색한 데이타 의존영역을 G,B영역에 그대로 사용하여 고속복호화가 가능하였다.

  • PDF

디지털 영상의 허프 변환에 의한 미디언 필터링 포렌식 분류 (Forensic Classification of Median Filtering by Hough Transform of Digital Image)

  • 이강현
    • 전자공학회논문지
    • /
    • 제54권5호
    • /
    • pp.42-47
    • /
    • 2017
  • 본 논문에서는 디지털 영상의 배포에서, 위 변조에 사용되는 미디언 필터링 (Median Filtering : MF)을 분류하는 포렌식 검출 알고리즘을 제안한다. 이러한 문제를 해결하기 위한 특징벡터는 영상의 에지 검출량 정보 32, 64, 128에 대한 허프변환(Hough Transform)에 의하여, 각 허프라인 (Hough Line)의 양끝 좌표값과 Angle-Distance 좌표상의 허프픽크치 (Hough Peaks)를 조합하여 42-Dim.으로 구성하였다. 변조된 영상들 중에서 미디언 필터링을 분류하는 검출기는 SVM (Support Vector Machine)에서 특징벡터를 학습하여 구현되었다. 제안된 미디언 필터링 검출 알고리즘은 특징벡터의 길이가 10-Dim.의 MFR (Median Filtering Residual) 스킴 및 686-Dim.의 SPAM (Subtractive Pixel Adjacency Matrix) 스킴과 비교하여 원영상, 평균필터링 ($3{\times}3$), JPEG (QF=90, 70) 압축, 가우시안 필터링 ($3{\times}3$, $5{\times}5$) 영상 모두에서 미디언 필터링의 포렌식 분류율이 99% 이상의 성능을 확인하였다.

적응 분할과 벡터 근사에 기반한 고차원 이미지 색인 기법 (High-Dimensional Image Indexing based on Adaptive Partitioning ana Vector Approximation)

  • 차광호;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권2호
    • /
    • pp.128-137
    • /
    • 2002
  • 이 논문은 고차원 이미지 데이타의 효율적인 색인을 위한 LCP+-file을 제시한다. 멀티미디어 데이타의 사용이 증가하면서 고차원 이미지 데이타의 색인과 검색의 지원에 대한 요구가 증가하고 있다. 최근에 고차원 데이타의 색인을 위해 벡터 근사에 기반한 LPC-file (5)이 개발되었다. LPC-file은 특히, 데이터 집합이 균일하게 분포할 때는 좋은 성능을 나타내지만 클러스터(cluster)를 이를 때는 성능이 하락한다. 본 논문은 강하게 클러스터를 이루는 이미지 데이타 집합에 대해 LPC-file의 성능을 향상시킨 LCP+-file을 제시한다. 기본 아이디어는 고밀도 클러스터를 갖는 부분 공간을 찾기 위해 데이타 공간을 적응적으로 분할하고, 그 공간에 대해 벡터 근사의 식별 능력을 향상시키기 위해 더 많은 수의 비트를 할당한다. 그러나 분할된 공간이 비트들을 공유하기 때문에 사용되는 전체 비트 수는 오히려 줄어든다. 실험 결과에 따르면 LCP+-file은 강하게 클러스터를 이루는 이미지 데이터 집합에 대해 LPC-file의 성능을 크게 향상시킨다.

움직이는 카메라에 의한 변화하는 환경하의 강인한 배경 획득 및 유동체 검출 (Robust background acquisition and moving object detection from dynamic scene caused by a moving camera)

  • 김태호;조강현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.477-481
    • /
    • 2007
  • A background is a part where do not vary too much or frequently change in an image sequence. Using this assumption, it is presented a background acquisition algorithm for not only static but also dynamic view in this paper. For generating background, we detect a region, where has high correlation rate compared within selected region in the prior pyramid image, from the searching region in the current image. Between a detected region in the current image and a selected region in the prior image, we calculate movement vector for each regions in time sequence. After we calculate whole movement vectors for two successive images, vector histogram is used to determine the camera movement. The vector which has the highest density in the histogram is determined a camera movement. Using determined camera movement, we classify clusters based on pixel intensities which pixels are matched with prior pixels following camera movement. Finally we eliminate clusters which have lower weight than threshold, and combine remained clusters for each pixel to generate multiple background clusters. Experimental results show that we can automatically detect background whether camera move or not.

  • PDF

투영 벡터의 형상 정보를 이용한 영상검색 (Image Retrieval Considering Shape Information of Projection Vector)

  • 권동현;이태홍
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권4호
    • /
    • pp.651-656
    • /
    • 2001
  • 히스토그램 인터섹션은 영상에서 컬러가 가지는 값의 빈도 수를 이용하여 간단하면서도 효율적으로 영상을 검색하는 방법으로, 영상의 글로블 특성을 잘 나타내는 반면 영상에서의 위치 정보가 누락되어 다른 영상을 동일 영상으로 인지하기 쉽고, 영상 내에 포함된 형상 정보를 표현하는 적절한 방법은 아니다. 영상에 대한 1차원 투영을 이용하면 영상의 개략적인 형상 정보와 함께 위치 정보를 나타낼 수 있어 히스토그램의 단점을 극복할 수 있지만, 영상 크기에 따라 투영 벡터의 길이가 달라져 색인 데이타로 사용하기에는 문제가 있다. 본 논문에서는 투영벡터에서 영상이 가지는 형상 정보의 첨두치를 이용하여 첨두치들 간의 상대거리 및 최대 첨두치에 관한 정보를 검색에 사용하였다. 검색 성능의 확인을 위하여 히스토그램 인터섹션 및 투영벡터만을 이용한 경우의 검색 결과와 비교하였고, 실험 결과를 이용하여 각 방법의 장단점을 분석하였다.

  • PDF

A Mechanical Sensorless Vector-Controlled Induction Motor System with Parameter Identification by the Aid of Image Processor

  • Tsuji Mineo;Chen Shuo;Motoo Tatsunori;Kawabe Yuki;Hamasaki Shin-ichi
    • KIEE International Transaction on Electrical Machinery and Energy Conversion Systems
    • /
    • 제5B권4호
    • /
    • pp.350-357
    • /
    • 2005
  • This paper presents a mechanical sensorless vector-controlled system with parameter identification by the aid of image processor. Based on the flux observer and the model reference adaptive system method, the proposed sensorless system includes rotor speed estimation and stator resistance identification using flux errors. Since the mathematical model of this system is constructed in a synchronously rotating reference frame, a linear model is easily derived for analyzing the system stability, including motor operating state and parameter variations. Because it is difficult to identify rotor resistance simultaneously while estimating rotor speed, a low-accuracy image processor is used to measure the mechanical axis position for calculating the rotor speed at a steady-state operation. The rotor resistance is identified by the error between the estimated speed using the estimated flux and the calculated speed using the image processor. Finally, the validity of this proposed system has been proven through experimentation.

Vector Quantization for Medical Image Compression Based on DCT and Fuzzy C-Means

  • Supot, Sookpotharom;Nopparat, Rantsaena;Surapan, Airphaiboon;Manas, Sangworasil
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -1
    • /
    • pp.285-288
    • /
    • 2002
  • Compression of magnetic resonance images (MRI) has proved to be more difficult than other medical imaging modalities. In an average sized hospital, many tora bytes of digital imaging data (MRI) are generated every year, almost all of which has to be kept. The medical image compression is currently being performed by using different algorithms. In this paper, Fuzzy C-Means (FCM) algorithm is used for the Vector Quantization (VQ). First, a digital image is divided into subblocks of fixed size, which consists of 4${\times}$4 blocks of pixels. By performing 2-D Discrete Cosine Transform (DCT), we select six DCT coefficients to form the feature vector. And using FCM algorithm in constructing the VQ codebook. By doing so, the algorithm can make good time quality, and reduce the processing time while constructing the VQ codebook.

  • PDF

Lifting Scheme과 PVQ를 이용한 영상압축 기법 (An Image Compression Technique with Lifting Scheme and PVQ)

  • 정전대;김학렬;신재호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1996년도 학술대회
    • /
    • pp.159-163
    • /
    • 1996
  • In this paper, a new image compression technique, which uses lifting scheme and pyramid vector quantization, is proposed. Lifting scheme is a new technique to generate wavelets and to perform wavelet transform, and pyramid vector quantization is a kind of vector quantization which dose not have codebook neither codebook generation algorithm. For the purpose of realizing more compression rate, an arithmetic entropy coder is used. Proposed algorithm is compared with other wavelet based image coder and with JPEG which uses DCT and adaptive Huffman entropy coder. Simulation results showed that the performance of proposed algorithm is much better than that of others in point of PSNR and bpp.

  • PDF