• 제목/요약/키워드: Image Dictionary

검색결과 78건 처리시간 0.024초

이미지데이터 활용을 위한 문서인식시스템 연구 및 개발 (Research and Development of Document Recognition System for Utilizing Image Data)

  • 곽희규
    • 정보처리학회논문지B
    • /
    • 제17B권2호
    • /
    • pp.125-138
    • /
    • 2010
  • 본 연구는 공공기관이 소장한 이미지데이터의 검색 및 열람 등의 활용성을 높이기 위한 전문검색서비스 구현 시 필수적인 문서인식시스템의 고도화를 목표로 한다. 주요한 연구방향은 공공기관이 소장하고 있는 데이터를 사전에 분석하여 문서이미지 전처리 및 문서구조분석 기술을 개발하고, 문서인식 과정에서 활용하기 위한 이미지내용DB, 문자모델DB, 용어DB로 구성되는 특화된 지식베이스를 구축하는 것이다. 또한, 지식베이스 관리도구를 개발하여 향후 다양한 형태의 문서이미지로의 확장을 가능하게 한다. 최근 본 연구는 국가기록원에서 소장하고 있는 이미지데이터에 적합한 문서구조분석 라이브러리와 특화된 지식베이스를 결합한 문서인식 프로토타입 시스템 개발을 완료했다. 향후 본 연구의 결과는 방대한 소장자료의 검색 및 활용을 극대화할 전문검색시스템 연계를 위한 성능평가 및 테스트베드 구축에 활용될 것이다.

절대값 대칭성과 사전 분류를 이용한 고속 Matching Pursuit (Fast Matching Pursuit Using Absolute Symmetry and Classified Dictionary)

  • 오석병;전병우
    • 대한전자공학회논문지SP
    • /
    • 제39권2호
    • /
    • pp.11-21
    • /
    • 2002
  • 비디오 데이터 부호화를 위한 여러 가지 방법들 중 matching pursuit을 이용한 비디오 부호화 방법은 저속 채널상에서 뛰어난 효율을 보이고 있으나, 기존의 블록 기반 변환 부호화 방법에 비하여 연산량이 월등히 많기 때문에 비디오 부호화에 적용하는 데는 어려운 점이 있다 본 논문에서는 matching pursuit의 전체 계산량 중 가장 큰 비중을 차지하는 내적 연산량을 줄이기 위해 matching pursuit의 내적연산에 사용되는 1차원 사전(Dictionary)을 구성하는 각각의 기본 신호들의 절대값이 대칭성을 가진다는 특성과, 크게 화질에 영향을 주지는 않지만 연산량을 줄이는 데는 도움을 줄 수 있도록 변형된 사전을 사용할 수 있다는 것, 그리고 주파수 특성을 이용하여 2차원 사전이 미리 분류될 수 있다는 사실을 이용한다. 실험결과에 나타난 바와 같이 제안하는 방법은 큰 화질 열화 없이, Neff가 제안한 사전의 분리성(Separability)을 이용한 기존의 고속 방법보다 내적 연산량에 소요되는 곱셈량을 약 1/8로 감소시키는 효과를 가져온다.

사용자 편의성과 효율성을 증진하기 위한 신뢰도 높은 이미지-텍스트 융합 CAPTCHA (Reliable Image-Text Fusion CAPTCHA to Improve User-Friendliness and Efficiency)

  • 문광호;김유성
    • 정보처리학회논문지C
    • /
    • 제17C권1호
    • /
    • pp.27-36
    • /
    • 2010
  • 웹 서비스 신청 단계에서 신청자가 실제 인간 사용자임을 확인하기 위해 사용되는 텍스트 기반 캡차(text-based CAPTCHA)의 변형된 문자를 광학문자인식 기술로 파악하는 것이 가능하기에 캡차의 신뢰성이 떨어지는 문제가 발생하고 있다. 이 문제를 해결하기 위해 제안되었던 기존의 이미지 기반 캡차(image-based CAPTCHA)에서도 여러 문제점이 존재한다. 인공지능 프로그램을 사용하여 시스템이 보유하고 있는 제한된 수의 이미지 내용을 파악함으로써 신뢰도가 떨어지는 문제가 발생할 수 있으며, 제공된 이미지에 대해 사용자가 다른 유사한 단어를 입력하는 경우에는 오답으로 판정되어 반복적으로 캡차를 시도해야 하는 불편함이 발생 할 수 있으며 또한, 사용자에게 캡차 문제를 제공하기 위해 여러 이미지 파일을 전송해야 하기에 전송 비용의 비효율성 문제가 존재한다. 이러한 기존 이미지 기반 캡차의 문제점들을 해결하기 위해 본 논문에서는 이미지와 관련 키워드 일부를 융합하여 제공하는 이미지-텍스트 융합 캡차를 제안하였다. 본 논문에서 제안한 이미지-텍스트 융합 캡차에서는 이미지와 관련된 단어의 일부분을 힌트로 활용하여 쉽게 정답을 입력할 수 있도록 사용자 편리성을 제공하며 이미지와 텍스트를 한 이미지 파일 내에 융합시켰기 때문에 전송 비용을 절약하여 효율성을 증진할 수 있다. 또한, 캡차 시스템의 신뢰성 증진을 위해 인터넷 검색으로 캡차용 이미지를 대량으로 수집하도록 하였으며 수집되는 캡차 이미지의 정확성을 유지하기 위해 필터링 과정을 거치도록 하였다. 또한, 본 논문에서는 실제 실험을 통해 제안된 이미지-텍스트 융합 캡차가 기존 이미지 기반 캡차보다 사용자에게 편리하고 신뢰성이 증진될 수 있음을 입증하였다.

Hyperspectral Image Classification via Joint Sparse representation of Multi-layer Superpixles

  • Sima, Haifeng;Mi, Aizhong;Han, Xue;Du, Shouheng;Wang, Zhiheng;Wang, Jianfang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권10호
    • /
    • pp.5015-5038
    • /
    • 2018
  • In this paper, a novel spectral-spatial joint sparse representation algorithm for hyperspectral image classification is proposed based on multi-layer superpixels in various scales. Superpixels of various scales can provide complete yet redundant correlated information of the class attribute for test pixels. Therefore, we design a joint sparse model for a test pixel by sampling similar pixels from its corresponding superpixels combinations. Firstly, multi-layer superpixels are extracted on the false color image of the HSI data by principal components analysis model. Secondly, a group of discriminative sampling pixels are exploited as reconstruction matrix of test pixel which can be jointly represented by the structured dictionary and recovered sparse coefficients. Thirdly, the orthogonal matching pursuit strategy is employed for estimating sparse vector for the test pixel. In each iteration, the approximation can be computed from the dictionary and corresponding sparse vector. Finally, the class label of test pixel can be directly determined with minimum reconstruction error between the reconstruction matrix and its approximation. The advantages of this algorithm lie in the development of complete neighborhood and homogeneous pixels to share a common sparsity pattern, and it is able to achieve more flexible joint sparse coding of spectral-spatial information. Experimental results on three real hyperspectral datasets show that the proposed joint sparse model can achieve better performance than a series of excellent sparse classification methods and superpixels-based classification methods.

미디어 동기화를 지원하는 웹기반 멀티미디어 전자사전 시스템 (A Web-Based Multimedia Dictionary System Supporting Media Synchronization)

  • 최용준;황도삼
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1145-1161
    • /
    • 2004
  • 본 연구는 인터넷에 분산되어 있는 언어자원들의 미디어 데이터를 통합하여 멀티미디어 전자사전 시스템을 구축하는 기법을 연구하는 것으로, 텍스트 데이터를 기반으로 한 기존 전자사전 시스템을 멀티미디어 환경으로 발전시킨다. 이를 위하여 인터넷에 분산되어 있는 언어자원들의 미디어 데이터를 웹 브라우저 환경에서 통합하는 기법을 제안한다. 제안하는 기법은 미디어 통합데이터에 의해 웹 브라우저가 모든 작업을 수행하므로 복잡한 서버 시스템을 필요로 하지 않는다. 구현하는 전자사전은 웹 브라우저 환경에서 작동하며, 텍스트와 이미지 및 음성을 통합하여 합성하거나 움직임을 재생한다. 통합과 움직임의 데이터를 기술하기 위하여 각 미디어의 의미를 분석하여 SMIL 문서를 생성하고 웹 브라우저에서 실행하도록 하였다. 제안하는 멀티미디어 전자사전 시스템은 단순한 미디어 데이터들을 통합하는 방식으로 작동하므로 전용 서버 시스템을 필요로 하지 않는다. 또한, 각 미디어 데이터는 분산되어 있는 데이터를 공유하는 형태이므로 저장 공간을 절약하게 되며, 최근의 데이터로 갱신하는 것이 간단하게 이루어진다.

  • PDF

Dictionary Attack on Functional Transform-Based Cancelable Fingerprint Templates

  • Shin, Sang-Wook;Lee, Mun-Kyu;Moon, Dae-Sung;Moon, Ki-Young
    • ETRI Journal
    • /
    • 제31권5호
    • /
    • pp.628-630
    • /
    • 2009
  • Recently, Ratha and others proposed a cancelable biometrics scheme which transforms an original fingerprint template into a new one using a noninvertible transformation. However, we show that the original template is recovered by a dictionary attack if two transformed templates originating from it are revealed. In our attack, we simulate the transformation and construct a set of possible pre-images for each transformed template. Then, we find the correct pre-image by computing the intersection of these sets. We present an algorithm implementing this idea as well as successful experimental results.

명시야 현미경 영상에서의 세포 분할을 위한 이중 사전 학습 기법 (Dual Dictionary Learning for Cell Segmentation in Bright-field Microscopy Images)

  • 이규현;트란민콴;정원기
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권3호
    • /
    • pp.21-29
    • /
    • 2016
  • 본 논문은 명시야 (bright-field) 현미경 영상를 위한 데이터 기반 세포 분할 알고리즘을 제시한다. 제시된 알고리즘은 일반적인 사전 학습 기법과 다르게 동시에 두 개의 사전과 관련된 희소 코드 (sparse code)를 통해 정의된 에너지 함수의 최소화를 진행하게 된다. 두 개의 사전 중 하나는 명시야 영상에 대해 학습된 사전이고 다른 하나는 사람에 의해 수작업으로 세포 분할된 영상에 대해 학습된 것이다. 학습된 두 개의 사전을 세포 분할 될 새로운 입력 영상에 대해 적용하여 이와 관련된 희소 코드를 획득한 후 픽셀 단위의 분할을 진행하게 된다. 효과적인 에너지 최소화를 위해 합성곱 희소 코드 (Convolutional Sparse Coding)와 Alternating Direction of Multiplier Method(ADMM)이 사용되었고 GPU를 사용하여 빠른 분산 연산이 가능하다. 본 연구는 이전에 사용된 가변형 모델 (deformable model)을 이용한 세포 분할 방식과는 다르게 제시된 알고리즘은 세포 분할을 위해 사전 지식이 필요없이 데이터 기반의 학습을 통해서 쉽고 효율적으로 세포 분할을 진행할 수 있다.

Low-Rank Representation-Based Image Super-Resolution Reconstruction with Edge-Preserving

  • Gao, Rui;Cheng, Deqiang;Yao, Jie;Chen, Liangliang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3745-3761
    • /
    • 2020
  • Low-rank representation methods already achieve many applications in the image reconstruction. However, for high-gradient image patches with rich texture details and strong edge information, it is difficult to find sufficient similar patches. Existing low-rank representation methods usually destroy image critical details and fail to preserve edge structure. In order to promote the performance, a new representation-based image super-resolution reconstruction method is proposed, which combines gradient domain guided image filter with the structure-constrained low-rank representation so as to enhance image details as well as reveal the intrinsic structure of an input image. Firstly, we extract the gradient domain guided filter of each atom in high resolution dictionary in order to acquire high-frequency prior information. Secondly, this prior information is taken as a structure constraint and introduced into the low-rank representation framework to develop a new model so as to maintain the edges of reconstructed image. Thirdly, the approximate optimal solution of the model is solved through alternating direction method of multipliers. After that, experiments are performed and results show that the proposed algorithm has higher performances than conventional state-of-the-art algorithms in both quantitative and qualitative aspects.

영상 관찰 모델을 이용한 예제기반 초해상도 텍스트 영상 복원 (Example-based Super Resolution Text Image Reconstruction Using Image Observation Model)

  • 박규로;김인중
    • 정보처리학회논문지B
    • /
    • 제17B권4호
    • /
    • pp.295-302
    • /
    • 2010
  • 예제기반 초해상도 영상 복원(EBSR)은 고해상도 영상과 저해상도 영상간의 패치간 대응관계를 학습함으로써 고해상도 영상을 복원하는 방법으로, 한 장의 저해상도 영상으로부터도 고해상도 영상을 복원할 수 있는 장점이 있다. 그러나, 폰트의 종류나 크기가 학습 영상과 다른 텍스트 영상을 적용할 경우 잡영을 많이 발생시킨다. 그 이유는 복원 과정 중 매칭 단계에서 입력 패치들이 사전 내의 고해상도 패치와 부적절하게 매칭될 수 있기 때문이다. 본 논문에서는 이러한 문제점을 극복하기 위한 새로운 패치 매칭 방법을 제안한다. 제안하는 방법은 영상 관찰 모델을 이용하여 입력 영상과 출력 영상간의 상관 관계를 보존함으로써 잘못 매칭된 패치로 인한 잡영을 효과적으로 억제한다. 이는 출력 영상의 화질을 개선할 뿐 아니라, 다양한 종류 및 크기의 폰트를 포함한 대용량 패치 사전을 적용할 수 있게 함으로써 폰트의 종류 및 크기의 변이에 대한 적응력을 크게 향상시킨다. 실험에서 제안하는 방법은 폰트와 크기가 다양한 영상에 대하여 기존의 방법보다 우수한 영상 복원 성능을 나타내었다. 뿐만 아니라, 인식 성능도 88.58%에서 93.54%로 개선되어 제안하는 방법이 인식 성능의 개선에도 효과적임을 확인하였다.

비주얼 검색을 위한 위키피디아 기반의 질의어 추출 (Keyword Selection for Visual Search based on Wikipedia)

  • 김종우;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제21권8호
    • /
    • pp.960-968
    • /
    • 2018
  • The mobile visual search service uses a query image to acquire linkage information through pre-constructed DB search. From the standpoint of this purpose, it would be more useful if you could perform a search on a web-based keyword search system instead of a pre-built DB search. In this paper, we propose a representative query extraction algorithm to be used as a keyword on a web-based search system. To do this, we use image classification labels generated by the CNN (Convolutional Neural Network) algorithm based on Deep Learning, which has a remarkable performance in image recognition. In the query extraction algorithm, dictionary meaningful words are extracted using Wikipedia, and hierarchical categories are constructed using WordNet. The performance of the proposed algorithm is evaluated by measuring the system response time.