• 제목/요약/키워드: Image Dictionary

검색결과 77건 처리시간 0.038초

Sparse Representation based Two-dimensional Bar Code Image Super-resolution

  • Shen, Yiling;Liu, Ningzhong;Sun, Han
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권4호
    • /
    • pp.2109-2123
    • /
    • 2017
  • This paper presents a super-resolution reconstruction method based on sparse representation for two-dimensional bar code images. Considering the features of two-dimensional bar code images, Kirsch and LBP (local binary pattern) operators are used to extract the edge gradient and texture features. Feature extraction is constituted based on these two features and additional two second-order derivatives. By joint dictionary learning of the low-resolution and high-resolution image patch pairs, the sparse representation of corresponding patches is the same. In addition, the global constraint is exerted on the initial estimation of high-resolution image which makes the reconstructed result closer to the real one. The experimental results demonstrate the effectiveness of the proposed algorithm for two-dimensional bar code images by comparing with other reconstruction algorithms.

가변 적응형 사전을 이용한 텍스트 압축방식의 병렬 처리를 위한 VLSI 구조 (A Novel VLSI Architecture for Parallel Adaptive Dictionary-Base Text Compression)

  • 이용두;김희철;김중규
    • 한국정보처리학회논문지
    • /
    • 제4권6호
    • /
    • pp.1495-1507
    • /
    • 1997
  • 컴퓨터 통신망의 발달로 다량의 텍스트(Text) 또는 영상(Image) 정보의 전달이 이루어 지고 있다. 텍스트 압축과정에서 주어진 어휘를 이전에 나타난 같은 어휘를 가리키는 포인터로 대치시키는 원리에 준하여 설계된 LZ77 알고리즘은 가변적응형(adaptive) 사전을 이용한 텍스트 압축 방식으로 실제적으로 가장 많이 사용되는 알고리즘이다. 본 논문은 LZ77의 병렬 처리를 위해 LZ77의 Parallelism에 대한 분석 결과를 보여주며, 그 분석 결과를 적용한 병렬 LZ77 알고리즘의 설계, 그리고 그러한 병렬 LZ77 알고리즘을 처리하도록 고안된 VLSI 시스템 구조에 관한 연구 내용을 기술한다. 이전의 유사한 연구 내용과 비교하여, 본 논문에서 제안된 VLSI 시스템은 사전 윈도우(dictionary window)의 크기에 제한이 없으므로 확장성이 뛰어난 장점을 갖으며, 입력 텍스트의 길이가 (N)일때, 사전 윈도우의 크기에 관계없이 그 처리속도가 O(N)이며 VLSI 구현시 다른 유사한 시스템보다 향상된 집적도를 갖는다.

  • PDF

역전파 알고리듬과 사전을 이용한 필기체 영문자 인식 (A Recognition of Handwritten English Characters Using Back Propagation Algorithm and Dictionary)

  • 김응성;조성환;이근영
    • 한국통신학회논문지
    • /
    • 제18권2호
    • /
    • pp.157-168
    • /
    • 1993
  • 본 논문에서는 역전파 알고리듬으로 학습된 신경회로망과 사전을 이용하여 필기체 영문자 인식을 수행하였다. 스캐너를 이용하여 입력된 영상화일로부터 불필요한 데이터 부분을 제거하고 문자의 다양성을 최소화하기 위해서 여러가지 전처리과정, 즉 문자분리, 중심변환, 잡음제거, 배율조정과 세선화과정을 거쳤다. 다음으로 세선화된 문체 패턴으로부터 문자의 특징이 추출되고, 신경회로망에 시험데이터에 대한 특징들을 학습시켰다. 그리고 테스트할 영문자에 대해서도 특징들을 추출하여 이미 학습된 신경회로망에 의해 분류하였다. 마지막으로 학습시간을 줄이고 인식율을 향상시키기 위한 방법과 학습시간과 은닉층의 노드수에 대해 고찰하였다. 실험 결과로서 이와 같은 시스템으로 필기체 영문제에 대하여 학습후에 약 93%의 높은 인식율을 얻을 수 있었을 사전을 이용했을 경우 인식율이 약 97%였다.

  • PDF

다중 스케일 얼굴 영역 딕셔너리의 적대적 증류를 이용한 얼굴 초해상화 (Face Super-Resolution using Adversarial Distillation of Multi-Scale Facial Region Dictionary)

  • 조병호;박인규;홍성은
    • 방송공학회논문지
    • /
    • 제26권5호
    • /
    • pp.608-620
    • /
    • 2021
  • 최근 딥러닝 기반의 얼굴 초해상화 연구는 일반적인 영상에 대한 초해상화 연구와 달리 인간의 얼굴이 가지는 구조적 혹은 의미론적인 특성을 반영한 안면 랜드마크 정보, 주요 영역 딕셔너리와 같은 사전 및 참조 정보를 사용하여 우수한 초해상화 결과를 보였다. 그러나 얼굴에 특화된 사전 정보를 사용할 시 추가적인 처리 소요 시간과 메모리를 요구하는 단점이 존재한다. 본 논문은 앞서 언급한 한계점을 극복하고자 지식 증류 기법을 활용한 효율적인 초해상화 모델을 제안한다. 주요 얼굴 영역 기반의 딕셔너리 정보를 사용하는 선생 모델에 지식 증류 기법을 적용하여 추론 시 랜드마크 정보와 부가적인 딕셔너리 사용이 필요 없는 학생 모델을 구축하였다. 제안하는 학생 모델은 특징맵 기반의 적대적 지식 증류를 통해 얼굴 주요 영역 딕셔너리를 가지고 있는 선생 모델로부터 학습을 진행하였다. 본 논문은 제안하는 학생 모델의 실험 결과를 통해 정량 및 정성적으로 우수함을 보이며 선생 모델의 연산량에 비해 90% 이상 절감되는 효율성을 증명한다.

낮은 복잡도의 준무손실 압축을 위한 향상된 예측 기법 (Enhanced Prediction for Low Complexity Near-lossless Compression)

  • 손지덕;송병철
    • 방송공학회논문지
    • /
    • 제19권2호
    • /
    • pp.227-239
    • /
    • 2014
  • 본 논문은 영상처리용 SoC에서 외부 메모리 대역폭을 효과적으로 낮추기 위한 near-lossless 이미지 코더의 압축 성능을 향상시키는 새로운 예측 기법을 제안한다. 먼저, RGB 간 correlation을 고려하여 이미 복원된 G 성분을 기반으로 R과 B 성분을 효과적으로 예측하는 inter-color prediction을 수행한다. 다음으로 가변 블록 예측을 통해 예측 성능을 향상시킨다. 마지막으로 이전 프레임에서 sampling된 템플릿 dictionary를 이용해 G 성분 예측 시 최소한의 내부 메모리만을 사용하여 시간 축 예측 성능을 개선시키는 방법을 제안한다. 실험 결과를 통해 자연 영상의 경우 기존 기법 대비 평균적으로 약 30%의 코딩 효율 향상을 보이고, CG 영상의 경우에는 평균 60% 정도의 성능 향상을 보임을 알 수 있다.

적응적 2차원 FIR 필터를 이용한 부화소 렌더링 기법 (Sub-Pixel Rendering Algorithm Using Adaptive 2D FIR Filters)

  • 남연오;최익현;송병철
    • 전자공학회논문지
    • /
    • 제50권3호
    • /
    • pp.113-121
    • /
    • 2013
  • 본 논문은 학습 기반의 2D-FIR필터를 이용한 부화소 렌더링 기법을 제안한다. 제안 기법은 크게 학습 단계와 합성 단계로 나뉜다. 학습 단계에서는 충분히 많은 수의 저해상도/고해상도의 영상 블록 쌍들을 이용하여 고해상도/저해상도 블록의 관계에 따른 합성 정보를 계산하고, 그 합성 정보를 담은 소위 사전을 생성한다. 합성 단계에서는 각 입력 영상에 대응하는 후보 블록을 상기 학습된 사전에서 찾는다. 탐색된 사전 내 합성 정보를 이용하여 부화소 레벨의 축소된 블록을 합성함으로써 최종 축소 영상을 얻는다. 한편, 영상 합성 시 디스플레이 장치의 RGB 패턴을 고려한 필터링을 통해 선명도를 향상시킨다. 모의 실험을 통해 제안 기법이 일반적인 영상축소 기법에 비해 흐림 효과, 엘리어싱 등의 화질 열화없이 고화질의 축소 영상을 생성함을 확인하였다.

COMMUNITY-GENERATED ONLINE IMAGE DICTORNARY

  • Li, Guangda;Li, Haojie;Tang, Jinhui;Chua, Tat-Seng
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.178-183
    • /
    • 2009
  • Online image dictionary has become more and more popular in concepts cognition. However, for existing online systems, only very few images are manually picked to demonstrate the concepts. Currently, there is very little research found on automatically choosing large scale online images with the help of semantic analysis. In this paper, we propose a novel framework to utilize community-generated online multimedia content to visually illustrate certain concepts. Our proposed framework adapts various techniques, including the correlation analysis, semantic and visual clustering to produce sets of high quality, precise, diverse and representative images to visually translate a given concept. To make the best use of our results, a user interface is deployed, which displays the representative images according the latent semantic coherence. The objective and subjective evaluations show the feasibility and effectiveness of our approach.

  • PDF

Object Cataloging Using Heterogeneous Local Features for Image Retrieval

  • Islam, Mohammad Khairul;Jahan, Farah;Baek, Joong Hwan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권11호
    • /
    • pp.4534-4555
    • /
    • 2015
  • We propose a robust object cataloging method using multiple locally distinct heterogeneous features for aiding image retrieval. Due to challenges such as variations in object size, orientation, illumination etc. object recognition is extraordinarily challenging problem. In these circumstances, we adapt local interest point detection method which locates prototypical local components in object imageries. In each local component, we exploit heterogeneous features such as gradient-weighted orientation histogram, sum of wavelet responses, histograms using different color spaces etc. and combine these features together to describe each component divergently. A global signature is formed by adapting the concept of bag of feature model which counts frequencies of its local components with respect to words in a dictionary. The proposed method demonstrates its excellence in classifying objects in various complex backgrounds. Our proposed local feature shows classification accuracy of 98% while SURF,SIFT, BRISK and FREAK get 81%, 88%, 84% and 87% respectively.

중국의 문화관광 공연작품 <장한가>에 나타난 영상이미지 효과 분석 (Analysis on Video Image Effect in , China's Performing Arts Work of Cultural Tourism)

  • 육정학
    • 한국콘텐츠학회논문지
    • /
    • 제13권6호
    • /
    • pp.77-85
    • /
    • 2013
  • 본 연구는 중국 최초의 대형 역사 무용극을 표방한 서안의 <장한가> 라는 작품 속에 들어있는 영상이미지의 공연효과를 분석하고자 한 것이다. 즉 <장한가> 작품 속에 들어 있는 특정 주제, 소재들을 표현함에 있어 어떠한 영상이미지를 사용하여 공연의 효과를 거두고 있는가에 대한 것이다. 영상이란 '사물의 모습이 반영된 상', 특히 영화, 텔레비전, 사전 등의 이미지를 의미하는 말로 그 범위는 매우 넓으며 image의 어원은 imitary에 근거를 둔 것으로 구체적 또는 심적으로 나타낼 수 있는 시각적 표시를 말한다. 따라서 영상이미지는 '영상'과 '이미지' 라는 동의어의 결합으로 볼 수 있는데 여기서 영상이란 단순히 시나리오의 문학성, 연극성, 미술성 등과 같이 전통적인 예술장르의 종합이 아니라 모든 예술의 본원적 기능을 통합하고 인간존재의 오묘한 이미지 활동을 연결한 결과로서의 총체라고 보는 것이다. 연구결과는 다음과 같다. <장한가>에 표현되는 영상 이미지의 효과로 첫째, 시대성과 문화를 반영한 함축적 의미의 표현 효과 둘째, 상상적 동일시 효과, 셋째, 장면전환의 효과 넷째, 몰입을 통한 극적 재미의 효과, 다섯째, 공연의 입체감을 통한 시각적 효과가 있음을 알 수 있었다.

ICT 활용 지리수업을 위한 DB형 교수-학습 자료 개발 (The Development of DB-type Teaching and Learning Material for Geography Instruction Using a Method of ICT)

  • 최원회;조남강;장길수;박종승;최규학;신기진;백종렬;현경숙;신홍철
    • 대한지리학회지
    • /
    • 제38권2호
    • /
    • pp.275-291
    • /
    • 2003
  • ICT(Information & Communication Technology) 활용 지리수업을 위해서는 데이터베이스(database, 이하, ‘DB' 라 칭함)형 교수-학습 자료를 개발하는 것이 필수적이다. 이러한 DB형 교수-학습자료는 WBI(Web Based Instruction. 웹기반수업)에서의 지리이미지자료 사용상의 문제점을 극복해 줄 대안으로 간주된다. 이를 위하여 본 구에서는 우선 지리이미지 데이터베이스 프로그램(이하. '지리이미지 DB 프로그램' 이라 칭함)을 기반으로 CD-ROM 형태의 지리이미지 전자사전(이하, 'GEO-DB' 라 칭함)을 제작했다. GEO-DB에는 3,060개의 지리이미지가 원자료로 수록되어 있는데, 이러한 자료들은 온라인과 오프라인 상에서 교사와 학습자가 공동으로 수집한 것이다. GEO-DB에는 교사와 학습자 모두 지리이미지 자료를 단순하게 활용함은 물론. 임의적으로 자료의 가공이 가능하도록 포트폴리오 기능을 첨부했는데, 이러한 포트폴리오 기능은, 특히 학습자의 자기주도적 학습능력의 신장에 기여하고자 한 것이다 GEO-DB는 사용의 수월성, 검색의 신속성 및 확장의 무한성을 갖고 있어서, 지리 교수-학습에서 ICT의 활용 가능성을 극대화시켜 줄 수 있고. 학습자의 지리학습능력의 신장과 지리학습태도의 변화에 크게 기여할 수 있는 것으로 교사와 학습자에 의해 평가되었다.