• Title/Summary/Keyword: 문서영상 분석

Content based data search using semantic annotation (시맨틱 주석을 이용한 내용 기반 데이터 검색)

  • Kim, Byung-Gon;Oh, Sung-Kyun
    • Journal of Digital Contents Society
    • v.12 no.4
    • pp.429-436
    • 2011
  • Various documents, images, videos and other materials on the web has been increasing rapidly. Efficient search of those things has become an important topic. From keyword-based search, internet search has been transformed to semantic search which finds the implications and the relations between data elements. Many annotation processing systems manipulating the metadata for semantic search have been proposed. However, annotation data generated by different methods and forms are difficult to process integrated search between those systems. In this study, in order to resolve this problem, we categorized levels of many annotation documents, and we proposed the method to measure the similarity between the annotation documents. Similarity measure between annotation documents can be used for searching similar or related documents, images, and videos regardless of the forms of the source data.

Classification for Hafltone Images and Non-Halftone Images Using Characteristics of Color Distribution (칼라분포특성을 이용한 해프톤 영상과 비해프톤 영상의 분류 방법)

  • 변지윤;김민환;박창민;김종민;김성영
    • Proceedings of the Korea Multimedia Society Conference
    • 2001.06a
    • pp.133-137
    • 2001
  • 본 논문에서는 해프톤 영상의 칼라 분포 특성을 이용하여 해프톤 영상과 비해프톤 영상을 분류하는 방법에 대해 연구하였다. 이를 위해 스캐닝한 RGB 해프톤 영상을 HSV 칼라 모델로 변환한 후, Hue에 대한 히스토그램에서 해프톤 영상이 갖는 고유한 칼라분포 특성을 분석하였다. 일반적으로 해프톤 영상에서는 인쇄시 사용된 칼라들로 인해 특정 Hue 값을 갖는 픽셀의 빈도가 비해프톤 영상과 달리 피크(peak) 형태로 높게 나타나는 특성이 있다. 본 논문에서는 이러한 특성을 고려하여 해프톤 영상과 비해프톤 영상을 구분할 수 있는 분류 방법을 개발하였으며, 실험을 통해 그 타당성을 검토하였다. 제안한 방법은 내용기반 검색시스템에서의 영상분류과정과 문서영상분할 분야 등에서 활용할 수 있다.

A Study on High-speed Image Binarization Using SIMD (SIMD를 이용한 영상의 고속 이진화에 관한 연구)

  • Kim, Doo-Sik;Lee, Sang-Ho;Kim, Byeong-Geun
    • Annual Conference of KIPS
    • 2002.11a
    • pp.775-778
    • 2002
  • 영상 이진화란 명도 영상(gray-scaled image)을 이진 영상(bi-leveled image)으로 변환하는 것을 말한다. 영상 이진화는 문서 인식, 비디오 영상 분석 등과 같이 영상처리 분야에서 많이 사용되는 기본적인 영상 처리 과정에 해당한다. 본 논문은 Intel 사의 Pentium 계열 프로세서에서 지원하는 SIMD(Single-Instruction Multiple-Data) 기술을 이용하여 영상 이진화를 고속으로 수행하는 방법을 소개한다. 우편영상에 대하여 실험한 결과, SSE2 명령어로 구현된 프로그램은 기존의 C 언어로 구현된 프로그램에 비하여 4배 이상의 속도 향상을 보였다.

Document Image Segmentation by the Statistical Distribution Analysis of Wavelet Coefficients (웨이블릿 계수의 통계적 이산 분석을 이용한 문서 영상 분할)

  • Lee, In-Sue;Kim, Min-Soo;Kim, Woo-Sung;Hahn, Kwang-Rok
    • Annual Conference of KIPS
    • 2000.10b
    • pp.927-930
    • 2000
  • 본 논문은 문서 영상에 대해 투영을 사용하여 영역을 나누었고 각 영역에 대해 고주파 밴드의 웨이블렛 계수의 통계적 분산과 히스토그램을 기반으로 한 두 가지 특징을 사용하여 문자와 그림으로 분류하였다. 투영으로 나누어진 영역들에 대해 일정 크기의 블록으로 나누고 두 가지 특징에 따라 문자와 그림으로 분류하였다. 따라서 투영에 의해 나뉜 영역 중 문자와 그림이 혼합되어 의미가 모호한 영역에 대해 잘못 분류되는 가능성을 줄일 수 있었다.

Performance Analysis of Adaptive Corner Shrinking Algorithm for Decimating the Document Image (문서 영상 축소를 위한 적응형 코너 축소 알고리즘의 성능 분석)

  • Kwak No-Yoon
    • Journal of Digital Contents Society
    • v.4 no.2
    • pp.211-221
    • 2003
  • The objective of this paper is performance analysis of the digital document image decimation algorithm which generates a value of decimated element by an average of a target pixel value and a value of neighbor intelligible element to adaptively reflect the merits of ZOD method and FOD method on the decimated image. First, a target pixel located at the center of sliding window is selected, then the gradient amplitudes of its right neighbor pixel and its lower neighbor pixel are calculated using first order derivative operator respectively. Secondly, each gradient amplitude is divided by the summation result of two gradient amplitudes to generate each local intelligible weight. Next, a value of neighbor intelligible element is obtained by adding a value of the right neighbor pixel times its local intelligible weight to a value of the lower neighbor pixel times its intelligible weight. The decimated image can be acquired by applying the process repetitively to all pixels in input image which generates the value of decimated element by calculating the average of the target pixel value and the value of neighbor intelligible element. In this paper, the performance comparison of proposed method and conventional methods in terms of subjective performance and hardware complexity is analyzed and the preferable approach for developing the decimation algorithm of the digital document image on the basis of this analysis result has been reviewed.

Seal Detection in Scanned Documents (스캔된 문서에서의 도장 검출)

  • Yu, Kyeonah;Kim, Kyung-Hye
    • Journal of the Korea Society of Computer and Information
    • v.18 no.12
    • pp.65-73
    • 2013
  • As the advent of the digital age, documents are often scanned to be archived or to be transmitted over the network. The largest proportion of documents is texts and the next is seal images indicating the author of the documents. While a lot of research has been conducted to recognize texts in scanned documents and commercialized text recognizing products are developed as highlighted the importance of the scanned document, information about seal images is discarded. In this paper, we study how to extract the seal image area from the color or black and white document containing the seal image and how to save the seal image. We propose a preprocessing step to remove other components except for the candidate outlines of the seal imprint from scanned documents and a method to select the final region of interest from these candidates by using the feature of seal images. Also in case of a seal imprint overlapped with texts, the most similar image among those stored in the database is selected through the template matching process. We verify the implemented system for a various type of documents produced in schools and analyze the results.

A Design and Implementation of the System Analyzing Computer Programs Using Java on WWW (웹 상에서 JAVA를 이용한 컴퓨터 프로그램분석 시스템의 설계 및 구현)

  • 최돈은;이재영;서영상
    • Proceedings of the Korean Information Science Society Conference
    • 1999.10b
    • pp.670-672
    • 1999
  • 인터넷의 빠른 보급으로 인해 교육용 시스템은 독립형 교육시스템에서 최신의 정보를 실시간으로 얻을 수 있는 웹 기반 교육시스템으로 변화하고 있다. 본 연구에서는 학습자들이 제공한 프로그램을 관리자가 교육시스템내에서 구조체와 함수 단위로 분석한다. 분석된 구조체와 함수는 구조체 파일과 함수 파일로 파일 시스템에 저장되고, 저장된 구조체 파이과 함수 파일의 정보는 데이터베이스에 추가된다. 그 후, 제공된 소스 파일을 HTML문서로 변환하는 과정에서 구조체와 함수는 데이터베이스에서 구조체와 함수 파일을 찾게되고, 발견하면 각각의 파일 정보를 이용하여,

Development of Internet Online Survey System (인터넷 온라인 설문조사 시스템 개발)

  • Jeon, Seung-Won;Lee, Won-Ho;Jung, Jin-Ho;Shim, Jae-Jeong;Ko, Sung-Jea
    • Proceedings of the Korean Information Science Society Conference
    • 1998.10a
    • pp.403-405
    • 1998
  • 인터넷을 이용한 설문조사는 기존의 설문조사에 비해 저렴한 비용으로 빠른 시간내에 결과를 분석할 수 있다는 장점으로 인해 점점 이용이 증가하고 있다. 본 논문에서는 인터넷 상에서 온라인으로 설문문서의 작성에서부터 설문조사, 결과분석, 처리 및 가시화에 이르는 전 광정을 자동화한 새로운 설문조사 시스템을 제안한다. 제안하는 시스템은 설문문서 자동생성기를 통하여 설문조사 웹 페이지를 누구나 쉽게 만들 수 있고 CGI를 이용하여 인터넷과 데이터베이스를 자동으로 연동하였으며 자바 애플릿을 사용하여 설문결과를 그래프로 가시화 하였다. 또한 음성이나 동영상 등의 멀티미디어 파일을 첨부함으로써 설문대상자들의 관심과 흥미를 유도하여 설문결과의 신뢰도를 높였다. 그리고 제안하는 시스템을 이용하여 인터넷 상에서 실제 설문조사를 실시하여 시스템의 활용 가능성을 확인하였다.

Font Classification using NMF and EMD (NMF와 EMD를 이용한 영문자 활자체 폰트분류)

  • Lee, Chang-Woo;Kang, Hyun;Jung, Kee-Chul;Kim, Hang-Joon
    • Proceedings of the Korean Information Science Society Conference
    • 2004.04b
    • pp.688-690
    • 2004
  • 최근 전자화된 문서 영상을 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문서의 자동 분류에 관한 많은 연구가 발표되고 있다. 본 논문에서는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법을 제안한다. 제안된 방법은 폰트의 구분 특징들이 공간적으로 국부성을 가지는 부분으로 표현될 수 있다는 가정을 바탕으로, 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 학습된 폰트의 특징들은 계층적 군집화 알고리즘을 이용하여 템플릿을 생성하고, 테스트 패턴을 분류하기 위하여 템플릿 패턴과의 EMD(earth mover's distance)를 사용한다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들의 폰트 식별을 위한 적절성을 보였다. 제안된 방법이 기존의 문자인식. 문서 검색 시스템들의 전처리기로 사용되면. 그 시스템들의 성능을 향상시킬 것으로 기대된다.

Hierarchical Text Extraction and Localization on Images (이미지로부터 계층적 문자열 추출에 관한 연구)

  • Jun, Byoung-Min;Jun, Woogyoung
    • Journal of the Korea Academia-Industrial cooperation Society
    • v.19 no.1
    • pp.609-614
    • 2018
