An Image-based Word Matching Method for Large volume Printed Hangul Document Retrieval (대용량 인쇄 한글 문서 검색을 위한 영상 기반 단어 매칭 방법)

  • 진영범;오일석
    • Proceedings of the Korean Information Science Society Conference
    • 2000.10b
    • pp.461-463
    • 2000
  • 기계 인쇄된 문서 영상에서 주제어를 탐색하는 문제는 여러 응용 분야에 필수적인 핵심 기술이지만 수작업 또는 OCR 소프트웨어를 이용하여 텍스트로 변환하는 방법은 많은 비용 때문에 한계를 가지고 있다. 요즘 영상 형태로 원문을 저장하는 경우가 많으므로 본 논문은 영상-기반 매칭을 통한 검색 방법을 채택하였다. 문자 또는 단어 매칭에서 가장 중요한 요소가 특징인데 본 논문에서는 디지털도서관과 같이 매칭 대상 단어가 수천만∼수십억에 달하는 대용량 한글 문서 검색에 이용될 수 있도록 비교적 간단히 추출할 수 있고 차원수 조절이 용이한 4방향 프로파일 특징을 이용하는 빠른 검색 방법을 제안한다. 실험결과 8-차원 정도의 간단한 특징으로도 의미 있는 검색 성능을 얻을 수 있음을 보였다.

Language Identification of Character-level in Document Image (문서영상의 낱자 단위 언어 구분)

  • 권세광;오일석
    • Proceedings of the Korean Information Science Society Conference
    • 2003.10b
    • pp.613-615
    • 2003
  • 본 논문은 문서 구조분석을 통해 얻어진 텍스트 영상에 대해 낱자 단위 분할 과정과 분할된 낱자에 대한 언어 구분 방법을 제안한다. 먼저 8방향 연결 요소를 이용한 레이블링을 수행하고 각 레이블의 거리관계와 한글 종모음의 특징을 이용하여 낱자 분리를 수행한다. 분리가 이루어진 낱자의 언어 구분은 각 낱자에 존재하는 concavity 특징을 이용하여 한글과 영어로 구분하게 된다. Concavity 특징을 찾기 위해 낱자를 이루는 흑화소 중 수직런을 이루는 흑화소 중 일부와 세리프 성분을 제거하며 그 방법을 기술한다. concavity 특징은 분리기를 통해 한글과 영어 두 가지로 분리되며, 분류기는 신경망을 이용한다. 제안된 방법은 20개의 텍스트 영상에 총 7923개의 낱자를 대상으로 실험하였으며, 낱자 분리는 97.20%의 정확도를 보였으며 분리된 낱자에 대한 언어 구분은 92.70%의 정확도를 얻을 수 있었다.

A Study of Development on technique for document & image unite (웹 기반 영상과 문서의 자동결합기법에 관한 연구)

  • Na, Jong-Won
    • Annual Conference of KIPS
    • 2006.11a
    • pp.187-190
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

Document Image Compression Using Binary Subband Analysis and Zerotree-based Arithmetic Coder (이진 대역분할과 Zerotree 기반 산술부호기를 이용한 문서 영상 압축)

  • 김정권;김승환;이충웅
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • 1999.06b
    • pp.45-50
    • 1999
  • 이진 영상의 압축은 디지털 도서관, 팩시밀리 전송, 문서 입출력 시스템과 같이 한정된 대역폭과 저장 공간을 가진 응용 분야에서 절실히 요구되고 있다. 현재 많은 영상 압축 알고리즘이 채택하고 있는 대역분할 기법을 문서와 같은 이진 영상의 압축에 적용한다면, 점진적 전송, 축소영상을 통한 빠른 검색 등의 장점을 얻을 수 있다. 그러나, 이진 영상 신호가 두 단계의 휘도 값을 가지므로, 이에 적합한 대역분할 방법과 산술부호기를 선택하여야 한다. 본 논문에서는 표본화-XOR 대역분할 기법을 선택하여, 알파벳 수의 증가를 막고 공간영역에서 국부적인 성질을 얻을 수 있다 또한, 넓은 단일-색 영역을 Zerotree로 대표하여 부호화 되는 신호의 수를 줄이고, 대역분할 구조에서 예측성의 저하를 막기 위한 적절한 조건화문맥과 새로운 부호를 선택한다. 이진 영상에 적합한 대역분할 방법과 산술부호기를 선택하여, 대역분할의 장점과 우수한 압축 성능을 달성할 수 있다.

A Study on Collaboration in Classification System Development Practice (분류시스템 개발과정에서의 협력에 대한 연구)

  • Park, Ok-Nam
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.42 no.4
    • pp.181-199
    • 2008
  • This study presents an empirical study of classification system design focused upon an image design team within an organizational setting. It aims to understand collaboration during design practice. Data was collected through on-site interviews, observations, and document and email reviews. This study uses social process model as a conceptual framework. The study revealed type of collaboration, factors influencing collaboration, influences of collaboration on design practice.

Development of Standard Hill Technology for Image Encryption over a 256-element Body

  • JarJar, Abdellatif
    • Journal of Multimedia Information System
    • /
    • v.8 no.1
    • pp.45-56
    • 2021
  • This document traces the new technologies development based on a deep classical Hill method improvement. Based on the chaos, this improvement begins with the 256 element body construction, which is to replace the classic ring used by all encryption systems. In order to facilitate the application of algebraic operators on the pixels, two substitution tables will be created, the first represents the discrete logarithm, while the second represents the discrete exponential. At the same time, a large invertible matrix whose structure will be explained in detail will be the subject of the advanced classical Hill technique improvement. To eliminate any linearity, this matrix will be accompanied by dynamic vectors to install an affine transformation. The simulation of a large number of images of different sizes and formats checked by our algorithm ensures the robustness of our method.

R&D of Intelligent Document Recognition Library for utilizing image data (이미지데이터 활용을 위한 지능형 인식 라이브러리 연구 개발)

  • Kwag, Hee Kue;Kim, Sung Hun;Lee, Jung Woo;Yoo, Ji Hun;Lee, Hyun Joo
    • Annual Conference of KIPS
    • /
    • 2009.11a
    • pp.329-330
    • 2009
  • 본 연구는 공공기관이 소장한 이미지데이터 활용성을 높이기 위한 전문검색서비스 구현 시 필수적인 문서인식시스템의 고도화에 있으며, 주요한 연구방향은 공공기관이 소장하고 있는 데이터의 분석을 통해 이미지분석 기술 및 라이브러리를 개발하고 특화된 지식베이스를 구성하는 것이다. 또한, 향후 확장성을 고려하여 지식베이스를 지속적으로 관리할 수 있는 툴을 개발하는 것이다. 본 연구는 현재 지능형 인식 라이브러리를 결합한 프로토타입(prototype) 시스템 개발이 완료된 바, 방대한 국가기록원내 소장자료를 대상으로 다양한 성능평가를 위한 테스트베드 구축이 진행되고 있다.

Understanding Documents With Chemical Structures Using Image Segmentation (영상 분할을 활용한 화학 구조 문서 이해)

  • Yang, Haeyoon;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • pp.1297-1300
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

A Digital Library Prototype for Access to Diverse Collections (다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축)

  • Choi Won-Tae
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.32 no.2
    • pp.295-307
    • 1998
  • This article is an overview of the digital library project, indicating what roles Koreas diverse digital collections may play. Our digital library prototype has simple architecture, consisting of digital repositories, filters, indexing and searching, and clients. Digital repositories include various types of materials and databases. The role of filters is to recognize a format of a document collection and mark the structural components of each of its documents. We are using a database management system (ORACLE and ConText) supporting user-defined functions and access methods that allows us to easily incorporate new object analysis, structuring, and indexing technology into a repository. Clients can be considered browsers or viewers designed for different document data types, such as image, audio, video, SGML, PDF, and KORMARC. The combination of navigational tools supports a variety of approaches to identifying collections and browsing or searching for individual items. The search interface was implemented using HTML forms and the World Wide Web's CGI mechanism.

Study on the Digital Storytelling Types and Characteristics of Fashion Designer Brands (패션 디자이너 브랜드의 디지털 스토리텔링 유형과 특성)

  • Hong, Yun Jung;Kim, Young In
    • Journal of the Korean Society of Costume
    • /
    • /
    • /
    • 2013
  • The purpose of this research is to systemize the fashion digital storytelling by analyzing the communication method and its elements, and extracting the characteristics and processes of digital storytelling. Based on the previous study on the characteristics and types of storytelling the following things have been researched: 1) the process of digital storytelling in the communication process, 2) the concept and the feature of the academia of digital storytelling 3) storytelling in the document research. On the groundwork of the document research, we were able to sort out the various types, and formed a system of the features in the fashion digital storytelling cases, mainly in the four collections (Milan, Paris, London, New York) from 2000's to recent years of 2010. The types of fashion digital storytelling are episode type, narrative type, and creative type. The characteristics of each of the types are as follows. Firstly, the episode type communicates through the digital media based on the information or fact of the fashion designer brand. Secondly, narrative type communicates with the consumers using previous literature or an existing idea of the original cultural form that is rearranged in digital story expressed by the digital media. Lastly, creative type makes the designer's and consumer's susceptibility and creativity communicate through the newly made story, which expresses the unique originality of the designer. It seems that the cases and studies of using the fashion digital storytelling will increase because of its short history and lack of the case study. Fashion designer brands will show their brand image using the digital storytelling because they are able to better express originality, creativity and imagination of the fashion designer, which were factors that could not be conveyed through fashion alone.