• 제목/요약/키워드: document image processing

검색결과 105건 처리시간 0.037초

Optical Character Recognition for Hindi Language Using a Neural-network Approach

  • Yadav, Divakar;Sanchez-Cuadrado, Sonia;Morato, Jorge
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.117-140
    • /
    • 2013
  • Hindi is the most widely spoken language in India, with more than 300 million speakers. As there is no separation between the characters of texts written in Hindi as there is in English, the Optical Character Recognition (OCR) systems developed for the Hindi language carry a very poor recognition rate. In this paper we propose an OCR for printed Hindi text in Devanagari script, using Artificial Neural Network (ANN), which improves its efficiency. One of the major reasons for the poor recognition rate is error in character segmentation. The presence of touching characters in the scanned documents further complicates the segmentation process, creating a major problem when designing an effective character segmentation technique. Preprocessing, character segmentation, feature extraction, and finally, classification and recognition are the major steps which are followed by a general OCR. The preprocessing tasks considered in the paper are conversion of gray scaled images to binary images, image rectification, and segmentation of the document's textual contents into paragraphs, lines, words, and then at the level of basic symbols. The basic symbols, obtained as the fundamental unit from the segmentation process, are recognized by the neural classifier. In this work, three feature extraction techniques-: histogram of projection based on mean distance, histogram of projection based on pixel value, and vertical zero crossing, have been used to improve the rate of recognition. These feature extraction techniques are powerful enough to extract features of even distorted characters/symbols. For development of the neural classifier, a back-propagation neural network with two hidden layers is used. The classifier is trained and tested for printed Hindi texts. A performance of approximately 90% correct recognition rate is achieved.

W3 가상도서관 활용을 위한 HTML 문서작성과 이미지/사운드 처리 (A Review of Access Conditions of the W3 and the Inline Image/Sound Processing of HTML Document for Utilizing of the Virtual Library)

  • 유사라
    • 정보관리학회지
    • /
    • 제12권1호
    • /
    • pp.45-66
    • /
    • 1995
  • 90년대 중반기의 가상도서관을 기대하는 정보 이용자들은 W3에 대한 수요를 급증시키고 있다. 본 연구는 인터넷 조직의 하나인 CERN이 제공하는 가상도서관의 도서관 정보자원을 소개하고, 가상도서관의 활용을 위한 인터넷 서비스의 하나인 W3의 특징과 HTML/URLs 체계, 그리고 도서관 W3 서버를 탐색하는 과정에서의 HTML 화일내의 이미지와 사운드정보의 저장과 출력을 실제 W3검색을 통하여 상세히 기술하며, 최근에 정리된 HTML 문서작성에 대한 기본적 요소와 그에 대한 출처정보를 요약한다.

  • PDF

체인 정합과 확장된 그룹핑 방법을 사용한 곡선형 텍스트 라인 추출 (Extracting curved text lines using the chain composition and the expanded grouping method)

  • ;윤진선;송영준;김남;김용기
    • 정보처리학회논문지B
    • /
    • 제14B권6호
    • /
    • pp.453-460
    • /
    • 2007
  • 본 논문은 정형화되지 않은 텍스트 라인들을 추출하기 위한 방법을 보여주고 있다. 텍스트 라인들은 각기 다른 각도로 구성되고, 심하게 굴곡이 있는 모양, 그리고 텍스트 라인내의 약간의 단어 사이의 공간이 생기게 된다. 그러한 텍스트 라인들은 포스터, 주소, 그리고 예술 문서 등에서 발견된다. 제안하는 방법은 기존의 직관적인 그룹핑 방법에 기반을 두고 있지만, 하나의 라인에서 발생하는 불충분한 특징점들과 모호한 회전 등을 극복하기 위한 방법을 개발하였다. 본 논문에서 텍스트 라인들은 몇 개의 연결된 성분들로 구성되고, 이 성분들은 하나의 문자 또는 연결된 문자들의 검은색 화소들의 집합이라고 가정하였다. 제안하는 방법은 반복적으로 증가되는 임계값과 가까운 성분들은 하나의 체인으로 병합하게 되고 확장되어 길어진 체인들은 라인의 원시 체인으로서 인지된다. 그때 원시 체인들은 텍스트 라인의 부분적 회전에 따라 좌우로 확장되어 진다. 텍스트 라인의 부분적인 회전은 원시 체인이 확장될 때, 체인들의 각 면에서 재구성될 것이다. 이러한 과정을 통해서 모든 텍스트 라인들이 구성되어 진다. 제안 방법은 로고와 슬로건에서 사용된 곡면으로 쓰여진 텍스트 라인들에 대해서 실험한 결과 직선 텍스트 라인은 98%, 곡선 텍스트 라인은 94%로서 높은 추출율을 보여주고 있다.

컨텐츠 제공자 지정 웹 클리핑 방식의 이동 인터넷 컨텐츠 변환 (A New Mobile Content Adaptation Based on Content Provider-Specified Web Clipping)

  • 양서민;이혁준
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.35-44
    • /
    • 2004
  • 작은 화면을 가진 이동 단말기에서 데스크탑 화면에 맞추어 제작된 웹 컨텐츠들을 브라우징 하는 것은 많은 어려움을 갖는다. 웹 페이지에는 이동 단말기용 브라우저의 제한된 기능으로 인해 표시할 수 없는 객체가 일부 포함되어 있는 경우도 있고, 브라우저에서 호환되지 않는 마크업 표준을 사용하여 브라우징 자체가 불가능할 수도 있다. 본 논문에서는 웹 페이지를 이동 단말기에 최적화된 형태로 변환할 수 있는 웹 클리핑 방식의 새로운 이동 인터넷 컨텐츠 적응 방법을 소개한다. 이 방법에서는 컨텐츠 제공자가 클립 편집기를 이용하여 설정한 클립 명세에 따라 원본 웹 문서가 자동으로 클리핑 되고 변환된다. 클립 편집기는 컨텐츠 제공자가 단일 클립, 그룹 클립, 다중 레벨 클립, 동적 클립을 설정하고, 문서의 레이아웃을 수정할 수 있도록 한다. 이렇게 설정된 클립 명세에 따라 원본 문서로부터 추출된 각 클립들은 먼저 중간 언어 형태의 문서로 변환되고, 이는 다시 이동 단말기를 위한 최종 마크업 문서로 변환된다. 또한 다양한 이미지 타입에 대한 변환기능을 제공한다.

웹 통합문서의 효율적 생성과 검색을 위한 자동링크지원 시스템의 설계 및 구축 (Design and Implementation of Automatic Linking Support System for Efficient Generating and Retrieving Integrated Documents Based on Web)

  • 이원중;정은재;주수종;이승용
    • 정보처리학회논문지A
    • /
    • 제10A권2호
    • /
    • pp.93-100
    • /
    • 2003
  • 분산 컴퓨팅과 웹 서비스 기술의 발달과 함께, 급증하는 인터넷 사용자는 웹 기반의 맞춤형 정보를 편리하게 작성하고 제공받을 수 있는 서비스들을 요구하고 있다. 이를 위해, 본 논문에서는 맞춤형 정보로서 웹 기반의 통합문서를 생성하고, 사용자 요구에 따라 다양한 검색을 지원할 수 있는 자동링크지원 시스템(ALSS : Automatic Linking Support System)을 구축하고자 한다. 본 시스템의 구성은 클라이언트/서버 환경을 기반으로, 서버는 어휘분석, 질의처리 및 통합문서생성 기능들을 제공하는 자동링크엔진과 사전, 이미지 컨텐츠 및 URLs로 이루어진 데이터베이스를 지원하도록 구축하였다. 클라이언트 측은 서버 측의 자동링크엔진과 데이터베이스를 접근하여 웹 기반의 통합문서를 생성하는 웹 에디터와 검색 서비스를 지원하는 웹 도우미로 구축하였다. 웹 에디터나 웹 도우미 프로그램은 클라이언트 측에 별도의 설치 없이 서버로부터 다운로딩하여 실행할 수 있으며, 서버의 실행기능들의 일부를 글라이언트 측에 분산시키므로써 서버의 부하를 감소시켰다. 본 시스템의 구현으로서, 사용자 인터페이스는 JDK 1.3 기반의 SWING을 이용하고, 클라이언트와 서버간의 연동을 위한 자바 RMI 기법을 적용하였으며, SQL Server 7.0을 사용하여 데이터베이스를 구축하였다. 마지막으로 웹 에디터와 웹 도우미에 의해 자동링크엔진과 데이터베이스를 접근하는 과정과 그들의 실행결과를 보였다.

퍼지 성능 측정자를 이용한 적응 데이터 마이닝 모델 (Adaptive Data Mining Model using Fuzzy Performance Measures)

  • 이현숙
    • 정보처리학회논문지B
    • /
    • 제13B권5호
    • /
    • pp.541-546
    • /
    • 2006
  • 데이터 마이닝은 방대한 양의 데이터를 다루는 응용영역에서 학습과 함께 연구되어 실세계의 문제를 해결할 수 있는 구체적인 방법을 제시해 주고 있다. 데이터 마이닝을 위한 보편적인 방법으로 사용되어 온 클러스터 분석 방법은 데이터의 양이 많아질수록, 실세계에서 직접 얻은 데이터일수록 경계가 불분명하고 처리과정에서 많은 오차가 발생하게 되어 직접 적용하고자할 때 고려해야할 점이 많다. 이를 위하여 퍼지 개념이 도입된 퍼지 클러스터링 방법론은 클러스터 타당성문제와 함께 널리 연구되어왔다. 본 논문에서는 클러스터링의 결과가 만들어 내는 오류 값을 최소화하는 방향으로 학습하는 비교사 학습신경망에 의하여 클러스터링이 이루어지고 이를 퍼지 성능 측정자에 의하여 평가하면서 최적의 클러스터 수를 찾아가는 적응형 데이터 마이닝 모델을 제안하고자 한다 또한 뉴스그룹의 텍스트 데이터를 처리하여 문서분류에 활용할 수 있음을 보임으로 제안된 모델의 타당성을 확인하고자 한다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

SMIL을 기반으로 한 멀티미디어 네트워크 교육시스템 (Multimedia Network Teaching System based on SMIL)

  • 우뢰;조극양;방진숙;조태범;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.524-527
    • /
    • 2008
  • 최근 디지털 및 인터넷이 보편화되고, 멀티미디어 처리 기술과 정보통신 기술이 발달함에 따라 인터넷을 이용한 교육의 수요는 급격히 증가하고 있다. 또한 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 그러나 여러 종류의 오디오, 미디어와 같은 멀티미디어 데이터를 통합하여 표현하기 위한 요구가 확산되었다. 이에 따라 1998년 W3C에서 XML(eXtensible Markup Language)에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 네트워크 교육 학습자와 상호 작용하는 멀티미디어 콘텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 추가하여 보다 많은 정보를 전달하며, 이를 통해 학습자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서 제안한 시스템은 교사가 쉽게 멀티미디어 정보를 만들어 수업에 활용 할 수 있도록 한다. 학생들은 교사가 수업하는 오디오, 비디오 등 정보를 동시에 시청각할 수 있다. 그리고 채팅창을 통해서 문자로 실시간 교류할 수 있다. 또한, 수업 후에 학생들은 언제나 수업의 내용을 자율적으로 요청하고 볼 수 있다.

  • PDF

18세기 전반 물선진상 관련 자료 분석 - 『진상별단등록』을 중심으로 - (Mulseon-Jinsang Related Document Analysis in First Half of the 18th Century)

  • 전상욱
    • 헤리티지:역사와 과학
    • /
    • 제47권4호
    • /
    • pp.178-191
    • /
    • 2014
  • 진상제는 지방의 특산물을 왕실에 봉진하는 제도이다. 진상물은 물품의 성격, 봉진시기, 용도에 따라 제향진상, 방물진상, 물선진상, 약재진상으로 구분된다. 이 중에서 물선진상은 전국의 산해진미를 봉진하는 것으로, 주로 식재료로 구성되었다. 그리고 물선진상은 다른 진상물과 달리 물품의 수량 경감 내지 일시적인 봉진 중지가 빈번하였다. 이는 물선진상의 경감을 통해 백성에게 물질적인 혜택을 줌으로써 자애로운 군주상을 확보하기 위한 국왕의 의도였다. 숙종 역시 재위기간 동안 빈번히 물선진상을 경감하거나 폐지하였다. 그러나 이 같은 물선진상 변경내역의 문서 보완이 미비하면서, 영조 즉위 직후 물선진상의 물종 및 수량이 불분명한 상태였다. 이에 영조는 "진상별단등록" 간행을 통해 물선진상의 물종 및 수량, 경감내역을 분명히 하였다. "진상별단등록"은 진상지역, 봉진시기, 봉진대상, 물종 및 수량, 경감내역이 기재되어 있다. 이 중에서 물선진상의 물종 및 수량은 다른 내용에 비해 중요하다. "진상별단등록"에 수록된 물선진상은 총 176종에 이르는데, 이 중에서 어류, 패류, 건어류 등 수산물이 117종으로 약 67%를 차지하고 있었다. 그리고 대부분의 물선진상이 원재료로 구성되어 있었고, 생물 이외에 말리거나 절이는 등 다양한 형태로 가공되었다. 물선진상의 지역별 분정특징을 살펴보면, 경상도, 함경도, 강원도 순으로 물선진상이 많이 수록되어 있다. 그리고 이들 지역은 동해안과 접해 있다보니, 수산물의 비중이 상대적으로 높은 편이다. 경상도와 전라도는 석류, 유자 등 양남지역의 대표적인 과실류가 분정되어 있었고, 제주도는 감귤류, 각종 전복가공품 등 전국에서 유일하게 분정된 물종이 대부분을 차지하고 있었다. 그리고 서울과 지리적으로 먼 곳에 위치한 도에는 건어류, 염어류 등을 집중적으로 분정하였다.

3차원 형상 모델의 디지털 워터마킹 구현 (The Implementation of the Digital watermarking for 3D Polygonal Model)

  • 김선형;이순흠;김기석;안덕상
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.925-930
    • /
    • 2002
  • 워터마킹은 DRM(digital rights management)의 요소 기술로서 많은 연구가 진행되어 왔다. 하지만, 3D 신속 조형 기술(RP : rapid proto-typing)에 적용된 연구는 찾아보기 어렵다. 대부분의 연구가 텍스트 문서, 2D 이미지, 동영상, 음악 등의 컨텐츠에 한정되어 있다. RP 시스템은 다품종 소량 생산에 적합하고, 시제품을 제작하여 제품개발 초기 단계에서 설계상의 오류나 부적합한 요인을 조기에 발견하는 것이 가능한 까닭에 산업 현장에 많이 사용되고 있다. 본 논문은 3D 형상 모델을 가지고 있는 STL(stereolithography) 파일에 워터마크를 삽입하는 방법에 관한 연구이다. 제안된 알고리즘은 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크를 삽입한다. 이런 까닭에 3D 형상에는 어떠한 왜곡도 발생하지 않으며 워터마크의 비가시성(invisibility)을 충족한다. 제안된 알고리즘으로 3D 형상 데이터의 법선 영역과 패싯 뒷면 영역에 워터마크 데이터의 삽입과 추출이 가능함을 보여주었으며, 본 연구의 실험 결과는 fragile 워터마킹과 robust 워터마킹과의 이용가능성을 제시하였다.