Character Shape Distortion Correction of Camera Acquired Document Images (카메라 획득 문서영상에서의 글자모양 왜곡보정)

  • Jang Dae-Geun;Kim Eui-Jeong
    • Journal of the Korea Institute of Information and Communication Engineering
    • v.10 no.4
    • pp.680-686
    • 2006
  • Document images captured by scanners have only skewing distortion. But camera captured document images have not only skew but also vignetting effect and geometric distortion. Vignetting effect, which makes the border areas to be darker than the center of the image, make it difficult to separate characters from the document images. But this effect has being decreased, as the lens manufacturing skill is developed. Geometric distortion, occurred by the mismatch of angle and center position between the document image and the camera, make the shape of characters to be distorted, so that the character recognition is more difficult than the case of using scanner. In this paper, we propose a method that can increase the performance of character recognition by correcting the geometric distortion of document images using a linear approximation which changes the quadrilateral region to the rectangle one. The proposed method also determine the quadrilateral transform region automatically, using the alignment of character lines and the skewed angles of characters located in the edges of each character line. Proposed method, therefore, can correct the geometric distortion without getting positional information from camera.

Efficient Sharing System of Medical Information for Interoperability between PACS System (PACS 시스템간 상호운용성을 위한 효율적인 의료 정보공유시스템)

  • Cho, Ik-Sung;Kwon, Hyeong-Soong
    • Journal of the Korea Institute of Information and Communication Engineering
    • v.13 no.3
    • pp.498-504
    • 2009
  • In the PACS system, the radiology image(X-ray) and its report are saved as separated parts. The exchange of the radiology image between clinics that installed this system are easily achieved by the DICOM standardization. But it is difficult to exchange the radiology report between clinics because a solution of PACS system is different according to manufacturers. The radiology report should be unified the vocabulary and the type of code for effective sharing and exchanging, and also the radiology image and its report should be integrated for the accurate analysis. In this paper, we propose the sharing system of medical information based on HL7-CDA, it defines the templates and converts the structured documents. For this purpose, we design the XML schema of the radiology report and turn the DICOM files into defined schema. The HL7-CDA documents based on XML is easily displayed on web browser and can help the diagnosis by inserting the radiology image.

Document Image Binarization Using a Water Flow Model (Water Flow Model을 이용한 문서 영상의 이진화)

  • Kim, In-Gwon;Jeong, Dong-Uk;Song, Jeong-Hui;Park, Rae-Hong
    • Journal of the Institute of Electronics Engineers of Korea SP
    • v.38 no.1
    • pp.19-32
    • 2001
  • This paper proposes a local adaptive thresholding method based on a water flow model, in which an image surface is considered as a 3-dimensional (3-D) terrain. To extract characters from backgrounds, we pour water onto the terrain surface. Water flows down to the lower regions of the terrain and fills valleys. Then, the amount of filled water is thresholded, in which the proposed thresholding method is applied to gray level document images consisting of characters and backgrounds. The proposed method based on a water flow model shows the property of locally adaptive thresholding. Computer simulation with synthetic and real document images shows that the proposed method yields effective adaptive thresholding results for binarization of document images.

Recognition of Word-level Attributed in Machine-printed Document Images (인쇄 문서 영상의 단어 단위 속성 인식)

  • Gwak, Hui-Gyu;Kim, Su-Hyeong
    • Journal of KIISE:Software and Applications
    • v.28 no.5
    • pp.412-421
    • 2001
  • 본 논문은 문서 영상에 존재하는 개별 단어들에 대한 속성정보 추출 방법을 제안한다. 단어 단위의 속성 인식은 단어 영상 매칭의 정확도 및 속도 개선, OCR 시스템에서 인식률 향상, 문서의 재생산 등 다양한 응용 가치를 찾을 수 있으며, 메타정보(meta-information) 추출을 통해 영상 검색(image retrieval)이나 요약(summary) 생성 등에 활용할 수 있다. 제안하는 시스템에서 고려하는 단어 영상의 속성은 언어의 종류(한글, 영문), 스타일(볼드, 이탤릭, 보통, 밑줄), 문자 크기(10, 12, 14 포인트), 문자 개수 (한글: 2, 3, 4, 5, 영문: 4, 5, 6, 7, 8, 9, 10), 서체(명조, 고딕)의 다섯 가지 정보이다. 속성 인식을 위한 특징은, 언어 종류 인식에 2개, 스타일 인식에 3개, 문자 크기와 개수는 각각 1개, 한글 서체 인식은 1개, 영문 서체 인식은 2개를 사용한다. 분류기는 신경망, 2차형 판별함수(QDF), 선형 판별함수(LDF)를 계층적으로 구성한다. 다섯 가지 속성이 조합된 26,400개의 단어 영상을 사용한 실험을 통해, 제안된 방법이 소수의 특징만으로도 우수한 속성 인식 성능을 보임을 입증하였다.

Restoration of Character String Stained with Line in Various Kinds of Form Documents (다양한 서식 문서에서 선에 의해 훼손된 문자열 복원)

  • 이창현;이관용;김경환;최영우;이일병
    • Proceedings of the Korean Information Science Society Conference
    • 1999.10b
    • pp.479-481
    • 1999
  • 현 사회에서 사용하고 있는 문서들은 양식을 가지고 있는 서식문서가 대부분이며, 이러한 양식을 가지고 있는 서식문서는 사회가 발전함에 따라 전자 문서로의 변경이 요구되고 있다. 그러나 서식문서를 전자 문서로 바꾸는 작업은 쉬운 일이 아니며, 이 작업을 위해 문자인식 기술이 요구된다. 특히 서식문서에서 문자의 인식률을 높이기 위해서는 문서양식의 라인과 겹쳐진 문자에 대하여 라인제거 및 문자 복원이 필수적이며, 또한 대부분의 서식 문서의 양식에 기입하는 내용은 문자열로 구성되어 있으므로 문자복원에 있어서 낱자 단위의 문자복원이 아닌 문자열 단위의 문자복원이 필요하다. 본 논문에서는 다양한 서식문서에서 라인과 겹쳐진 문자 영상에 대해 문자열 단위의 라인제거 및 복원하는 방법을 제안한다.

The Study for the Recognition System of Finger Languages (자화 인식 시스템에 관한 연구)

  • 강민지;최은숙;손영선
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.09b
    • /
    • pp.151-154
    • /
    • 2003
  • 본 논문에서는 흑백 CCD 카메라를 이용하여 청각 장애인의 의사전달 수단인 지화 동작을 동영상으로 입력받아 인식하여, 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다. 일련의 입력 영상들 중에서 흐린 영상과 선명한 영상의 구분은 영상의 잔상을 이용하였고, 촬영된 연속 영상들의 배열로부터 문자 자소를 구하고, 오토마타를 적용하여 완성된 문자를 문서 편집기에 출력시켰다 획득된 선명한 영상 데이터 중 변화가 심한 손목 부분을 제거한 후, 최대 원형 이동법을 이용하여 손의 무게 중심점을 구하고, 원형 패턴 벡터 알고리즘을 적용하여 지화 해석에 필요한 손을 인식하였다. 손 중심으로부터 거리 스펙트럼을 이용하여 지화 인식에 사용되는 손 모양의 특징 벡터를 추출하고, 퍼지추론을 적용하여 표준 패턴과 입력 패턴의 특징벡터를 비교, 지화 동작을 인식하였다.

Definition and Implementation of Image Enhancement Techniques for Efficient Binarization (효과적인 이진화를 위한 영상개선기법의 정의 및 구현)

  • Choe, Gyeong-Ju;Byeon, Hye-Ran;Lee, Il-Byeong
    • Journal of KIISE:Software and Applications
    • v.26 no.2
    • pp.284-296
    • 1999
  • 문자 인식 및 영상 인식 분야의 대부분의 연구들은 이진영상(binary image)을 바탕으로 이루어진다. 하지만, 입력영상에서 보다 많은 정보를 얻기 위해 명도영상(grayscale image) 으로 입력받아 필요한 정보를 추출한후 이진영상으로 변환하여 처리하는 방법도 많이 사용되고 있다. 이런 경우, 명도영상으로부터의 보다 깨끗한 이진영상의 획득 여부는 시스템의 성능과도 밀접한 관계가 있다. 본 논문에서는 기존의 대부분의 이진화 방법과는 달리, 실제 이진화를 수행하기 이전에 여러 가지 필터링 기법을 사용하여 영상의 질을 개선시키는 영상개선기법을 사용한후, 기존의 이진화방법을 사용하여 명도영상을 이진화하는 방법을 제안하고자 한다. 영상의 질을 개선시키기 위해서 BM 필터링, 경게선 개선 필터링, Erosion필터링 방법을 사용하였으며 , 기존의 이진화방법으로는 전역적 이진화 방법중 하나로써 클래스간 분산을 이용한 Ostu 방법[1]을 사용하였다. 다양한 종류의 문서를 대상으로 실험하였는데 평가실험에 사용된 영상은 문서 특성에 따라 균일하지 않은 배경을 가진 영상, 순수하게 텍스트로만 구성된 영상, 선성분이 많으며 명도값이 다양하게 나타나는 영상, 텍스트와 선성분이 함께있는 영상 등 크게 4가지 부류로 구분하였고, 평가대상 영상에 대해 매개변수의 개수, 끊어진/잃어버린 /뭉게진 물체가 적은 정도, 실행속도, 매개변수 결정의 용이성, 잡영이 적은 정도를 평가기준으로 선정한 후, 정량적인 평가가 어려운 항목에 대해서는 9개의 등급으로 나누어 이진화 된 영상의 특성을 분석, 평가하였다.

A Study of Development on technique for document & image unite (웹 기반 영상과 문서의 자동결합기법에 관한 연구)

  • Na, Jong-Won
    • Annual Conference of KIPS
    • 2006.11a
    • pp.187-190
    • 2006
  • 텍스트위주의 자료와 영상회의 자료를 결합하여 통합하고 이를 웹을 통해 서비스 하도록 구현하였다. 멀티미디어 회의정보 등록시 사용자는 DAM실행 파일을 자신의 PC에서 실행하고 프로그램에 내장된 윈도우 탐색기를 통해 등록하고자 하는 회의파일을 선택하면 XML 자동 피싱모듈이 실행되면서 자료 저장을 위한 핵심정보와 검색을 위한 단어색인 및 인덱스를 수행하여 오류시에는 에러메세지를 보여주고 성공시에는 분석된 핵심정보를 제공해준다. 서버로 전송된 멀티미디어 회의자료는 종류/시간/등으로 구분되어 윈도우 탐색기 형태의 트리구조와 사용자가 직접 단어를 입력하여 원하는 회의 정보를 검색하는 2가지 형태의 검색서비스를 제공하게 된다. 사용자는 본인의 서비스 환경에 따라 영상+문서, 문서 등을 자유롭게 선택하여 볼 수 있다. DAM의 경제적인 효과에 대하여 정확한 통계 자료가 국내에 아직 발표되지 않아 유사분야인 WCM시장 분석을 근거로 예상하였으며 시스템이 다양하고 복잡해질수록 투자대비 경제적인 효과가 높아 동기화 기술분야 시장이 확대될 것으로 기대된다.

The Optimization of Near Duplicate Detection Using Representative Unigram Grouping (대표 Unigram 군집화를 통한 유사중복문서 검출 최적화)

  • Kwon, Young-Hyun;Yun, Do-Hyun;Ahn, Young-Min
    • Proceedings of the Korean Information Science Society Conference
    • 2012.06b
    • pp.291-293
    • 2012
  • SNS, 블로그의 이용이 늘어나면서, 문서의 복제와 재생산이 빈번하게 발생함에 따라 대용량 문서에서의 유사중복문서 검출이 큰 이슈로 제기되고 있다. 본 논문에서는 한국어 문서를 대상으로 이러한 문제를 해결하기 위해 품질을 유지하면서 신속하게 문서집합 중 유사중복문서를 검출하는 방법에 대해 제안한다. 제안하는 알고리즘에서는 문서를 대표하는 고빈도 Unigram Token을 활용하여 문서를 군집화함으로써 비교 대상을 최소화 하였다. 실험결과, 76만 문서에서 기존 방법 대비 평균 0.88의 Recall을 유지하면서도 중복을 검출하는데 있어서 십수초내에 처리가 가능함을 보였다. 향후 대용량 검색시스템 및 대용량 이미지, 동영상 유사중복 검출에도 활용할 수 있을 것으로 기대한다.

Character Segmentation on Printed Korean Document Images Using a Simplification of Projection Profiles (투영 프로파일의 간략화 방법을 이용한 인쇄체 한글 문서 영상에서의 문자 분할)

  • Park Sang-Cheol;Kim Soo-Hyung
    • The KIPS Transactions:PartB
    • v.13B no.2 s.105
    • pp.89-96
    • 2006
  • In this paper, we propose two approaches for the character segmentation on Korean document images. One is an improved version of a projection profile-based algorithm. It involves estimating the number of characters, obtaining the split points and then searching for each character's boundary, and selecting the best segmentation result. The other is developed for low quality document images where adjacent characters are connected. In this case, parts of the projection profile are cut to resolve the connection between the characters. This is called ${\alpha}$-cut. Afterwards, the revised former segmentation procedure is conducted. The two approaches have been tested with 43,572 low-quality Korean word images punted in various font styles. The segmentation accuracies of the former and the latter are 91.81% and 99.57%, respectively. This result shows that the proposed algorithm using a ${\alpha}$-cut is effective for low-quality Korean document images.