• 제목/요약/키워드: Document image analysis

검색결과 85건 처리시간 0.041초

Deep-Learning Approach for Text Detection Using Fully Convolutional Networks

  • Tung, Trieu Son;Lee, Gueesang
    • International Journal of Contents
    • /
    • 제14권1호
    • /
    • pp.1-6
    • /
    • 2018
  • Text, as one of the most influential inventions of humanity, has played an important role in human life since ancient times. The rich and precise information embodied in text is very useful in a wide range of vision-based applications such as the text data extracted from images that can provide information for automatic annotation, indexing, language translation, and the assistance systems for impaired persons. Therefore, natural-scene text detection with active research topics regarding computer vision and document analysis is very important. Previous methods have poor performances due to numerous false-positive and true-negative regions. In this paper, a fully-convolutional-network (FCN)-based method that uses supervised architecture is used to localize textual regions. The model was trained directly using images wherein pixel values were used as inputs and binary ground truth was used as label. The method was evaluated using ICDAR-2013 dataset and proved to be comparable to other feature-based methods. It could expedite research on text detection using deep-learning based approach in the future.

개에서 겐타마이신으로 유발된 급성 신부전의 초음파상 변화 (Ultrasonographic Changes of Acute Renal Failure Induced by Gentamicin in Dogs)

  • 진경훈;정종태
    • 한국임상수의학회지
    • /
    • 제18권1호
    • /
    • pp.35-43
    • /
    • 2001
  • Present study was undertaken in order to document early renal ultrasonographic changes of gentamicin nephrotoxicosis and to show the value of renal ultrasonography as a contributory means of early diagnosis of acute renal failure in dogs. The experimental design was a randomized complete block design with six treatments in two blocks (gentamicin-treated & saline-treated). Acute renal failure was induced by toxic dosage of gentamicin (30 mg/kg) and saline solution sham equivalent in volume to that of the toxic dosage of gentamicin (1.5-3ml). Subjective visualization of increased renal cortex was visible as homogenous echoes that were hypoechoic relative to the surrounding tissues, whereas the renal medulla was anechoic to slightly hypoechoic. After treatment, the renal cortex was hyperechoic relative to the surrounding tissue. Increased renal cortex echogenicity was associated with significant nephrotoxicosis and was superior to serum creatinine elevation in nephrotoxicosis detection. Urine GGT was superior to other clinicopathological data utilized in the diagnosis of nephrotoxicosis. Based on the above results, increased renal cortex echogenicity seemed to be of use in detecting of acute renal failure.

  • PDF

PDM 구축을 위한 TIM 모듈개발 (Development of TIM Module for Construction PDM)

  • 이승우;송준엽
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 2001년도 춘계학술대회 논문집
    • /
    • pp.307-310
    • /
    • 2001
  • In this paper, development of TIM Module for constructing PDM will be introduced. Technical information relevant product data influences cost, quality, precision and productivity. One of the very important feature of product data is organizing not by oneself but very closed to many technical information such as document, file, image and analysis sheet. To manage various technical information, several kinds of management system are used in multi level of production system. PDM and TIM systems are being developed for suitable purpose and are in need of Network technology, Information Technology, Database, sharing and distributing information. Developed TIM system is based on Web environment. By using this system, we can manage systematic technical information and reduce cost for constructing PDM system. And also we will put to practical use another technical information management system for mold plant.

  • PDF

문서영상의 레이아웃 분석과 문자 분할 (Page Layout Analysis and Text Segmentation in Document Image)

  • 최재형;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.71-74
    • /
    • 2012
  • 본 논문에서는 새로운 문자 분할 알고리즘을 제안한다. 고전적인 문자 분할 알고리즘은 학술적인 문서영상과 같이 단순한 구조를 가진 문서영상을 대상으로 하여 좋은 성능을 보였지만 다양한 문자 크기와 색상, 그림, 복잡한 배경 등으로 구성된 문서영상에서는 좋지 못한 성능을 보인다. 최근에 제안고 있는 방법들은 복잡한 문서영상에서도 좋은 성능을 보이도록 다양한 기법들을 적용하여 우수한 성능을 보이고 있지만, 대부분의 방법들이 영상을 일정한 크기의 블록으로 나누어 문자분할을 하기 때문에 세밀한 부분에서는 성능이 어느 정도 한계를 보인다. 따라서 본 논문에서는 블록의 크기에 제한을 갖지 않는 새로운 방법으로서, watershed 알고리즘을 이용한 문자분할 방법을 제시한다. 구체적으로, watershed 알고리즘을 이용하여 문서영상의 구조(docstrum)를 파악하고 이를 기반으로 문자를 분할한다. 제안하는 방법은 크게 엣지 검출, distance transform, watershed 알고리즘을 이용한 docstrum 분석, 문자 분할의 네 단계를 거친다. 실험 결과 블록에 기반한 기존의 방법들이 놓치는 세밀한 부분에서도 제안된 알고리즘은 올바른 분할결과를 얻을 수 있음을 확인하였다.

  • PDF

웨이블릿 계수의 통계적 이산 분석을 이용한 문서 영상 분할 (Document Image Segmentation by the Statistical Distribution Analysis of Wavelet Coefficients)

  • 이인수;김민수;김우성;한광록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (하)
    • /
    • pp.927-930
    • /
    • 2000
  • 본 논문은 문서 영상에 대해 투영을 사용하여 영역을 나누었고 각 영역에 대해 고주파 밴드의 웨이블렛 계수의 통계적 분산과 히스토그램을 기반으로 한 두 가지 특징을 사용하여 문자와 그림으로 분류하였다. 투영으로 나누어진 영역들에 대해 일정 크기의 블록으로 나누고 두 가지 특징에 따라 문자와 그림으로 분류하였다. 따라서 투영에 의해 나뉜 영역 중 문자와 그림이 혼합되어 의미가 모호한 영역에 대해 잘못 분류되는 가능성을 줄일 수 있었다.

  • PDF

이진 대역분할과 Zerotree 기반 산술부호기를 이용한 문서 영상 압축 (Document Image Compression Using Binary Subband Analysis and Zerotree-based Arithmetic Coder)

  • 김정권;김승환;이충웅
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.45-50
    • /
    • 1999
  • 이진 영상의 압축은 디지털 도서관, 팩시밀리 전송, 문서 입출력 시스템과 같이 한정된 대역폭과 저장 공간을 가진 응용 분야에서 절실히 요구되고 있다. 현재 많은 영상 압축 알고리즘이 채택하고 있는 대역분할 기법을 문서와 같은 이진 영상의 압축에 적용한다면, 점진적 전송, 축소영상을 통한 빠른 검색 등의 장점을 얻을 수 있다. 그러나, 이진 영상 신호가 두 단계의 휘도 값을 가지므로, 이에 적합한 대역분할 방법과 산술부호기를 선택하여야 한다. 본 논문에서는 표본화-XOR 대역분할 기법을 선택하여, 알파벳 수의 증가를 막고 공간영역에서 국부적인 성질을 얻을 수 있다 또한, 넓은 단일-색 영역을 Zerotree로 대표하여 부호화 되는 신호의 수를 줄이고, 대역분할 구조에서 예측성의 저하를 막기 위한 적절한 조건화문맥과 새로운 부호를 선택한다. 이진 영상에 적합한 대역분할 방법과 산술부호기를 선택하여, 대역분할의 장점과 우수한 압축 성능을 달성할 수 있다.

  • PDF

Gabor 특징과 웨이브렛 영역의 BDIP와 BVLC 특징을 이용한 질감 특징 기반 언어 인식 (Texture Feature-Based Language Identification Using Gabor Feature and Wavelet-Domain BDIP and BVLC Features)

  • 장익훈;이우신;김남철
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.76-85
    • /
    • 2011
  • 본 논문에서는 Gabor 특징과 웨이브렛 영역의 BDIP와 BVLC 특징을 이용한 질감 특징 기반 언어 인식 방법을 제안한다. 제안된 방법에서는 먼저 시험 영상에 Gabor 변환과 웨이브렛 변환을 적용한다. 웨이브렛 영역의 상세 대역에는 Donoho의 연역치화를 적용하여 잡음을 제거한다. 이어서 Gabor 영상에는 크기 연산자를 적용하고 웨이브렛 부대역에는 BDIP와 BVLC 연산자를 적용한다. 그런 다음 Gabor 크기 영상과 BDIP, BVLC 부대역에 대하여 통계치를 계산하여 그 결과들을 벡터화하고 융합하여 특징 벡터로 사용한다. 분류 단계에서는 얼굴 인식에 주로 사용되는 WPCA를 분류기로 하여 시험 특징 벡터와 가장 유사한 학습 특징 벡터를 찾는다. 실험 결과 제안된 방법은 실험 문서 영상 DB에 대하여 비교적 낮은 특징 벡터 차원으로 매우 우수한 언어 인식 성능을 보여준다.

광복로 로드숍 파사드디자인의 색채분석을 통한 지역색 연구 (A Study on Area Color of Gwangbok-ro Based on the Analysis of the Colors of the Facade Designs of Stores Along the Road)

  • 여미;이창노
    • 한국실내디자인학회논문집
    • /
    • 제22권1호
    • /
    • pp.247-255
    • /
    • 2013
  • In this study, the colors and characteristics of Gwangbok-ro of Busan were analyzed in the standpoint of local images based on the examination of the facade designs of stores along the road of Gwangbok-ro, Busan a main street with massive population flow. To that end, the facades of stores, correlation with the city, color and locality were examined, and after the status of facade designs in Gwangbok-ro were identified through case survey by it, color images were analyzed. For color analysis, Munsell color system was used as basic tool. As a result of examining the colors in Gwangbok-ro area, the following status could be analyzed on 3 attributes of hue, brightness and chroma: First, analysis results of hue indicated that dominant color that covers 70% or more of the area represented mid brightness and low chroma in GY(36.1%) series, subsidiary color which covers 25% or more of the area mid brightness and low chroma in YR(26.5%) series, and accent color that covers less than 5% of the area high brightness and low chroma of GY(40%) series. Second, in brightness analysis, dominant color mostly represented mid brightness, subsidiary color mid brightness and accent color high brightness respectively. In particular accent color showed more intensive crowding phenomenon in high brightness. Third, as for chroma, dominant color, subsidiary color and accent color all are gathered in low chroma, however in small number of accent colors, peculiar high chroma appeared notable. In conclusion, the colors of Gwangbok-ro area analyzed based on the facade design of the stores along the road in this study were superficial colors that reflect the life of people in the area, artificial colors by improvement of the local environment. This study is meaningful in that the image of Gwangbok-ro was found through building colors in one part of the city Busan. It is judged that the study results would become useful as reference document in planning out environment colors later on.

다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축 (A Digital Library Prototype for Access to Diverse Collections)

  • Choi Won-Tae
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.295-307
    • /
    • 1998
  • 본 논문은 다양한 유형으로 구성되어 있는 디지털 도서관의 장서가 어떠한 역할을 수행하는지를 나타내는 디지털 도서관의 구축에 관한 것이다. 본 연구에서 구축된 디지털도서관의 프로토타입은 디지털 리포지토리, 필터, 색인 및 검색, 클라이언트의 구조로 되어 있다. 디지털 리포지토리는 여러 가지 유형의 문서유형과 다양한 형태의 데이터베이스로 구성된다. 필터는 다양한 문헌의 포맷을 인식하고 문헌 각각의 조직적인 요소를 지능적으로 구분하는 역할을 수행한다. 본 시스템은 관계형 데이터베이스 관리 시스템인 ORACLE과 ConText를 이용하여 구성되었으며 새로운 객체의 분석 및 조직화, 색인기술의 적용을 용이하게 처리할 수 있다. 클라이언트는 여러 유형의 데이터 포맷(이미지, 오디오 비디오 SGML, PDF, KORMARC 등)의 디스플레이를 위한 브라우저, 뷰어이다. 이용자는 이러한 도구들을 이용하여 문헌을 구분하고 각각의 아이템을 브라우징하고 탐색할 수 있다. 본 연구의 탐색 인터페이스는 HTML과 WWW의 CGI를 이용하여 구현되었다.

  • PDF

Gabor, MDLC, Co-Occurrence 특징의 융합에 의한 언어 인식 (Language Identification by Fusion of Gabor, MDLC, and Co-Occurrence Features)

  • 장익훈;김지홍
    • 한국멀티미디어학회논문지
    • /
    • 제17권3호
    • /
    • pp.277-286
    • /
    • 2014
  • 본 논문에서는 Gabor 특징과 MDLC 특징, 그리고 co-occurrence 특징의 융합에 의한 질감 특징 기반언어 인식 방법을 제안한다. 제안된 방법에서는 먼저 시험 영상에 Gabor 변환에 이은 크기 연산자를 적용하여 Gabor 크기 영상을 얻고 그 통계치를 계산하여 결과를 벡터화한다. 이어서 MDLC 연산자를 이용하여 MDLC 영상을 얻고 역시 그 통계치를 계산하여 벡터화한다. 다음으로 시험 영상으로부터 GLCM을 계산하고 이를 이용하여 co-occurrence 특징을 계산한 다음 벡터화한다. 이들 Gabor, MDLC, co-occurrence 특징에 의한 벡터들은 벡터 융합에 의하여 특징 벡터로 사용된다. 분류 단계에서는 얼굴 인식에 주로 사용되는 WPCA를 분류기로 하여 시험 특징 벡터와 가장 유사한 학습 특징 벡터를 찾는다. 제안된 방법의 성능은 15개국 언어의 문서를 스캔하여 얻은 시험 문서 영상 DB에 대한 평균 인식률을 조사하여 알아본다. 실험 결과 제안된 방법은 시험 DB에 대하여 비교적 낮은 특징 벡터 차원으로 매우 우수한 언어 인식 성능을 보여준다.