DOI QR코드

DOI QR Code

An Implementation of an Android Mobile System for Extracting and Retrieving Texts from Images

이미지 내 텍스트 추출 및 검색을 위한 안드로이드 모바일 시스템 구현

  • 고은비 (숙명여자대학교 멀티미디어과학과) ;
  • 하유진 (숙명여자대학교 멀티미디어과학과) ;
  • 최수렴 (숙명여자대학교 멀티미디어과학과) ;
  • 이기훈 (KT 연구소) ;
  • 박영호 (숙명여자대학교 멀티미디어과학과)
  • Received : 2010.12.22
  • Accepted : 2011.03.30
  • Published : 2011.03.31

Abstract

Recently, an interest in a mobile search is increasing according to the growing propagation of smart phones. However, a keypad, which is not appropriate for mobile environment, is the only input media for the mobile search. As an alternative, voice emerged as a new media for the mobile search, but this also has weaknesses. Thus, in the paper, we propose a mobile content called Orthros for searching the Internet using images as an input. Orthros extracts texts from images, and then inserts the texts to public search engines as a keyword. Also, Orthros can repeat searching with the extracted texts by storing result URL to internal databases. As an experiment, we analyze properties of recognizable images and present the implementation method in details.

스마트폰의 보급량이 증가하면서 이동성과 휴대성이 강조된 모바일 검색이 주목 받고 있다. 그러나 모바일 검색을 위한 일반적인 키워드 입력 수단은 키패드로 제한되어 있다. 키패드는 모바일 기기가 갖는 이동성과 휴대성에 적합하지 않다는 단점을 갖는다. 이를 보완하기 위해 음성을 이용한 검색이 등장 하였지만, 이 또한 단점을 지니고 있다. 따라서, 본 논문에서는 다양한 상황에서의 정보 접근성을 향상 시키기 위해 이미지를 검색 수단으로 사용하는 검색 시스템을 제안한다. 본 콘텐츠는 안드로이드 플랫폼 기반의 스마트폰에서 이미지를 얻어 텍스트를 추출하고, 이를 검색 엔진의 키워드로 입력하여 그 결과를 출력하는 과정을 거친다. 또한, 검색 결과를 스마트폰의 내장 데이터베이스에 저장하고, 이를 관리하여 추후에 재사용할 수 있도록 한다. 실험을 통해 인식 가능한 이미지의 특성을 분석하고, 본 콘텐츠의 기능을 소개한다.

Keywords

References

  1. 김기영, 강동호, "개방형 모바일 환경에서 스마트폰 보안기술," 한국정보보호학회지, Vol.19, No.5, pp. 21-28, 2009
  2. 장상규, 배건성, "음성 인식을 이용한 정보검색 시스템용 사용자 인터페이스 개발," 대한전자공학회 학술대회 논문집, Vol.9, No.1, pp. 607-610, 1996
  3. "doopedia," http://www.doopedia.co.kr/encyber/master/master.do?_method=view&MAS_IDX=101013000790664
  4. G. Chang, C. Tan, G. Li, and C. Zhu, "Developing Mobile Applications on the Android Platform," Mobile Multimedia Processing: Fundamentals, Methods, and Applications, Springer, 2010
  5. "Independent JPEG Group", http://www.ijg.org/
  6. J. He, R. Zhou, and Z. Hong, "Modified fast climbing search auto-focus algorithm with adaptive step size searching technique for digital camera," IEEE Trans. On Consumer Electronics, Vol.49, No.2, pp. 257-262, 2003 https://doi.org/10.1109/TCE.2003.1209511
  7. LAB Asprise, "The Java Developer's Guide to Asprise OCR SDK 4.0," Asprise, 2007
  8. R. Smith, "An Overview of the Tesseract OCR Engine," in Proc. of Intl' Conf. on Document Analysis and Recognition(ICDAR) , 2007
  9. "tesseract-ocr," http://code.google.com/p/tesseract-ocr/
  10. R.Smith, "The Tesseract OCR Engine," http://conferences.oreillynet.com/presentations/os2007/os_raysmith.pdf, 2007
  11. "OCR - Optical Character Recognition," https://help.ubuntu.com/community/OCR
  12. "WeOCR Project," http://weocr.ocrgrid.org/
  13. "The Apache HTTP Server Project," http://httpd.apace.org/
  14. "PHP: Hypertext Preprocessor," http://www.php.net
  15. "Netpbm home page", http://netpbm.sourceforge.net/
  16. "project-O2 home page", http://www.imglab.org/p/O2/

Cited by

  1. Vocabulary Generation Method by Optical Character Recognition vol.18, pp.8, 2015, https://doi.org/10.9717/kmms.2015.18.8.943
  2. An Optical Character Recognition Method using a Smartphone Gyro Sensor for Visually Impaired Persons vol.21, pp.4, 2016, https://doi.org/10.9723/jksiis.2016.21.4.013
  3. Speech Synthesis System for Detected Objects by Smart Phone vol.19, pp.2, 2016, https://doi.org/10.9717/kmms.2016.19.2.469
  4. 한글 음식 메뉴 인식을 위한 OCR 기반 어플리케이션 개발 vol.21, pp.5, 2011, https://doi.org/10.6109/jkiice.2017.21.5.951
  5. 윈도우 기반의 광학문자인식을 이용한 영상 번역 시스템 구현 vol.5, pp.2, 2019, https://doi.org/10.20465/kiots.2019.5.2.015