• Title/Summary/Keyword: 문자 검색

Search Result 287, Processing Time 0.022 seconds

Character String Detection using Character-Edge Map with Adaptive Character Size and Character String Orientation in Natural Images (자연영상에서 문자의 크기와 문자열의 방향에 적응적인 문자-에지 맵을 이용한 문자열 검출)

  • Park, Jong-Cheon;Hwang, Dong-Guk;Lee, Woo-Ram;Jun, Byoung-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2007.11a
    • /
    • pp.262-265
    • /
    • 2007
  • 이미지 데이터베이스 시스템에서 이미지에 포함된 문자정보를 기반으로 검색어를 사용한다면 검색의 정확도 높일 수 있다. 이미지에서 문자정보를 추출을 위한 전단계로서 문자열 영역 검출이 필수적인 과제가 된다. 그러므로 본 논문에서는 문자의 크기와 문자열의 방향에 적응적인 문자-에지 맵을 이용한 문자열 영역 검출 방법을 제안한다. 캐니-에지 검출기로 에지를 추출하고, 생성된 에지 이미지로 레이블 이미지를 얻고, 그 영역의 문자구조 특징을 분석하기 위해서 배열문법으로 문자-에지 맵에 적응적으로 분석한다. 문자-에지 맵의 분석결과로서 문자열 후보 영역을 얻고, 문자열 영역의 구조적인 특징을 이용하여 문자열 후보 영역을 검증함으로서 최종적인 문자열 영역을 검출한다. 제안한 방법은 다양한 종류의 자연영상을 대상으로 실험하였고, 자연영상에서 기울어진 문자열과 다양한 크기의 문자를 갖는 문자열 영역을 효과적으로 검출하였다.

  • PDF

Edge-based Text Localization Using Geometrical Features of Hangul Character in Mobile Images (모바일 영상에서 한글 문자의 기하학적 특징을 이용한 에지 기반 텍스트 검출)

  • Park, Jong-Cheon;Oh, Myoung-Kwan;Jeon, Byeong-Min
    • Proceedings of the KAIS Fall Conference
    • /
    • 2012.05b
    • /
    • pp.820-822
    • /
    • 2012
  • 최근 모바일 기기의 보급이 일반화됨으로서 모바일 영상을 다루는 많은 응용프로그램이 개발되고 있다. 모바일 영상을 분석하여 정보를 추출한 결과를 인터넷 검색의 키워드로 연계함으로서 직관적인 멀티미디어 검색을 가능하도록 한다. 본 연구는 모바일 영상에 포함된 한글 문자영역을 검출하는 방법을 제안하였다. 한글 문자의 기하학적인 특징을 추출하고 이를 분석함으로서 후보 한글문자 영역을 검출하고, 검출된 후보 문자영역을 한글 자소 병합 알고리즘을 이용하여 병합한다. 그리고 후보 문자 영역을 한글 6가지 한글 문자 유형 특징을 이용하여 한글 문자 영역을 판별함으로서 최종적인 한글 문자영역을 검출한다. 실험결과, 문자영역 검출률의 성능 평가 요소로서 재현률이 향상됨을 알 수 있었다.

  • PDF

A Design and Implementation of Electronic Dictionary for support bidirectional searching (양방향 검색을 지원하는 전자사전 구조의 설계 및 구현)

  • Kim, Cheol-Su;Park, In-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10a
    • /
    • pp.367-370
    • /
    • 2000
  • 본 논문에서는 빠른 검색 시간을 가지면서 단어의 역문자열도 검색할 수 있는 사전 구조를 설계하고 구현한다. 빠른 검색 시간을 지원하고, 역문자열 검색을 효율적으로 하기 위해 트라이 구조를 이용하였으며 트라이 성질 잘 표현하는 배열을 이용한 구현 방법을 사용하였다. 이 사전 구조는 형태소분석, 정보검색, 음성인식 및 문자 인식 과정 등 다양한 분야에서 유용하게 이용할 수 있다.

  • PDF

An Electronic Dictionary Structure supporting Truncation Search (절단검색을 지원하는 전자사전 구조)

  • 김철수
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.9 no.1
    • /
    • pp.60-69
    • /
    • 2003
  • In an Information Retrieval System(IRS) based on an inverted file as a file structure it is possible to retrieve related documents when the searcher know the complete words of searching fields. however, there are many cases in which the searcher may not know the complete words but a partial string of words with which to search. In this case, if the searcher can search indexes that include the known partial string, it is possible to retrieve related documents. Futhermore, when the retrieved documents are few, we need a method to find all documents having indexes which include known the partial string. To satisfy these requests, the searcher should be able to construct a query formulation that uses the term truncation method. Also the IRS should have an electronic dictionary that can support a truncated search term. This paper designs and implements an electronic dictionary(ED) structure to support a truncation search efficiently. The ED guarantees very fast and constant searching time for searching a term entry and the inversely alphabetized entry of it, regardless of the number of inserted words. In order to support a truncation search efficiently, we use the Trie structure and in order to accommodate fast searching time we use a method using array. In the searching process of a truncated term, we can reduce the searching time by minimizing the length of string to be expanded.

Retrieving Information from Korean OCR Text Database (문자 인식에 의해 구축된 한글 문서 데이터베이스에 대한 정보 검색)

  • Lee, Jun-Ho;Lee, Chung-Sik;Han, Seon-Hwa;Kim, Jin-Hyeong
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.4
    • /
    • pp.833-841
    • /
    • 1999
  • The texts constructed with Optical Character Recognition(OCR) contain more errors than those constructed with keyboard typing. Therefore, in order to retrieve useful information from OCR texts, we need to develop an effective automatic indexing method. In this paer, we investigate automatic indexing methods that can retrieve information effectively from Korean OCR text database with the character-level recognition ratio of 90%. Experimental result shows that 2-gram indexing provides similar retrieval effectiveness of morpheme-based indexing for the Korean OCR text database.

  • PDF

Improvement of algorithm for calculating word count using character hash and binary search tree (문자 해시와 이원 탐색 트리를 이용한 어절 빈도 계산 알고리즘의 성능 개선)

  • Park, Il-Nam;Kang, Seung-Shik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.599-602
    • /
    • 2010
  • 인터넷 검색 사이트는 사용자들이 검색한 단어들의 순위를 매기는 실시간 검색 순위 서비스를 제공하는데 검색되는 단어들의 순위를 매기기 위해서는 각 단어들의 분포도를 알 수 있는 어절 빈도 계산을 수행해야 한다. 어절 빈도는 BST(Binary Search Tree)를 수행하여 계산할 수 있는데, 사용자에 의하여 검색되는 단어들은 길이와 그 형태가 다양하여 빈도 계산시에 BST 의 깊이가 깊어져서 계산 시간이 오래 걸리게 된다. 본 논문에서는 문자 해시를 이용하여 깊이가 깊은 BST 의 탐색 속도를 개선하는 알고리즘을 제안하였다. 이 방법으로 빈도 계산 속도를 비교하였을 때 문자 해시의 범위에 의해 1KB 의 추가적인 기억공간의 사용하여 9.3%의 성능 개선 효과가 있었고, 해시 공간을 10KB 추가로 사용할 때는 24.3%, 236KB 일 때는 40.6%로의 효율로 BST 의 빈도 계산 속도를 향상 시킬 수 있었다.

Design and Performance Evaluation of an Indexing Method for Partial String Searches (문자열 부분검색을 위한 색인기법의 설계 및 성능평가)

  • Gang, Seung-Heon;Yu, Jae-Su
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.6
    • /
    • pp.1458-1467
    • /
    • 1999
  • Existing index structures such as extendable hashing and B+-tree do not support partial string searches perfectly. The inverted file method and the signature file method that are used in the web retrieval engine also have problems that they do not provide partial string searches and suffer from serious retrieval performance degradation respectively. In this paper, we propose an efficient index method that supports partial string searches and achieves good retrieval performance. The proposed index method is based on the Inverted file structure. It constructs the index file with patterns that result from dividing terms by two syllables to support partial string searches. We analyze the characteristics of our proposed method through simulation experiments using wide range of parameter values. We analyze the derive analytic performance evaluation models of the existing inverted file method, signature file method and the proposed index method in terms of retrieval time and storage overhead. We show through performance comparison based on analytic models that the proposed method significantly improves retrieval performance over the existing method.

  • PDF

Text Cues-based Image Matching Method for Navigation (네비게이션을 위한 문자영상기반의 영상매칭 방법)

  • Park, An-Jin;Jung, Kee-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.631-633
    • /
    • 2005
  • 유비쿼터스 시대가 다가오면서, 많은 사람들은 모르는 장소에서 자신의 위치와 목적지까지의 경로에 대한 정보를 알고 싶어할 것이다. 기존의 네비게이션(navigation)을 위한 비전기술은 고차원과 저차원 특징값을 이용하였다. 텍스춰 정보, 색상 히스토그램과 같은 저차원 특징값은 영상의 특징을 정확하게 표현하기 어려우며, 마커와 같은 고차원 정보는 실험환경을 구축하는데 어려움이 있다. 우리는 기존 저/고차원의 특징값 대신, 영상의 특징을 표현하고 인덱싱(indexing)하기 위한 유용한 정보를 많이 포함하고 있으며, 실제환경에서 널리 분포되어있는 중차원 특징값인 문자영상을 이용한다. 문자영상추출은 MLP(Multi-layer perceptron)와 CAMShift알고리즘을 결합한 방법을 이용하며, 서로 다른 장소지만 같은 문자를 가진 곳에서 인식을 수행하기 위해 문자영상의 크기와 기울기를 기반으로 한 영상 검색공간을 대상으로 영상매칭을 수행한다. 실험에서 문자영상을 포함하는 직사각형 검색공간으로 인해 다양한 크기와 기울기에서 높은 인식률을 보이며, 간단한 계산으로 빠른 수행시간을 가진다.

  • PDF

Caption Detection and Recognition for Video Image Information Retrieval (비디오 영상 정보 검색을 위한 문자 추출 및 인식)

  • 구건서
    • Journal of the Korea Computer Industry Society
    • /
    • v.3 no.7
    • /
    • pp.901-914
    • /
    • 2002
  • In this paper, We propose an efficient automatic caption detection and location method, caption recognition using FE-MCBP(Feature Extraction based Multichained BackPropagation) neural network for content based retrieval of video. Frames are selected at fixed time interval from video and key frames are selected by gray scale histogram method. for each key frames, segmentation is performed and caption lines are detected using line scan method. lastly each characters are separated. This research improves speed and efficiency by color segmentation using local maximum analysis method before line scanning. Caption detection is a first stage of multimedia database organization and detected captions are used as input of text recognition system. Recognized captions can be searched by content based retrieval method.

  • PDF

The System Design and Implementation for Knowledge-based Image Retrieval System of an Automobile Head Lamp (자동차 전조등 영상의 지식기반 영상 검색을 위한 시스템 설계 및 구현)

  • 이병일;손병환;최흥국;홍성욱
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.165-168
    • /
    • 2001
  • 자동차 전조등에서 얻을 수 있는 자료는 차량마다 가지는 각각의 다양한 패턴과 문자 숫자 및 특수문자이탈 문자나 숫자 그리고 특수문자의 경우는 저장된 데이터베이스의 활용으로 그 차량에 대한 정보를 검색할 수 있다. 하지만 전조등의 경우에는 부분적인 패턴만이 있다면 숫자나 문자들의 정보에 의존할 수 없게 된다. 본 논문에서는 무늬가 가지는 특징의 추출을 이용하여 발생하고 있는 교통사고나 기타 사건의 발생시 부분적인 영상만이 획득되더라도 정색을 통한 후보 차량의 정색이 가능하도록 영상의 특성 값들을 구성하러 조합하였다. 본 시스템은 사고차량의 추적 및 교통사고에서보다 효율그인 과학수사에 일조할 것으로 기대한다.

  • PDF