• Title/Summary/Keyword: 문자

Search Result 3,504, Processing Time 0.034 seconds

The Extraction of Character from an English Name Card by Using Smearing Method and Contour Trucking Algorithm (스미어링 기법과 윤곽선 추적 알고리즘을 이용한 영문 명함 영상에서의 문자 추출)

  • 조아현;이혜현;류재욱;김광백
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.05a
    • /
    • pp.410-413
    • /
    • 2002
  • 본 논문에서는 영문 명함 영상에서 개별 문자 추출 방법을 제안한다. 30개의 원본 명함 영상을 대상으로 스미어링 기법과 윤곽선 추적 알고리즘을 이용하여 영문 명함의 개별 문자들 추출하였다. 본 논문에서는 3$\times$3 마스크를 이용하여 가장 작은 값으로 3 배 축소하는 방법을 적용하여 스미어링하는 시간을 단축시키고 문자들간의 간격을 제거하여 윤곽선 추적 알고리즘을 이용하여 문자열 후보 영역을 추출하였다 그리고 추출된 후보 영역의 가로 및 세로의 비율과 면적을 이용하여 문자열과 비 문자열로 분리하고, 문자열 영역에서 4 방향 윤곽선 추적 알고리즘을 이용하여 개별문자를 추출하였다. 30개의 명함 영상을 실험한 결과, 309개의 문자열 중에서 280개가 추출되었고 개별 문자는 4504개중에서 4110개가 추출되었다

  • PDF

The Similar Character Classification in the Mixed Document (혼용문서에서의 유사문자 분류)

  • Moon, Kyung-Ae;Chi, Su-Young;Oh, Weon-Geun
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.485-492
    • /
    • 1993
  • 본 논문에서는 혼용문서에서 문자들의 유사성으로 인해 발생하는 오인식문자를 줄이기위해 대분류 단계에서 유사문자군을 찾고 이들 사이의 유사도를 계산, 분류하는 유사문자분류 방법을 제안하였다. 이 방법은 유사문자군내의 각 문자마다 그 문자만이 갖는 고유한 요인과 그 문자를 제외한 나머지 문자일 가능성이 있는 요인을 찾아 입력문자와 비교하여 유사도가 가장 큰 문자를 인식문자로 선택하는 알고리즘이다. 또한, 인식 후 오인식된 문자들에 대해 특징사전의 갱신을 통하여 인식률을 향상시켰다.

  • PDF

Text Location in Scene Images (자연 영상에서 문자열 추출)

  • 최미화;김희승
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.389-391
    • /
    • 2000
  • 본 논문을 자연여상에서 문자열의 위치를 찾아내는데 모폴로지 연산인 WTH(white top-hats)과 BTH(black top-hars)을 사용하였다. 기존의 자연영상에서의 문자열추출은 칼라양자화방법 경우 각 칼라공간에서 문자열 추출과정을 반복 적용하거나 모델기반방법의 경우 문자열의 획의 크기나 특징에 따라서 하나의 영상을 여러 개로 분리 적용하여 추가적인 계산비용을 필요로 한다는 점을 개선하고 공간적 변화도를 이용하여 영상을 직접 처리하는 경우 최소 문자열 후보영역을 찾기 위한 프로세스를 다시 적용해야 한다는 점을 개선하였다. 자연영상에 문자열의 위치를 대략적으로 찾아내기 위해 WTH+BTH을 적용하여 그 결과로 문자열의 대략적 위치와 최소문자열후보영역을 동시에 얻을 수 있다. 문자열이 가지는 특성을 적용하여 문자열-비문자열 분류과정을 적용하고 후처리를 통해 완전한 문자열의 위치를 보여준다.

  • PDF

Character Region Extraction Based on Texture and Depth Features (질감과 깊이 특징 기반의 문자영역 추출)

  • Jang, Seok-Woo;Park, Young-Jae;Huh, Moon-Haeng
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.14 no.2
    • /
    • pp.885-892
    • /
    • 2013
  • In this paper, we propose a method of effectively segmenting character regions by using texture and depth features in 3D stereoscopic images. The suggested method is mainly composed of four steps. The candidate character region extraction step extracts candidate character regions by using texture features. The character region localization step obtains only the string regions in the candidate character regions. The character/background separation step separates characters from background in the localized character areas. The verification step verifies if the candidate regions are real characters or not. In experimental results, we show that the proposed method can extract character regions from input images more accurately compared to other existing methods.

Restoration of Character String Stained with Line in Various Kinds of Form Documents (다양한 서식 문서에서 선에 의해 훼손된 문자열 복원)

  • 이창현;이관용;김경환;최영우;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.479-481
    • /
    • 1999
  • 현 사회에서 사용하고 있는 문서들은 양식을 가지고 있는 서식문서가 대부분이며, 이러한 양식을 가지고 있는 서식문서는 사회가 발전함에 따라 전자 문서로의 변경이 요구되고 있다. 그러나 서식문서를 전자 문서로 바꾸는 작업은 쉬운 일이 아니며, 이 작업을 위해 문자인식 기술이 요구된다. 특히 서식문서에서 문자의 인식률을 높이기 위해서는 문서양식의 라인과 겹쳐진 문자에 대하여 라인제거 및 문자 복원이 필수적이며, 또한 대부분의 서식 문서의 양식에 기입하는 내용은 문자열로 구성되어 있으므로 문자복원에 있어서 낱자 단위의 문자복원이 아닌 문자열 단위의 문자복원이 필요하다. 본 논문에서는 다양한 서식문서에서 라인과 겹쳐진 문자 영상에 대해 문자열 단위의 라인제거 및 복원하는 방법을 제안한다.

  • PDF

Character Segmentation Using Depth Information (거리 정보를 활용한 문자 분할)

  • Jang, Seok-Woo;Park, Young-Jae;Kim, Gye-Young;Choi, Hyun-Jun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.01a
    • /
    • pp.229-230
    • /
    • 2013
  • 본 논문에서는 입체영상을 분석하여 3차원의 영상 내에 나타나는 문자 영역을 효과적으로 분리하는 알고리즘을 제안한다. 제안된 알고리즘은 먼저 입력된 영상에서 질감 특징을 이용해 문자영역이 존재하는 후보 영역을 분할하고, 후보 문자영역 중에서 문자열만을 형성하는 영역을 추출한다. 그런 다음, 지역화된 문자영역을 문자와 배경으로 분리하며, 거리 특징을 활용하여 추출된 문자영역이 비 문자영역을 포함하지 않고 문자영역만을 포함하고 있는지를 최종적으로 검증한다. 실험에서는 제안된 방법을 여러 가지 영상에 적용하여 테스트 해 보았으며, 제안된 방법이 기존의 방법에 비해 보다 정확하게 문자영역을 추출함을 확인하였다.

  • PDF

Detailed Recognition of Similar Characters Based on Optimum Linear Transform (최적선형변환에 의한 유사문자의 상세분류인식)

  • 김형원;김성원;양윤모
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.493-495
    • /
    • 2001
  • 본 논문에서는 문자 인식에서 두 단계의 식별과정을 통하여 인식률을 향상시키는 방법에 대하여 연구하였다. 한글 문자인식에서의 어려움은 인식대상 클래스가 많고 유사문자가 많은 반면, 여러 폰트의 글자를 하나의 글자를 하나의 클래스로 할 경우에는 그 문자의 분산이 더욱 커지게 되는 점이다. 따라서 본 연구에서는 문자의 분포를 고려하여 거리를 계산하는 Bayes에 의한 식별 함수를 1단계 인식과정에서 사용하여 1위 후보문자를 인식하였다. 2단계에서는 미리 준비된 1위 후부문자의 유사문자세트의 최적선형변환 공간에서 상세분류를 행하였다. 결과적으로 1단계의 Bayes거리반에 의한 인식률(91.1%)보다도, 또한 처음부터 모든 클래스에 대하여 최적선형변환에 의한 인식률(87.9%)보다 좋은 결과(92.9%)를 얻게되었다. 이로서 1단계의 대규모 문자세트에 대한 대분류에서는 문자의 분포를 고려하는 Bayes에 의한 인식이 유효하고, 2단계의 최적선형변환에 의한 인식은 소수의 유사문자들에 대한 변별력을 높이는데 유효함을 입증하였다.

  • PDF

Recognition of English Calling Card by Using Hierarchical Approach and Enhanced RBF Networks (계층적인 접근과 개선된 RBF 네트워크를 이용한 영문 명함 인식)

  • 임은경;김광백
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2003.05a
    • /
    • pp.141-146
    • /
    • 2003
  • 본 논문에서는 문자열 영역 추출을 위한 3배 축소 명함 영상, 개별 문자 추출을 위한 2배 축소 명함 영상, 정확한 인식을 위한 원본 영상으로 명함 영상을 분리하고, 분리된 영상들을 대상으로 각 영상 크기에 적합한 처리를 수행하고 각각의 결과들을 이용하여 정확한 문자를 추출할 수 있는 방법을 제안한다 그리고 추출된 개별 문자들의 인식을 위해서 ART1을 적용한 개선된 RBF 네트워크를 제안하여 적용한다 제안된 명함 추출 방법은 원 영상을 각각의 처리 방법에 적합하도록 하기 위해서 다해상도로 분리한다. 문자열의 추출은 문자들의 간격을 축소 시켜서 블록을 추출하기 쉬운 적절한 최소 크기의 영상에서 수행하고, 개별 문자의 추출은 문자들의 간격을 분리할 수 있는 적절한 영상의 크기에서 수행한다 개별 문자 인식은 문자의 형태학적 특성을 잘 나타내기 위해서 원본 영상에 적용한다 본 논문에서 제안한 추출 방법은 문자를 정확히 추출할 수 있으며 병렬 처리가 가능하여 처리시간을 단축할 수 있는 장점을 가진다. 그리고 정확히 추출된 개별 문자들을 개선된 R8F 네트워크를 이용하여 인식률을 향상시킨다. 제안된 명함 추출 및 인식 방법의 성능을 확인하기 위해서 실제 영문 명함 영상을 대상으로 실험한 결과, 기존의 방법보다 명함 추출 및 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

Design and Implementation Automatic Character Set Encoding Recognition Method for Document File (문서 파일의 문자 인코딩 자동 인식 기법의 설계 및 구현)

  • Seo, Min-Ji;Kim, Myung-Ho
    • Annual Conference of KIPS
    • /
    • 2015.10a
    • /
    • pp.95-98
    • /
    • 2015
  • 문자 인코딩은 컴퓨터에 저장하거나 네트워크상에서 전송하기 위해 문서를 이진화 하는 방법이다. 문자 인코딩은 고유의 문자 코드 테이블을 이용하여 문서를 이진화 하기 때문에, 문서에 적용된 문자 인코딩과 다른 문자 인코딩을 이용하여 디코딩 하면 원본과 다른 문서가 출력되어 문서를 읽을 수 없게 된다. 따라서 문서를 읽기 위해서는 문서에 적용된 문자 인코딩을 알아내야 한다. 본 논문에서는 문서의 문자 인코딩을 자동으로 판별하는 방법을 제시한다. 제안하는 방법은 이스케이프 문자를 이용한 판별법, 문서에 나타난 코드 값 범위 판별법, 문서에 나타난 코드 값의 특징 판별법, 단어 데이터베이스를 이용한 판별법과 같은 여러 단계를 걸쳐 문서에 적용된 문자 인코딩을 판별한다. 제안하는 방법은 문서를 언어별로 분류하여 문자 인코딩을 판별하기 때문에, 높은 문자 인코딩 인식률을 보인다.

A Study on the Education System for People Who Don't Have Their Own Letters, SOUL (문자 없는 나라를 위한 문자 교육 시스템(소울)에 관한 연구)

  • Ham, Hye-Ryeong;Noh, Yong-Deok
    • Annual Conference of KIPS
    • /
    • 2010.11a
    • /
    • pp.377-380
    • /
    • 2010
  • 지식기반 사회에서 교육은 장기적인 발전을 위한 필수 요소이다. 교육을 위해서는 말하기, 듣기, 쓰기, 읽기 능력이 필요하다. 이 중 하나라도 충족하지 못한다면 제대로 된 교육을 받을 수 없다. 하지만 전 세계에 존재하는 약 6900여종의 언어 중 6600여종의 언어는 표기할 수 있는 고유 문자가 없다. 읽기 능력과 쓰기 능력을 기르기 위한 최소 조건조차 마련되어 있지 않은 것이다. 그래서 말은 있지만 문자는 없는 국가에 말을 표기할 수 있는 문자를 보급하여 지식기반 발전의 기반을 마련해 주는 소울(SOUL) 시스템을 제안한다. 소울(SOUL)은 두 가지 기능을 가지고 있다. 문자 교육 기능과, 지식 공유 공간 기능이다. 문자 교육 기능에서는 각 문자가 내는 소리와 조합방법, 그리고 각 문자의 표기법, 표기 순서 등을 익힘으로써 문자를 쉽게 익힐 수 있도록 하였다. SOUL은 말을 표기할 문자로 비교적 익히기 쉬운 언문인 한글을 채택하였다. 그리고 지식 공유 공간 기능에서는 문자를 익힌 사용자가 마치 위키피디아처럼 지식을 기록하고 공유할 수 있어 지식을 축적하도록 도와주도록 설계하였다. 여기서는 소울(SOUL) 시스템의 구조 및 구현을 보인다.