• Title/Summary/Keyword: 문자 분류

Search Result 351, Processing Time 0.029 seconds

대화식 클러스터링 기법을 이용한 칼라 지도의 문자 영역 추출에 관한 연구 (Character Extraction from Color Map Image Using Interactive Clustering)

  • 안창;박찬정;이상범
    • 한국정보처리학회논문지
    • /
    • 제4권1호
    • /
    • pp.270-279
    • /
    • 1997
  • 지도 영상에 포함된 문자들을 효율적으로 인식하기 위해서는, 문자 영역만을 추 출하여 독립된 계층으로 만드는 전처리 단계가 선행되어야 한다. 본 논문에서는 칼라 지도 영상의 색 정보를 대화식 클러스터링 기법에 의해 색 별로 분리하고, 문자 영역 을 추출하는 알고리즘을 제안하였다. 제안된 대화식 클러스터링 기법은 칼라 영상 중 에서 사용자가 분리하기 원하는 색을 대화식으로 선택하여 각각의 선택된 색을 중심 으로 클러스터를 형성하고 분리한다. 문자를 추출하는 알고리즘은 문자를 표현하는 색만을 추출한 이전 영상을 벡터 데이터화 한 후 각 원시 요소들의 상호 관계를 고려 하여 직선, 원, 문자의 세 계층으로 분류하는 것으로서, 문자와 직선이 중첩되어, 하 나의 연결 요소를 이루고 있을 때에도 효과적으로 문자를 분리할 수 있다. 알고리즘 의 평가를 위해 1:3,000의 지번약도에 대한 실험을 수행하였으며, 선분과 문자가 중 첩되어 있는 경우에도 각각 분리할 수 있음을 확인하였다.

  • PDF

문자 인식 기술을 이용한 데이터베이스 구축 (Building Database using Character Recognition Technology)

  • 한선화;이충식;이준호;김진형
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1713-1723
    • /
    • 1999
  • 문자 인식 기술은 인쇄도니 형태로 존재하는 수많은 정보를 데이터베이스화 할 수 있는 가장 유용한 대안이다. 본 논문에서는 문자 인식 기술을 사용한 데이터베이스 구축의 타당성을 조사하기 위하여, 문자인식기를 사용한 데이터베이스를 시범적으로 구축하였다. 우선 데이터베이스를 구축할 때 문자 인식기의 선택 시 고려하여야 할 사항들을 살펴보고, 이를 기준으로 4가지의 상용 문자 인식기에 대한 인식 실험을 거친 후 그 중 인식 성능이 가장 좋은 것을 선택하였다. 대상 문서로는 다양한 인쇄 품질 및 특성을 갖는 실제 논문집의 초록을 대상으로 삼았으며, 대량 데이터에 대한 인식률 계산을 위해 수작업된 데이터베이스가 있는 KT 테스트 컬렉션[1]을 선택하였다. 실험은 실제 대용량 데이터베이스 구축과 유사한 환경을 만들기 위해, 문서별 학습이나 기울기 보정 등의 사전 작업을 생략하였다. 실험 결과 970편의 논문 요약문에 대해 평균 문자 인식률 90.5%를 보여, 한글 문자 인식 기술이 아직 데이터베이스 구축에 활용되기에는 이르다는 것을 보였다. 문자 인식에 의한 인식 오류에서는 수작업 한 문서에서 발견되는 오류와는 상이한 유형이 많이 발견된다. 본 논문에서는 추후의 연구를 위하여 문자 인식 텍스트에서 나타나는 오류의 유형을 분류하였다.

  • PDF

Japanese Puzzle을 이용한 인쇄체 영문자, 숫자, 기호의 인식 (A Recognition of the Printed Alphabet, the Number and the Symbols by Using Japanese Puzzle)

  • 손영선;김보성
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.119-122
    • /
    • 2007
  • 지금까지의 연구에서 Japanese Puzzle을 이용한 인쇄체 영문자 인식을 구현하여 좋은 결과를 얻었고, 본 논문 에서는 인쇄체 영문자(바탕, 돋움) 인식을 확장시켜 영문장을 인식하기 위해 키보드에서 입력 가능한 숫자 및 기호를 포함하여 인식하는 시스템을 구현하였다. 이미지를 입력 받아 이진화 처리, 히스토그램 투영을 이용한 문자 분리는 영문자 인식에서와 동일한 처리를 한다. 기호 중에서 세로 길이보다 가로 길이가 긴 기호인 -,-,= 만 가로를 정규화 하였고, 나머지는 세로를 정규화 하였다. 정규화 된 문자에 Japanese Puzzle을 역으로 적용하여 구하여진 수치 정보로부터 영문자, 숫자, 기호를 분류 및 인식하여 좋은 결과를 얻었다.

  • PDF

낱자 인식기와 자소 조합 인식기를 혼용한 인쇄체 한글 인식방법 (A Method of Machine-Printed Hangul Recognition using Character and Combined-Grapheme Recognizers)

  • 장승익;임길택;김호연;정선화;남윤석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2003
  • 본 논문에서는 낱자 인식기와 자소 조합 인식기를 혼용한 저품질 인쇄체 한글의 고성능 인식 방법을 제안하였다. 제안한 방법에서는 입력 문자를 한글 6형식과 기타 형식의 문자, 총 7종으로 분류한, 입력문자를 인식 대상 문자의 수와 자소 복잡도에 따라 하나 또는 두 개의 인식 단위(HRU: Hangul recognition unit)로 분리하여 인식한다. 각 인식 단위 영상에서 추출한 방향각 특징을 다층신경망 인식기를 이용하여 인식한다. 다음으로, 각 다층신경망 인식기의 신뢰도를 조합하여 최종 인식 결과를 도출한다. 제안한 방법을 사용한 실험에서 98.80%의 인식률을 얻을 수 있었으며, 이는 기존 방법에 비해 23.61%의 오류가 감소한 것이다.

  • PDF

칩의 문자들을 검사하기 위한 마크 자동 검사 시스템 (A Mark Automatic Checking System to Inspect Character Strings on Chips)

  • 주기세
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2005년도 추계학술대회지
    • /
    • pp.191-196
    • /
    • 2005
  • 칩의 마크는 종류별로 다르고 매우 작아서 작업자가 육안 검사로 처리하기에는 매우 어려운 작업이다. 본 논문에서는 칩의 마크를 인식하여 잘못된 마크를 판별하는 마크 자동 검사 시스템에 대하여 제안한다. 불량 항목을 검사하기 위해서 템플릿 매칭 방법과 다양한 불량 판별 조건을 사용한다. 그리고 불량판별 조건은 문자 ROI 명암도, 문자 ROI 매칭, 문자 명암도, 브로컨, 브렌치로 분류된다. 제안된 방법은 마크 불량 판별에 커다란 성능향상이 보임을 일련의 실험들을 통하여 보여준다.

  • PDF

임베디드 TTS 시스템을 위한 아라비안 숫자의 문자 변환 (Grapheme-to-Phoneme Conversion of Arabic Numeral Expressions for Embedded TTS Systems)

  • 정영임;윤애선;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.442-444
    • /
    • 2005
  • 본 논문에서는 아라비안 숫자의 중의성을 효과적으로 제거하고 숫자 표현의 발음을 정확하게 문자화할 수 있는 임베디드 시스템용 경량화된 아라비안 숫자 읽기 시스템을 제안한다. 이를 위해 7 가지의 숫자 읽기 방식(Headings of Arabic Numerals RAN)을 분류하였고, 문자화 규칙을 설정하기 위해. (1) 문맥 자질, (2) 패턴 자질, (3) 휴리스틱 정보를 숫자 표현의 의미에 따라 분석하였다. 그리고 숫자의 문자화 시스템을 최적화하여 임베디드 시스템에 탑재하기 위해 (1) 형태소 분석 모듈의 분리, (2) 사전 압축, (3) 인명과 지명의 제거를 하였고, 이를 홍해 심각한 정확도 손실 없이 메모리 사용량과 처리 시간을 크게 줄일 수 있었다. 경량화된 mini-TAN 은 $96.9\~98.3\%$의 정확도를 보이며, 기존 상용 TTS 시스템에 비해서도 숫자 읽기의 처리에 있어 높은 정확도를 보인다.

  • PDF

병합된 예제를 이용한 자동차 번호판 문자 인식 (Character Recognition in License Plate Using Merged Examples)

  • 김종성;박태진;강재호;백남철;강원의;이상협;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.238-240
    • /
    • 2004
  • 경제 성장과 생활 수준의 향상으로 인한 자동차 수의 증가는 않은 문제를 발생시키고 있다 제한된 인력과 비용으로 효율적인 자동차 관리를 위한 연구 분야 중에서 자동차 번호판 인식 (Vehicle Plate Recognition) 기술은 법규위반의 식별, 통행료 징수, 납세, 도난.도주 차량 확인 및 주차 관리 등의 않은 분야에 응용되고 있다. 자동차 번호판 문자 인식 문제와 같이 훈련 예제 수집 비용이 많이 드는 경우에 제한된 수의 훈련 예제를 최대한 활용하여 분류 성능을 향상시키기 위한 방안 중 하나로, 수집된 훈련 예제들로부터 가상의 예제를 생성하고, 생성된 가상 예제를 훈련 예제로 추가하여 학습하는 절러 연구가 수행된 바 있다. 본 논문에서는 자동차 번호판 문자 인식의 성능 향상을 위친 수집된 예제들을 적절히 병합하여 가상의 예제를 생성하는 방안에 관해 기술하고, 문자 인식 분야에서 일반적으로 많이 사용되는 여러 알고리즘에 대하여 다양한 가상 예제 생성 방안 및 다양한 생성 비율 따른 실험을 통해 그 효용성을 확인하였다

  • PDF

SIFT 서술자를 이용한 오프라인 필기체 문자 인식 특징 추출 기법 (Feature Extraction for Off-line Handwritten Character Recognition using SIFT Descriptor)

  • 박정국;김경중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.496-500
    • /
    • 2010
  • 본 논문에서는 SIFT(Scale Invariant Feature Transform) 기술자를 이용하여 오프라인 필기체 문자 인식을 위한 특징 추출방법을 제안한다. 제안하는 방법은 문자의 획의 방향 정보를 제공하는 특징 벡터를 추출함으로써 오프라인 문자 인식에서 성능 향상을 기대할 수 있다. 테스트를 위해 MNIST 필기체 데이터베이스와 UJI Penchar2 필기체 데이터베이스를 이용하였고, BP(backpropagation)신경망과 LDA(Linear Discriminant Analysis), SVM(Support Vector Machine) 분류기에서 성능 테스트를 하였다. 본 논문의 실험결과에서는 일반적으로 사용되는 특징추출로부터 얻어진 특징에 제안된 특징추출을 정합하여 성능항샹을 보인다.

  • PDF

적응적 탬플릿 마스킹과 패턴 벡터 기법을 이용한 일본 차량 번호판 인식 (Japanese License Plate Recognition Using Adaptive Template Masking and Pattern Vector Method)

  • 김미진;김국성;이응주
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.635-640
    • /
    • 2003
  • 본 논문에서는 일본 차량 번호판 인식에 적응적 탬플릿 마스킹 방법을 이용하여 번호판 문자, 숫자를 분할하고 패턴벡터기법을 이용하여 인식하는 방법을 제안하였다 주, 야간과 거리에 따른 일본 차량 번호판 영상을 입력받아 전처리 과정을 수행한 후 에지 정보와 명도값 변화의 빈도수를 이용하여 번호판 영역을 검출하였다 검출된 번호판 영역에서 각 문자 및 숫자의 위치정보와 적응적 탬플릿을 이용하여 분할하고 번호판의 지역문자를 무게중심 패턴으로 분류 한 다음 크기와 이동에 무관한 특실을 가지는 패턴 벡터를 적용하여 문자를 인식하였으며, 숫자는 Four Segment Pattern을 이용하여 인식하도록 하였다 본 논문에서 제안한 방법을 실제 일관 차량 번호판 인식에 적용한 결과 98.8% 추출율과 96.6%의 인식율을 나타내었다.

  • PDF