• 제목/요약/키워드: 한글 문자 인식

검색결과 326건 처리시간 0.023초

형태소 분석을 이용한 문자인식 에러의 검출 (A Method of Detecting of OCR error using Morphological Analysis)

  • 김윤호;이종국;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.545-553
    • /
    • 1992
  • 문자인식에 있어서 인식율을 높이기 위한 후처리의 한 방법으로서, 문법 정보를 이용하는 후처리를 제안하고자 한다. 즉, 문자 인식 시스템에 의해 인식된 국어문에 대해서 오인식된 문자를 포함하는 어절을 검출하고, 오인식된 문자의 적절한 후보를 선정하여 그에 따라 자동수정을 행하는 것을 전채 후처리 과정으로 전제한다. 본 논문에서는 형태소 분석을 통해 오인식된 부분을 검출하는 과정을 보임으로써 문자인식에 있어서 문법 정보를 이용하는 후처리의 가능성과 그 유효성을 보이는 것을 목적으로 한다.

  • PDF

한국어 음가를 한글 표기로 변환하는 표준규칙 제정 (Establishment of the Korean Standard Vocal Sound into Character Conversion Rule)

  • 이계영;임재걸
    • 전자공학회논문지CI
    • /
    • 제41권2호
    • /
    • pp.51-64
    • /
    • 2004
  • 표기 체계인 한글을 한국어 음가로 변환하는 음운변동 규칙을 역으로 적용하여, 한국어 음가를 한국어를 표기하는 문자 체계인 한글로 전환시키는 규칙을 고안하는 것이 본 연구의 목표이다. 제정된 규칙은 한국어 음성인식에 있어서 매우 귀중한 역할을 담당한다. 일반적인 음성인식 기법은 수회의 학습과정을 통하여 추출된 음성의 표준패턴과 인식 대상으로 입력된 음성을 비교하여 가장 유사한 패턴을 찾는 방법을 사용한다. 이 때 표준 음성패턴이 띄어쓰기 단위의 어절이라면 수백만 개의 표준 패턴이 수록되어야 하므로 표준패턴을 위한 방대한 데이터베이스의 구축은 물론 표준패턴과의 비교 회수도 너무 많아져서 실용화가 불가능하다. 이에 대한 대안인 음절 단위 인식의 경우는 인식된 음가가 실제의 한글 표기와 맞지 않으므로, 인식된 결과를 출력할 때에 실제의 한글표기로 변환해 주어야 하는 과제를 안게 된다. 이 과제를 해결하는 과정, 즉 일련의 한국어 음가들을 일련의 한글 표기 문자로 바꾸어 주는 과정에서는 본 논문에서 제안한 표준 한국어 음가 - 표기 문자 변환 규칙을 적용할 수 있을 것이다. 본 논문에서는 새롭게 제안된 표준 한글 음가-표기 문자 변환 규칙을 사용하여 한국어 음가를 한글 표기로 변환하는 시스템을 구현하였다. 그리고, 고안된 규칙의 무결성을 보이기 위하여 표준 발음규칙 30항을 반영하는 데이터 집합을 이용하여 구현된 시스템을 시험하였으며, 그 실험 결과를 제시한다.

방향성분 특징과 Fisher Measure를 이용한 간판영상 한글인식 (Recognition of Korean Text in Outdoor Signboard Images Using Directional Feature and Fisher Measure)

  • 임준식;김수형;이귀상;양형정;이명은
    • 정보처리학회논문지B
    • /
    • 제16B권3호
    • /
    • pp.239-246
    • /
    • 2009
  • 본 논문은 모바일 폰 기반의 간판 영상내 한글 문자인식에 관한 연구로써 인식 대상은 간판영상에서 추출된 상호명으로 하였고 인식대상 문자 수는 상호명 빈도수 기반 808자로 한정하였다. 인식과정은 특징 추출, 대분류, 상세 분류로 구성되고 특징 추출과정에서는 문자영상의 크기, 잡음 및 왜곡에 강건한 비선형 방향성분 특징을 이용하였고 대분류 과정에서는 추출된 특징과 인식 대상문자에 대하여 최소거리 분류를 수행하고 10순위까지의 후보 문자를 추출하였다. 상세 분류 과정에서는 Fisher discriminant measure 이용하여 대분류에서 발생 할 수 있는 오인 식 결과를 보완하였다. 실험결과 1순위 인식률은 80.45%이고 5순위까지의 누적 인식률은 93.51%를 보였다.

런 길이를 이용한 필기체 한글 자획의 방향 성분 추출 (Extraction of Directional Strokes in Handwritten Hangul using Runlength)

  • 정민철
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2006년도 춘계학술발표논문집
    • /
    • pp.485-488
    • /
    • 2006
  • 본 논문은 수평 런 길이와 수직 런 길이를 이용해 필기체 한글 문자의 자획 두께를 구하고, 그 자획 두께를 이용해 입력 문자의 자소를 수평 성분과 수직 성분으로 분리하는 기술을 제안한다. 수평 성분과 수직 성분 분석은 각도와 관계없이 자획 두께와 수평 런 길이의 변화량만을 이용해 구한다. 분리된 수평 성분 자획과 수직 성분 자획은 오프라인 필기체 한글 인식을 위한 요소 기술 중 하나인 자소 분리를 위한 특징이 된다.

  • PDF

원형 패턴 벡터를 이용한 인쇄체 한글 인식 (Recognition of Printed Hangul Text Using Circular Pattern Vectors)

  • 정지호;최태영
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.269-281
    • /
    • 2001
  • 본 논문에서는 단일 글꼴에 의존하는 원형 패턴 벡터(circular pattern vectors)를 이용하여 위치 이동, 크기 변화 그리고 회전에 무관한 새로운 인쇄체 한글 인식 알고리즘을 제안한다. 제안한 알고리즘은 2진 형태론(binary morphology)을 이용하여 입력 문자에 존재하는 잡음(noise)을 제거한 후, 원형 패턴벡터를 추출한다. 추출된 원형 패턴 벡터는 주어진 문자의 무게 중심을 원의 중심으로 하여 그린 여러 원주 상에 위치한 공간적인 분포 값을 나타내는 것이다. 마지막으로, 실험 문자는 기준 원형 패턴 벡터와 실험 원형 패턴 벡터간의 거리가 최소가 되는 기준 문자로 인식하게 된다. 제안한 알고리즘의 성능을 평가하기 위해, 크기 변화와 회전 변형이 있는 완성형 바탕체 한글 2,350자를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 고리 투영 알고리즘보다 크기 변화와 회전 변형이 있는 한글 인식에 있어서 우수함을 보였다.

  • PDF

인간에게 친밀한 한글 인식 및 편집 지원시스템 (Human Friendly Recognition and Editing Support System of Korean Language)

  • 손영선
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.494-499
    • /
    • 2007
  • 본 논문에서는 책 또는 논문을 읽을 때 중요한 부분 또는 정리해야 할 부분의 영역을 선택하면, 해당영역의 문자들을 문서편집기에 순차적으로 출력시킴으로써 수정 저장 가능하게 하여 공부한 부분을 정리하는 시스템을 구현하였다. 이 시스템은 사용자가 원하는 영역을 손가락으로 선택하면, 손 인식 알고리즘을 적용하여 손가락 움직임을 검출하여 선택된 영역을 인식한다. 선택된 영역의 가로, 세로 거리를 펄스 수로 변환한 후 모터를 제어하여 그 위치만큼 카메라를 이동시킨다. 문자인식이 가능하도록 줌을 확대/축소하고 조정된 줌에 맞는 초점으로 근접 제어한 후, 더욱 선명한 영상을 얻기 위해 명암차이를 이용하여 미세조정을 하였다. 획득된 영상에 문자인식 알고리즘을 적용하여 문서로 변환시켜서 중요 부분들을 정리케하는 한글 인식 및 편집지원 시스템을 구현하였다

한글 인식에 있어서의 자소추출 (A Method of the Extraction of Phonemes in Hangeul Recognition)

  • 최병욱
    • 대한전자공학회논문지
    • /
    • 제18권2호
    • /
    • pp.36-43
    • /
    • 1981
  • 본 논문은 한글 인식에 있어서 문제점으로 되어 있는 조합문자에서의 자소추출 방법의 제안에 관한 것이다. 한글의 구성원리에 입각하여 자소의 단치정보와 Stroke의 방향성을 고려하여 Top-down 적으로 한글의 구조를 분석하고, 이에 따른 3단계 처리에 의하여 자소가 순차적으로 추출되는 과정을 보였다. 일상 활동에서 사용되고 있는 문자중, 677자에 대한 자소의 추출실험결과, 96 %의 추출률을 얻어, 본 방식의 유효성을 확인할 수 있었다.

  • PDF

한글 인식과정에서의 안구운동 특성분석

  • 김창희;이동춘
    • 대한인간공학회:학술대회논문집
    • /
    • 대한인간공학회 1995년도 춘계학술대회논문집
    • /
    • pp.199-208
    • /
    • 1995
  • 본 연구에서는 사람이 한글을 읽는 동안에 문자인식에 영향을 미치는 문장구조의 여러 요소 중 글자크기와 줄간간격에 대한 주시시간과 오독률을 분석함으로써 한글 인식에 있어서 사람에게 적합한 문장구조를 제시하는 데 그 목적이 있다고 할 수 있다. 실험에서는 남녀 각 5명씩의 피실험자에게 아이카메라를 착용시킨 후, 40cm 거리에서 문장중심과 피실험자의 시선이 일치되게 하여, 각기 다른 문장구조를 가 지는 9개의 실험예문(B5용지)을 소리내어 읽게 하였다. 실험결과로 부터 글자크기 와 줄간간격은 읽기수행도(reading performance)에 영향을 미치는 것으로 나타났다. 이를 이용하여 인쇄물의 제작시에 적용시켜 읽기수행도를 제고시킬 수 있다.

  • PDF

구조적 정보를 근거로 최적우선탐색하는 온라인 한글 인식 (An On-Line Hangul Recognition System Based on the Structural Information and the Best-First Search)

  • 권오성;권영빈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.515-523
    • /
    • 1992
  • 일반적으로 한글 인식 과정은 많은 후보들을 생성하며 이 후보들로부터 정확한 인식결과를 얻고 복잡도를 줄이기 위해서는 효과적인 한글 표현과 탐색기법이 요구된다. 이런 목적을 위하여 본 논문에서는 한글에 적합한 구조적 정보들을 4단계 계층적 형태로 표현한다. 그리고 이 정보들을 근거로 후보 문자의 생성과 탐색을 진행하며 전체적으로 최적우선탐색을 이룬다. 인식실험은 다양한 필자들을 대상으로 한글 잦기 상위 422자로 실험한 결과 평균 86% 인식률을 얻을 수 있었다.

  • PDF