• 제목/요약/키워드: 글자 인식

검색결과 182건 처리시간 0.022초

실시간 글자 인식을 위한 안드로이드 기반의 글자 영역 추출 기술 (A text region extraction algorithm based on Android for real-time text recognition)

  • 이규철;이상용;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.194-196
    • /
    • 2016
  • 본 논문에서는 안드로이드 환경에서 글자 인식을 위한 전처리 과정으로 입력 영상에서 글자 영역만을 추출하는 기법을 제안한다. 대부분의 글자 인식 어플리케이션에서 글자를 인식하는 방법은 RoI(Region of Interest)에 인식하려는 글자를 위치시켜 놓고 사용자가 촬영함으로써 진행된다. 하지만 촬영된 영상 그대로를 인식에 사용하기 때문에 잡음 및 글자가 아닌 영역들을 글자로 인식하는 문제 등으로 인하여 인식률이 현저히 떨어진다. 제안하는 기법에서는 MSER(Maximally Stable Extremal Regions) 기법을 통해 각각의 글자를 추출한 후, 글자의 특성을 이용하여 글자 영역만을 추출한다. 기법의 성능 평가는 무료 OCR(Optical Character Recognition) 엔진인 Tesseract-OCR을 통해 글자 인식률을 비교하였으며, 제안하는 기법을 적용한 글자 인식 시스템이 적용하지 않은 시스템보다 글자의 인식률이 향상되는 것을 확인하였다.

  • PDF

한글 인식 초기과정의 글자유형 분류처리 (Recognition of global character type in initial phase of hangul character identification)

  • 김미현;이만영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.525-532
    • /
    • 1992
  • 본 연구는 한글 글자를 지각하는데 있어서 인식의 초기 단계에 사람들이 글자의 유형을 처리하는지 알아보기 위하여 시행되었다. 글자인식의 초기 단계에서 유형 분류를 한다는 것은 이미 인공시각 연구자들에 의해 시뮬레이션을 통해 검증된 바 있으나, 그것이 심리학적으로 실재성을 가지는지에 대한 검토는 없었으므로 본 연구를 실시하게 된 것이다. 먼저 예비실험을 통해 본 실험에서 쓸 자극제시시간을 구했으며, 실험은 한글 글자 중 낱자 수가 두 개인 유형 1, 2 의 글자를 자극으로 쓰는 경우와, 낱자 수가 세개인 유형 3, 4, 5 의 글자를 자극으로 쓰는 경우를 나누어서 실시하였다. 실험 1 과 실험 2 의 결과는 모두 가설을 강력히 지지하는 것으로 나왔다. 즉 자극제시시간을 역치하로 했을 경우 글자의 정답율과 유형의 정답율을 비교해 보았을 때 유형의 정답율이 유의하게 높았으며, 이는 아직 글자의 의미처리가 일어나기 전인 인식의 초기 단계에서 이미 글자의 유형에 대한 처리가 일어났음을 시사해 주는 것이다.

  • PDF

만주 글자의 단위를 추출하는 효율적인 방법 (An Efficient Method to Extract Units of Manchu Characters)

  • 스노우버거 아론 다니엘;이충호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.617-619
    • /
    • 2021
  • 만주 문자는 세로로 씌여지며 한 단어 안에서는 띄어쓰기 없이 이어져 있기 때문에 문자를 인식하기 전에 글자영역 분리와 글자를 이루는 단위를 분리해 내는 전처리과정이 필요하다. 본 논문에서는 글자영역을 추출하고 글자의 단위를 끊어내는 전처리 방법을 기술한다. 기존 연구가 단어별 또는 문자단위로 인식하는 방법을 전제로 하거나, 이어져 있는 글자의 줄기를 없앤 후 남는 부분으로 인식하는 것과 달리, 본 방법은 인식 가능한 단위별로 글자를 끊어낸 다음 그 단위의 합성으로 글자를 인식하는 방법에 적용할 수 있다. 실험을 통하여 본 방법의 유효성을 검증하였다.

  • PDF

글자체파일의 컴퓨터프로그램저작물성 판단에 대한 비판 (Comment on the Copyrightability of Font-files as Computer Program)

  • 정진근
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제15권2호
    • /
    • pp.17-24
    • /
    • 2019
  • 글자체파일의 무단 이용이 사회적으로 문제가 되고 있다. 이러한 가운데, 우리 법원은 글자체파일을 컴퓨터프로그램으로 인식한다. 글자체를 컴퓨터에서 이용할 수 있도록 디지털화한 글자체파일이 컴퓨터프로그램인가? 이러한 인식은 컴퓨터프로그램과 데이터를 구별하지 못 함으로써 발생하는 것이다. 반면, 전문가들의 인식은 글자체파일을 컴퓨터프로그램으로 인식하지 않는다. 이와 관련하여, 2014년에 INI파일이 컴퓨터프로그램이 아니며, 단지 데이터 파일에 불과하다는 판례가 있었다. 특히, CAD 파일들 역시 외형상 지시명령을 포함하고 있다는 점에서, 대법원의 태도는 컴퓨터프로그램과 데이터 간의 구별을 어렵게 할 뿐이다. 대법원의 판결은 변경될 필요가 있다. 아울러, 글자체파일을 보호하기 위한 새로운 법제도가 마련되어야 한다.

어텐션 중심을 이용한 글자 단위 영역 검출 (Character-level Region Detection Using Attention Center)

  • 김지인;정창성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.952-953
    • /
    • 2019
  • 최근 딥러닝으로 진행되는 광학 문자 인식 분야는 대부분 단어 단위로 인식하는 것으로 글자 단위의 영역을 검출하는 데에는 적합하지 못하다. 본 연구는 각 글자의 영역을 검출하기 위해 기존의 딥러닝을 이용한 광학 문자 인식 절차인 단어 분리 과정과 단어 인식 과정을 유지하면서 어텐션 중심을 이용하여 각 글자의 영역을 보다 정확하게 검출하는 것을 목표로 한다. 제안하는 모델은 CRAFT 와 Attention Network 를 사용한 OCR 과정을 확장한 모델로 각 단어 문자열 결과물에 각 글자의 영역을 추가로 나타내게 되며 각 글자와 라벨 간의 IOU 평균은 0.671 로 나타났다.

글자의 이중상에 의한 심리적 혼란감과 지각 통합 과정 (Psychological Disturbance caused by Letters in Double lmage and its lmplication on Perceptual Integration)

  • 박상호;정찬섭
    • 인지과학
    • /
    • 제6권1호
    • /
    • pp.47-71
    • /
    • 1995
  • 글자의 이중상으로 인한 심리적 혼란감을 '글자멀미'라 정의하였고,눈운동 및 글자 인식 과정이 교란될 때 글자 멀미가 발생한다는 가설을 검증하기 위하여 자극의 노출시간과 글자의 친숙도가 글자 멀미에 미치는 효과를 측정하였다.글자 멀미는 자극 노출 시간이 50ms,100ms,3000ms로 길어짐에 따라,덜 친숙한 외국 문자보다는 친숙한 한글에서 유의미한 단어보다는 무의미한 단어에서 큰것으로 나타났다.이러한 실험발견은 이중상을 제거하려는 눈 운동이 실효를 거두지 못함에 따라 글자 멀미가 발생한다는 것,친숙한 글자일수록 글자 인식 과정의 개입을 더 강화하며 그결과 이중상에 의한 교란 효과가 증폭된다는것,글자 형태는 친숙하지만 의미추출이 어렵게 되면 이중상의 교란효과가 가중된다는 것을 암시한다.의미를 처리하는 경향이 클수록 이중상에 의한 글자 멀미가 심해진다는 가설을 좀 더 분명히 검증하기 위하여 여섯 개의 점으로 구성된 점자를 시각적으로 인식하도록 피험자들을 학습시킨 결과,학습율이 증가함에 따라 글자 멀미가 증가하는 것으로 나타나, 하나의 자극을 의미있는 상징으로 취급하여 해석하려 할때 글자멀미가 증가한다는 결론을 얻었다.

  • PDF

모음 우선 인식에 의한 즐단위 필기체 한글의 인식 (Recognition of Handprinted Hangul Line using Vowel Pre-Recognition Method)

  • 함경수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.195-200
    • /
    • 1994
  • 본 논문에서는 글자 구분선 없이 자유로이 쓰여진 필기체 한글의 인식 방안을 보인다. 즐단위의 한글 입력 영상에서 글자의 골격선을 추출하는 새로운 방법과 골격선들 간의 접촉점과 끝점을 그래프의 노드로 표현하고, 획은 그래프의 가지로 표현하는 방안을 보인다. 한글의 글자 구성 원리는 모음을 중심으로 모아쓰므로, 그래프로 표현된 즐단위의 한글에서 모음의 시작위치 및 속성을 가지는 로드로부터 한글의 모음을 가장 먼저 유도하여 인식하고, 우측 글자 및 자소끼리의 접촉을 분리하여 초성 자음 및 종성 자음을 인식하여, 좌에서 우의 방향으로 한 문자씩 인식해 나간다. 본 논문에서의 자유로이 필기된 한글의 인식 실험은 우리나라의 주소 50개를 서로 다른 25인이 필기한 영상 데이터를 사용하였고 한글 문자의 인식율은 89%이다.

  • PDF

한글 온라인 필기 인식을 위한 전처리 모듈 개발 (Development of Preprocessing module for Korean online handwriting recognition)

  • 정민진;정다빈;이강은;김성석;양순옥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.63-65
    • /
    • 2019
  • 본 논문은 개발하고자 하는 기계학습 기반 한글 필기 인식 시스템의 첫 연구 결과를 담고 있다. 즉, 기계학습을 위해서는 학습용 및 테스트용 필기 데이터가 아주 많이 필요하므로, 이를 수집하고 전처리하는 방법을 제안하였다. 한글의 한 글자는 자음과 모음을 결합하여 생성되는데, 실제 만 개 이상의 글자가 생성될 수 있다. 따라서 각각의 글자 데이터를 수집하는 대신, 수집한 글자 데이터로부터 초성, 중성, 종성을 구분하여 최종적으로 자음, 모음 데이터로 저장하고자 한다. 아직 초기 연구이므로, 다양한 경우에 대한 분석이나 실험 결과는 없지만, 이를 활용하여 온라인 필기 인식 모델에 적용하여 인식 성능을 높이기 위한 추후 연구의 기반으로 활용하고자 한다.

배경 세선화를 이용한 한글 필기체 글자 단위 분할 (Handwritten Korean Character Segmentation using Background thinning)

  • 서원택;조범준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.823-825
    • /
    • 2004
  • 본 연구에서는 필기체 한글의 글자단위의 분할을 위해 배경 세선화(Background thinning)라는 방법을 제안한다. 배경 세선화 방법은 글자와 글자 사이에 존재하는 배경의 정보를 세선화 처리하여 필기체 한글에서 많이 발생할 수 있는 중첩(Overlap)글자와 연결(Touched)글자를 서로 분할하는데 효과적인 성능을 보였다. 배경 세선화를 이용하여 글자를 분할하는 방법은 인식과정의 판단을 필요하지 않은 외적분할 방법으로 빠른 속도의 분할 성능을 보였다. 이 방법은 특히, 중첩된 글자의 분할에 탁월한 성능을 보였을 뿐만 아니라, 연결된 글자에 대해서도 좋은 성능을 보였다.

  • PDF

명조체와 샘물체 단어모양이 한글인식에 미치는 효과 (The effect of Meungzo and Saemmul fonts on Hangul recognition)

  • 김호영;정찬섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.259-267
    • /
    • 1992
  • 단어모양이 한글 시각정보처리에 미치는 효과를 알아보기 위해 명조체와 샘물체로 된 한음절 글자, 두음절 단어, 세음절 단어의 정확인식율을 비교하였다. 명조체는 자모의 모양과 크기가 글자의 고정된 사각틀에 맞게 변형되므로 단어모양이 글자의 자모조합 유형과 음절길이에 따라 크게 달라지지 않는다. 이에 반해 샘물체는 자모조합 유형에 따라 글자의 사각틀이 변형되므로 부가적인 단어변별 정보가 단어모양에 포함되며, 음절길이가 증가할 때 단어모양 정보가 명조체에 비해 더욱 두드러진다. 이처럼 서로 구별될 수 있는 명조체와 샘물체 단어의 시각적 구조는 각각 다른 근거에서 한글인식에 영향을 미칠 수 있을 것으로 예상된다. 연구결과, 명조체의 정확인식율이 샘물체보다 높았으며, 음절길이가 증가할 때 명조체와 샘물체에 상관없이 정확인식율이 향상되었다. 본 실험의 결과는 단어의 외곽모양 변이가 영어의 경우보다 한글 시각정보처리에서 상대적으로 덜 중요하다는 것을 시사한다.

  • PDF