• 제목/요약/키워드: 문자 구조적 특징

검색결과 70건 처리시간 0.029초

기초 통계량을 이용한 저작자 진위 추론

  • 이근무;이근우
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2001년도 추계학술발표회 논문집
    • /
    • pp.69-73
    • /
    • 2001
  • 이 논문에서 문장특성을 파악하는 방법으로 주로 이용한 것은 특정문자의 출현율이다. 어떤 사람이나 그 글 속에는 자신의 개성이 들어있다. 문장의 길이를 비롯하여 문장의 구조나 어휘량, 유의어 중에서 선호하는 글자, 평서문이나 의문문의 사용, 품사의 사용, 문두나 문말에 오는 글자 등에서 각각의 개성이 드러난다. 그 중에서도 접속사나 조사, 접두어, 접미어 등 상대적으로 의미적인 요소보다는 형식적인 요소에 가까운 영역에서 문장의 특성이 두드러지는 것으로 보고되어 있다, 이런 특징을 이용하여 화랑세기의 저작자의 진위를 추론하고자 한다.

  • PDF

유의어를 이용한 저작자 진위 추론 (Author′s Inference Usng Significant Word)

  • 이근무;이근우
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.762-765
    • /
    • 2004
  • 이 논문에서 문장특성을 파악하는 방법으로 주로 이용한 것은 특정문자의 출현율이다. 어떤 사람이나 그 글 속에는 자신의 개성이 들어있다. 문장의 길이를 비롯하여 문장의 구조나 어휘량, 유의어 중에서 선호하는 글자, 평서문이나 의문문의 사용, 품사의 사용, 문두나 문말에 오는 글자 등에서 각각의 개성이 드러난다. 그 중에서도 접속사나 조사, 접두어, 접미어 등 상대적으로 의미적인 요소보다는 형식적인 요소에 가까운 영역예서 문장의 특성이 두드러지는 것으로 보고되어 있다. 이런 특징을 이용하여 화랑세기의 저작자의 진위추론을 시도하고자한다.

  • PDF

NMF와 EMD를 이용한 영문자 활자체 폰트분류 (Font Classification using NMF and EMD)

  • 이창우;강현;정기철;김항준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.688-690
    • /
    • 2004
  • 최근 전자화된 문서 영상을 효율적으로 관리하고 검색하기 위한 문서구조분석 방법과 문서의 자동 분류에 관한 많은 연구가 발표되고 있다. 본 논문에서는 NMF(non-negative matrix factorization) 알고리즘을 사용하여 폰트를 자동으로 분류하는 방법을 제안한다. 제안된 방법은 폰트의 구분 특징들이 공간적으로 국부성을 가지는 부분으로 표현될 수 있다는 가정을 바탕으로, 전체의 폰트 이미지들로부터 각 폰트들의 구분 특징인 부분을 학습하고, 학습된 부분들을 특징으로 사용하여 폰트를 분류하는 방법이다. 학습된 폰트의 특징들은 계층적 군집화 알고리즘을 이용하여 템플릿을 생성하고, 테스트 패턴을 분류하기 위하여 템플릿 패턴과의 EMD(earth mover's distance)를 사용한다. 실험결과에서 폰트 이미지들의 공간적으로 국부적인 특징들이 조사되고, 그 특징들의 폰트 식별을 위한 적절성을 보였다. 제안된 방법이 기존의 문자인식. 문서 검색 시스템들의 전처리기로 사용되면. 그 시스템들의 성능을 향상시킬 것으로 기대된다.

  • PDF

카메라형 광학식문자판독기술(OCR)을 활용한 오프라인 중고서점의 장서 디지털 데이터화 관리 방안 제안 (An Efficient Management Strategy of A Offline Second-Hand Bookstore With Camera Type OCR Technology)

  • 구자민;함승모;김우제;심현동;류기동
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.283-286
    • /
    • 2014
  • 본 논문에서는 카메라형 OCR (Optical Character Reader) 기술을 이용해 오프라인 중고서점의 효율적 장서관리 시스템을 구축하기 위한 디지털 데이터화 관리시스템 방안을 제안한다. OCR은 광학적으로 인식할 수 있는 문자를 컴퓨터가 읽을 수 있도록 하는 기술이다. 원리적으로 문자 한 개를 수십 개의 모눈으로 분할해 특정한 모눈의 흑백 또는 자획형상 특징에 의해 문자를 판독한다. 이 논문에서는 OCR 기술을 활용함으로써 디지털 데이터화의 효과는 물론 적용 환경의 개선효과를 기대해 볼 수 있는 오프라인 중고서점 시장을 목표로 했다. 오프라인 중고서점에서 보유하고 있는 장서의 디지털 데이터화는 기업형 중고서점과의 경쟁에 있어서도 생존을 위해 필요한 요소이다. 카메라형 OCR 기술을 활용한 장서 디지털 데이터화는 오프라인 중고서점 판매자가 도서재고 검색 및 판매 관리 효율을 높이도록 도와줄 뿐 아니라, 도서판매 유형, 소비자 분석과 수요 예측을 가능하게 한다. 또한 소비자에게 오프라인 중고서점에서 보유하고 있는 희귀 장서와 중고서적들을 검색해 구입할 수 있는 편의를 제공할 것이다. 오프라인 중고서점 판매를 촉진하고 활성화시킨다면 출판의 선순환적 구조를 만드는 데 기여할 것으로 예상된다.

  • PDF

부분 매칭 방법을 이용한 효율적인 서식 문서 분류 (Efficient From Document Classification Large using Partial Matching Method)

  • 변영철;최영우;김경환;이일병
    • 정보처리학회논문지B
    • /
    • 제8B권1호
    • /
    • pp.1-9
    • /
    • 2001
  • 본 논문에서는 서식 문서를 짧은 처리 시간에 정확히 분류함으로써 실제 환경에서 응용할 수 있는 서식 분류 방법을 제안한다. 제안하는 방법은 서식 문서 이미지 전체를 다루기보다는 처리하고자 하는 서식 문서에서 서식 구조가 많이 다른 곳을 찾아서 매칭 영역으로 결정하고, 그 영역들에 대해서만 비교를 수행함으로써 계산 시간을 줄이고 인식률을 높인다. 선분 추출 시 오류를 고려하기 위하여 기존 인쇄 문자와 채워진 데이터, 그리고 매칭 영역의 크기 정보를 페널티 함수로 반영하여 매칭 영역 선택 시 고려한다. 본 방법은 구조적으로 많이 다르고, 양질의 특징을 포함하는 적은 수의 매칭 영역을 선택함으로써 처리 시간을 줄일 수 있음은 물론 높은 서식 분류율을 얻을 수 있다.

  • PDF

WIPI 기반 모바일 공학용 계산기 (WIPI-Based Mobile Scientific Calculator)

  • 김현철;김보라;공기석;서대영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.281-285
    • /
    • 2007
  • 일반 공학용계산기를 모델로 WIPI를 이용한 어플리케이션인 모바일 공학용계산기를 개발하였다. 모바일 공학용계산기는 사용빈도가 높은 함수연산(삼각함수, log, $\surd$(루트), $\Pi$(파이), !(팩토리얼), 제곱 등)을 지원하며 식의 저장(Save), 불러오기(Load) 기능으로 이용의 편리함을 더하였다. 입력받은 문자열을 숫자로 변환하여 한자리씩 계산한 후 문자열로 재결합하는 구조로 결과값의 길이에 대한 제한 없이 출력이 가능하다. 성능은 PC나 일반 공학용계산기의 처리속도와 결과의 정확도면에서 뒤떨어지지 않는다. 모바일 공학용계산기는 휴대폰에 탑재되어 이동성이 탁월하며 언제어디서나 사용가능하고, 한번의 다운로드로 수명이 영구적이다. 또한 소프트웨어 업그레이드로 프로그램의 확장성이 특징이다.

  • PDF

擴張된 DP 매칭법에 依한 흘림체 한글 온라인 認識 (On-Line Recognition of Cursive Hangeul by Extended DP Matching Method)

  • 이의동;김태균
    • 대한전자공학회논문지
    • /
    • 제26권1호
    • /
    • pp.29-37
    • /
    • 1989
  • 본 논문은 DP(dynamic programming) 매칭법을 확장하여 흘림체 한글을 온라인으로 인식하는 방법에 대하여 논한 것이다. 한글의 자소는 보다 간단한 자소에 선분이 점차로 추가되어 보다 복잡한 구조로 발전되는 특징이 있다. 자소의 조합에 의해 구성되는 한글에는 유사한 문자 패턴이 많다. 이러한 특성으로 인하여 한글에 대하여 DP매칭법을 적용하여도, 입력문자와 표준문자와의 패턴간 거리를 정확하게 구하는 것이 곤란하다. 본 방식에서는 DP매칭을 행하기 전에, 한글의 최초, 최후선분의 특성을 살린 대분류매칭을 행함으로써 DP매칭의 대상수를 줄였다. 본 방식은 DP매칭법에 자소패턴의 추출기능을 부가함으로써, DP매칭을 확장하여, 한글의 문자패턴간의 거리를 정확하게 측정하는 것을 시도한다. 자소패턴의 추출은, 자소패턴을 구성하는 선분의 ON/OFF, 방향코오드, 방향코오드의 변화, 배치 구조등을 조사함으로써 행한다. 이와같이 하므로써 필기운동 변화의 흡수와 비교적 안정된 스트로크의 분리가 가능함을 확인하였다.

  • PDF

인지이론과 ART 신경회로망에 기반한 한글 문자 분류 모델 (Hangeul Character Classification Model Based on Cognitive Theory and ART Neural Network)

  • 박중양;박재흥;장재혁
    • 한국콘텐츠학회논문지
    • /
    • 제5권5호
    • /
    • pp.33-42
    • /
    • 2005
  • 본 논문에서는 ART 신경회로망의 성능을 개선하기 위해, 불필요한 클러스터의 생성과 변화를 억제하여 효율적인 패턴 분류가 가능하도록 하는 학습 알고리즘을 제안한다. 또한, 패턴 분류의 정확성을 향상시키기 위해 한글의 구조적 특징을 이용한 위치추출 알고리즘을 적용하였다. 제안하는 학습 알고리즘은 현재 학습되는 패턴과 최초 패턴간의 일치도를 비교한 후 리세트 시스템을 작동케 한다. 그 결과, 신경회로 망은 이미 입력되었던 패턴이 다시 입력되어도 새로운 클러스터의 생성을 방지하여 오인식율을 줄이게 된다.

  • PDF

관심 문자열 인식 기술을 이용한 가스계량기 자동 검침 시스템 (Automatic gasometer reading system using selective optical character recognition)

  • 이교혁;김태연;김우주
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.1-25
    • /
    • 2020
  • 본 연구에서는 모바일 기기를 이용하여 획득한 가스계량기 사진을 서버로 전송하고, 이를 분석하여 가스 사용량 및 계량기 기물 번호를 인식함으로써 가스 사용량에 대한 과금을 자동으로 처리할 수 있는 응용 시스템 구조를 제안하고자 한다. 모바일 기기는 일반인들이 사용하는 스마트 폰에 준하는 기기를 사용하였으며, 획득한 이미지는 가스 공급사의 사설 LTE 망을 통해 서버로 전송된다. 서버에서는 전송받은 이미지를 분석하여 가스계량기 기물 번호 및 가스 사용량 정보를 추출하고, 사설 LTE 망을 통해 분석 결과를 모바일 기기로 회신한다. 일반적으로 이미지 내에는 많은 종류의 문자 정보가 포함되어 있으나, 본 연구의 응용분야인 가스계량기 자동 검침과 같이 많은 종류의 문자 정보 중 특정 형태의 문자 정보만이 유용한 분야가 존재한다. 본 연구의 응용분야 적용을 위해서는 가스계량기 사진 내의 많은 문자 정보 중에서 관심 대상인 기물 번호 및 가스 사용량 정보만을 선별적으로 검출하고 인식하는 관심 문자열 인식 기술이 필요하다. 관심 문자열 인식을 위해 CNN (Convolutional Neural Network) 심층 신경망 기반의 객체 검출 기술을 적용하여 이미지 내에서 가스 사용량 및 계량기 기물번호의 영역 정보를 추출하고, 추출된 문자열 영역 각각에 CRNN (Convolutional Recurrent Neural Network) 심층 신경망 기술을 적용하여 문자열 전체를 한 번에 인식하였다. 본 연구에서 제안하는 관심문자열 기술 구조는 총 3개의 심층 신경망으로 구성되어 있다. 첫 번째는 관심 문자열 영역을 검출하는 합성곱신경망이고, 두 번째는 관심 문자열 영역 내의 문자열 인식을 위해 영역 내의 이미지를 세로 열 별로 특징 추출하는 합성곱 신경망이며, 마지막 세 번째는 세로 열 별로 추출된 특징 벡터 나열을 문자열로 변환하는 시계열 분석 신경망이다. 관심 문자열은 12자리 기물번호 및 4 ~ 5 자리 사용량이며, 인식 정확도는 각각 0.960, 0.864 이다. 전체 시스템은 Amazon Web Service 에서 제공하는 클라우드 환경에서 구현하였으며 인텔 제온 E5-2686 v4 CPU 및 Nvidia TESLA V100 GPU를 사용하였다. 1일 70만 건의 검침 요청을 고속 병렬 처리하기 위해 마스터-슬레이브 처리 구조를 채용하였다. 마스터 프로세스는 CPU 에서 구동되며, 모바일 기기로 부터의 검침 요청을 입력 큐에 저장한다. 슬레이브 프로세스는 문자열 인식을 수행하는 심층 신경망으로써, GPU에서 구동된다. 슬레이브 프로세스는 입력 큐에 저장된 이미지를 기물번호 문자열, 기물번호 위치, 사용량 문자열, 사용량 위치 등으로 변환하여 출력 큐에 저장한다. 마스터 프로세스는 출력 큐에 저장된 검침 정보를 모바일 기기로 전달한다.

동적 프로그래밍을 이용한 오프라인 환경의 문서에 대한 필적 분석 방법 (A Verification Method for Handwritten text in Off-line Environment Using Dynamic Programming)

  • 김세훈;김계영;최형일
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1009-1015
    • /
    • 2009
  • 필적 감정은 개인의 필적 개성을 이용하여 임의의 두 필기 문장 또는 텍스트가 동일인에 의해 작성되었는지를 판별하는 기술이다. 본 논문은 패턴 인식 기술을 사용하여 효과적으로 필적을 분석하고 판별하는 오프-라인 환경에서의 검증 방법을 제안한다. 본 논문에서 연구된 방법의 핵심 절차는 문자 영역 추출, 문서의 구조적 특징을 반영하는 특징의 추출, DTW(Dynamic Time Warping) 알고리즘과 주성분 분석을 이용한 특징 분석이다. 실험 결과는 제안하는 방법의 우수한 성능을 보여준다.