• 제목/요약/키워드: 한글자모

검색결과 99건 처리시간 0.027초

문자 인식을 이용한 한글 문서 검색 (Hangul Document Retrieval Using Character Recognition)

  • 안재철;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.544-546
    • /
    • 2001
  • 이 논문은 OCR(Optical Character Reader)로 인식된 한글 문서에서의 오인식 경향을 분석하고, 이를 이용한 한글 단어 검색 방법을 제안한다. OCR로 인식된 많은 야의 한글 문서를 기반으로 자모별 인식 빈도수를 계산하고 이를 바탕으로 초성, 중성, 중성별 인식 혼동 행렬(confusion matrix)을 구성하였다. 또한 인식 정보를 적절히 이용하기 Bayes 정리를 이용하였다. 질의어에 대한 오인식 단어의 검색 방법을 제시하고 혼동 행렬과 이 검색 방법을 바탕으로 OCR 기반 단어 검색 시스템을 구축하였다.

  • PDF

데이터베이스상의 한글 자모단위 비교를 통한 데이터 정정기법 (A Revising Method using Phoneme Comparison for Databases with Korean Character Set)

  • 김대환;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.532-534
    • /
    • 2003
  • 코드로써 관리되어있지 않은 데이터베이스 내의 다양한 속성들이 시간이 흐름에 따라 정보로써 가치를 갖게 되면서. 비코드성 한글 데이터의 정형화에 대한 요구가 증가하고 있다. 정형화에 있어 한글의 특수성 중에 하나는 한글자료의 경우 KSC5601, CP949등을 사용하여 음절단위의 문자셋을 사용하여 음절단위로 저장 관리한다. 그런데 입력 시정에서는 자판기등을 이용하여 음소단위로 데이터를 입력하면서 발생하는 오류 및 비정형 데이터의 유입의 문제 등을 내포하고 있다. 이러한 문제를 해결하기 위하여 데이터의 저장단위인 음절이 아닌 음소 단위의 비교를 통하여 데이터를 정정하는 기법을 제안하고자 한다.

  • PDF

형식별 블럭분할에 기초한 다중신경망과 퍼지추론에 의한 한글 형식분류 (Classification of Korean Character Type using Multi Neural Network and Fuzzy Inference based on Block Partition for Each Type)

  • 편석범;박종안
    • 한국음향학회지
    • /
    • 제13권4호
    • /
    • pp.5-11
    • /
    • 1994
  • 본 논문에서는 형식별 블럭분할에 기초한 다중신경망과 퍼지추론에 의한 한글 형식분류에 대해 연구하였다. 효과적인 자모분류를 위해 입력문자에 대해서 한글의 각 형식을 구성하는 자모의 영역으로 분할하는 블럭분할방법을 제한하였으며, 분할된 블럭이 형식에 따라 적응적으로 변화할 수 있도록 하였다. 또한 분류율의 향상을 위해 전체신경망과 부분신경망으로 이루어진 다중신경망을 구성하였으며, 퍼지추론에 의해 한글 형식을 판정하였다. 비교, 실험을 통하여 제안된 방법의 타당성을 검증하였으며, $92.6\%$의 분류율을 나타내므로서 유효성을 확인하였다.

  • PDF

한글문자의 인식에 관한 연구(IV) (Mathematical Analysis of the Structure of Korean Characters)

  • 최주근
    • 대한전자공학회논문지
    • /
    • 제9권4호
    • /
    • pp.25-32
    • /
    • 1972
  • 이 논문은 한글문자의 조직을 수학적인 관점에서 분석 겸토하였다. 1) 자모문자와 조합문자외 조직개념을 통일된 관점에서 겸토하였고. 2) 문자는 24개의 기본자음과 모음이 음에 따라 조합될뿐만 않이라 그것은 또한 음(또는 문자)의 집단을 한음으로서 일거에 결정짖고 또 계단적으로 발전하는 특의한 성질을 가지고 있다는 것을 지적하였다. 3) 또 24개의 자모가 matrix 조직에 의한 수학적 방법에 의하여 14,364자가 조직배열 된다는 것을 기술하였다.

  • PDF

역사속 과학인물 - 최초의 한글 전신부호 고안 '김학우(1862~1894년)

  • 박성래
    • 과학과기술
    • /
    • 제32권1호통권356호
    • /
    • pp.32-34
    • /
    • 1999
  • 구한 말의 김학우는 최초의 한글 전신부호를 고안한 발명가로 고종의 총애를 받았다. 1862년 함경도에서 태어난 그는 갑오경장의 소용돌이 속에서 32세로 암살을 당했다. 러시아어, 중국어, 일어 등에 능통했던 그는 미국을 비롯한 중국, 일본 등 해외를 왕래하면서 전신기술을 배우고 돌아와 한글 자모의 모르스 전신부호를 만들어 1885년 10월 3일 최초로 서울과 인천 사이의 전신을 개통시킨 산파역이다.

  • PDF

자모 및 음절 임베딩 결합을 이용한 오타에 효과적인 한국어 형태소 분석 (Effective Korean POS Tagging for Typing Errors Using the Concatenation of Jamo and Syllable Embedding)

  • 김혜민;양선;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.574-579
    • /
    • 2018
  • 본 논문에서는 한국어 형태소 분석 시스템을 제안하는데, 연구 목표는 오타 없는 문서를 대상으로 한 경우에도 높은 성능을 유지하면서, 동시에 오타가 있는 문서에서도 우수한 성능을 산출하는 것이다. 실험은 크게 두 종류로 나누어서 진행된다. 주 실험인 첫 번째 실험에서는, 자모 임베딩과 음절 임베딩을 결합(concatenate)한 벡터를 입력으로 Bidirectional LSTM CRFs을 수행함으로써, 세종말뭉치 대상으로 어절 정확도 97%, 그리고 1, 2, 5 어절마다 오타가 출현한 경우에서도 각각 80.09%, 87.53%, 92.49%의 높은 성능을 산출하였다. 추가 실험인 두 번째 실험에서는, 실생활에서 자주 발생하는 오타들을 집계하여 그 중에서 11가지 오타 유형을 선정 후, 각 유형에 대해 변환된 임베딩 벡터를 적용함으로써, 해당 오타를 포함한 문장에서 93.05%의 우수한 성능을 산출하였다.

  • PDF

소형 정보통신 단말기를 위한 한글 입력 방법 (Hangul Input Method for Small Electronic Networking Devices)

  • 강승식;한광수
    • 한국멀티미디어학회논문지
    • /
    • 제8권2호
    • /
    • pp.287-295
    • /
    • 2005
  • 정보통신 단말기에서 한글을 쉽고 빠르게 입력 할 수 있는 방법을 모색하기 위해 한글 자음과 모음의 표기법 및 조합 원리를 분석하여 한글 자모 집합보다 작은 크기의 기본 자모 집합으로 한글을 입력하는 방법을 제시하였다 그 결과로 자음의 경우 기본 자음과 기능키를 이용하여 자음들을 조합하고, 모음은 8개의 기본모음으로부터 모음의 조합 원리 및 가획 원리에 의해 입력키가 할당되지 않은 모음을 조합하는 방식을 제안하였다. 특히, 유사 자소간의 에러 발생시에 지움 버튼을 사용하는 불편함을 해소하기 위해 자소간의 전환이 가능한 오류 수정 방식을 도입하였을 뿐만 아니라, 사용자가 입력 방식에 쉽게 익숙해질 수 있도록 입력방식을 다양화함으로써 사용자 편의 성 을 추구하였다 기존의 천지인, 나랏글 방식과 비교했을 때 사용자 편의성과 입력의 신속성, 에러 수정의 용이성 측면에서 매우 효율적임을 확인하였다.

  • PDF

조합형 한글 정규식 Java 라이브러리 설계 (A Design of the Java Library for Combined Hangul Regular Expression)

  • 정재용;우균
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.31-34
    • /
    • 2015
  • 현재의 한글 정규식은 완성형 한글에 맞춰 글자단위로 사용할 수밖에 없으므로 사용이 불편하다. 따라서 이러한 불편함을 해결하기 위해 자모단위로 처리 가능한 조합형 한글 정규식 Java 라이브러리를 설계하였다. 조합형 한글 정규식 Java 라이브러리를 통해서 단순히 '가'로 시작하는 글자가 아니라 'ㄱ'으로 시작하는 글자나, 종성이 없는 단어 등을 처리할 수 있으며 기존의 정규식 문법 또한 사용할 수 있다. 이를 위해서 초성, 중성, 종성 각각에 조건을 주는 규칙을 한글 정규식 문법에 추가하였으며, 기존의 Java 정규식 라이브러리와 해당 라이브러리에서 이용하는 유니코드 표현상에서의 한글 인코딩 특징을 이용하였다.