• 제목/요약/키워드: 한글 자소 결합

검색결과 8건 처리시간 0.024초

컴퓨터형 한글 서체 개발을 위한 자소 결합 알고리즘 연구 (A study on the combination algorithm of Korean alphabet to develope the Hangul fonts for computers)

  • 김윤식;엄정국;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.341-344
    • /
    • 1998
  • 컴퓨터 상에서 모든 한글 음절을 구현하고자 하면 현대한글 11,172음절의 완성형 코드나 조합형 코드를 사용해야 하는데 조합형의 경우 글자의 미려도가 떨어지는 문제성이 발생되므로 자소 벌수를 늘려 그 문제점을 보완하려는 연구가 진행되어 왔다. 이는 메모리 및 코드처리상 비효율적인 요소가 많으므로 본 논문에서는 자소는 초 중 종성 각각 6벌씩만 제작한 후 자소의 어울림에 따라 자소의 이동과 변형으로 그 미려도를 추구할 수 있는 방안을 제시하고자 한다.

  • PDF

봉네트 - 그후 일년 (BongNet - One Year After)

  • 신봉기;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.503-518
    • /
    • 1993
  • 봉네트는 온라인 한글 필기 글씨 모델이다 [신92]. 글씨를 자소와 연결획의 결합구조로 보고, 각 자소 및 연결획 모델을 정의한 후, 이들을 제자 원리에 따라 네트워크 구조로 설계한 모델이다. 본 논문에서는 봉네트가 소개된 후 지난 일년 동안 수행되었던 실험 및 모델 검증의 결과와 앞으로도 계속될 개선책을 소개하고, 동 모델의 바탕이 된 통계적 인식 이론을 정립하고자 한다.

  • PDF

상태공간탐색을 이용한 한글패턴 인식방법 (A Recognition Method of HANGEUL Pattern Using a State Space Search)

  • 김상진;이병래;박규태
    • 한국통신학회논문지
    • /
    • 제15권4호
    • /
    • pp.267-277
    • /
    • 1990
  • 이 논문에서는 인공지능의 기본적인 문제풀이 기법인 상태공간 탐색을 이용하여 한글을 구성하는 기본자소를 분리하여 인식하는 방법을 제안하였다. 자소분리와 인식과정을 보다 밀접하게 결합하기 위하여 문제를 상태공간에 표현하고, 이 공간을 탐색하여 풀이하였다. 그리고 탐색효율을 향상시키기 위하여 한글의 조합규칙에 입각한 구조정보와 매트릭스 평면에서 각 자소가 갖는 위치정보를 이용하였으며, 컴퓨터실험을 통하여 그 유용성을 확인하였다.

  • PDF

개선된 봉네트

  • 이재준;권재욱;신봉기;김진형
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.189-194
    • /
    • 1994
  • 봉네트는 온라인 한글 필기 글씨 모델이다. 글씨를 자소와 연결획의 결합구조로 보고, 각 자소 및 연결획 모델을 은닉 마르코프 모델을 사용하여 구성한 후, 이들을 한글의 제자 원리에 따라 네트워크 구조로 설계한 모델이다. 본 논문에서는 모델간의 분별력 부족과 입력 정보의 취약등에 기인한 약점을 해결하기 위하여 구조적 인식 방법을 결합한 봉네트의 확장과, 연속 필기 글씨의 처리를 위한 순환 구조로의 확장등, 지난 일년 동안 수행되었던 실험 및 결과를 소개하고, 앞으로의 연구 방향을 논의하고자 한다.

  • PDF

2단계 규칙을 이용한 해체된 한글 음절의 결합 (Assembling Disjoint Korean Syllables Using Two-Step Rules)

  • 이주호;김학수
    • 인지과학
    • /
    • 제19권3호
    • /
    • pp.283-295
    • /
    • 2008
  • SMS나 메신저의 사용이 증가함에 따자 의도적으로 음절을 해체한 새로운 형태의 문장들이 젊은이들 사이에서 습관적으로 사용되고 있다. 이러한 상황에서 자연어 인터페이스 시스템을 개발하기 위해서는 해체된 한글 음절을 결합하여 올바른 문장을 만들어 주는 기술이 먼저 개발되어야 한다. 본 논문에서는 해체된 음절을 2단계 규칙을 이용하여 결합해주는 방법을 제안한다. 1단계에서는 수동으로 자성한 휴리스틱을 이용하여 단순하게 초성, 중성, 종성으로만 해체된 음절을 결합한다. 그리고 2단계에서는 매핑 테이블과 변환기반 학습을 이용하여 복자음까지 해체된 음절을 결합한다. 실험 결과, 제안한 방법은 단순 해체 음절의 결합과 복자음 해체 음절의 결합에서 각각 100%와 99.98%라는 매우 높은 정확률을 보였다.

  • PDF

다양한 크기 및 활자체를 갖는 인쇄체 한글 영상의 문서화에 관한 연구 (A Study on Documentization of Printed Hangul Image with Multi-size and Multi-style)

  • 김장욱;김경숙;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 추계학술대회 학술발표 논문집
    • /
    • pp.295-298
    • /
    • 2001
  • 본 논문에서는 CCD카메라로 입력 받은 다중 크기 및 활자체로 구성된 한글문서의 화상 데이터를 편집기에서 수정 가능한 문자로 변환시키는 시스템을 구현하였다. 먼저 Dynamic 이 진화 처리 과정을 거친 화상을 흑백 화소의 누적분포에 따라 문자단위로 분할한 후, 다양한 크기로 분할된 문자를 표준패턴 크기로 표준화 시켰다. 한글을 자소 간 공백 위치의 특징에 따라서 6가지 유형으로 분류한 후, 퍼지 이론을 접목시킨 원형 패턴 벡터 알고리즘을 사용해서 표준벡터와 입력된 글자의 특징벡터를 비교하여 문자로 인식하게 하였다. 각 6가지 유형에서 서로 다른 자소로 결합된 문자들을 30개 선정하여 여러 가지 활자체 및 크기에 적용해 본 결과, 모두 문서화가 가능함을 알 수 있었다.

  • PDF

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

  • 김병재;박찬민;최윤영;권명준;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF

문자형식 분류 기반의 인쇄체 문자인식에 관한 연구 (A Study on Machine Printed Character Recognition Based on Character Type Classification)

  • 임길택;김호연
    • 전자공학회논문지CI
    • /
    • 제40권5호
    • /
    • pp.266-279
    • /
    • 2003
  • 본 논문에서는 문자의 형식정보를 이용하여 인식대상 문자군을 분할하여 인쇄체 문자를 인식하는 방법을 제안한다. 인식대상 문자를 전체 7개의 형식으로 나누는데, 한글 문자의 경우 자소 조합 방식에 따라 6개의 형식으로 분류하며, 영·숫자 및 기호 문자의 경우 1개의 형식으로 분류한다. 각 문자형식에 따라 입력 문자 영상을 몇 개의 인식단위로 나누고, 이에 대한 방향각도 특징을 추출하여 신경망 인식기에 입력하여 인식한 후 인식된 각 인식단위를 조합하여 문자인식을 한다. 각각 구현된 7가지 형식별 문자인식기를 단순 스위칭 및 통합 방법과 두 방법의 변형 방법 등 7가지의 방법으로 결합하여 최종 문자인식을 하였다. 실험 결과, 단순 스위칭 방법은 98.62%, 단순 통합 방법은 90.54%, 나머지 5가지의 변형 방법들이 97.35%에서 98.65%의 인식 성능을 보였다.