• 제목/요약/키워드: 한글자모

검색결과 99건 처리시간 0.028초

효율적인 한글 코드화에 관한 연구 (A Study on an Efficient Coding of Hangeul)

  • 김경태;민용식
    • 한국통신학회논문지
    • /
    • 제14권6호
    • /
    • pp.633-641
    • /
    • 1989
  • 본 논문은 한글의 특성을 3상태 변환 그래프를 이용하여 경제적으로 코드화하는 방법을 제시한 것이다. 이 방법을 사용하면, 한글을 표시하는데 코드의 평균 길이는 자모당 약 204비트 정도가 필요하게 되는데 이것은 다른 방법에서 제시된 것보다 약 1비트이상 축약된 것이다. 따라서 정뵤교환이 필수 조건인 정확성 간결성 신속성 경제성을 향상시킬 수가 있게 된다.

  • PDF

키워드 인식을 위한 한글 Pseudo 2D HMM의 동적 합성 방법 (Dynamic Synthesis of Pseudo 2D HMMs for Korean Characters in Key Character Recognition Tasks)

  • 조범준
    • 한국통신학회논문지
    • /
    • 제26권6B호
    • /
    • pp.820-827
    • /
    • 2001
  • 한글은 둘 또는 세 개의 자모가 사각형 영역 안에 적절히 배치된 구조로 되어 있다. 이와 같은 구성 방법에 따라 글자의 영상을 합성하고 이를 실시간에 Pseudo 2D HMM으로 변환하는 방법을 제안한다. 본 방법에 따라 실시간 합성된 모델과 추가의 필러(filler) 모델, 여백 모델을 문서 영상의 글자 영역에서 핵심어 검출에 적용하였다. 실험 결과 최소한의 설계 변수 조정으로도 오검출, 미검출률이 낮고 언어 모델 없이 숫자 89%, 한글 80%의 검출성능을 보였으며, 따라서 제안된 방법이 인쇄 문자 패턴의 실시간 모델링 및 키워드 검출에 효과가 있음을 보였다. 본 연구 결과는 내용 기반의 광학 문서 색인 등에 활용할 수 있다.

  • PDF

굴곡점에서의 삼각분할을 이용한 필기체 한글자모 고속인식에 관한 연구 (A Fast Recognition of The Korean Hand_Written Character using the Triangulation of the Bend Points)

  • 김현경;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1988년도 전기.전자공학 학술대회 논문집
    • /
    • pp.632-635
    • /
    • 1988
  • 이 논문에서는 필기체 한글 인식에 있어서 입력된 기본자소를 window를 이용한 윤곽선 추적과 삼각분할에 의한 이분점 추출에 의해 각 기본자소가 갖고있는 특징성분을 찾아내고 그 특징성분에 의해 문자의 골격을 추출하여 인식하는 방법을 제안하였다. 윤곽선 추적시 window를 이용함으로 간단한 잡음제거와 추적속도를 증가 시켰으며 삼각분할에 의한 이분점 추출방법을 사용함으로 단순한 윤곽선 추적에 의해 특징성분을 추출하는 방법보다 문자의 특징성분을 정확하게 추출할 수 있다는 장점을 갖는다.

  • PDF

전자식 전화기를 이용한 문자 입력용 코드( I ) (Letter Keying Codes for MFC Telephone Sets( I ))

  • 김응인;이종락
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.271-283
    • /
    • 1992
  • 이 논문에서는 전자식 전화기를 이용하여 문자를 입력할 수 있는 코드를 제안하였다. 기존의 문자 입력 방식들과 새로이 고안된 입력 방식을 입력 속도, 수용할 수 있는 문자의 수 및 입력시의 모호성 발생 여부를 판단 기준으로 비교하고 시험하여 새로운 방식이 더 우월함을 입증하였다. 이 방식에 기초하여 한글자모, 영문자를 전화기의 문자판에 배치하고, 그 배치가 최적인지를 검증하기 위해 각각의 배치에 대해 여러가지 시험을 실시하여 표준 $4{\times}3$형의 전화기 자판에 최적인 문자 코드 배치를 선택하였다.

  • PDF

퍼지소속함수를 이용한 온라인 한글 인식 (On-line Recognition in Korean Character Using Fuzzy Membership Function)

  • 심영철;오경환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1991년도 제3회 한글 및 한국어정보처리 학술대회
    • /
    • pp.300-306
    • /
    • 1991
  • 본 논문에서는 온라인 한글 인식을 위하여 퍼지소속함수를 사용하였다. 획의 오인식으로 인한 문자의 오인식 문제를 해결하기 위하여 인식 시스템 내에서 획을 퍼지집합으로 표현하며, 자모를 인식하는데 사용되는 획의 중심점들 간의 방향은 퍼지소속 함수로 정의하여 추론한다. 본 논문에서 제시하는 퍼지추론 방법은 같은 획으로 시작되는 모든 자소에 대하여 적용되며, 애매모호한 상황하에서도 인식을 수행한다. 따라서 퍼지소속함수를 사용한 시스템은 종래에 오인식 되었던 애매한 글자들을 정확하게 인식할 수 있었다.

  • PDF

전자계산기에 의한 필기체 한글 인식에 관한 연구 (A study on the Automatic Recognition of Hand Printed Hangeul patterns by the Computer)

  • 남궁재찬;김영건
    • 한국통신학회논문지
    • /
    • 제5권1호
    • /
    • pp.44-48
    • /
    • 1980
  • 본 논문에서는 필기체 한글인식을 위한 한 방법을 제안했다. 기본 자모를 대상으로 하였으며, 임의의 Pattern에 대하여 접합보상및 정형 Algorithm을 제안하므로써 본래의 표준 한글 pattern으로 정형화하였다. 인식에는 Tree grammar를 사용하였으며, 새로운 Parsing 방법을 제안하므로써 종래의 방법보다 처리를 간단화시켰으며 error를 감소시켰다. 제한된 필기체에 대하여는 매우 효과적이었으며 on line 필기체 인식에도 유용성이 있음을 보였다.

  • PDF

인쇄체 한글 및 한자의 인식에 관한 연구 (A Study on the Printed Korean and Chinese Character Recognition)

  • 김정우;이세행
    • 한국통신학회논문지
    • /
    • 제17권11호
    • /
    • pp.1175-1184
    • /
    • 1992
  • 본 논문에서는 한자를 포함하는 한글 문서 인식을 위한 인쇄체 한글, 한자의 구분과 인식 방법에 대하여 연구하였다. 제안된 한글, 한자 구분 방법은 한글의 수직모음과 수평모음의 구조적 특징을 이용하였다. 한글은 6가지 형태로 분류하고 분류된 각 형태에 대하여 세선화 과정을 거치지 않고 모음 우선추출에 의한 자모분리를 행하고 분리된 자음에 대하여 변형된 교차거리 특징을 이용하여 인식하였다. 한자에 대해서는 획교차수의 평균치를 이용하여 전체 한자 대상문자에 대해 분류를 하였으며, 문자의 획교차수와 흑점비율 특징을 이용하여 인식하였다. 한글과 한자의 구분에서는 90.5%의 분류율을 얻었다. 한글인식에 있어서는 대상문자 명조체 2512자에 대하여 90.0%의 형태 분류율을 얻었다. 인식 결과 실험 데이타 1278자에 대하여 92.2%의 인식율을 얻었다. 한자인식에 있어서는 대상문자 4585자에 대하여 분류한 결과 최대밀집 구간은 124자로서 약 1/40 정도로 분류되었음을 알 수 있었고, 인식실험 결과 89.2%의 인식율을 얻었다.

  • PDF

한글 단어재인에 있어서 글자처리와 낱자의 지각 (II) (Syllabic Processing and Latter Perception in Korean Word Recognition (II))

  • 김정오;김재갑
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.423-433
    • /
    • 1992
  • 낱자 또는 음절들을 매우 짧게 제시하고 차폐로 지운 후 두 낱자 중하나를 선택하는 과제 (Reicher, 1969)를 사용하여 음절 맥락에서 낱자 지각에 영향을 주는 변수들과 그 배후 지각과정들을 검토하였다. 자모 조합유형이 음절 내 낱자의 정체 파악에 체계적으로 영향을 주고 있었고, 예상과는 달리 음절 내의 낱자들이 단독으로 제시되는 낱자 보다 잘 파악되지 않는 음절열등효과가 일관되게 관찰되었다. 본 연구의 세 실험 결과들을 상호작용활성화 모형과 초보지각자-기억자 모형에 비추어 논의하였다.

  • PDF

음절 단위 및 자모 단위의 Byte Pair Encoding 비교 연구 (Comparing Byte Pair Encoding Methods for Korean)

  • 이찬희;이동엽;허윤아;양기수;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.291-295
    • /
    • 2018
  • 한국어는 교착어적 특성이 강한 언어로, 교착어적 특성이 없는 영어 등의 언어와 달리 형태소의 수에 따라 조합 가능한 어절의 수가 매우 많으므로 어절 단위의 처리가 매우 어렵다. 따라서 어절을 더 작은 단위로 분해하는 전처리 단계가 요구되는데, 형태소 분석이 이를 위해 주로 사용되었다. 하지만 지도학습 방법을 이용한 형태소 분석 시스템은 다량의 학습 데이터가 요구되고, 비지도학습 방법을 이용한 형태소 분석은 성능에 큰 하락을 보인다. Byte Pair Encoding은 데이터를 압축하는 알고리즘으로, 이를 자연어처리 분야에 응용하면 비지도학습 방법으로 어절을 더 작은 단위로 분해할 수 있다. 본 연구에서는 한국어에 Byte Pair Encoding을 적용하는 두 가지 방법인 음절 단위 처리와 자모 단위 처리의 성능 및 특성을 정량적, 정성적으로 분석하는 방법을 제안하였다. 또한, 이 방법을 세종 말뭉치에 적용하여 각각의 알고리즘을 이용한 어절 분해를 실험하고, 그 결과를 어절 분해 정확도, 편향, 편차를 바탕으로 비교, 분석하였다.

  • PDF

세종 형태분석 말뭉치의 오류 수정 도구 개발 (Developing an Error Correction Tool for Sejong POS Tagged Corpus)

  • 최명길;남유림;서형원;전길호;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.114-116
    • /
    • 2011
  • 한국어 정보처리에서 널리 사용되는 세종 형태분석 말뭉치는 품사정보와 문장정보 등 다양한 한국어 정보를 포함하고 있다. 이 말뭉치는 방대한 양의 정보들로 구축되었지만 많은 오류 또한 포함되어 있다. 예를 들면 철자 오류, 띄어쓰기 오류, 그리고 품사부착 오류 등이 있다. 하지만 세종말뭉치와 같이 대용량 말뭉치의 오류를 수정하는 것은 많은 인력과 시간이 필요하며 일관성 있게 오류를 수정하는 것은 쉽지 않다. 따라서 본 논문에서는 세종 형태분석 말뭉치에 포함된 오류를 빠르고 일관성 있게 수정하기 위한 오류 수정 도구를 구현하였다. 본 논문에서 수정 대상이 되는 오류는 어절과 형태소 분석 결과의 불일치에 관한 오류만 대상으로 한다. 이를 위해 세종 형태분석 말뭉치를 데이터베이스로 재구축하였으며, 본래의 어절과 품사가 부착된 형태소의 자모를 각각 분리하여 두 자모의 차이점을 분석하여 오류 후보를 선정한다. 오류 후보에서 동일한 오류 패턴을 갖는 모든 오류 후보에 대하여 동일한 방법으로 일관성 있고 빠르게 수정할 수 있다.

  • PDF