• 제목/요약/키워드: 한글쓰기

검색결과 64건 처리시간 0.031초

셀들의 군집 정보를 이용한 한글 문자 인식률 향상 기법 연구 (Improving Korean Character Recognition Rate based on the Cell Clustering Information)

  • 신우준;고윤식;임영택;윤영수;박희완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.810-812
    • /
    • 2015
  • 문자인식 즉 OCR(Optical Character Recognition)기술은 광학적으로 인식할 수 있는 문자를 컴퓨터가 읽을 수 있도록 하는 기술을 뜻한다. 문자인식의 근간이 되는 방법은 스트링 매칭 기법이 사용되어 왔지만 한글의 경우 자음, 모음, 자음 조합으로 만 가지 유형이 넘고, 더욱이 상용한자와 영어를 섞어 쓰기 때문에 오인식되는 경우가 많다. 본 논문에서는 한글이 수직선, 수평선, 사선과 같이 방향성이 강한 선소들로 구성되어 있다는 점을 이용하여 한글의 인식률을 높이는 방법을 제안하였다.

국제 표준 틀 안의 한글 부호계 운용 방안 및 한 바이트 한글 부호계 안 (A Proposal on operating ISO-conforming Hangul codes and on a new one-byte Hangul code)

  • 김경석;정연정;조층래
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.253-258
    • /
    • 1994
  • 이 글에서 살펴본 바는 다음과 같다. 1) ISO 10646-1 한글 부호계의 운용 방안은, 앞으로 얼마동안은 2,350 완성형 소리마디를 쓸 수도 있겠지만, 길게 보아서는 첫가끝 부호계 238 글자로 통일하는 것이 바람직하다고 본다. 2) ISO 2022 틀을 따르면서 한글을 완벽하계 지원하는 한 바이트 한글 부호계를 개발하여, 국제 등록부 (International Register) 에 등록하여, Escape Sequence을 받아서, ISO 2022 를 따르는 분야에서 쓸 수 있도록 하여야하겠다. 3) ISO 10646-1 을 개정하여 4,516 소리마디를 넣자는 안은, 완성형으로만 한글을 지원하게 되어 바람직하지 않다고 본다. 모아쓰기 글자를 지원하는 세계 추세가 조합방식이므로, 10646-1 을 현재대로 두고, 첫가끝 방식의 238 글자를 쓰는 것이 바람직하다고 본다. 4) 10646-1 을 재대로 지원할 수 있는 세벌식 자판을 정부의 복수 표준으로 채택할 것을 제안한다.

  • PDF

한글문자 모아쓰기 Display의 한방안 (Amethod for the Display of Hangout in its traditional Combined Form)

  • 안수길
    • 대한전자공학회논문지
    • /
    • 제12권1호
    • /
    • pp.27-33
    • /
    • 1975
  • 한글의 기하학적 배조상의 복잡도로 부터 한글 각 자소의 character generator용 diode matrix의 size를 추산하고 이자소 matrix 3성(초성, 중성, 종성)의 OR동작으로시 모아쓰기 한글의 모든 조합이 가능합을 보였고 수평각음순가성과 수직모음용초성의 자판 선택자, 종성이 있을 때와 없을때의 중용길이의 변경등이 비교적 간단한 논리회로로서 switch될 수 있음을 보였다. 새로 15bit내부 code를 제안하였는데 이는 86개의 sparse diode matrix로시 모든 조합을 다 카버하고 그러면서도 decodig기구의 규모를 줄여준다. The required minimum size of character diode matrix of Korean letters is estimated from the topological complexity of letter structure. The OR aombination of three letter boards (diode matrice) gives all possible Hangout whole letters in proper traditional combined form with minimum required discernibility. Two forms of first consonants (centre located ones for horizontal vowels and leftward displaced ones for vertical and composed vowels) are switched by only 1 bit of the vowel code. The vowel pattern length is modified by again the last four bits of the code. A new 15bit sized inner code is proposed which permits considerably small sized decoding mechanism.

  • PDF

한글의 조합 규칙 표현 방법에 관한 연구 (An Effective Representation of Combination Rule for the Hangul Typeface Design)

  • 이병국;박윤범;이완규
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1580-1587
    • /
    • 1996
  • 조합형 설계의 한글 폰트 디자인은 한글의 모아쓰기 원리를 이용하여 일관된 모 양을 유지하면서, 조합 가능한 활자체를 빠른 시간에 구성할 수 있는 장점이 있다. 그러나 균형감 있는 훌륭한 활자체를 개발하기 위해서는 설계할 자소의 수는 많아지 고 조합 방법은 복잡해진다. 본 논문에서는 조합형 설계의 성공적인 결과를 위하여 효율적인 조합 규칙 표현 방법을 제안한다.

  • PDF

제4기과학 한글원고 바로 쓰기 (Writing a Good Scientific Manuscript in Korean on the Quaternary Sciences)

  • 장순근
    • 한국제4기학회지
    • /
    • 제14권1호
    • /
    • pp.73-86
    • /
    • 2000
  • 1999년 11월 공주대학교에서 열렸던 한국 제4기학회 제 26차 학술발표대회에 발표되었던 요약문과 논문들이 한글로 잘 쓰였는가 하는 점에 관심을 두고 훑어보았다. 원고 문장에는 일본말법 표현과 한문이나 영어 같은 외국 단어들과 외국 표현들과 너무 긴 문장들이 간간이 보인다. 또한 의미가 전달되지 않는 문장, 한자를 쓴 어려운 표현, 정확하지 않은 시제와 어법 따위들이 포함돼 있다. 좋은 한글원고를 쓰는 방법으로 교양과학책 독서와 한글 작문 연습을 제안한다. 한글작문연습에는 저자들이 시간 여유를 가지고 쓰고, 동료와 논의하고, 비판을 받아들일 마음을 연 자세들이 포함된다. 편집진들도 원고를 인쇄하기 전에 점검해야 한다.

  • PDF

한글 입력 방식의 구현을 위한 범용적인 복합 낱자 분석 시스템 (Logic Analyzer of Composite Hangul Units for Implementation of Input Methods)

  • 김용묵;김국
    • 인지과학
    • /
    • 제28권4호
    • /
    • pp.223-243
    • /
    • 2017
  • 한글 입력 방식은 어떤 형태이건 기본 낱자들에 대한 글쇠배열과 결합 규칙이라는 두 요소를 반드시 가진다. 그런데 그 규칙을 토대로 입력 방식을 실제로 구현해 보면, 기본 낱자가 여럿 모인 복합 낱자를 입력할 때 모호성이 존재하거나 다음 글자의 연속 입력이 되지 않는 식의 문제가 발생할 수 있다. 한글은 모아쓰기라는 특성으로 인해 낱자 경계와 글자 경계라는 보이지 않는 정보가 입력 과정에서 추가로 고려되어야하기 때문이다. 초성과 종성을 문맥에 따라 구분해야 하는 두벌식, 글쇠가 매우 적은 모바일 환경, 수십 종류의 낱자들을 조합해야 하는 옛한글이라는 조건이 더해지면 입력 방식을 기술하고 분석하는 난이도가 더욱 높아진다. 본 논문에서는 한글 입력 방식에서 쓰이는 낱자의 결합 규칙을 대결합과 소결합으로 구분해서 기술하는 체계를 제안하며, 이를 토대로 어떤 입력 방식이 주어졌을 때 복합 낱자를 입력하는 세부 규칙을 생성하고 예상되는 문제점을 자동으로 분석해 주는 도구 프로그램을 소개하였다. 그리고 모바일용 삼성 천지인과 KT나랏글 한글 입력 방식을 실제로 분석한 결과를 제시하였다.

인쇄체 문서의 문자영역에서 한글과 한자의 구별에 관한 연구 (A Study on Classification into Hangeul and Hanja in Text Area of Printed Document)

  • 심상원;이성범;남궁재찬
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.802-814
    • /
    • 1993
  • 본 논문에서는 문서인식시스템의 문자인식부에서 각 문자를 인식하기 위한 전처리 단계인 한글과 한자를 구별하는 알고리즘을 제안한다. 본 연구에서는 문자의 구별에 큰 영향을 미치고, 쓰기형태와 글자체에 따라서 변동을 흡수할 수 있는 9가지의 한자 특성을 제안하고, 문자의 크기에 영향을 받지 않고 문자를 구별할 수 있도록 문자 크기에 따른 비율을 제안된 각 특성에 반영하여 문자의 구별을 행하였다. 입력된 문서 제안한 9가지의 한자 구조적 특성을 조사하여, 한글과 한자로 구별한다. KS-C5601의 한글 2350자와 한자 4888자의 고딕, 명조체에 대하여, 실험결과는 인쇄 표본, 신문, 학회지, 잡지 교재에서 각각 98.8%, 92%, 96%, 98%, 98%을 얻었다.

  • PDF

한글 받아쓰기 문제 자동 출제 시스템 (Automatic Quiz Generation System for Hangul Dictation Exercises)

  • 김화영;강승식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.833-836
    • /
    • 2006
  • 국어 교과는 말하기 듣기, 읽기, 쓰기 영역으로 구성되어 있으며, 높은 수준의 창의적 사고력을 길러준다. 국어 교과에서 받아쓰기는 우리나라 초등학교 교육 현장에서 가장 기본적으로 활용되고 있으며 현행 국어과의 교육과정에서 중요하게 다루어지고 있다. 그러나 매 회의 받아쓰기 문제지의 문항을 타당성과 신뢰도를 고려하여 조정하여 지도하기는 어려움이 있다. 본 논문에서는 이러한 단점을 보완하기 위해 초등학교 교육 현장에서 사용되는 여러 가지 형태의 받아쓰기와 교과서를 분석하여 문장의 받아쓰기 등급을 정하였다. 문장의 받아쓰기 등급을 가지고 입력한 난이도에 따라 정해진 문장 받아 쓰기 등급이 같으면 받아쓰기 문제로 선택이 되고 문장 받아쓰기 등급과 다르면 다른 문장을 탐색하게 하였다. 최종적으로 선택된 문제는 여러 등급의 문제로 구성함으로써 문제의 타당성과 신뢰도를 높이고, 창의적인 국어사용 능력을 향상시키도록 하였다.

  • PDF

언어 산출 과정의 몇 가지 특성: - 지식 유형, 텍스트 유형, 산출양식이 언어 산출에 미치는 효과 (Some Characteristics of Language Production Processes: The Effects of Knowledge Types, Text Types, and Production Modes)

  • 노영희;이정모
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.241-247
    • /
    • 1993
  • 이 연구에서는 지식 유형, 텍스트 유형 및 언어 산출 양식이 언어 산출 과정에 미치는 효과를 알아보았다. 본 연구에서는 산출할 말글에 대한 1) 사전정보를 대형(거시적) 의미구조, 소형(미시적) 의미구조, 관련 단어들의 모음의 세 지식 유령에 의해 조작하고, 2) 산출할 말글 유형을 이야기 말글과 논술 말글의 두 유형으로 변화하고, 3) 언어 산출 양식을 말하기, 펜으로 쓰기, 컴퓨터로 쓰기의 세 양식으로 변화하였을 때에, 언어 산출 과정에 어떠한 처리 부담이 가하여지는가를 3개의 실험을 통하여 연구하였다.

  • PDF

문자 없는 나라를 위한 문자 교육 시스템(소울)에 관한 연구 (A Study on the Education System for People Who Don't Have Their Own Letters, SOUL)

  • 함혜령;노용덕
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.377-380
    • /
    • 2010
  • 지식기반 사회에서 교육은 장기적인 발전을 위한 필수 요소이다. 교육을 위해서는 말하기, 듣기, 쓰기, 읽기 능력이 필요하다. 이 중 하나라도 충족하지 못한다면 제대로 된 교육을 받을 수 없다. 하지만 전 세계에 존재하는 약 6900여종의 언어 중 6600여종의 언어는 표기할 수 있는 고유 문자가 없다. 읽기 능력과 쓰기 능력을 기르기 위한 최소 조건조차 마련되어 있지 않은 것이다. 그래서 말은 있지만 문자는 없는 국가에 말을 표기할 수 있는 문자를 보급하여 지식기반 발전의 기반을 마련해 주는 소울(SOUL) 시스템을 제안한다. 소울(SOUL)은 두 가지 기능을 가지고 있다. 문자 교육 기능과, 지식 공유 공간 기능이다. 문자 교육 기능에서는 각 문자가 내는 소리와 조합방법, 그리고 각 문자의 표기법, 표기 순서 등을 익힘으로써 문자를 쉽게 익힐 수 있도록 하였다. SOUL은 말을 표기할 문자로 비교적 익히기 쉬운 언문인 한글을 채택하였다. 그리고 지식 공유 공간 기능에서는 문자를 익힌 사용자가 마치 위키피디아처럼 지식을 기록하고 공유할 수 있어 지식을 축적하도록 도와주도록 설계하였다. 여기서는 소울(SOUL) 시스템의 구조 및 구현을 보인다.