• Title/Summary/Keyword: 한글표현

Search Result 514, Processing Time 0.028 seconds

On-line Recognition in Korean Character Using Fuzzy Membership Function (퍼지소속함수를 이용한 온라인 한글 인식)

  • Shim, Young-Chul;Oh, Kyung-Whan
    • Annual Conference on Human and Language Technology
    • /
    • 1991.10a
    • /
    • pp.300-306
    • /
    • 1991
  • 본 논문에서는 온라인 한글 인식을 위하여 퍼지소속함수를 사용하였다. 획의 오인식으로 인한 문자의 오인식 문제를 해결하기 위하여 인식 시스템 내에서 획을 퍼지집합으로 표현하며, 자모를 인식하는데 사용되는 획의 중심점들 간의 방향은 퍼지소속 함수로 정의하여 추론한다. 본 논문에서 제시하는 퍼지추론 방법은 같은 획으로 시작되는 모든 자소에 대하여 적용되며, 애매모호한 상황하에서도 인식을 수행한다. 따라서 퍼지소속함수를 사용한 시스템은 종래에 오인식 되었던 애매한 글자들을 정확하게 인식할 수 있었다.

  • PDF

Font Design System for Hangul (한글꼴을 근간으로 한 서체설계지원시스뎀)

  • Choi, Hae-Ock;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.173-184
    • /
    • 1993
  • 폰트관련기술은 폰트의 개발에 사용되는 폰트개발기술과 개발된 폰트의 효율적인 이용에 관한 폰트처리기술로 구분된다. 본 논문에서는 폰트개발기술의 대표적인 예인 서체설계지원시스템 특히 한글폰트의 개발을 쉽고 빠르게 할 수 있는 시스템의 개발에 대하여 논한다. 지금까지의 폰트개발은 서체전문가의 원도제작과정과 제작된 원도를 폰트화하는 과정으로 진행되었으나 본 시스템은 서체전문가가 직접 컴퓨터의 지원을 받아 원도를 제작하며 원도제작과정의 결과로 폰트가 만들어지도록 폰트개발과정을 일원화하도록 하였다. 이를 위하여 서체설계과정을 정의하고, 정의된 서체설계과정을 컴퓨터상에서 구현하기 위한 기법을 개발하였다. 본고에서는 참조설계로 표현되는 서체설계지원시스템의 개발을 위하여 고안된 기법중 글자의 중심선과 굵기로 윤곽선을 자동생성하는 기법과 글자의 특징을 이루는 돌기를 라이브러리화하여 운영하는 기법에 대하여 논하기로 한다. 시스템 개발은 PC상에서 VGA그래픽카드와 mouse를 사용하여 구현하였다.

  • PDF

A Recognition Method of HANGEUL Pattern Using a State Space Search (상태공간탐색을 이용한 한글패턴 인식방법)

  • 김상진;이병래;박규태
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.15 no.4
    • /
    • pp.267-277
    • /
    • 1990
  • In this paper, a method of separation and recognition of phonemes from a composite Korean character pattern through a state space search strategy which is a problem solving method in artificial intelligence is proposed. To correlate the separating of phonemes with their recognizing, the problem is represented into the state space, on which a search strategy is performed. For the minimization of search area, the structural information based on the composition rules of Korean characters and the positional information of phonemes in the basic forms are used. And the effectiveness of the approach is shown by a computer simulation.

  • PDF

A Study on the Improvement of the Code System in Public Information Systems (공공정보시스템 부호체계 개선방안 연구)

  • Kim, Ji-Yong;Lee, Song-Hee;Choi, Jin-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.303-306
    • /
    • 2010
  • 공공정보시스템에서 외래어 표기법에 어긋나는 귀화자 성명이나 브랜드명(법인명)을 사용할 경우에, 비표준 확장한글을 인식하지 못하여 성명이나 주소를 포함하는 글자가 "?"로 표시되는 깨짐현상이 발생하여 공공서비스 이용에 많은 불편함을 초래하고 있다. 그 원인으로는 첫째로, 외래어 표기법을 준수하지 않았다는 것, 두 번째로는 기존에 구축된 공공정보시스템 대부분이 'EUC-KR' 인코딩 방식을 사용하고 있으므로 비표준 확장한글을 표현하지 못하고 있기 때문이다. 이에 본 논문에서는 기존의 운영환경을 그대로 유지하면서, 비표준 확장한글을 지원할 수 있는 시스템 운영방안을 제안하였다. 연구결과는 실제 공공정보시스템 운영시에 적용할 수 있으며, 사용자에게 보다 나은 서비스를 제공할 수 있다.

Automatic Extraction of Paraphrases from a Parallel Bible Corpus (정렬된 성경 코퍼스로부터 바꿔쓰기표현(paraphrase)의 자동 추출)

  • Lee, Kong-Joo;Yun, Bo-Hyun
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.4
    • /
    • pp.323-336
    • /
    • 2006
  • In this paper, we present a pilot system that can extract paraphrases from a parallel corpus using to-training method. Paraphrases are useful for the applications that should rreate a varied ind fluent text, such as machine translation, question-answering system, and multidocument summarization system. One of the difficulties in extracting paraphrases is to find a rich source from which we can extract paraphrases. The bible is one of the good sources fur extracting paraphrases as it has several Korean versions in which every sentence can be easily aligned by the chapter and the verse. We ran extract not only the lexical-level paraphrases but also the phrasal-level paraphrases from the parallel corpus which consists of the bibles using co-training method.

  • PDF

Embedding with different levels for idiom disambiguation (관용표현 중의성 해소를 위한 다층위 임베딩 연구)

  • Park, Seo-Yoon;Kang, Ye-Jee;Kang, Hye-Rin;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.167-172
    • /
    • 2021
  • 관용표현 중에는 중의성을 가진 표현이 많다. 즉 하나의 표현이 맥락에 따라 일반적 의미와 관용적 의미 두 가지 이상으로 해석될 가능성이 있어 이런 유형의 관용표현을 중의성 해소 없이 자연어 처리 태스크에 적용할 경우 문제가 발생하게 된다. 본 연구에서는 관용표현의 특성인 중의성과 더불어 '관용표현은 이미 사용자의 머릿속에 하나의 토큰으로 저장되어 있다'라는 'Idiom Principle'을 바탕으로 관용표현에 대해 각각 표면형, 단순 단일 토큰형, stemming 단일 토큰형 층위의 임베딩을 만들어 관용표현 분류 연구를 진행하였으며, 실험 결과 표면형 및 stemming을 적용하지 않은 단순 단일 토큰으로 학습하는 것보다, stemming을 적용한 후 단일 토큰으로 학습하는 것이 관용표현의 중의성 해소에 유의미한 효과가 있음을 확인하였다.

  • PDF

Analysis over Extracting Physical Referring Expressions by Recursive Application over Neural Network (물리적 지시 표현 추출 및 처리를 위한 신경망의 재귀적 사용에 대한 고찰)

  • Koo, Sangjun;Lee, Kyusong;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.142-147
    • /
    • 2012
  • 본 논문에서는 신경망을 재귀적으로 사용하여 문장에서 지시 표현을 추출하고 분석하는 방법에 대해서 제안한다. 임의의 문장이 들어올 때, 문장을 구성하는 각 단어들은 통사론적 자질 벡터와 의미론적 자질 벡터로 나눌 수 있다. 이들 벡터들의 쌍을 인자로써 입력받는 신경망 구조를 제시할 수 있으며, 신경망의 출력 결과는 다시 재귀적으로 쌍인자 신경망에 입력으로써 주입된다. 신경망을 재귀적으로 학습시킴으로써, 문장 내의 지시 표현을 추출할 수 있다. 쌍인자 신경망 파싱 모델의 성능을 측정했고, 제안한 모델의 문제점과 가능성에 대해서 관찰하였다.

  • PDF

Automatic Text Categorization Using Text Summarization Techniques (문서 요약 기법을 이용한 자동 문서 범주화)

  • Park, Jin-Woo;Ko, Young-Joong;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.138-145
    • /
    • 2001
  • 자동 문서 범주화란 문서의 내용에 기반하여 미리 정의되어 있는 범주에 문서를 자동으로 분류하는 작업이다. 문서 분류를 위해서는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고, 이러한 자질들을 통해 분류할 문서를 표현해야 한다. 기존의 연구들은 문장간의 구분 없이, 문서 전체에 나타난 각 자질의 빈도수를 이용하여 문서를 표현 한다. 그러나 하나의 문서 내에서도 중요한 문장과 그렇지 못한 문장의 구분이 있으며, 이러한 문장 중요도의 차이는 각각의 문장에 나타나는 자질의 중요도에도 영향을 미친다. 본 논문에서는 문서에서 사용되는 중요 문장 추출 기법을 문서 분류에 적용하여, 문서 내에 나타나는 각 문장들의 문장 중요도를 계산하고 문서의 내용을 잘 나타내는 문장들과 그렇지 못한 문장들을 구분하여 각 문장에서 출현하는 자질들의 가중치를 다르게 부여하여 문서를 표현한다. 이렇게 문장들의 중요도를 고려하여 문서를 표현한 기법의 성능을 평가하기 위해서 뉴스 그룹 데이터를 구축하고 실험하였으며 좋은 성능을 얻을 수 있었다.

  • PDF

DBpedia Ontology Population Coverage Enhancement with FrameNet (프레임넷을 통한 디비피디아 온톨로지 인스턴스 생성의 커버리지 개선)

  • Hahm, Younggyun;Seo, Jiwoo;Hwang, Dosam;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.32-37
    • /
    • 2014
  • 비구조 텍스트로부터 지식을 추출하여 온톨로지 기반 지식베이스를 구축하는 연구가 최근 국내외로 다양하게 진행되고 있다. 이러한 목적을 달성하기 위해서는 자연어 텍스트에서 나타난 지식요소들의 다양한 속성들을 표현할 수 있는 온톨로지를 필요로 한다. 디비피디아 역시 위키피디아의 지식들을 표현하기 위하여 디비피디아 온톨로지를 사용한다. 그러나 디비피디아 온톨로지는 위키피디아의 인포박스에 기반한 온톨로지로서, 요약된 정보를 설명하기에는 적합할 수 있으나 자연어 텍스트로 표현된 다양한 지식표현을 충분히 커버하는 것은 보증되지 않는다. 본 논문에서는 자연어 텍스트로 쓰여진 지식을 디비피디아 온톨로지가 충분히 표현할 수 있는지를 검토하고, 또한 그 불완전성을 프레임넷이 어느정도까지 보완할 수 있는지를 살핀다. 이를 통해 한국어 텍스트로부터 지식베이스를 자동구축하는 온톨로지 인스턴스 자동생성 연구의 방향으로서 디비피디아 온톨로지와 프레임넷의 효용성을 전망한다.

  • PDF

Mathematical Equation Retrieval by Converting Plaintext Queries into MathML Terms (평문 질의어 MathML 용어 변환을 이용한 수학식 검색)

  • Lee, Jun-Young;Yang, Seon;Ko, Young-Joong
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.312-314
    • /
    • 2012
  • 본 논문은 한글로 입력된 질의어를 이용하여 웹상의 MathML (Mathematical Markup Language) 수학식을 검색하는 시스템을 제안한다. 웹상의 수학식은 과거 이미지를 이용하여 표현되는 경우가 많았지만, 현재는 대부분 MathML과 같은 수학식 표현 마크업 언어로 작성되고 있다. 그러나 이러한 수학식을 검색하기 위해서는 해당 언어를 알고 있거나 수식 입력 툴을 이용해야 하는 경우가 대부분이기 때문에, 일반 사용자들이 수학식 검색을 하는 데에는 제약점이 따랐다. 본 연구에서는 사용자들이 전통적인 검색 방법을 이용하여 특정 마크업 언어가 아닌 일반 평문으로 작성된 질의어를 입력하여 수학식을 검색 가능 하도록 하기 위해, 평문 질의어를 MathML 표현으로 변환시키는 방법을 사용한다. 질의어로 입력될 수 있는 다양한 수학식 표현을 미리 구축한 사전을 이용하여 MathML 표현으로 변환하는 간결한 기법만으로도 MRR 0.495 의 높은 성능을 얻을 수 있었다.