• 제목/요약/키워드: Hangul,.

검색결과 648건 처리시간 0.024초

한글-로마자 인명 변환의 통계적 순위 추천 시스템 (Statistical Ranking Recommendation System of Hangul-to-Roman Conversion for Korean Names)

  • 이정훈;김민호;권혁철
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1269-1274
    • /
    • 2017
  • 본 논문에서는 한글-로마자 인명 변환을 다루며, 기존에 사용되고 있는 다양한 표기를 인정하고 인명 변환의 사용 빈도에 따라 결과를 제공함을 목표로 한다. 한글-로마자 인명 표기가 다양해진 이유는 크게 두 가지이다. 첫째로 국내외에서 만들어진 다양한 표기법의 무분별한 사용이며, 둘째로 현행표기법에서의 관습적인 표기를 허용하기 때문이다. 이런 이유로 한글 인명 하나에도 다양한 로마자 표기가 가능해졌다. 시스템에서는 400만 명의 인명 데이터를 통계 사전으로 구축하여 변환한다. 첫 단계에서는 성씨의 매칭과정을 통해 인명 유무를 판단하고, 두 번째 단계에서는 이름 전체를 통계사전에서 비교하여 변환한다. 마지막 단계에서는 이름의 음절을 비교 후 변환하여 결과를 사용 빈도에 따라 순위로 제공한다. 본 논문에서는 기존의 웹에서 서비스 중인 시스템과 비교하여 성능을 측정하였으며, 타 시스템에 비해서 다소 높은 성능을 보였다.

한글 문자 인식에서의 오인식 문자 교정을 위한 단어 학습과 오류 형태에 관한 연구 (A Study on Word Learning and Error Type for Character Correction in Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1273-1280
    • /
    • 1996
  • 본 논문에서는 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들 을 언어적 지식을 이용하여 교정하는 문자 인식 후처리에 관하여 논한다. 문자 인식의 오인식 교정시스템의 경우 후보 단어가 많을 때 많은 후보 단어중에서 가장 적당한 단어를 후보 단어로 올려주기 위해서는 여러 가지 정보가 필요하다. 본 논문에서는 이러한 정보로 이용할 수 있는 것으로 단어들의 특성과, 문자 인식에 발생하는 오인식 형태, 단어 학습에 관하여 논한다. 이를 위한 실험으로 15 만여의 단어가 수록된 국어 사전을 이비력하고 초중고 국어교과서에 나타난 단어 들의 사용빈도를 조사하여 국어 사전에 등록된 단어 중에서 10.7%정도가 실제 초중고 국어교과서에 사용되고 있다는 것을 알 수 있었다. 또한 실제 문자 인식 시스템들을 가지고 여러 문서를 입력하고 인식하여 오인식이 자주 일어나는 글자들 의 형태를 분류하여 보았다. 그리고 한국어 처리 관련 서적이나 논문을 처리하고자 한국어에 관련된 책의 찾아보기에 나타난 단어 를 학습시켜 후보 단어들의 다른 인하여 정확한 단어를 예측하기 힘들던 문제를 해결 하고자 하였다.

  • PDF

신경망 학습 코드에 따른 오프라인 필기체 한글 인식률 비교 (Comparisons of Recognition Rates for the Off-line Handwritten Hangul using Learning Codes based on Neural Network)

  • 김미영;조용범
    • 전기전자학회논문지
    • /
    • 제2권1호
    • /
    • pp.150-159
    • /
    • 1998
  • 본 논문은 필기체 한글의 특징을 추출한 후 이를 신경망을 이용하여 인식하였다. 한글의 특징 추출을 위해 $5{\times}5$ 윈도우 방법을 사용하였는데, 이는 $3{\times}3$ 윈도우 방법을 수정한 것이다. 추출된 특징을 이진화 코드로 변환하여 신경망의 입력으로 사용하며, 백프로퍼게이션 알고리즘으로 학습시켰다. 수직 모음, 수평모음, 자음 인식을 위한 3개의 신경망을 각각 구성하였고, 결과를 비교하기 위하여 3가지 학습 방법을 사용하였다. 3가지 학습 방법은 고정 코드 방법, 학습 코드 방법 I, 학습 코드 방법 II이고 학습 코드 방법 II가 가장 좋은 결과를 보였다. 이 경우 수직 모음과 수평 모음은 100%의 인식률을, 자음은 93.75%의 인식 결과를 보였다.

  • PDF

한글 문자 데이터베이스 PHD08 구축 (Construction of Printed Hangul Character Database PHD08)

  • 함대성;이득용;정인숙;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제8권11호
    • /
    • pp.33-40
    • /
    • 2008
  • 문자 인식의 응용이 형식 문서의 인식 같은 고전적인 영역을 벗어나 웹 문서나 자연 영상의 문자 인식으로 확장되고 있다. 이러한 새로운 응용에서는 명조나 고딕같은 표준 글꼴뿐만 아니라 다양한 모양의 글꼴을 사용하는 것이 보편적이다. 기존의 데이터베이스들은 주로 표준 글꼴을 대상으로 제작되어 새로운 응용에 사용하는데 한계를 안고 있다. 본 논문에서는 완성형 2350자 각각을 대상으로 9종류의 글꼴에 대해 글꼴 크기, 품질, 해상도를 달리하여 243개의 이미지 샘플을 생성하였다. 또한 이들 샘플 각각에 대해 이진 임계치와 회전 각도를 달리하여 변형된 샘플을 얻었다. 이러한 과정으로 각 글자마다 2,187개의 샘플을 생성하였으며, 총 5,139,450개의 샘플을 갖는 인쇄체 한글 데이터베이스를 구축하였다. 데이터베이스에 대한 특성과 상용 OCR 소프트웨어에 대한 인식 성능 등을 제시한다.

유니코드 변환이 적용된 NTFS 인덱스 레코드에 데이터를 숨기기 위한 안티포렌식 기법 (An Anti-Forensic Technique for Hiding Data in NTFS Index Record with a Unicode Transformation)

  • 조규상
    • 융합보안논문지
    • /
    • 제15권7호
    • /
    • pp.75-84
    • /
    • 2015
  • 윈도우즈 NTFS 파일시스템에서 인덱스 레코드에 데이터를 숨기기 위한 기법은 파일명을 이용하여 메시지를 숨기는 방법이다. 윈도우즈 NTFS의 파일명 규칙에서 일부 ASCII 문자는 파일명으로 사용할 수 없는 문제가 있다. 영문과 함께 한글, 기호 문자가 함께 입력이 될 때와 바이너리 형태의 데이터들이 입력될 때 인덱스 레코드에 데이터 숨기기 방법 수행 시에 파일생성 에러 문제가 발생하는 것을 해결하기 위한 방법으로 유니코드의 특정 영역으로 변환하는 방법을 제안한다. 에러가 발생하는 문자들을 한글과 영문 영역이 아닌 유니코드로 변환하고. 바이너리 형태의 데이터인 경우는 확장 유니코드 영역과 아스키 코드의 영역이 아닌 유니코드의 영역으로 256개의 코드 전체를 변환하는 방식을 적용한다. 영문과 함께 한글이 사용된 경우에 제안한 방식이 적용된 사례의 결과를 보이고. 바이너리의 경우는 PNG이미지 파일의 바이너리 코드를 유니코드로 변환한 사례를 통해서 제안한 방법이 타당함을 보인다.

우편물 자동처리를 위한 한글 4 State 바코드 시스템 (The Hangul 4 State Bar Code System for the Automatic processing of Mail Items)

  • 박문성;송재관;우동진
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.146-155
    • /
    • 2000
  • 이 논문은 통상우편물의 자동구분 처리를 위한 한글 4 State 바코드문자의 규격을 설계한 것이다. 이 한글 4 State 바코드문자의 생성은 우편물 자동구분, 운송을 위한 우편물량 정보의 획득, 우편고객에게 우편요금별납의 자동정산, 종적추적과 같은 부가서비스 제공과 데이터 수록 및 획득을 위하여 필요하다. 한글 4 State 바코드에 수록되는 정보의 내용은 우편번호, 순로코드, 고객정보(고객 식별번호, 이름 등) 그리고 오류교정을 위한 체크문자로 구성되었으며, 하나의 바코드라벨로 인쇄되도록 시험용 인쇄모듈과 판독모듈을 개발하여 시험하였다. 한글 4 State 바코드에 순로코드를 적용할 경우에 우편물 자동구분 범위가 확장되고, 고객바코드 인쇄제도에 의한 부가서비스를 우편고객에게 제공할 수 있다. 또한, 물량 및 과금 데이터의 획득이 가능하게 되어 우편물 처리의 생산성 향상계획을 위한 정보로 활용될 수 있을 것으로 기대된다.

  • PDF

한글 텍스트가 내장된 디지털 워터마크 생성 알고리즘 (Digital Watermark Generation Algorithm Embedding Hangul Text)

  • 조대제;김현기
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.485-490
    • /
    • 2003
  • 현재 알려진 워터마킹 방법들은 주로 PN-수열과 같은 잡음 특성을 가진 이진 코드를 워터마크로 사용하고 있는데, 이것은 생성 과정에서 일정한 길이의 이진 코드가 주기적으로 반복되는 단점이 있다. 그러나 혼돈 수열(chaotic sequence)은 기존의 PN-수열을 대체할 수 있는 새로운 개념의 수열로 여러 가지 장점을 가지고 있어서 워터마크로 사용하기에 적합하다. 본 논문에서는 우리 실정에 적합할 뿐 아니라, 의미를 바로 알 수 있는 한글 텍스트를 혼돈수열로 변환하여 워터마크로 사용한다. 즉. 한글로 이루어진 저작권 정보론 워터마크로 만들어 영상에 내장하고, 내장된 워터마크를 추출하여 다시 한글로 변환하여 원 저작권자가 누구인지를 알 수 있도록 한다. 한글 텍스트를 워터마크로 사용하는 경우, 내장할 수 있는 텍스트의 길이는 한계가 있다. 그래서 본 논문에서는 한글 텍스트를 단일 실수로 함축하는 방법과 이것을 다시 복원하여 원래의 문장으로 재생하는 알고리즘을 사용하여 한글 텍스트의 길이가 길어지더라도 워터마크로 사용할 수 있도록 하였다.

원형 패턴 벡터를 이용한 인쇄체 한글 인식 (Recognition of Printed Hangul Text Using Circular Pattern Vectors)

  • 정지호;최태영
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.269-281
    • /
    • 2001
  • 본 논문에서는 단일 글꼴에 의존하는 원형 패턴 벡터(circular pattern vectors)를 이용하여 위치 이동, 크기 변화 그리고 회전에 무관한 새로운 인쇄체 한글 인식 알고리즘을 제안한다. 제안한 알고리즘은 2진 형태론(binary morphology)을 이용하여 입력 문자에 존재하는 잡음(noise)을 제거한 후, 원형 패턴벡터를 추출한다. 추출된 원형 패턴 벡터는 주어진 문자의 무게 중심을 원의 중심으로 하여 그린 여러 원주 상에 위치한 공간적인 분포 값을 나타내는 것이다. 마지막으로, 실험 문자는 기준 원형 패턴 벡터와 실험 원형 패턴 벡터간의 거리가 최소가 되는 기준 문자로 인식하게 된다. 제안한 알고리즘의 성능을 평가하기 위해, 크기 변화와 회전 변형이 있는 완성형 바탕체 한글 2,350자를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 고리 투영 알고리즘보다 크기 변화와 회전 변형이 있는 한글 인식에 있어서 우수함을 보였다.

  • PDF

정보통신 단말기를 위한 한글 모음 입력 시스템 (Hangul Vowel Input System for Electronic Networking Devices)

  • 강승식;한광수
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.507-512
    • /
    • 2005
  • 휴대용 정보통신 단말기에서 한글 입력 방식은 단말기에 부착되어 있는 제한된 버튼만을 이용한다는 제약이 있다. 이 제약 조건 하에서 한글 모음을 편리하고 빠르게 입력할 수 있도록 8개의 기본 모음 집합으로부터 이중 모음을 조합하는 방식을 제안한다. 이 방식은 최대 2타로 모든 모음들이 조합될 수 있어서 신속한 입력이 가능하고, 이중 모음에 대해 사용자들이 익숙한 방법으로 조합될 수 있도록 2가지 이상의 조합 방식을 지원하여 사용자 편의성을 높였다 또한, 양성-음성 모음 간에 빈번하게 발생하는 입력 오류를 쉽게 수정할 수 있도록 양성 모음과 음성 모음이 추가 키 입력으로 전환되는 오류 수정 기능을 추가하였다. 기존의 모음 입력 방식들과 비교했을 때 제안한 방식이 입력의 신속성과 오류 수정의 용이성 등의 관점에서 매우 효율적임을 확인하였다.

한글 디자인과 어울림 (Hangil Design and Oullim, the Great Harmony)

  • 안상수
    • 디자인학연구
    • /
    • 제17권3호
    • /
    • pp.383-392
    • /
    • 2004
  • 오늘날 다원적 가치의 문화 환경에서 '어울림'이란 그 고유한 문화를 지속케 할 수 있는 생명적 원리이다. 글쓴이는 한글창제의 디자인 적 의의와 한글의 조형성과 우수성에 대한 평가 준거를 어울림의 관점에서 제시함으로써 '넓은 뜻의 디자인'이라는 지평에서 '한글의 디자인적 의의'를 조명해 보려 한다. 이러한 관점에서 훈민정음 창제의 큰 뜻은 '다름'에 대한 깨달음의 실천, 사람을 '어엿비 여기는' 인본주의적 생각, 배우고 쓰기 '쉬움'에 바탕을 두고 있었고, 철학적 터전은 동양의 근본 사상인 태극 음양오행설에 두었다. 한글이란 사람 소리를 자연 철학적 관점에서 보고 그 소리의 생성과 조직을 음양오행의 역학에서 추출한 성운학 이론과 원리에 따라 과학적이고 체계적인 글자로 디자인한 것이다. 곧 뜻과 꼴이 맞는 어울림이라고 할 수 있다. 본 연구에서는 이러한 훈민정음 창제를 디자인 적 관점에서 보아, 제 모습 제 말에 어울리는 생명 적이고 질서 있는 시스템이자, 자연 성음의 원리에 맞고, 끝없이 구르고 변통 자재하는 유기적 디자인의 탄생으로 보았다. 나아가 한글 창제에 담긴 넓고 깊은 뜻과 포부가 '어울림'의 뜻에 맞는 완전함을 지향하는 '큰_디자인 짓'으로 규정하고, '어울림' 디자인 가치의 전형으로 제시하고자 한다. 이를 통해, '훈민정음 창제 정신을 되짚어 보며, 어울림'이 새로운 디자인 사상을 잉태하는 씨앗으로서, 표현적 가치와 잣대로, 또 이 시대의 디자인을 풍요롭게 하는 슬기로 작용하기를 바란다.

  • PDF