• 제목/요약/키워드: Hangul Code

검색결과 72건 처리시간 0.022초

Character based Hangeul search using Location-specific Character Frequency

  • Lee, Jung-Hwa;Lee, Jong-Min;Kim, Seong-Woo
    • Journal of information and communication convergence engineering
    • /
    • 제7권3호
    • /
    • pp.345-350
    • /
    • 2009
  • Hangul search functionality, including dictionary search is used in many Hangeul applications. Existing research of hangeul search method is the study of using hangeul syllable as a basic unit. However when you consider the characteristics of Hangul, the research of using hangeul character as a basic unit is needed. In this paper we propose the character based hangeul search method using the location-specific frequency information and verify the effectiveness of the proposed method through the experiments.

ISO 10646 부호계를 이용한 옛한글 문서 편집기 개발에 관한 연구 (A Study of developing an Old-Hangul Editor supporting the international standard Hangul code)

  • 이중화;김경석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.427-436
    • /
    • 1993
  • 국제 표준화 기구 (ISO) 에서는 1992년에 국제 표준 글자 부호계 ISO 10646을 확정하였는데, 거기에 들어 있는 국제 표준 한글 부호계는 새로운 조합형과 완성형 두 가지로 이루어져 있으며, 새로운 조합형은 옛한글까지 완벽하게 지원할 수 있다. 그러나 아직까지 이 새로운 조합형의 실용성에 대한 실증적인 연구가 없었다. 본 논문에서는, 새로운 조합형 한글 부호계를 지원하는 옛 한글 문서 편집기 개발 과정을 살펴보고, 또한 편집기 개발을 통하여 확인한 다음 두 가지 점에 대해서도 살펴보겠다. 첫째, 새로운 조합형을 써서 한글 정보 처리를 하는 데 아무 문제가 없으며, 둘째, 새로운 조합형으로 옛 한글을 지원할 수 있다는 사실을 확인할 수 있었다. 옛 한글 문서 편집기의 성공적인 개발로, 이 때까지 어려움을 겪었던 옛 한글 자료의 전산화가 가능하게 되어, 우리의 고전에 대한 연구가 활발해질 것으로 예상한다.

  • PDF

유니코드 변환이 적용된 NTFS 인덱스 레코드에 데이터를 숨기기 위한 안티포렌식 기법 (An Anti-Forensic Technique for Hiding Data in NTFS Index Record with a Unicode Transformation)

  • 조규상
    • 융합보안논문지
    • /
    • 제15권7호
    • /
    • pp.75-84
    • /
    • 2015
  • 윈도우즈 NTFS 파일시스템에서 인덱스 레코드에 데이터를 숨기기 위한 기법은 파일명을 이용하여 메시지를 숨기는 방법이다. 윈도우즈 NTFS의 파일명 규칙에서 일부 ASCII 문자는 파일명으로 사용할 수 없는 문제가 있다. 영문과 함께 한글, 기호 문자가 함께 입력이 될 때와 바이너리 형태의 데이터들이 입력될 때 인덱스 레코드에 데이터 숨기기 방법 수행 시에 파일생성 에러 문제가 발생하는 것을 해결하기 위한 방법으로 유니코드의 특정 영역으로 변환하는 방법을 제안한다. 에러가 발생하는 문자들을 한글과 영문 영역이 아닌 유니코드로 변환하고. 바이너리 형태의 데이터인 경우는 확장 유니코드 영역과 아스키 코드의 영역이 아닌 유니코드의 영역으로 256개의 코드 전체를 변환하는 방식을 적용한다. 영문과 함께 한글이 사용된 경우에 제안한 방식이 적용된 사례의 결과를 보이고. 바이너리의 경우는 PNG이미지 파일의 바이너리 코드를 유니코드로 변환한 사례를 통해서 제안한 방법이 타당함을 보인다.

한글문자의 로마문자 표기코드 (A Roman Representation Code System of Hangul Characters)

  • 강주상
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-101
    • /
    • 1995
  • 한글문자를 기계화하기 위하여 로마문자로 표기하는 코드체계에 대하여 살펴본다. 이 표기코드는 로마문자의 대문자와 소문자를 이용하며 영문 OS 상에서의 한글사용, 음성학적 연구, 합리한 한글자판, 한글고어 연구 등에서 다른 코드보다 합리적이다. 또한 이 코드체계는 새로운 표준코드로서도 우수한 잠재성을 가지고 있다.

  • PDF

한글 코드 변환 인터페이스에 관한 연구 (A Study on Hangul Code Conversion Interface)

  • 윤호상;백두권;황종선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.39-46
    • /
    • 1990
  • 최근 컴퓨터의 발달로 인하여 많은 부분에서 컴퓨터가 사용되고 있다. 그러나 컴퓨터가 한글 사용을 전혀 고려하지 않고 개발되었기 때문에 한글 사용에 많은 문제점이 발생하였다. 본 논문에서는 컴퓨터에서 한글의 사용에 있어서의 문제점을 고찰해보고 이를 해결하기 위하여 한글 코드변환 인터페이스를 연구하였다.

  • PDF

유니 코드를 바탕으로 한 프로그램 상에서의 한글 자/모 구별 방법에 따른 연구 (Reserches to divided Hangul Spelling for Program based on Uni-Code)

  • 권훈;김정희;곽호영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.781-783
    • /
    • 2004
  • 본 논문에서는 컴퓨터 상에서의 처리되는 한글 코드 중 유니코드를 이용한 한글 입력방법을 분석하여, 이를 일련의 프로그램에서 초ㆍ중ㆍ종성에 따라 자/모음을 분리, 구별하는 방법을 제안하고, 이에 따라, 제안된 방법을 적용한 구현 프로그램을 통해 정확한 자/모음 분리를 할 수 있었으며, 한글 입력에서의 정확도와 신뢰도 향상 및 단어에 따른 정확한 조사판별이 가능해 짐을 알 수 있었다. 또한, 제안방법에 따른 통계적 데이터를 가지고 각종 분야에 적용이 가능하게 됨을 알 수 있었다.

  • PDF

수 연산과정에서 ERP로 확인된 숫자어휘와 부호변환 과정 (Words for Numbers and Transcoding Processes Reflected by ERPs during Mental Arithmetic)

  • 김충명;김동휘
    • 한국산학기술학회논문지
    • /
    • 제11권2호
    • /
    • pp.689-695
    • /
    • 2010
  • 한글 숫자어휘의 부호변환 과정을 알아 봄에 있어, 수연산이 시행되는 동안 주어진 목표자극들 간의 연산결과가 일치하는지에 대한 과제를 ERP 실험방법에 의거 시행하였다. 평균진폭에 대한 실험 결과는 과제-의존적인 처리가 아닌 자극유형-의존적인 처리과정을 보여주었는데, 덧셈 및 곱셈과제에서의 한글 숫자어휘의 시간적인 뇌파개형은 아라비아 숫자에 대한 그것과 유사하게 나타났다. 이 처리과정에서의 유의미한 차이점은 300ms 부근에서 나타난 지연된 양성파형의 성분으로서, 이는 한글 숫자어휘의 아라비아 숫자로의 부호변환 과정으로 해석가능하다. 이 과정에 수반된 뇌영상을 분석한 결과, 두 조건에서 서로 다른 파형을 야기한 영역은 한글문자 처리에 관여하는 좌측 측두-두정영역으로 확인되었다. 이와 같은 결과는 수연산 과정의 개개 자극인 한글 숫자어휘의 내재적 수표상 방식이, 수개념으로의 직접적 접근이 아니라 일정한 부호변환 과정을 통한 도식화된 통로를 거치고 있음을 시사한다 할 수 있다.

한국공업규격 한자코드에 대한 고찰 (A study on the korean standard code for information interchange)

  • 이춘택
    • 한국도서관정보학회지
    • /
    • 제25권
    • /
    • pp.295-338
    • /
    • 1996
  • The findings from this study are summarized as follows : 1. It is questionable to define the term "Hanja" as "the Chinese Character used independently or used along with Hangul. 2. It is found to be a problem that the validity and objectivity in the selection of Hanja are lacking. 3. It is also a problem that there is neither principles nor consistency in styling of characters. 4. The system of arrangement has problems, too. The adoption of arrangement of Hanja by its Korean pronunciation results in lots of errors and mistakes. Besides, mistaken strokes and radicals produced considerable errors in the arrangement of Hanja. 5. The omission of the abbreviated Hanja in the Code can be considered to neglect the current trend of increased use of them. 6. The issue concerned with the Japanese-origin Hanja is that several number of Hanja deemed unnecessary are included.y are included.

  • PDF

EUC 틀안의 한글 처리 연구 (A Study of the Hangul Processing in the EUC framework)

  • 김용호;윤홍원;김경석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.415-425
    • /
    • 1993
  • 본 논문은 국내 표준 한글 부호계와 국제 표준 한글 부호계를 유닉스의 EUC 틀 안에서 수용하는 방안을 제안한다. EUC (Extended Unix Code)는 4 개의 코드 셀 (Code Set)를 지원하는데, 그 중 3 개의 코드 ???V은 멀티바이트를 지원한다. EUC 에서는, ASCII 를 빼고는 모두 MSB (most significant bit) 가 1 이어야 한다. 이러한 제약 조건 아래서, KSC 5601 완성형 한글 부호계, 두 바이트 조합형 한글 부호계, 그리고 1992 년에 국제 표준으로 확정된 ISO 10646 의 새로운 조합형과 완성형 소리마디를 EUC 틀안에서 종합적으로 지원하는 방안을 검토해 본 결과, 짧게는 새로운 조합형과 KSC 5601을 지원하되, 길게는 새로운 조합형으로 나가는 것이 바람직하다는 결론을 얻었다.

  • PDF

경계선 기울기 방법을 이용한 다양한 인쇄체 한글의 인식 (Recognition of Various Printed Hangul Images by using the Boundary Tracing Technique)

  • 백승복;강순대;손영선
    • 한국지능시스템학회논문지
    • /
    • 제13권1호
    • /
    • pp.1-5
    • /
    • 2003
  • 본 논문에서는 CCD 흑백 카메라를 이용하여 입력되는 인쇄체 한글 이미지의 문자를 인식하여 편집 가능한 텍스트 문서로 변환하는 시스템을 구현하였다 문자 인식에 있어서 잡음에 강한 경계선 기울기 방법을 이용함으로써 문자의 구조적 특성에 근거한 윤곽선 정보를 추출할 수 있었다. 이를 이용하여 각 문자 이미지의 수평 및 수직 모음을 인지하고 6가지 유형으로 분류한 후, 자소 단위로 분리하고 최대 길이 투영을 사용하여 모음을 인식하였다. 분리된 자음은 경계선이 변화되는 위상의 형태를 미리 저장된 표준 패턴과 비교하여 인식하였다. 인식된 문자는 KS 한글 완성형 코드로 문서 편집기에 출력되어 사용자에게 제공되는 시스템을 구현하였다.