• 제목/요약/키워드: EUC-KR

검색결과 8건 처리시간 0.02초

다중바이트 문자집합 텍스트에서의 문자열 검색 알고리즘 (String Matching Algorithm on Multi-byte Character Set Texts)

  • 김은상;김진욱;박근수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1015-1019
    • /
    • 2010
  • 문자열 완전일치 검색 알고리즘용 지금까지 많은 연구가 되어왔지만, EUC-KR 용 다중바이트 문자집합에 대해서는 연구원 것이 부족한 상황이다. 이 논문에서는 기존의 KMP 알고리즘을 사용할 때 EUC-KR과 같은 다중바이트 문자집합 텍스트에서 오검색이 발생할 수 있음을 보이며, 문자 단위의 접두사 함수를 적용하여 오검색이 발생하지 않도록 개선한 KMP 알고리즘을 제안한다. 또한, 널리 사용되고 있는 편집기인 Vim과 Emacs의 검색 알고리즘 및 기존의 오토마타 방식의 연구 결과에 비해 논문에서 제안한 알고리즘이 더 빠른 속도를 보이는 실험 결과를 제시한다.

XML 및 SOAP 메시지 정규화 알고리즘 (Algorithm of XML and SOAP Messages Canonicalization)

  • 정회경
    • 공학논문집
    • /
    • 제6권1호
    • /
    • pp.125-137
    • /
    • 2004
  • 본 논문에서는 XML과 SOAP 메시지 정규화 알고리즘을 수행하는 시스템을 설계 및 구현하였다. 따라서 더 정교하고 정규화된 문서로 변형하여 W3C 표준을 따르는 다른 응용 시스템과의 상호운용이 가능하다. 또한 웹 서비스 상호 운용성을 위한 XML 및 SOAP 메시지 교환 시 물리적 동일성이 요구되는 여러 시스템에서의 사용이 용이할 것으로 사료된다. 뿐만 아니라 국제적 인코딩 스킴과 국내 인코딩 스킴인 EUC-KR과의 변환기능을 추가함으로써 국내 실정에 맞는 XML 및 SOAP 정규화 알고리즘이 될 것이며, 이는 국제적 상호 운용성 확보의 기반 기술이 될 것이다.

  • PDF

북한 한글 순서를 지원하는 EUC-KR 기반의 로캘과 응용 프로그램 개발 (Development of EUC-KR based Locale and Application Program Supporting North Korean Collating Sequence)

  • 정일동;이중화;김용호;김경석
    • 정보처리학회논문지B
    • /
    • 제11B권7호
    • /
    • pp.875-884
    • /
    • 2004
  • UCS(=ISO/BC 10646, =Unicode)는 국제화에 따라 앞으로 점점 더 많이 쓰게 될 것이고, 일단 정착되고 나면 한참 동안 쓸 것으로 예상하고 있다. 하지만, UCS로는 남한과 북한의 같은 글자를 쓰면서도 다른 사전 순서로 쓰는 상황을 해결할 수 없다. 국제 표준 ISO/IEC 14651:2000(International String Ordering)은 여러 나라 글자계(script)가 섞여 있을 때, 모든 글자의 차례를 정하고 간추리는 틀에 관한 표준이다. ISO/IEC 14651을 이용하면 간추리는 차례가 공통 틀 표(Common Template Table)에 들어 있기 때문에 글자의 간추리는 차례를 쉽게 바꿀 수 있으며, 남한과 북한의 가나다 차례를 통일하지 않고 글자 순서가 다른 문제를 해결할 수 있다. ISO/IEC 14651 관련 함수는 리눅스와 솔라리스, FreeBSD와 같은 유닉스 기반 운영체제의 최신 라이브러리에 포함되어 있다. 본 논문에서는 북쪽의 한글 가나다 차례를 남쪽에서 활용할 수 있도록 하기 위해서 북쪽의 한글 가나다 차례를 포함하는 북쪽 로캘을 리눅스 시스템에서 만들고, 입력된 문자열(=글자떼)을 남쪽 혹은 북쪽의 한글 가나다 차례에 따라 간추리기 할 수 있는 프로그램을 개발하였다.

UTF-8을 이용한 인명한자의 표현과 한글 독음 처리 (A Representation of Korean Human Names and Their Written in Chinese Characters Pronunciation Processing Using UTF-8)

  • 조영철;유정원;변정용
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.575-578
    • /
    • 2004
  • 인물 정보 검색 시스템은 사용자에게 종합적이고 정확한 정보와 편리한 사용자 인터페이스를 제공해야 한다. 하지만 현재 웹 상에서 이 시스템의 방대한 화장 한자 자료를 표현하는데 EUC-KR은 많은 어려움을 가지고 있다. 그리고 어려운 인명용 한자와 전문 한자 용어로 인해 일반인들의 사용이 어려웠다. 이를 해결하기 위해 본 논문에서는 확장된 한자를 표기하기 위하여 UTF-8 인코딩 방식을 사용한다. 그리고 사용자가 알기 원하는 한자의 한글 독음 변환 처리를 통해 데이터베이스의 효율성과 사용자가 쓰기 편한 인터페이스를 제공한다.

  • PDF

전자서명 시스템을 위한 XML 정규화 알고리즘 설계 및 구현 (Design and Implement of Canonical XML Algorithm for Digital Signature System)

  • 유윤식;이강찬;전종홍;이원석;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.504-507
    • /
    • 2003
  • 오늘날 XML이 전자 상거래 시장에 널리 수용하여 사용되고 있다. 하지만 XML 문서는 논리적으로 동일한 의미를 물리적으로 여러 다른 형태로 나타낼 수 있는 표현의 자율성이 존재하기 때문에 XML 전자서명과 같은 물리적 형태로써 유효성을 판단하는 응용프로그램에서는 문제가 발생할 수 있다. 따라서 이런 문제점을 해결하기 위하여 W3C에서는 논리적으로 동일한 의미의 XML 문서를 물리적으로 동일하게 변환시키도록 XML 정규화 알고리즘을 제안하여 사용하도록 권고하고 있다. 이에 본 논문에서는 W3C에서 권고한 XML 정규화 알고리즘을 수행하는 시스템을 설계 및 구현함으로써, 좀 더 정교하고 정규화된 문서로 변형하여 W3C 표준을 따르는 다른 응용 시스템과의 상호운용이 가능하다. 또한 웹 서비스를 위한 전자서명 시스템에서의 사용이 용이하며 웹 서비스 상호 운용성을 위한 XML 문서 교환 시 물리적 동일성이 요구되는 여러 시스템에서 다양한 방면으로 사용될 것으로 사료된다. 뿐만 아니라 국제적 인코딩 스킴과 국내 인코딩 스킴인 EUC-KR과의 변환기능을 추가함으로써 국내 실정에 맞는 XML 정규화 알고리즘이 될 것이며, 이는 국제적 상호 운용성 확보의 기반 기술이 될 것이다.

  • PDF

XML 정규화 알고리즘 구현 (An Implementation of the Canonical XML Algorithm)

  • 박기식;조인준;정회경
    • 한국정보통신학회논문지
    • /
    • 제7권8호
    • /
    • pp.1698-1707
    • /
    • 2003
  • 현재 XML이 전자 상거래 시장에 널리 수용하여 사용되고 있다. 그러나 XML 문서는 논리적으로 동일하나 물리적으로 여러 다른 형태가 존재할 수 있어, XML 디지털 서명과 같은 물리적 형태로써 유효성을 판단하는 응용 프로그램에서는 문제점이 발생할 수 있다. 따라서 이런 단점을 해결하기 위해 W3C에서는 논리적으로 동일한 XML문서를 물리적으로 동일하게 변환시키도록 XML 정규화(Canonical XML) 알고리즘을 제안하여 사용하도록 권고하고 있다. 본 논문에서는 W3C에서 권고한 XML 정규화 알고리즘을 수행하는 시스템을 설계 및 구현함으로써, 좀 더 정교하고 정규화 된 문서로 변형하여 W3C 표준을 따르는 다른 응용 시스템과의 상호 운용이 가능하다. 또한 웹 서비스를 위한 전자서명 시스템에서의 사용이 용이할 뿐만 아니라, 웹 서비스 상호 운용성을 위한 XML 문서 교환 시 물리적 동일성이 요구되는 여러 시스템에서의 사용이 용이할 것으로 사료된다. 뿐만 아니라 국제적 인코딩 스킴과 국내 인코딩 스킴인 EUC­KR과의 변환기능을 추가함으로써 국내 실정에 맞는 XML 정규화 알고리즘이 될 것이며, 이는 국제적 상호 운용성 확보의 기반 기술이 될 것이다.

공공정보시스템 부호체계 개선방안 연구 (A Study on the Improvement of the Code System in Public Information Systems)

  • 김지용;이송희;최진영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.303-306
    • /
    • 2010
  • 공공정보시스템에서 외래어 표기법에 어긋나는 귀화자 성명이나 브랜드명(법인명)을 사용할 경우에, 비표준 확장한글을 인식하지 못하여 성명이나 주소를 포함하는 글자가 "?"로 표시되는 깨짐현상이 발생하여 공공서비스 이용에 많은 불편함을 초래하고 있다. 그 원인으로는 첫째로, 외래어 표기법을 준수하지 않았다는 것, 두 번째로는 기존에 구축된 공공정보시스템 대부분이 'EUC-KR' 인코딩 방식을 사용하고 있으므로 비표준 확장한글을 표현하지 못하고 있기 때문이다. 이에 본 논문에서는 기존의 운영환경을 그대로 유지하면서, 비표준 확장한글을 지원할 수 있는 시스템 운영방안을 제안하였다. 연구결과는 실제 공공정보시스템 운영시에 적용할 수 있으며, 사용자에게 보다 나은 서비스를 제공할 수 있다.