• 제목/요약/키워드: UTF-8

검색결과 11건 처리시간 0.027초

UTF-8 부호의 HDB-3스크램블링 최소화를 위한 문자의 원천부호화 규칙 (Source Coding Rule of Characters to Minimize HDB-3 Scrambling in Line Coder for UTF-8 code)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.1019-1026
    • /
    • 2015
  • 본 논문은 UTF-8 부호화된 문자의 원천부호가 회선부호기에 입력될 때 HDB-3 스크램블링을 최소화하도록 하는 문자의 원천부호화 규칙을 연구하였다. 기존 연구는 원천부호자체가 회선부호기에 입력될 때 HDB-3 스크램블링을 최소화하기 위한 문자의 원천부호화 규칙에 관한 내용이었으나 이번 연구에서는 원천부호가 UTF-8부호로 변환되면서 UTF-8부호와 원천부호간의 스크램블링 관계가 상호 대응적이지 않음을 분석하였다. 따라서 UTF-8 부호의 HDB-3 스크램블링 최소화를 위한 문자의 원천부호화 규칙이 없을 경우, UTF-8부호에서 스크램블링이 발생하는 부호를 분석하기 위해 원천부호를 모두 UTF-8부호로 변환한 후에 분석을 통해 스크램블링이 발생하지 않는 원천부호영역에서 부호화해야 한다. 제안된 UTF-8 부호에 대한 문자의 원천부호화 규칙을 적용할 경우, 이러한 복잡한 과정을 거치지 않고 스크램블링을 최소화 할 수 있는 문자의 원천부호화가 가능하다.

Unicode의 UTF-8 부호화 방식의 HDB-3 스크램블링 방식과의 적합성 (Compatibility of UTF-8 Encoding System to HDB-3 Scrambling Method)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제8권2호
    • /
    • pp.227-240
    • /
    • 2013
  • 본 논문에서는 국내 표준규격인 HDB-3 스크램블링 방식을 기준으로 유니코드(Unicode)의 한글낱자 및 호환용 한글낱자 부호와 이 부호가 UTF-8 부호체계로 변환되었을 때 원천부호화 규칙에 얼마나 부합되는지 여부를 분석하였다. 연구결과 유니코드 한글낱자 및 호환용 한글 낱자 부호체계와 UTF-8부호체계내에 문자의 원천 부호화 규칙에 위배되는 부호가 상당히 존재하는 것으로 나타났다. 특히 UTF-8로 변환함에 따라 그 위배율이 증가하는 것으로 분석되었다.

Unicode 한글낱자의 UTF-8 부호화에 따른 HDB-3 스크램블링 발생빈도 (Scrambling Occurrence Frequency in HDB-3 in UTF-8 Coding of UNICODE Hangul Jamo)

  • 홍완표
    • 한국항행학회논문지
    • /
    • 제19권2호
    • /
    • pp.153-160
    • /
    • 2015
  • 본 논문은 국제적 문자부호체계인 유니코드 내에 있는 한글낱자와 호환용 한글낱자 부호를 통신망에 전송하기 위해 UTF-8부호로 변환할 때 회선부호기에서 발생하는 스크램블링의 발생빈도를 연구하였다. 본 논문에서 적용한 회선부호기의 스크램블링 방식은 ITU 및 한국의 표준전송방식인 HDB-3방식으로 하였다. 각 한글낱자부호에서 발생하는 스크램블링을 분석하기 위해 원천 부호화규칙을 적용하였다. 스크램블링 발생량은 각 한글낱자에서 발생하는 스크램블링의 발생횟수와 각 한글낱자의 사용빈도에 의한 발생 빈도율을 추출하였다. 연구결과 한글낱자의 부호에 대한 스크램블링 발생은 유니코드 체계내에서 24번, 52%, UTF-8체계 내에서 148번, 228%발생하였다. 호환용 한글낱자 부호에서는 유니코드 체계내에서 10번, 14%, UTF-8 체계 내에서 83번, 131%발생하였다. 즉, 유니코드체계의 한글낱자와 호환용 한글낱자는 UTF-8체계로 변환하면서 스크램블링 발생 빈도율이 각각 340%, 851%증가하는 것으로 나타났다.

유니코드 기반 UTF-8 한글글자마디 부호의 회선부호기내 스크램블링 발생에 관한 연구 (Study on Scrambling Occurrence in Line Coder for UTF-8 Hangul Syllable Code based on Unicode)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권7호
    • /
    • pp.831-836
    • /
    • 2015
  • 본 논문은 국제적 문자부호체계인 유니코드 체계를 기반으로 한 한글글자마디의 UTF-8부호가 회선부호기상에서 어느 정도 스크램블링이 발생하는 지를 연구하였다. 회선부호기의 ${\ldots}$ 경우를 대상으로 하였다. 이것은 ITU-T의 규격중 AMI 회선부호기에 적용되는 HDB-3 스크램블링과 관련된다. 본 논문은 스크램블링이 발생하는 문자의 코드를 분석하기 위해 문자의 원천부호화 규칙을 적용하였다. 연구결과 유니코드를 기반으로 하는 UTF-8한글글자마디부호 중에서 약 39%의 스크램블링이 발생하는 것으로 분석되었다.

UTF-8을 이용한 인명한자의 표현과 한글 독음 처리 (A Representation of Korean Human Names and Their Written in Chinese Characters Pronunciation Processing Using UTF-8)

  • 조영철;유정원;변정용
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.575-578
    • /
    • 2004
  • 인물 정보 검색 시스템은 사용자에게 종합적이고 정확한 정보와 편리한 사용자 인터페이스를 제공해야 한다. 하지만 현재 웹 상에서 이 시스템의 방대한 화장 한자 자료를 표현하는데 EUC-KR은 많은 어려움을 가지고 있다. 그리고 어려운 인명용 한자와 전문 한자 용어로 인해 일반인들의 사용이 어려웠다. 이를 해결하기 위해 본 논문에서는 확장된 한자를 표기하기 위하여 UTF-8 인코딩 방식을 사용한다. 그리고 사용자가 알기 원하는 한자의 한글 독음 변환 처리를 통해 데이터베이스의 효율성과 사용자가 쓰기 편한 인터페이스를 제공한다.

  • PDF

데이터통신 전송효율과 라틴어 부호 체계 고찰 (A study on Code System of Latin Character to Improve Transmission Efficiency in Data Communications)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.761-776
    • /
    • 2012
  • 본 논문은 국제표준 문자부호 체계인 유니코드(Unicode) 3.0에 포함된 라틴어 문자에 관한 새로운 부호 체계를 제시하였다. 이 연구의 시작 배경은 Unicode 3.0의 라틴어 부호 체계가 데이터통신의 전송효율 측면에서 적정한가에 대한 것이었다. 데이터통신을 할 때, 4개 또는 8개 이상의 연속 "0"의 비트가 단말 정보기기로 부터 회선부호화 장치에 입력 될 수 있다. 이 경우에 그 비트열은 스크램블링 과정을 거쳐 연속 "0"이 아닌 비트열로 변경된다. 그러므로 단말 정보기기에서 처리되는 0 문자, 기호 등의 부호 체계에 따라서 데이터통신의 회선부호기 운용이 달라지게 된다. 즉, 데이터통신의 전송효율에 영향을 주게 된다. 이러한 관점에서 본 논문은 [1]에서 제시된 ($4{\times}4$)hexa 원천 부호화 규칙과 영어 문자의 사용빈도 통계를 적용하여 유니코드와 UTF-8의 라틴어 부호 체계에 대한 개선방안을 제시하였다. 그 결과 본 연구에서 제시한 개선된 유니코드와 UTF-8 라틴어 부호 체계를 적용할 경우, 회선부호기의 스크램블러 운용효율이 유니코드를 통신용으로 사용할 경우 최소 3645%에서 최대 31400%, 제시된 UTF-8 부호 체계를 적용할 경우 최소 480%에서 최대 1700%까지 개선되는 것으로 나타났다.

애플리케이션 기반에서 Punycode 를 적용한 다국어 이메일 주소 제안 및 구현 (The Proposal and Implementation of The Internationalized Email Address applying Punycode in Application Layer)

  • 박민수;이희찬;송관호;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.944-947
    • /
    • 2010
  • 새로 제정된 이메일 프로토콜 표준에 따라 사용자는 이메일 주소에 한글과 같은 다국어를 포함할 수 있다. 다국어 이메일 주소를 사용하여 송수신자가 메일을 전송하기 위해서는 양측 메일 서버가 모든 문자를 표현할 수 있는 UTF-8 인코딩 방식을 지원하도록 정의하고 있지만 현재의 네트워크 상에는 UTF-8 인코딩 방식을 지원하는 메일 서버와 지원하지 않는 메일 서버 모두가 존재하고 있다. 이는 곧 메일이 정상적으로 수신자에게 전송이 되지 못하는 결과를 발생시킨다. 본 논문에서는 UTF-8 을 지원하는 서버와 지원하지 않는 서버의 기존 상태를 유지하면서 메일을 정상적으로 송수신을 하기 위해 애플리케이션에서 퓨니코드 변환을 적용시킨 전달 기법을 제안하였으며 직접 구현하여 정상적으로 작동하는 것을 확인 하였다.

다국어 도메인을 위한 DNS 프로토콜 : mlDNS (A New DNS Protocol for Multilingual Domain Names)

  • 신혜원;이승익;이동만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.328-330
    • /
    • 2000
  • DNS(Domain Name Service)는 인터넷 호스트의 주소를 제공하는 서비스로써 기존의 시스템은 영어 알파벳 이외의 다른 언어들로 구성된 도메인 네임(Domain Name)은 처리하지 못한다. 최근, 인터넷의 국제화에 따른 다국어 도메인의 필요성이 점차 증대됨에 따라 이러한 문제점을 해결하고 다국어 도메인 이름을 처리할 수 있는 새로운 DNS 프로토콜인 mlDNS(Multilingual Domain Name Service)를 제안한다. 기존의 DNS와의 호환성 및 상호 운용성을 보장하고 특정 언어에 종속되지 않는 시스템을 디자인하기 위해 mlDNS에서는 Unicode 문자 집합을 기반으로 모든 DNS 질의를 UTF-8 인코딩 방식으로 처리하고 이러한 새로운 mlDNS 질의와 기존의 DNS 질의를 구분하기 위해 DNS 질의 헤더에 'IN'이라는 새로운 비트 영역을 지정하여 사용한다.

  • PDF

Construction of L-Threonine Overproducing Escherichia coli by Cloning of the Threonine Operon

  • Lee, Jin-Ho;Oh, Jong-Won;Noh, Kap-Soo;Lee, Hyune-Hwan;Lee, Jae-Heung
    • Journal of Microbiology and Biotechnology
    • /
    • 제2권4호
    • /
    • pp.243-247
    • /
    • 1992
  • The thr operon of Escherichia coli TF427, an $\alpha$-amino-$\beta$-hydroxyvaleric acid (AHV)-resistant threonine overproducer, was cloned in a pBluescriptII $KS^+$ plasmid by complementation of E. coli mutants. All clones contained a common 8.8 kb HindIII-generated DNA fragment and complemented the thrA, thrB, and thrC mutants by showing that these clones contained the whole thr operon. This thr operon was subcloned in the plasmid vectors pBR322, pUC18, and pECCG117, an E. coli/Corynebacterium glutamicum shuttle vector, to form recombinant plasmids pBTF11, pUTF25 and pGTF18, respectively. The subcloned thr operon was shown to be present in a 6.0 kb insert. A transformant of E. coli TF125 with pBTF11 showed an 8~11 fold higher aspartokinase I activity, and 15~20 fold higher L-threonine production than TF125, an AHV-sensitive methionine auxotroph. Also, it was found that the aspartokinase I activity of E. coli TF125 harboring pBTF11 was not inhibited by threonine and its synthesis was not repressed by threonine plus isoleucine.

  • PDF

한의학 용어의 UMLS 등재 - KIOM 용어정제연구 중 경혈명(經穴名)을 중심으로- (Inclusion of the Traditional Korean Medical Terms into the UMLS)

  • 김진현;김상균;장현철;김민아;오용택;배순희;김창석;전병욱;김재훈;송미영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2011년도 춘계 종합학술대회 논문집
    • /
    • pp.185-186
    • /
    • 2011
  • 본 연구의 목적은 미국국립의학도서관(NLM)의 Unified Medical Language System(UMLS)에 한의학의 용어를 등재하는 것이다. 1차 등재 대상으로 한국한의학연구원(KIOM)에서 진행중인 한의학 용어 정제 연구 결과물 중 임(任) 독맥(督脈)과 12정경(正經)에 속하는 360개의 경혈명(經穴名)의 Concept Unique Identify(CUI)를 선정하였다. UMLS Knowledge Source Server (UMLSKS)의 메타시소러스 검색을 통해 UMLS 내 경혈(經穴)용어에 대한 terminology정보를 수집, 분석하였다. 이를 바탕으로 용어간 개념 비교를 통해 UMLS의 경혈(經穴)용어와 KIOM의 경혈(經穴)용어를 매핑하였다. 마지막으로 Rich Release Format(RRF)로 데이터를 저장하고, Unicode Transformation Format-8 (UTF-8)로 인코딩하여 NLM으로 송부하였다. NLM에서 용어 등재에 대한 적합성 여부를 판별한 후 2010AB버젼에 "TKMT2010"이라는 소스명으로 한글로 된 한의학 용어가 최초로 UMLS에 등재되었다. 향후 UMLS와 같은 국제표준의학용어와 연계를 통해 한의학 용어가 다양한 의학용어체계와 상호호완성을 확보하고 표준화, 세계화할 수 있도록 지속적인 연구가 필요하다.

  • PDF