• 제목/요약/키워드: 문자부호

검색결과 56건 처리시간 0.024초

UTF-8 부호의 HDB-3스크램블링 최소화를 위한 문자의 원천부호화 규칙 (Source Coding Rule of Characters to Minimize HDB-3 Scrambling in Line Coder for UTF-8 code)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.1019-1026
    • /
    • 2015
  • 본 논문은 UTF-8 부호화된 문자의 원천부호가 회선부호기에 입력될 때 HDB-3 스크램블링을 최소화하도록 하는 문자의 원천부호화 규칙을 연구하였다. 기존 연구는 원천부호자체가 회선부호기에 입력될 때 HDB-3 스크램블링을 최소화하기 위한 문자의 원천부호화 규칙에 관한 내용이었으나 이번 연구에서는 원천부호가 UTF-8부호로 변환되면서 UTF-8부호와 원천부호간의 스크램블링 관계가 상호 대응적이지 않음을 분석하였다. 따라서 UTF-8 부호의 HDB-3 스크램블링 최소화를 위한 문자의 원천부호화 규칙이 없을 경우, UTF-8부호에서 스크램블링이 발생하는 부호를 분석하기 위해 원천부호를 모두 UTF-8부호로 변환한 후에 분석을 통해 스크램블링이 발생하지 않는 원천부호영역에서 부호화해야 한다. 제안된 UTF-8 부호에 대한 문자의 원천부호화 규칙을 적용할 경우, 이러한 복잡한 과정을 거치지 않고 스크램블링을 최소화 할 수 있는 문자의 원천부호화가 가능하다.

국제 문자 부호계에 포함된 한글 부호계의 개선 방안 (A Method of Improving Hangul Code Systems Embedded in UCS)

  • 변정용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.192-194
    • /
    • 1998
  • 현행 국제문자부호계(KS C 5700-1995)에는 세 가지 종류의 한글 부호계인 완성 음절형, 자소형, 자모형이 포함되어 있으며, 이들을 적용할 때 구현 수준에 따라서 표현이 불가능하거나 혼합 부호계 표현으로 혼란이 일어날 소지가 매우 크다. 뿐만 아니라 완성 음절형 부호계를 주된 부호계로 삼고 있기 때문에 이런 기반 위에서 국어정보처리를 하는 것은 불가능하며, 옛 한글 표현은 수준을 달리하였을 때 가능하다. 본 논문은 국제문자보호계에 세가지 한글 부호계를 분석 평가하여 이들이 함께 존재할 필요성이 있는지 여부와 제정자의 관점 그리고 각각의 한계점과 파생될 문제점을 검토하고 국제문자 보호계의 바른 나아갈 바에 대하여 2 가지 방안을 모색한다.

  • PDF

정보교환용 조선글 부호 KPS 9566-97의 분석 (An Analysis of KPS 9566-97 Korean Character Code for Information Interchange)

  • 변정용
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.199-204
    • /
    • 2001
  • 분단으로 빚어진 남북한 사회의 이질화는 한글과 조선글이라는 쌍둥이의 탄생으로 연결되고, 이들 둘은 자모순이 다르고 음절 부호화 방식을 채택하였기 때문에 정보교환을 함에 있어서 돌아오지 못할 다리를 건너고 말았다. 이제 남북경협의 본격화가 예상되고 그에 따른 정보교환의 급증이 예상되는 시점에서 최근 개정된 조선글 두바이트 부호 국규 9566-97의 분석을 통하여 양 문자를 통합할 수 있는 기틀을 마련하고자 한다 여기서 문제 해결의 핵심은 자모순이 서로 다름으로 인하여 빚어지는 것으로 이들 남북의 자모순 및 정보교환용 문자부호 표준화를 위하여 몇 가지 모색을 하고 방법을 논한다. 또한 남한안 일변도인 국제 문자부호 표준에 대하여 북한의 수정요구가 진행되고 있고 그 내용과 조선글 두바이트 부호안을 종합하여 표준을 마련하기 위한 기본 방향을 설정하고 허배선생의 연구를 통하여 새로운 자모순 모색의 가능성을 논한다.

  • PDF

데이터통신 전송효율과 ASCII 부호체계 고찰 (Study on the ASCII Code in the side of the Transmission Efficiency in Data Communications)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.657-664
    • /
    • 2011
  • 본 논문은 국제표준문자부호인 ASCII 부호체계에 대한 새로운 부호 체계를 제시하였다. 이 연구의 시작점은 ASCII부호체계가 데이터통신의 전송효율 측면에서 적정한가에서부터 출발하였다. 데이터통신을 할 때, 정보기기에서 회선부호화 장치에 입력되는 연속 "0"의 비트는 스크램블링과정을 거쳐야 한다. 즉, 정보기기에서 처리되는 문자, 기호 등의 부호의 구성형태에 의해 전송효율이 영향을 받게 된다. 본 논문은 이러한 관점에서 기 제시된 문자 부호화 규칙과 문자의 사용빈도 통계를 적용하였다. 그 결과 본 연구에서 제시한 수정된 ASCII부호체계를 적용할 경우, 회선부호기의 스크램블러 운용효율이 약30%이상 개선되는 것으로 나타났다.

데이터통신 전송효율과 라틴어 부호 체계 고찰 (A study on Code System of Latin Character to Improve Transmission Efficiency in Data Communications)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.761-776
    • /
    • 2012
  • 본 논문은 국제표준 문자부호 체계인 유니코드(Unicode) 3.0에 포함된 라틴어 문자에 관한 새로운 부호 체계를 제시하였다. 이 연구의 시작 배경은 Unicode 3.0의 라틴어 부호 체계가 데이터통신의 전송효율 측면에서 적정한가에 대한 것이었다. 데이터통신을 할 때, 4개 또는 8개 이상의 연속 "0"의 비트가 단말 정보기기로 부터 회선부호화 장치에 입력 될 수 있다. 이 경우에 그 비트열은 스크램블링 과정을 거쳐 연속 "0"이 아닌 비트열로 변경된다. 그러므로 단말 정보기기에서 처리되는 0 문자, 기호 등의 부호 체계에 따라서 데이터통신의 회선부호기 운용이 달라지게 된다. 즉, 데이터통신의 전송효율에 영향을 주게 된다. 이러한 관점에서 본 논문은 [1]에서 제시된 ($4{\times}4$)hexa 원천 부호화 규칙과 영어 문자의 사용빈도 통계를 적용하여 유니코드와 UTF-8의 라틴어 부호 체계에 대한 개선방안을 제시하였다. 그 결과 본 연구에서 제시한 개선된 유니코드와 UTF-8 라틴어 부호 체계를 적용할 경우, 회선부호기의 스크램블러 운용효율이 유니코드를 통신용으로 사용할 경우 최소 3645%에서 최대 31400%, 제시된 UTF-8 부호 체계를 적용할 경우 최소 480%에서 최대 1700%까지 개선되는 것으로 나타났다.

HDB-3 스크램블링과 HDLC 프로토콜에서 효율적 문자부호 전송을 위한 문자부호 작성 규칙 (Composition Rule of Character Codes to efficiently transmit in HDLC Protocol with HDB-3 Scrambling)

  • 홍완표
    • 한국항행학회논문지
    • /
    • 제16권5호
    • /
    • pp.831-838
    • /
    • 2012
  • 정보 기기 내에서 문자를 어떠한 규칙에 의해 부호화하는가에 따라 데이터 전송효율을 제고시킬 수 있다. 본 논문은 데이터 전송 효율면에서 OSI 표현계층에서 이루어지는 문자부호화 원칙을 제시하였다. 본 논문에서 제시하는 문자부호화 원칙은 두가지점을 고려하여 제시되었다 첫째는 OSI 데이터링크 계층의 HDLC와 PPP 프로토콜의 플래그 필드를 구성하는 비트열이다. 둘째는 OSI 물리계층에서 이루어지는 HDB-3 스크램블링 방식이다. 첫 번째 고려사항에서는 원천부호에 비트"1"이 연속하여 다섯 개 이상 발생치 않도록 하는 것이다. 두번째 고려사항에서는 원천부호에 비트"0"이 연속하여 네 개 이상 발생치 않도록 하는 것이다. 본 논문에서 제시하고 있는 원천부호화 규칙에 의하여 문자를 원천부호화 할 때에 데이터의 전송효율을 제고시키게 된다.

유니코드 기반 UTF-8 한글글자마디 부호의 회선부호기내 스크램블링 발생에 관한 연구 (Study on Scrambling Occurrence in Line Coder for UTF-8 Hangul Syllable Code based on Unicode)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제10권7호
    • /
    • pp.831-836
    • /
    • 2015
  • 본 논문은 국제적 문자부호체계인 유니코드 체계를 기반으로 한 한글글자마디의 UTF-8부호가 회선부호기상에서 어느 정도 스크램블링이 발생하는 지를 연구하였다. 회선부호기의 ${\ldots}$ 경우를 대상으로 하였다. 이것은 ITU-T의 규격중 AMI 회선부호기에 적용되는 HDB-3 스크램블링과 관련된다. 본 논문은 스크램블링이 발생하는 문자의 코드를 분석하기 위해 문자의 원천부호화 규칙을 적용하였다. 연구결과 유니코드를 기반으로 하는 UTF-8한글글자마디부호 중에서 약 39%의 스크램블링이 발생하는 것으로 분석되었다.

HDLC(High-level Data Link Control) 프로토콜에서 효율적 문자부호 전송을 위한 문자부호화 규칙 (Composition Rule of Character Codes to efficiently transmit the Character Code in HDLC(High-level Data Link Control) Protocol)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.753-760
    • /
    • 2012
  • 본 논문은 데이터 통신의 전송효율 측면에서 OSI 표현계층에서 수행되는 문자의 원천부호화에 대하여 연구하였다. 데이터링크 계층의 HDLC와 PPP 프로토콜은 프레임과 프레임간의 식별 및 수신기의 동기화 패턴용으로 프레임의 맨 앞뒤에 FLAG 바이트를 삽입한다. 이 FLAG 바이트는 "01111110"의 8비트열로 구성된다. 그러므로 데이터비트열에서 "0"비트 이후 "1"의 비트가 연속하여 5개 이상 발생될 경우 데이터비트열이 플래그(flag)로 혼동되어 질 수 있다. 이를 방지하기 위해 HDLC에서는 데이터 비트열에 "1"의 비트가 5개 이상 연속될 경우 5번째 비트 다음에 "0"비트를 인위적으로 추가해 주고 있다. 그러므로 문자 부호에 연속 5개의 "1"비트열이 많이 발생하도록 부호화하게 되면 데이터 통신의 전송 효율에 영향을 주게 된다. 본 본문에서는 문자부호에 연속 5개 이상의 비트"1"이 발생 되지 않도록 하는 문자부호화 규칙을 제시하였다.

AMI/HDB-3 회선부호화 및 HDLC FLAG를 고려한 KS × 1001 정보 교환용 로마문자 부호체계고찰 (Consideration of Roman Character in KS × 1001 Code System for Information Interchange considered AMI/HDB-3 and HDLC FLAG)

  • 홍완표
    • 한국전자통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1017-1023
    • /
    • 2013
  • 데이터를 원거리에 전송하는 회선부호화 방식으로는 AMI방식을 사용한다. AMI방식의 단점은 원천부호에 일정한 개수 이상의 0의 비트가 존재할 경우 비트동기를 상실하게 되는 것이다. 이 단점을 보완하기 위해 스크램블링 기술을 적용한다. HDB-3 스크램블링 방식은 원천부호에 비트 0이 네 개 이상 연속하여 있을 때 이것을 인위적으로 변환시킨다. 그러므로 원천 부호 중에 연속하여 네 개 이상의 0의 비트로 구성된 부호가 많을 경우, 회선부호화 과정 중에서 데이터전송효율을 감소시키게 된다. 한편 HDLC 통신규약에서는 플래그 비트열과 유사한 비트열의 오인을 방지위해 비트 또는 문자 스터핑 방식을 사용한다. 본 논문은 이러한 관점에서 $KS{\times}1001$에 포함된 로마문자용 부호집합을 분석대상으로 하였다. 이러한 분석결과를 토대로 하여 데이터의 전송효율을 제고시키는 최적의 로마문자 원천부호체계를 제시하였다. 본 연구에는 문자의 ($4{\times}4$)비트 원천 부호화 규칙과 영어 알파벳의 사용빈도 통계를 적용하였다. 연구결과 본 논문에서 제시하는 로마문자용 부호집합체계를 적용할 경우에 약134%의 데이터처리 효율을 제고시키는 것으로 나타났다.

AMI/HDB-3 회선부호화와 한·중·일 한자 유니코드 체계 고찰 (Consideration of CJK Joint Hanja Unicode when is used in AMI/HDB-3 Line Coding)

  • 태동진;홍완표
    • 한국전자통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1011-1015
    • /
    • 2013
  • 본 논문은 한중일통합 한자 유니코드 부호 집합체계가 원천부호화규칙에 위배되는 정도를 분석하였다. 본 연구에서는 한중일통합 한자의 유니코드 중에서 사용빈도 수가 높은 문자 150개를 대상으로 하여 연구하였다. 이 한중일통합 한자 150개 문자의 사용 빈도율은 한중일통합 한자 유니코드 전체 사용빈도율의 약 50%에 해당된다. 본 연구에서는 한중일통합 한자 유니코드를 AMI회선부호화 방식과 HDB-3 스크램블링 방식을 사용할 경우를 대상으로 하였다. 분석결과 150개의 문자중 원천부호화 규칙에 위배되는 문자는 총 77개 였다. 이들 문자들의 사용 빈도율에 의한 원천부호화 규칙 위배율은 약28%였다. 결과적으로 이 원천부호화 규칙에 위배되는 문자들을 사용빈도가 낮고 원천부호화 규칙에 부합되는 문자부호로 대체 할 때, 회선부호기에서의 회선부호 처리율을 약37%만큼 개선시킬 수 있음을 나타냈다.