• 제목/요약/키워드: 알파벳

검색결과 113건 처리시간 0.029초

임베디드시스템을 위한 혼용텍스트 파일의 개선된 LZW 압축 알고리즘 구현 (Development on Improved of LZW Compression Algorithm by Mixed Text File for Embedded System)

  • 조미남;지유강
    • 한국콘텐츠학회논문지
    • /
    • 제10권12호
    • /
    • pp.70-76
    • /
    • 2010
  • 최근의 스마트폰, 임베디드시스템 등의 정보통신 단말기는 데이터의 송 수신 및 분산처리 등의 업무를 수행하기 위하여 데이터의 크기를 축소시키는 압축률 향상이 매우 크게 대두되어졌다. 일반적으로 텍스트의 압축에는 LZW(Lempel Ziv Welch)알고리즘을 활용하고 있다. 그러나 LZW알고리즘은 1Byte 조합형 텍스트(알파벳 등)의 압축에는 효율적이나 2Byte 완성형 텍스트(한글 등)에 압축률이 현저하게 저하되는 단점을 가지고 있다. 이를 극복하기 위하여 본 논문에서는 2Byte 전위 필드(prefix)와 반복 계수를 위한 1Byte 후위 필드(suffix)를 사용하는 확장된 ELZW(EBCDIC Lempel Ziv Welch)알고리즘을 제안한다. 제안 알고리즘은 압축률 증가를 위해 압축사전을 구성하여, 알파벳, 한글, 포인터에 따라 각각 서로 다른 비트 스트링으로 적절하게 패킹된다. 제안하는 알고리즘의 성능분석을 위하여 각 140,355byte의 영문, 한글, 한영혼용 텍스트를 비교 실험하였고, 실험결과 제안한 ELZW알고리즘의 압축률은 기존의 1Byte 방식의 LZW 알고리즘보다 5.22% 더 우수하고, 2Byte LZW 알고리즘 보다 8.96% 더 우수함을 보였다.

손 영역의 무게 중심과 퍼지 논리를 이용한 USB 카메라 기반의 지문자 인식 시스템 (USB Camera-Based Korean Manual Alphabet Recognition System Using Center of Gravity of Hand Region and Fuzzy Logic)

  • 오영준;박광현;변증남
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.300-303
    • /
    • 2007
  • 지문자는 청각장애인이 사용하는 수화로 표현하지 못하는 한글 문자를 알파벳으로 표시하기위한 손 제스처이다. 본 논문에서는 추출된 손 영역의 무게 중심과 퍼지 논리를 이용하여 지문자를 인식하는 알고리즘을 제안하고, 한글 문자를 표현하는 시스템을 개발한다. USB 카메라로부터 얻어진 영상에서 히스토그램을 이용하여 손의 피부색 영역을 추출하고, 영상 마스크를 이용하여 피부색이 아닌 배경 영역을 제거한다. 문턱 값을 사용하여 얻어진 이진화된 영상에서 손의 영역을 검출하고, 무게 중심을 이용하여 손 중심과 손가락 끝의 거리를 측정한다. 얻어진 거리 정보에 퍼지 기법을 적용하여 손가락의 굽힘 정도를 판단하고, 손 모양 데이터베이스에서 손가락 굽힘 정도와 가장 근사한 한글 문자를 선택한다.

  • PDF

Bar code 활용기술 분석

  • 김정호;박중무;이대기
    • 전자통신동향분석
    • /
    • 제4권4호
    • /
    • pp.85-97
    • /
    • 1989
  • 슈퍼나 소매점등에서 판매되는 상품의 포장을 자세히 살펴보면 흑색과 백색의 줄무늬가 인쇄되어 있는 것을 볼수가 있다. 이것을 bar code라고 하는 데 국명, 메이커명, 상품명등을 수치화하여 하나의 코드로 만들고 그것을 독해하여 가격을 산출하고 정산업무를 신속하고 정확하게 처리하면서 자료를 모아 해석하여 재고 관리, 발주, 매입 업무를 합리화하고 이를 정보 네트워크에 의하여 수요에 대응한 판매를 전개하는 등 물자의 유통관리에 폭넓게 이용되고 있다. 즉 bar code system은 흑색 또는 백색의 굵은 bar와 가는 bar의 구성에 의하여 하나의 성질 (숫자, 기호, 알파벳 문자)을 나타내고 그 연속을 광학식 입력수단을 통하여 하나의 코드에 정리한 자동화된 데이터수집(Automated Data Collection)방법으로 활용되고 있다. 본고에서는 이러한 bar code의 동작, 구성, 인식장치의 원리와 활용사례를 기술하였다.

Production of English Alphabets by Koreans

  • Yun, Yung-Do;Lee, Hyun-Gu
    • 영어어문교육
    • /
    • 제11권4호
    • /
    • pp.97-120
    • /
    • 2005
  • Production and perception of second language sounds are typically influenced by second language learners' native language sounds. In this study we investigate how the Korean language influences Korean speakers' production of English alphabets. In the experiment conducted to prepare for this study 16 native speakers of Korean pronounced English alphabets. Then three native speakers of English evaluated the Korean subjects' pronunciation of them. The results show that the Korean subjects' native language (i.e., Korean) influences their production of the English alphabets. When Korean has sounds corresponding to English alphabets, the English subjects rate the Korean subjects' production of them good. For instance, Korean has voiceless stop phonemes, hence their production of English alphabets was rated good by the English subjects. The Korean subjects' production of English alphabets containing the sounds that do not exist in Korean was rated poor by the English subjects. For instance, Korean does not have voiced fricative phonemes, hence their production of English alphabets was rated poor.

  • PDF

유한 알파벳 PID제어기 설계 (Design of the PID Controller Using Finite Alphabet Optimization)

  • 양윤혁;권오규
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.647-649
    • /
    • 2004
  • When a controller is implemented by a one-chip processor with fixed-point operations, the finite alphabet problem usually occurs since parameters and signals should be taken in a finite set of values. This paper formulates PID finite alphabet PID control problem which combines the PID controller with the finite alphabet problem. We will propose a PID parameter tuning method based on an optimization algorithm under the finite alphabet condition. The PID parameters can be represented by a fixed-point representation, and then the problem is formulated as an optimization with constraints that parameters are taken in the finite set. Some simulation are to be performed to exemplify the performance of the PID parameter tuning method proposed in this paper.

  • PDF

KSCI 구축을 위한 국내 학술지 식별체계 연구 (A Study on Developing the Identification Code System for Korean Sci-Tech Journals for KSCI)

  • 김선호;김태중
    • 한국문헌정보학회지
    • /
    • 제37권3호
    • /
    • pp.57-77
    • /
    • 2003
  • 본 연구는 국내 학술지의 표준화된 학술지 식별코드 체계인 KOJIC(KOrean Journal Identification Code)를 개발하는 것이 목적이다. 이 시스템을 개발하기 위하여 전통적인 자료식별 번호체계, 주요 국가서지번호, 그리고 국제적 또는 국가적 자료식별코드체계의 구조를 조사 분석한 다음, 유일성, 간편성, 조기성, 국제성, 그리고 확정성을 갖춘 KOJIC을 개발하였다. 이것은 6 자리의 알파벳 영문자와 숫자로 구성되는 코드이며, 한 개의 체크기호를 포함하고 있다.

  • PDF

유럽어 사용자를 위한 원격 한국어 코스웨어 개발도구 (Developing Tool of Distance Learning Korean Coursewares for European Language Speakers)

  • 김기혜;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.446-453
    • /
    • 1997
  • 정보화 시대에 한국어의 활발한 보급을 위해서는 다양한 모국어 사용자들의 학습 요구를 충족 시키는 한국어 코스웨어의 개발 및 통신망을 이용한 제공이 필요하다. 하지만, 외국어로서 한국어를 학습하고자 하는 학습자들을 위한 한국어 코스웨어는 영어와 일본어에 국한되어 있어서 유럽어를 모국어로 하는 학습자들의 한국어 학습 효율을 저하시키므로, 그들의 모국어로 된 한국어 코스웨어의 개발이 요구된다. 이러한 개발 단계에서 제일 처음 부딪히는 문제로 한글 윈도우(Windows)나 통신망(net-work) 환경에서 영어의 알파벳을 제외한 유럽어(European Languages) 특수문자의 입 출력이 불가능하다는 것이다. 따라서 비전산 전문가들이 손쉽게 코스웨어를 만들 수 있도록 개발된 기존의 저작 도구(authoring tool)로는 유럽어와 한글을 동시에 사용하는 한국어 학습 내용을 기술할 수 없다. 본 논문에서는 한국어 학습을 위한 원격 교육의 필요성 및 문제점을 알아보고 이를 바탕으로 설계한 유럽어 지원 한국어 코스웨어 개발 도구(developing tool)인 반디(BANDI)의 시스템 구성, 사용자 인터페이스 및 비전산 전문가인 학습 내용 개발자를 위한 스크립트 언어를 소개하였다.

  • PDF

음성 인식에서 훈련 및 인식 과정에 사용되는 대상 어휘의 차이에 대한 음향 모델의 성능 평가 (Performance Evaluation of Acoustic Models According to Differences between Vocabularies in Training and Test Phases of Speech Recognition)

  • 김회린;이항섭;권오욱
    • 한국음향학회지
    • /
    • 제17권7호
    • /
    • pp.22-27
    • /
    • 1998
  • 본 논문에서는 ETRI에서 개발한 가변 어휘 음성 인식기의 어휘 독립 음향 모델링 방법을 기술하고, 이 모델의 어휘 종속, 어휘 독립 및 어휘적응 성능을 평가하기 위하여 다 양한 고립단어 및 연속음성 DB에 대하여 실험한 결과를 분석하였다. 평가를 위하여 사용한 음성 DB로는 고립단어 음성으로 POW(Phonetically Optimized Words) 3848, PBW(Phonetically Balanced Words) 445, PBW 452, 호텔예약 244 단어, 게임 제어용 단어 등이며, 연속음성으로 일반 문장 음성 및 연속 숫자음을 이용하였다. 성능 분석 결과 40개 음소 모델만으로도 비교적 높은 인식률을 보여 주었지만, 어휘독립의 경우는 어휘종속에 비 하여 성능이 크게 낮았고, 특히 대상 어휘가 숫자음, 알파벳, 연속음 등의 경우에는 POW 데이터나 PBW 데이터만 가지고는 우수한 가변 어휘 음성 인식기를 구현하기에 한계가 있 음을 알 수 있다. 또한, 훈련 데이터의 어휘와 평가데이터의 어휘가 비슷할 경우에는 변이음 모델을 사용하면 음소 모델만을 사용할 경우에 비하여 그 성능이 우수하였지만, 일반적인 어휘독립의 상황에서는 효과가 별로 없음을 알 수 있었다.

  • PDF

다국어 도메인을 위한 DNS 프로토콜 : mlDNS (A New DNS Protocol for Multilingual Domain Names)

  • 신혜원;이승익;이동만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.328-330
    • /
    • 2000
  • DNS(Domain Name Service)는 인터넷 호스트의 주소를 제공하는 서비스로써 기존의 시스템은 영어 알파벳 이외의 다른 언어들로 구성된 도메인 네임(Domain Name)은 처리하지 못한다. 최근, 인터넷의 국제화에 따른 다국어 도메인의 필요성이 점차 증대됨에 따라 이러한 문제점을 해결하고 다국어 도메인 이름을 처리할 수 있는 새로운 DNS 프로토콜인 mlDNS(Multilingual Domain Name Service)를 제안한다. 기존의 DNS와의 호환성 및 상호 운용성을 보장하고 특정 언어에 종속되지 않는 시스템을 디자인하기 위해 mlDNS에서는 Unicode 문자 집합을 기반으로 모든 DNS 질의를 UTF-8 인코딩 방식으로 처리하고 이러한 새로운 mlDNS 질의와 기존의 DNS 질의를 구분하기 위해 DNS 질의 헤더에 'IN'이라는 새로운 비트 영역을 지정하여 사용한다.

  • PDF

음성합성을 위한 텍스트 음역 시스템과 숫자 음역 모호성 처리 (Text Transliteration System and Number Transliteration Disambiguation for TTS)

  • 박정연;신형진;육대범;이재성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.449-452
    • /
    • 2018
  • TTS(Text-to-Speech)는 문자열을 입력받아 그 문자열을 음성으로 변환하는 음성합성 기술이다. 그러나 실제 입력되는 문장에는 한글뿐만 아니라 영단어 및 숫자 등이 혼합되어 있다. 영단어는 대소문자에 따라 다르게 읽을 수 있으며, 단위로 사용될 때는 약어로 사용되는 것이므로, 알파벳 단위로 읽어서는 안 된다. 숫자 또한 함께 사용되는 단어에 따라 읽는 방식이 달라진다. 본 논문에서는 한글과 숫자 및 단위, 영단어가 혼합된 문장을 분류하고 이를 음역하는 시스템을 구성하며 word vector를 이용한 숫자 및 단위의 모호성 해소방법을 소개한다.

  • PDF