• Title/Summary/Keyword: 특수문자

Search Result 92, Processing Time 0.028 seconds

Support on Ideograph Characters Search of Unicode Based Information System (정보 시스템의 유니코드 기반 한자 검색 지원)

  • Yoon, So-Young
    • Journal of the Korean Society for information Management
    • /
    • v.24 no.4
    • /
    • pp.375-391
    • /
    • 2007
  • Unicode Han ideograph character set differed from the our principle of the phonetic value ordering in that it followed the principle of KangXi radical-stroke ordering of the characters. Therefore, information system should support ideograph search on precise analysis of materials which consist of korean character (hangul) and ideograph character (hanja). History Information system has been maintaining Hanja(Chinese Character) to Hangul Dictionary, Terminology Dictionary for composition, borrowing, non-ideographic principles, Variant Forms Dictionary, and Recently discovered Chinese Characters List.

An Implementation of a System for Video Translation on Window Platform Using OCR (윈도우 기반의 광학문자인식을 이용한 영상 번역 시스템 구현)

  • Hwang, Sun-Myung;Yeom, Hee-Gyun
    • Journal of Internet of Things and Convergence
    • /
    • v.5 no.2
    • /
    • pp.15-20
    • /
    • 2019
  • As the machine learning research has developed, the field of translation and image analysis such as optical character recognition has made great progress. However, video translation that combines these two is slower than previous developments. In this paper, we develop an image translator that combines existing OCR technology and translation technology and verify its effectiveness. Before developing, we presented what functions are needed to implement this system and how to implement them, and then tested their performance. With the application program developed through this paper, users can access translation more conveniently, and also can contribute to ensuring the convenience provided in any environment.

The Radical-rule and Arrangement System of Characters of Wu Jing Wen Zi: a Rebuttal of Yu Jiaxi's View (『오경문자(五經文字)』 부수 분류의 표준과 소속자의 귀속 체례 - 여가석(余嘉錫)의 『오경문자(五經文字)』 부수 평가에 대한 반박)

  • Lee, Kyeongwon
    • Cross-Cultural Studies
    • /
    • v.38
    • /
    • pp.385-404
    • /
    • 2015
  • Compiled in 776 by Zhang Shen, Wu Jing Wen Zi was regarded as the epitome of model book for standardized regular script in Tang Dynasty. Following early works like Shuo Wen Jie Zi, Zhang Shen adopted radical-rule for the compilation of this work. 3,250 characters were selected from the Five Classics and 160 radicals were established. Yu Jiaxi (1884-1955) harshly criticized the radical system of Wu Jing Wen Zi for being inconsistant and confusing. With careful review and analysis of examples from Wu Jing Wen Zi, this paper discusses the pupose of the compilation of this work, its unique radical-rule system, principles of arrangement of characters with the same or similar radicals, and the differentiation of variant characters. It further discusses the value of Wu Jing Wen Zi by its innovative radical-rule and effective differentiation of variant characters. It concludes with a rebuttal of Yu Jiaxi's argument and restate the necessity of reevaluation of this work even to this day.

Developing Tool of Distance Learning Korean Coursewares for European Language Speakers (유럽어 사용자를 위한 원격 한국어 코스웨어 개발도구)

  • Kim, Ki-Hye;Yoon, Ae-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.446-453
    • /
    • 1997
  • 정보화 시대에 한국어의 활발한 보급을 위해서는 다양한 모국어 사용자들의 학습 요구를 충족 시키는 한국어 코스웨어의 개발 및 통신망을 이용한 제공이 필요하다. 하지만, 외국어로서 한국어를 학습하고자 하는 학습자들을 위한 한국어 코스웨어는 영어와 일본어에 국한되어 있어서 유럽어를 모국어로 하는 학습자들의 한국어 학습 효율을 저하시키므로, 그들의 모국어로 된 한국어 코스웨어의 개발이 요구된다. 이러한 개발 단계에서 제일 처음 부딪히는 문제로 한글 윈도우(Windows)나 통신망(net-work) 환경에서 영어의 알파벳을 제외한 유럽어(European Languages) 특수문자의 입 출력이 불가능하다는 것이다. 따라서 비전산 전문가들이 손쉽게 코스웨어를 만들 수 있도록 개발된 기존의 저작 도구(authoring tool)로는 유럽어와 한글을 동시에 사용하는 한국어 학습 내용을 기술할 수 없다. 본 논문에서는 한국어 학습을 위한 원격 교육의 필요성 및 문제점을 알아보고 이를 바탕으로 설계한 유럽어 지원 한국어 코스웨어 개발 도구(developing tool)인 반디(BANDI)의 시스템 구성, 사용자 인터페이스 및 비전산 전문가인 학습 내용 개발자를 위한 스크립트 언어를 소개하였다.

  • PDF

A Preprocessing for Efficient Classification of E-mail Messages (전자우편문서의 효율적인 분류를 위한 전처리)

  • 강영순;이용배;김태현;조숙현;맹성현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.493-495
    • /
    • 2002
  • 인터넷 사용의 증가는 의사소통 매체의 하나로 전자우편(e-mail)을 일반화되게 땠다. 전자우편은 개인적인 목적 뿐만 아니라, 광고, 판매, 서비스 흑은 제품구입 관련문의 등의 특정목적에 이용되고 있는 추세이므로 한꺼번에 많은 메일을 처리 및 관리하기 위해서는 전자우편문서의 자동분류가 필요하다. 전자우편문서는 일반문서와는 달리 반구조적(semi-structure)구성, 특수문자, 약어 및 속어 등의 특징들이 있으므로 이러한 특성들은 자동분류의 정확도에 영향을 기치는 요인이 될 수 있다. 본 논문에서는 분류 성능을 향상 시키기 위해 자동분류의 오류가 될 수 있는 특성들을 제거하고, 구조적인 특징을 활용한 분류기의 전처리기를 설계한 방법론을 제시하고자 한다

  • PDF

Virtural Index System to Reduce Amount of Data Transmission in WWW Environment (WWW환경에서 데이터 전송량 절감을 위한 가상인덱스 시스템)

  • Gang, Jae-Cheol;Kim, Chang-Hwa
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.26 no.6
    • /
    • pp.693-705
    • /
    • 1999
  • 최근에 사용중인 검색엔진은 증가하는 지역사이트의 정보를 로봇사이트에 인덱스하는데 많은 문제점이 있다. 첫째, 지역사이트의 문서 전체를 로봇사이트로 전송하므로 네트워크의 트래픽을 증가시킨다. 왜냐하면 인덱스 하는데 불필요한 불용어와 특수문자, 중복된 키워드 전체를 전송하기 때문이다. 둘째 지역사이트의증가로 인해 로봇의 방문주기가 길어지므로 최근의 정보를 유지하는데 어려움이 있다. 마지막으로 문서를 로봇사이트에서 파싱하므로 파싱 시간이 길다. 이러한 문제점을 해결하기 위해 본 논문에서는 VITAR 방식을 제안하고 중앙집중식 인덱스방식과 성능을 비교분석한다. 이 방식은 지역사이트에서 문서를 생성,갱신, 삭제하고 지역 인덱스에이전트에 의해 파싱한후 푸싱기법을 이용하여 가상인덱스에 키워드 메시지만을 전송한다. VITAR방식의 장점은 키워드메시지만을 전송하므로 네트워크 트래픽을 줄일 수 있고 지역사이트에서 미리 파싱하므로 파싱 시간을 줄일 수 있으며 , 각 지역사이트의 문서가 변경되는 즉시 가상인덱스가 변경되므로 인해 최근의 자료를 유지할 수있다. 특히 중앙집중식 인덱스방식과 성능을 비교분석한 결과 생성타입인 경우 80.3%의 전송절감효과를 얻을 수있었다.

Encryption Program using Scratch (스크래치 기반의 암호화 프로그램)

  • Hur, Tai-Sung;Lee, Min-Jae;Kim, Ga-Gyeom
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.331-332
    • /
    • 2018
  • 일반적으로 정보를 전달함에 있어 정보의 유출은 큰 문제이다. 정보를 전달하는 방법이 발달하고 보편화됨에 따라 오늘날에 와서는 개인정보 유출과 관련된 문제가 지속적으로 대두되었다. 개인정보의 보호가 더욱 중요하게 생각되는 현 상황을 고려하여 스크래치(Scratch)의 기본 연산기능을 이용한 한글과 특수문자, 영어 암호화(Encryption) 및 복호화(Decryption)를 가능하게 하고, 정수 형태의 2개의 개인키와 간단한 알고리즘을 통해 암호문을 생성하는 어플리케이션을 통해 암호화와 복호화에 대한 개념을 학습하고, 더욱 나아가 개인정보 보호에 대한 중요성을 상기할 수 있도록 하였다.

  • PDF

A Study on Tools for Text Similarity Evaluation (문서 유사도 분석 도구에 관한 연구)

  • Kang, Hong-Bi;Kim, Hee-Jin;Kim, Han-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.411-414
    • /
    • 2017
  • 본 시스템은 LSA 또는 벡터공간 모델 방식을 이용하여, 문장 대 문장, 문서 대 문장, 다중 문서 간유사도 분석을 수행한다. 이는 문서의 특수문자를 제거한 뒤, 형태소 분석을 기반으로 단어를 추출하여 TF-IDF 가중치를 추출한뒤 행렬 계산을 통하여 Cosine 계산식을 사용하여 유사성을 검출하는 단계로 구성된다. 제시된 기법은 2개의 오픈소스를 이용하며, x86 기반 64bit Windows에서 개발되었으며, 60% 이상의 정확도를 나타낸다.

Pronunciation Generation Based on Morphophonological Analysis in Korean TTS (한글 TTS시스템에서 형태 음운론적 분석에 기반 한 발음열 생성)

  • Jeong, Kyung-Seok;Park, Hyuk-Ro
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.559-562
    • /
    • 2001
  • 한국어 TTS시스템에서 한 가지 모듈로써의 발음열 생성기는 한국어의 특성상 음운적 조건과 형태론적 조건 등에 의해 다양한 방법과 예외처리를 요구하고 한국어의 음운현상에 대한 체계적인 분석과 처리가 필요하다. 그래서 이 논문은 형태 음운론적 분석을 통한 발음열 자동 생성기법을 소개한다. 이 시스템은 형태소 분석을 선행한 후, 특수문자나 숫자 등을 정규화하고 복합명사 분해 사전을 이용한 복합명사 분해와 추가 조건을 통해 ㄴ-첨가 규칙을 전 처리한다. 그리고 음운 변화 현상을 분석하여 선택적으로 규칙을 적용하여 발음열을 생성한다. 제안된 시스템은 기존의 형태소 분석되지 않은 시스템에 비해 더욱 효과적인 음운, 형태소 변화를 가져옴과 함께, 특히 ㄴ-첨가가 적용되는 텍스트는 7$\sim$8%정도의 나은 발음열을 생성찬 수 있었다. 그 결과, 발음열 생성기는 한국어 TTS 시스템의 한국어 처리라는 고질적인 문제 해결에 좋은 방향과 결과를 기여할 수 있다.

  • PDF

Article Analytic and Summarizing Algorithm by facilitating TF-IDF based on k-means (TF-IDF를 활용한 k-means 기반의 효율적인 대용량 기사 처리 및 요약 알고리즘)

  • Jang, Minseo;OH, Sujin;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.271-274
    • /
    • 2018
  • 본 논문에서는 뉴스기사 데이터를 활용하여 대규모 뉴스기사를 소주제로 분류하는 군집 분석 방법을 제안한다. 또한, 분류된 뉴스기사를 사용자가 빠르게 이해하고 접할 수 있도록 핵심 문장을 추출하여 제공하는 방법을 제안한다. 분석 데이터는 포털 사이트 점유율 1위인 네이버의 경제 분야 뉴스기사를 크롤링하여 수집한다. 뉴스기사의 분석을 위해 전 처리를 통해 특수문자, 조사, 어미, 구두점 등의 불 용어 처리를 수행한다. 또한, k-means 알고리즘을 이용하여 대용량의 뉴스기사를 주제 별로 분류하는 것을 진행하며 그것을 토대로 핵심 문장을 추출한다. 추출된 핵심 문장은 분류된 뉴스기사의 주제를 나타내며 사용자에게 빠르게 정보를 전달하기 위해 활용한다. 본 논문의 연구 내용이 여러 언론사 사이트에 반영되면 사이트 품질과 사용자 만족도 향상에 기여할 수 있을 것으로 보인다.