통합 검색 | Korea Science

안드로이드에서 힌디어 텍스트 처리 방법 (A Text Processing Method for Devanagari Scripts in Andriod)

김재혁;맹승렬
- 한국콘텐츠학회논문지
- /
- 제11권12호
- /
- pp.560-569
- /
- 2011
본 논문에서는 개방형 OS인 안드로이드에서 힌디어 텍스트 처리방법을 제안한다. 텍스트 처리의 핵심은 알파벳을 문자로 조합하는 규칙을 정의하는 오토마타와 폰트 파일에서 문자에 대응하는 이미지를 검색하고 이를 화면에 표시하는 폰트 렌더링이다. 오토마타는 입력 문자의 종류와 개수에 좌우되는데 유니코드를 기반으로 자음 14자와 모음 34자를 알파벳으로 사용하는 오토마타를 제안한다. 조합된 음절은 테이블 매핑 방식을 사용하여 그립 인덱스로 변환하고 해당하는 폰트를 로드하기 위한 핸들로 사용한다. 프리 타입 폰트엔진의 다국어 지원 프레임워크에 따라 제안방법을 별도의 모듈로 추가함으로서 시스템 수준에서 힌디어를 지원할 수 있다. 메시지 어플리케이션을 통해 제안방법의 타당성을 보인다.
https://doi.org/10.5392/JKCA.2011.11.12.560 인용 PDF KSCI

흑백 만화 제작을 위한 스타일 폰트 설계 시스템 (A Stylized Font Rendering System for Black/White Comic Book Generation)

이정원;류동성;박수현;조환규
- 정보처리학회논문지A
- /
- 제15A권2호
- /
- pp.75-86
- /
- 2008
기존의 만화 제작 시스템은 대부분의 작업을 수작업으로 하기 때문에 많은 시간과 인력이 필요하였고, 만화 내용을 창작하는 데에도 한계가 있었다. 이와 같은 문제점을 해결하기 위해 이전 연구를 통하여 영화나 드라마와 같은 기존의 영상 스트림을 입력으로 하여 흑백 만화를 제작 할 수 있는 시스템(CORVIS)을 개발하게 되었다. 비디오 영상을 흑백 만화로 표현하기 위해서는 한 컷의 이미지에 개체의 시각적인 요소와 청각적인 요소, 그리고 극의 분위기를 표현해야 하는데, 이를 위해 필요한 표현법을 만화적 효과라고 하며, 스타일 폰트는 의성어와 의태어를 표현하기 위해 사용되는 만화적 효과이다. 하지만 지금까지 흑백 만화에 관한 연구에서 스타일 폰트는 큰 관심을 받지 못하였다. 본 논문에서는 CORVIS에 스타일 폰트 기능을 구현하기 위해 흑백 만화에서 사용되는 다양한 종류의 스타일 폰트를 살펴보고 이를 바탕으로 스타일 폰트의 기본적인 구조와 다양한 효과들을 분석한 후, 새로운 모델을 제시하였다. 또한, 정의된 모델을 기반으로 전처리된 정보만을 가지고 다양한 효과를 표현할 수 있는 방법론과 구현법에 대해 제안한다.
https://doi.org/10.3745/KIPSTA.2008.15-A.2.075 인용 PDF KSCI

GSM 핸드폰을 위한 폰트 처리 시스템의 설계 및 구현 (Development of a Font Processing System for GSM Mobile Phone)

이상범;이용훈
- 한국산학기술학회논문지
- /
- 제11권3호
- /
- pp.951-957
- /
- 2010
본 논문에서는 GSM 핸드폰 단말기에 사용할 폰트를 제작 처리할 수 있는 효율적인 시스템을 제안한다. 문자를 컴퓨터상에 표현하는 방법으로는 초기에는 아스키코드(ASCII code)가 개발 되어 사용하다가 문자 표현의 개수의 한계로 유니코드(Unicode)가 개발 되었으며 이에 대한 표준화 작업이 계속 되고 있다. 유니코드를 무선 단말기상에 적용하고자 하는 노력이 계속 되어 왔으나 각 나라마다 각기 다른 언어를 표현해야 하는 무선 단말기 상의 하드웨어적 제한이 있기에 이를 개선하기 위한 많은 시간과 노력이 필요하게 되었다. 본 연구에서는 이러한 문제를 개선할 수 있는 방법으로 유니코드를 무선 단말기에 적용시키는 일련의 과정을 단축하여 처리할 수 있는 효율적인 폰트 처리시스템을 설계 및 구현하였다.
https://doi.org/10.5762/KAIS.2010.11.3.951 인용 PDF KSCI

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

Chin, Seongah;Choo, Moonwon
- 지능정보연구
- /
- 제8권1호
- /
- pp.27-39
- /
- 2002
본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.
PDF

웹 기반하의 국어의 로마자 전사 표기 자동 변환 시스템 (Automatic translation system for hangul's romanization Based on the World Wide Web)

김홍섭
- 한국컴퓨터정보학회논문지
- /
- 제7권4호
- /
- pp.108-114
- /
- 2002
국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 국어의 로마자 표기 자동변환이 가능하게 설계 및 구현하였다. 특히, 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 테이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 유니코드(Unicode)와 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(')등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.
PDF

Image2PDF를 통한 웹 폰트의 인쇄물 적용 방안 (Web Font Supporting Method by Using Image2PDF Technology)

유소라;초황;강민재;정회경
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2011년도 춘계학술대회
- /
- pp.233-235
- /
- 2011
WYSIWYG 형태의 HTML 데이터를 PDF로 변환하기 위해서는 다양한 스타일시트와 한글 폰트 지원의 한계를 갖게 된다. 이는 RGB 색상이 아닌 CMYK 색상은 데이터의 출력물을 사용하는 인쇄 사업장에서 웹 폰트를 사용하지 못하는 현상을 야기한다. 본 논문에서는 이러한 문제를 해결하기 위해 HTML로 제작된 데이터를 COM 포트의 하드웨어적인 특성을 이용해 고해상도의 화면 캡쳐를 수행하고, 캡쳐된 이미지를 PDF로 변환함으로써 웹 폰트를 인쇄용 PDF 파일로 만드는 과정에 대해 기술한다.
PDF

새로운 글자체 구성에 의한 영어 발음기호의 컴퓨터 입력 방법에 관한 연구 (A Study on the Inputting Method of English Pronunciation for a Computer by Constructing New Font Table)

이현창
- 전자공학회논문지CI
- /
- 제42권6호
- /
- pp.11-18
- /
- 2005
본 논문에서는 영어 발음기호를 컴퓨터에 효과적으로 입력하는 방법을 연구하기 위해 영어 발음기호 체계와 컴퓨터 분야에 사용되는 입력 및 표현방법을 분석하였다. 이에 따라 영어 발음기호를 쉽게 입력할 수 있으면서 각종 응용 프로그램에서 호환될 수 있는 새로운 글자체와 그 배치를 제시하고 이를 구성해 실험하였다. 실험 결과에 따르면, 워드프로세서를 비롯해 스프레드시트, 데이터베이스, 프레젠테이션 등 각종 응용 프로그램에서 모두 영어 발음기호의 입력이 가능하고, 각 프로그램 간에 데이터 호환이 이루어짐은 물론, 다른 기종의 컴퓨터에도 동일한 글자체 설치에 의해 데이터 호환이 이루어짐을 확인하였다. 특히, 본 논문에서 제시한 글자체 자판 배치를 사용한 결과 워드프로세서 등에서 사용하는 특수문자 입력 기능에 비해 입력속도가 크게 향상됨을 확인하였다.
PDF KSCI

노노그램 퍼즐을 이용한 인쇄체 영문자 인식 (A Recognition of the Printed Alphabet by Using Nonogram Puzzle)

손영선;김보성
- 한국지능시스템학회논문지
- /
- 제18권4호
- /
- pp.451-455
- /
- 2008
본 논문에서는 흑백 CCD 카메라로부터 입력되는 2가지 인쇄체(바탕, 돋움) 영문자를 인식하여 편집 가능한 텍스트 형식으로 변환하는 시스템을 구현하였다. 입력된 인쇄체 영어 문장 영상을 이진화 처리 후. 히스토그램 기법을 적용하여 수평 투영으로 각 문장의 행을 분리하고 수직 투영으로 개별 문자를 분리하였으며, 문자의 높이를 48픽셀로 변환하여 정규화 하였다. 정규화 된 개별 문자에 노노그램 퍼즐 원리를 역으로 이용하여, 픽셀을 단위로 하는 작은 사각형들로 구성된 사각형으로 문자를 덮은 후 문자의 특성을 노노그램 퍼즐의 수치 정보로 나타내어 표준 패턴 정보와 비교하여 인식하게 하였다. 바탕체 2609개, 돋움체 1475개의 문자를 대상으로 실험하여 100% 인식률을 얻었다.
https://doi.org/10.5391/JKIIS.2008.18.4.451 인용 PDF KSCI

웹 기반하의 국어의 로마자 표기 자동 변환 시스템 설계 (Design of automatic translation system for hangul's romanization Based on the World Wide Web)

김홍섭
- 한국컴퓨터정보학회논문지
- /
- 제6권4호
- /
- pp.6-11
- /
- 2001
국어의 로마자 표기법 기본원칙을 모르더라도 웹 상에서 한글단어, 문장, 문서를 문자열(String)로 입력받아 자동변환이 가능하게 설계하였다. 특히 표음 중심의 전사(Transcription) 표기법의 기계적 변환을 위해 알고리즘(algorithm)화된 음운법칙을 적용하여 소리글자로 자동 변환 후 정부 표준안인 국어 로마자 표기법 레이블에서 대응 글자를 참조하여 기계화 코드 변환이 가능토록 자동변환 알고리즘 설계하였으며, 아스키(ASCII)테이블에서 잘 쓰이지 않는 코드를 반달표(ˇ)와 어깻점(´)등 특수부호로 할당하여 글꼴을 제작하였다. 또한 예외어 사전관리를 통한 예외 처리 문제에 대한 해결 방안을 제시하였으며, UML표기와 C++ 언어를 이용하여 사용자 편리성과 구현에 대한 모델을 제안하였다.
PDF

MSFM: Multi-view Semantic Feature Fusion Model for Chinese Named Entity Recognition

Liu, Jingxin;Cheng, Jieren;Peng, Xin;Zhao, Zeli;Tang, Xiangyan;Sheng, Victor S.
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제16권6호
- /
- pp.1833-1848
- /
- 2022
Named entity recognition (NER) is an important basic task in the field of Natural Language Processing (NLP). Recently deep learning approaches by extracting word segmentation or character features have been proved to be effective for Chinese Named Entity Recognition (CNER). However, since this method of extracting features only focuses on extracting some of the features, it lacks textual information mining from multiple perspectives and dimensions, resulting in the model not being able to fully capture semantic features. To tackle this problem, we propose a novel Multi-view Semantic Feature Fusion Model (MSFM). The proposed model mainly consists of two core components, that is, Multi-view Semantic Feature Fusion Embedding Module (MFEM) and Multi-head Self-Attention Mechanism Module (MSAM). Specifically, the MFEM extracts character features, word boundary features, radical features, and pinyin features of Chinese characters. The acquired font shape, font sound, and font meaning features are fused to enhance the semantic information of Chinese characters with different granularities. Moreover, the MSAM is used to capture the dependencies between characters in a multi-dimensional subspace to better understand the semantic features of the context. Extensive experimental results on four benchmark datasets show that our method improves the overall performance of the CNER model.
https://doi.org/10.3837/tiis.2022.06.004 인용 PDF KSCI HTML

검색결과 328건 처리시간 0.019초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)