• 제목/요약/키워드: Chinese Character Font

검색결과 10건 처리시간 0.021초

한글 한자 비트 맵 폰트의 압축과 복원에 관한연구 (A study on compression and decompression of hanguel and chinese character bit map font)

  • 조경윤
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.63-71
    • /
    • 1996
  • In this paper, a variable length block code for real time compression and decompression of hanguel and chinese character bit map font is proposed. The proposed code shows a good compression ratio in complete form of hangeul myoungjo and godik style and chinese batang and doddum style bit map font. Besides, a compression and decompression ASIC is designed and simulated on CAD. The 0.8 micron CMOS sea of gate is used to implement the ASIC in amount of 5,200 gates, and it runs at simple hardware and compress and decompress at 33M bit/sec at maximum, which is ideal for real time applications.

  • PDF

임계 획 밀도를 이용한 한글, 한자, 영문구분 (A Distinction of the Korean Character, Chinese Character and English Character using the Threshold Stroke Density)

  • 원남식
    • 한국산업정보학회논문지
    • /
    • 제5권4호
    • /
    • pp.32-38
    • /
    • 2000
  • 다중 문자 환경의 문서인식 시스템에서 문자를 인식하기 전에 문자의 종류를 먼저 구분하는 것은 인식률의 향상에 중요한 요인이 된다. 각 나라의 문자는 그 문자마다 고유의 구성상의 다양한 특징을 가진다. 본 연구에서는, 문자를 구분하기 위한 방법으로 획 밀도 값을 이용하였고, 대상 문자는 한글, 영문과 한자로 하였다. 다양한 형태의 활자가 사용되는 문서에 적용하기 위해 입력 데이터는 정규화 과정을 거친 후 처리되었다. 제안된 방법은 80% 이상의 높은 확률로 구분이 가능함을 실험 결과로써 입증하였다.

  • PDF

MSFM: Multi-view Semantic Feature Fusion Model for Chinese Named Entity Recognition

  • Liu, Jingxin;Cheng, Jieren;Peng, Xin;Zhao, Zeli;Tang, Xiangyan;Sheng, Victor S.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권6호
    • /
    • pp.1833-1848
    • /
    • 2022
  • Named entity recognition (NER) is an important basic task in the field of Natural Language Processing (NLP). Recently deep learning approaches by extracting word segmentation or character features have been proved to be effective for Chinese Named Entity Recognition (CNER). However, since this method of extracting features only focuses on extracting some of the features, it lacks textual information mining from multiple perspectives and dimensions, resulting in the model not being able to fully capture semantic features. To tackle this problem, we propose a novel Multi-view Semantic Feature Fusion Model (MSFM). The proposed model mainly consists of two core components, that is, Multi-view Semantic Feature Fusion Embedding Module (MFEM) and Multi-head Self-Attention Mechanism Module (MSAM). Specifically, the MFEM extracts character features, word boundary features, radical features, and pinyin features of Chinese characters. The acquired font shape, font sound, and font meaning features are fused to enhance the semantic information of Chinese characters with different granularities. Moreover, the MSAM is used to capture the dependencies between characters in a multi-dimensional subspace to better understand the semantic features of the context. Extensive experimental results on four benchmark datasets show that our method improves the overall performance of the CNER model.

Few-Shot Content-Level Font Generation

  • Majeed, Saima;Hassan, Ammar Ul;Choi, Jaeyoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권4호
    • /
    • pp.1166-1186
    • /
    • 2022
  • Artistic font design has become an integral part of visual media. However, without prior knowledge of the font domain, it is difficult to create distinct font styles. When the number of characters is limited, this task becomes easier (e.g., only Latin characters). However, designing CJK (Chinese, Japanese, and Korean) characters presents a challenge due to the large number of character sets and complexity of the glyph components in these languages. Numerous studies have been conducted on automating the font design process using generative adversarial networks (GANs). Existing methods rely heavily on reference fonts and perform font style conversions between different fonts. Additionally, rather than capturing style information for a target font via multiple style images, most methods do so via a single font image. In this paper, we propose a network architecture for generating multilingual font sets that makes use of geometric structures as content. Additionally, to acquire sufficient style information, we employ multiple style images belonging to a single font style simultaneously to extract global font style-specific information. By utilizing the geometric structural information of content and a few stylized images, our model can generate an entire font set while maintaining the style. Extensive experiments were conducted to demonstrate the proposed model's superiority over several baseline methods. Additionally, we conducted ablation studies to validate our proposed network architecture.

고문헌 벽자(僻字) 입력을 위한 한자 자형 부호화 방법 (A Character Shape Encoding Method to Input Chinese Characters in Old Documents)

  • 김기왕
    • 대한한의학원전학회지
    • /
    • 제32권1호
    • /
    • pp.105-116
    • /
    • 2019
  • Objectives : There are many secluded Chinese characters - so called Byeokja (僻字) in ancient classic literature, and Chinese characters that are not registered in Unicode and Variant characters (heterogeneous characters) that cannot be found in the current font sets often appear. In order to register all possible Chinese characters including such characters as units of information exchange, this study attempts to propose a method to encode the morphological information of Chinese characters according to certain rules. Methods : This study suggests the methods to encode the connection between the nodules constituting the Chinese character and the coordinates of the nodules. In addition to that, rules for expressing information about curves, expressions of aspect ratios of characters, rules for minimizing coordinate lines, and rules for expressing aggregation status of character components are added. Results : Through the proposed method, it is possible to generate codes of a certain length by extracting only information expressing the morphological configuration of characters. Conclusions : The method of character encoding proposed in this study can be used to distinguish variant characters with small variations in Byeokja, new Chinese characters and character strokes and to store and search them.

모바일 한자 학습 애니메이션 생성 (Animation Generation for Chinese Character Learning on Mobile Devices)

  • 구상옥;장현규;정순기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권12호
    • /
    • pp.894-906
    • /
    • 2006
  • 모바일 기기의 성능 및 화면, 무선 네트워크의 속도 등의 제약으로 모바일 컨텐츠 개발에는 많은 어려움이 있다. 단순히 유선 웹상에서 기존에 서비스 되던 컨텐츠의 가시적인 축소만으로는 양질의 컨텐츠 제작이 어렵다. 빠르게 변화하는 모바일 컨텐츠 시장에 적응하기 위해서는 컨텐츠 특성에 최적화된 데이타 표현 기법 및 저작 도구의 개발이 이루어져야 한다. 본 논문에서는 모바일 기기 상에서의 한자 학습을 위한 적은 용량의 모바일 컨텐츠 및 저작 도구를 개발하였다. 본 연구에서 개발한 모바일 컨텐츠는 단순히 한자 이미지와 설명 정보를 보여주는 것이 아니라, 한자 획순으로 붓으로 쓰는 것과 같은 애니메이션 효과를 줄 수 있다. 또한 저작 도구는 사용자가 그래픽이나 한자, 모바일 프로그래밍에 관한 전문가가 아니더라도 쉽고 빠르게 컨텐츠를 생성할 수 있는 개발 환경을 제공한다. 본 논문은 트루타입 폰트로부터 글자 모양을 획득하여, 간단한 사용자 입력으로 획 분할 및 획 순서 정보를 얻고, 자동으로 획의 방향을 추출, 각 획마다 붓으로 쓰는 효과의 애니메이션을 생성한다. 다음으로 모바일 기기에서의 효율적인 글자 애니메이션을 위해 애니메이션 데이타를 압축한다. 본 논문은 한자뿐 아니라, 한글 또는 다른 형태의 그래픽에도 이용될 수 있으며, 향후 획 분할 및 획 순서 결정을 자동화하는 방법을 연구하고자 한다.

한중한자자형비교연구(韓中漢字字形比較硏究)2 - 한문(漢文) 교육용(敎育用) 기초한자(基礎漢字) 고등학교용(高等學校用) 900자(字)를 중심(中心)으로

  • 강혜근
    • 중국학논총
    • /
    • 제62호
    • /
    • pp.1-25
    • /
    • 2019
  • 作者对韩国教育部指定的"漢文敎育用基礎漢字高等學校用900字"跟中国规范汉字字形, 进行比较分析的结果如下: (1)字形完全一样的(在附录"高中学校用900字"汉字旁边标注为"="), 一共有424个汉字(约占47%); (2)字形相似的(在附录"高中学校用900字"汉字旁边标注为"Δ"), 一共有86个汉字(约占10%); (3)字形不同的(在附录"高中学校用900字"汉字旁边标注为"×"), 一共有389个汉字(约占43%). 字形相似, 不等于字形相同, 所以也应该看作字形不同的字, 属于这两种情况的字合起来, 一共有475个(约占53%). 韩中汉字字形不同的主要来源, 不止"简化字"和"传承字里的新字形", 还有"从一些异体字里选出来的正体字"也和韩国常用汉字字形不同.

SEL-RefineMask: A Seal Segmentation and Recognition Neural Network with SEL-FPN

  • Dun, Ze-dong;Chen, Jian-yu;Qu, Mei-xia;Jiang, Bin
    • Journal of Information Processing Systems
    • /
    • 제18권3호
    • /
    • pp.411-427
    • /
    • 2022
  • Digging historical and cultural information from seals in ancient books is of great significance. However, ancient Chinese seal samples are scarce and carving methods are diverse, and traditional digital image processing methods based on greyscale have difficulty achieving superior segmentation and recognition performance. Recently, some deep learning algorithms have been proposed to address this problem; however, current neural networks are difficult to train owing to the lack of datasets. To solve the afore-mentioned problems, we proposed an SEL-RefineMask which combines selector of feature pyramid network (SEL-FPN) with RefineMask to segment and recognize seals. We designed an SEL-FPN to intelligently select a specific layer which represents different scales in the FPN and reduces the number of anchor frames. We performed experiments on some instance segmentation networks as the baseline method, and the top-1 segmentation result of 64.93% is 5.73% higher than that of humans. The top-1 result of the SEL-RefineMask network reached 67.96% which surpassed the baseline results. After segmentation, a vision transformer was used to recognize the segmentation output, and the accuracy reached 91%. Furthermore, a dataset of seals in ancient Chinese books (SACB) for segmentation and small seal font (SSF) for recognition were established which are publicly available on the website.

탈네모글꼴에 관한 역사적 연구와 전망 - 세벌식 한글 글꼴을 중심으로 - (A historical study on the flexibility square-format typeface and the prospects - Focused on the three-pairs fonts of hangeul -)

  • 유정미
    • 디자인학연구
    • /
    • 제19권2호
    • /
    • pp.241-250
    • /
    • 2006
  • 한국의 고유 문자인 한글은 학자들의 연구를 바탕으로 제자원리에 따라 창제되었다. 세계 대부분의 문자들이 자연 발생적으로 생겨난 것에 비해 한글은 문자를 만들던 당시 언어에 대한 정밀한 분석을 토대로 하여 만들어져 세계의 문자 중에서 가장 과학적이고 합리적이다. 하지만 한글 글꼴 디자인은 창제이념의 과학성과 합리성을 올바르게 계승하지 못하고 있다. 그 이유는 당시 사용되던 한자의 영향으로 네모 틀 형식을 그대로 사용했기 때문이다. 네모글꼴 한 벌을 디자인하려면 무려 11,172자를 만들어야 한다. 이는 자모 28자의 조합으로 모든 소리를 시각화 할 수 있도록 만들어진 한글의 장점을 제대로 살리지 못하고 있는 것이다. 네모글꼴의 문제점에 대한 인식은 1900년대 서구로부터 도입된 타자기의 등장으로 시작되었다. 타자기는 한글의 모아쓰기 원리를 활용하여 닿자와 홀자를 키보드에 배열하므로 활자를 쉽게 조합해서 쓸 수 있다. 이렇게 인식하게 된 개념이 탈네모글꼴이다. 그중 특히 세벌식 글꼴은 닿자와 홀자 그리고 받침자를 합하여 총 67자를 기본 자수로 제작할 수 있다. 세벌식 글꼴 개념은 기존의 네모글꼴이 지니고 있는 문제점을 보완해 줄 수 있는 대안 일뿐 아니라 한글 창제 이념의 본래적 의미를 계승하는 길이기도 하다. 이에 한글의 기계화로 비롯된 세벌식 글꼴 디자인의 역사를 살펴보므로 미래 한글 글꼴 디자인이 나아가야 할 길을 제시하려고 한다. 탈네모글꼴 디자인은 디지털 기술 발달로 인해 발전을 거듭하므로 정보화 시대가 요구하는 기능적이고 합리적인 특성에 부합되고 있다. 훈민정음이 한자의 영향에서 벗어나 문자적인 독자성을 획득하려고 했던 것처럼 탈네모글꼴 디자인이 우리 글꼴 디자인의 정체성을 회복할 수 있는 길이라는 것을 밝히려 한다. 적용될 수 있는 개념이다.조를 벗어나면서도 활기찬 가로의 이미지를 갖게 되는 것은 가로공간의 구조적요소 이외에 가로공간 활성화인자에 의해 많은 영향을 받고 있다는 것을 알 수 있었다. 즉, 이런 구조를 가진 한국의 상업지역의 가로인 경우 연도건물, 보도, 수경시설 등의 인자 순으로, 일본의 업무지역의 가로인 경우 수경시설, 연도건물, 보도인자 순으로 가로활성화에 영향을 주고 있다는 것을 알 수 있었다.과 대동소이했다. 물리적인 특성값(고유저항, 자기유도, 초투자율, 손실계수, 큐리온도 등)으로 미루어보아 각종 microwave 통신기기 core 및 고 투자율 deflection yoke core 등으로 사용이 가능하다.의 쐐기를 사용할 때 MU값이 크다. 결론: 수집된 광자선 빔 데이터를 분석하여 빔데이터의 정확성과 치료계획용 시스템의 계산 정확성을 대략적으로 점검 할 수 있는 기준 값을 제시하였다.동결이 요구되며 본 연구에서 이용된 OPS 동결 방법이 폭넓게 활용될 것으로 사료된다.며 이 때가 최상의 교배 적기로 사료되며, 혈장 progesterone농도가 4.0 ng/ml 이상으로 증가한 날(Bay 0)을 기준으로 하였을 때부터 CI는 혈장 estradiol-$17{\beta}$ peak 후 1일째인 최고치를 나타내었고, CI peak 후 1일째인 Day 0에 혈장 progesterone 농도가 최초로 4.0 ng/ml 이상으로 증가하여 CI가 90% 이상으로 지속된 시기가 최상의 교배 적기임이 확인되었다. 따라서 혈장 progesterone농도 측정으로 정확한 배란 시기 및 교배 적기를 판정할 수 있으나, 시설비가 저렴하고 검사 방법이 간단한 질 세포 검사가 Shih-tzu 견에서 발정 주기, 교배 적기 및 배란

  • PDF