• Title/Summary/Keyword: 특수문자

Search Result 92, Processing Time 0.035 seconds

Knowledge Graph-based Korean New Words Detection Mechanism for Spam Filtering (스팸 필터링을 위한 지식 그래프 기반의 신조어 감지 매커니즘)

  • Kim, Ji-hye;Jeong, Ok-ran
    • Journal of Internet Computing and Services
    • /
    • v.21 no.1
    • /
    • pp.79-85
    • /
    • 2020
  • Today, to block spam texts on smartphone, a simple string comparison between text messages and spam keywords or a blocking spam phone numbers is used. As results, spam text is sent in a gradually hanged way to prevent if from being automatically blocked. In particular, for words included in spam keywords, spam texts are sent to abnormal words using special characters, Chinese characters, and whitespace to prevent them from being detected by simple string match. There is a limit that traditional spam filtering methods can't block these spam texts well. Therefore, new technologies are needed to respond to changing spam text messages. In this paper, we propose a knowledge graph-based new words detection mechanism that can detect new words frequently used in spam texts and respond to changing spam texts. Also, we show experimental results of the performance when detected Korean new words are applied to the Naive Bayes algorithm.

A Cellular Broadcast Service Based on Firmware for Image Display (이미지 표출을 위한 펌웨어 기반의 재난문자 서비스)

  • Byun, Yoonjwan;Lee, Hyunji;Chang, Sekchin;Choi, Seong Jong;Pyo, Kyungsoo
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.145-147
    • /
    • 2019
  • 현 재난문자 서비스는 텍스트 기반의 재난경보 서비스 이다. 이 경우 한글에 익숙하지 않은 외국인 들은 제공받은 문자 메시지를 정확히 이해하기가 불가능하다. 이에 이미지 등 멀티미디어 정보를 제공함으로써 효과적인 재난경보 서비스를 실현할 수가 있다. 그러나 현 재난문사 서비스 방식은 멀티미디어 정보 전송에 적합하지 않다. 본 논문에서는 이러한 단점을 극복하고자 단말기에서 재난 이미지 표출을 위한 펌웨어 기반의 재난문자 서비스 방식을 제안한다. 이 방식을 위한 단말기는 재난 종류에 대응하는 이미지들을 미리 저장하고 있어야 한다. 또한 재난문자 메시지는 이미지 표출을 알려주는 특수문자를 사용한다. 이 방식은 신형 단말기에 장착되는 새로운 펌웨어를 이용하여 구현될 수 있다. 또한 본 논문은 이러한 방식이 기존 단말기와 충돌이 없음을 보여준다.

  • PDF

A Spam Filtering Method using Frequency Distribution of Special Letter and Frequency Ratio of Keyword (특수 문자 및 단어 빈도 비율을 이용한 스팸 필터링 방법)

  • Lee, Seong-Jin;Baik, Jong-Bum;Han, Chung-Seok;Lee, Soo-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.280-283
    • /
    • 2011
  • 인터넷 환경에서 무차별적으로 유통되는 스팸 문서로 인한 사회적 문제가 커져 가고 있는 가운데 스팸문서를 차단하기 위한 활발한 연구들이 이루어지고 있다. 이 가운데 대표적인 연구는 자질어를 이용한 기계학습 기반의 스팸 차단 기술이다. 그러나 이 방법은 미리 선택된 자질어로만 구성된 분류 모델을 사용하기 때문에 Term Spamming(단어 조작에 의한 스팸 차단 행위)에 취약하며, 스팸 차단의 성능과 학습 소요 시간이 선택된 자질어의 품질과 수에 민감하게 영향을 받는다는 문제점이 있다. 본 논문에서는 이러한 문제를 해결하기 위해 스팸 문서에서 등장하는 특수 문자의 빈도와 반복되는 단어의 특징을 이용한 스팸 탐지 방법을 제안한다. 제안 방법은 각 문서에서 등장하는 특수 문자의 비율과 최다 출현 단어의 반복 패턴을 정의하고 기계학습 알고리즘을 적용하여 스팸 분류 모델을 생성한다. 제안 방법의 성능 평가를 위해 E-mail 데이터와 블로그의 Post 데이터를 사용하여 자질어 기반의 스팸 차단 방법과 비교 실험을 진행하였다. 실험 결과 본 논문에서 제안하는 방법이 분류 정확도와 학습 소요 시간에 있어 우수한 성능을 보이는 것을 확인하였다.

2차원 마르코프 랜덤 필드를 이용한 팩시밀리 영상 복원

  • 윤명영;김주성;서민자
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 1997.03a
    • /
    • pp.141-161
    • /
    • 1997
  • 팩시밀리로부터 수신된 영상은 글자를 두껍게 하는 돌출잡영(salient noise), 문자주변에 점이 추가되는 고춧가루 잡영(pepper noise), 선의절단을 일으키는 백색잡영(white noise)으로 인하여 가독성이 떨어진다. 수신된 팩시밀리 영상을 원래의 영상으로 복원하기 위하여 최근에 Handley 와 Dougherty가 처음으로 형태학적 복원 방법을 제안하였다. 형태학적 복원 방법은 돌출잡영에 대해서 효과적이었지만, 확률적으로 발생하는 백색잡영과 고춧가루잡영에 대해서는 팩시밀리 영상을 결정적 수열(deterministic sequence)로다루었기 때문에 효과적이지 못했다. 본 논문에서는 주사과정, 고딩과정, 그리고 통신과정에서 생성되는 돌출, 고춧가루, 백색잡영에 의해 훼손된 팩시밀리 영상을 칼만여과를 이용하여 복원하는 새로운 방법을 제안하였다. 제안된 방법은 모델링과 복원 두 단계로 구축된다. 첫째, 이웃 화소들과의 종속관계를 갖는 팩시밀리 영상을 마르코프 랜덤 필드를 바탕으로 팩시밀리 시스템 모델을 제안하였다. 둘째, 제안된 팩시밀리 시스템 모델을 칼만 여과과정의 시스템 모델 및 관측모델로 재구성한 다음, 칼만 여과과정의 ill-conditioned 문제를 극복하기 위하여 양정치 (positive definite)공분산 행렬을 유도하여 새로운 복원방법을 제안하였다. 제안된 방법의 복원 능력을 검증하기 위하여 사무실에서 가장 많이 사용되는 한글을 사용하여 알파벳 대소문자, 숫자, 특수문자로 구성된 문서를 만들어 실험하였다. 그 결과, 제안된 방법이 형태학적인 복원 방법보다 성능이 우수함을 밝혔다.

Development of Universal Reduced Key Braille System (유니버설 단축키 점자시스템 개발)

  • Lee, Jung-Suk;Moon, Byung-Hyun
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.27 no.2
    • /
    • pp.45-51
    • /
    • 2022
  • In this paper, an universal reduced input system that can represent Korean text message, English alphabet letter, special characters, and numbers is develpoed. The reduced keyboard input system has 5 number keys and 4 special function keys to reduce the complexity of inserting characters for the severely disabled. Also, mobile application is developed for the use of easy communication for the disabled.

Video character recognition improvement by support vector machines and regularized discriminant analysis (서포트벡터머신과 정칙화판별함수를 이용한 비디오 문자인식의 분류 성능 개선)

  • Lim, Su-Yeol;Baek, Jang-Sun;Kim, Min-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.4
    • /
    • pp.689-697
    • /
    • 2010
  • In this study, we propose a new procedure for improving the character recognition of text area extracted from video images. The recognition of strings extracted from video, which are mixed with Hangul, English, numbers and special characters, etc., is more difficult than general character recognition because of various fonts and size, graphic forms of letters tilted image, disconnection, miscellaneous videos, tangency, characters of low definition, etc. We improved the recognition rate by taking commonly used letters and leaving out the barely used ones instead of recognizing all of the letters, and then using SVM and RDA character recognition methods. Our numerical results indicate that combining SVM and RDA performs better than other methods.

A Method of Image Display on Cellular Broadcast Service (재난문자 서비스에서의 이미지 표출 방안)

  • Byun, Yoonkwan;Lee, Hyunji;Chang, Sekchin;Choi, Seong Jong;Pyo, Kyungsoo
    • Journal of Broadcast Engineering
    • /
    • v.25 no.3
    • /
    • pp.399-404
    • /
    • 2020
  • The Disaster text service is a text-based service for public alert. But, foreigners who are not familiar with korean can not understand exactly the disaster text messages provided. Using multimedia information such as images is expected to solve this problem. However, the current disaster message service method is not suitable for multimedia information delivery. This study proposes a firmware-based disaster character service method for displaying disaster image in a terminal. A device using this method should store images corresponding to the type of disaster and use special characters to inform the presentation of image in a terminal. This approach can be implemented in the new firmware installed device and it can be work with the existing device.

Decomposition of a Text Block into Words Using Projection Profiles, Gaps and Special Symbols (투영 프로파일, GaP 및 특수 기호를 이용한 텍스트 영역의 어절 단위 분할)

  • Jeong Chang Bu;Kim Soo Hyung
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.9
    • /
    • pp.1121-1130
    • /
    • 2004
  • This paper proposes a method for line and word segmentation for machine-printed text blocks. To separate a text region into the unit of lines, it analyses the horizontal projection profile and performs a recursive projection profile cut method. In the word segmentation, between-word gaps are identified by a hierarchical clustering method after finding gaps in the text line by using a connected component analysis. In addition, a special symbol detection technique is applied to find two types of special symbols tying between words using their morphologic features. An experiment with 84 text regions from English and Korean documents shows that the proposed method achieves 99.92% accuracy of word segmentation, while a commercial OCR software named Armi 6.0 Pro$^{TM}$ has 97.58% accuracy.y.

Character Input Method Based On Gesture for The Visually Impaired (시각장애인의 스마트 기기 사용을 위한 제스처 기반 문자 입력 방법)

  • Bae, Ki-Tae;Sin, Eun-Ae;Bae, Yong-soo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2016.01a
    • /
    • pp.215-216
    • /
    • 2016
  • 본 논문에서는 물리적 버튼이 존재하지 않는 평면방식의 스마트 기기를 시각 장애인이 기존 음성 인식 기반의 문자 입력 방식 대비 3배 이상 빠른 속도로 문자를 입력할 수 있는 제스처 기반 가상 문자 입력 방법을 제안한다. 제안하는 방식의 원리는 스마트폰의 터치화면을 8개 방향으로 설정하고 사용자의 드래그 동작에 따른 입력값의 초기위치와 중앙점, 드래그 형태 등을 이용하여 숫자, 영문, 한글, 특수기호 등을 입력하거나, 스마트기기의 다양한 응용 프로그램들을 자연스럽게 제어하고 동작시킬 수 있는 제스처 기반의 문자입력 방법이다. 실제 시각장애인의 필드 테스트를 통해 제안하는 방식의 효율성을 입증해보인다.

  • PDF