• Title/Summary/Keyword: 언어 필터링

Search Result 91, Processing Time 0.028 seconds

A Filtering System for Messenger and Communication Mobile Application (메신저 및 커뮤니케이션 모바일 앱을 위한 필터링 시스템)

  • Myung, Roh-young;Jung, Dae-yong;Yu, Heon-chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1169-1172
    • /
    • 2013
  • 모바일 단말기들이 기술적으로 발달하면서 모바일 앱 시장도 급속도로 성장하고 있다. 모바일 앱중에서도 메신저, 커뮤니케이션 앱들의 시장 점유율이 현저하게 높은 실정인데 반해 해당 앱들에 서 사용되는 비속어, 은어에 대한 제제는 전무하다. 현재 정부차원에서도 모바일 앱에서 행해지는 무분별한 언어폭력에 대한 조치를 취하려는 모습을 보인다는 것을 볼 때 메신저, 커뮤니케이션 모바일 앱에서 사용될 필터링 시스템은 선택이 아닌 필수라고 볼 수 있다. 따라서 이 논문에서는 안드로이드 플랫폼 기반 모바일 앱에서 SQLite를 활용한 앱의 내부 DB를 분석하여 비속어와 같은 특정 카테고리의 단어 사용빈도가 일정횟수 이상이 되면 사용자에게 경고 메시지를 보내주는 시스템을 제안한다.

Real-time 2-D Separable Median Filter (실시간 2차원 Separable 메디안 필터)

  • Jae Gil Jeong
    • Journal of the Korea Computer Industry Society
    • /
    • v.3 no.3
    • /
    • pp.321-330
    • /
    • 2002
  • A 2-D median filter has many applications in various image and video signal processing areas. The rapid development in VLSI technology makes it possible to implement a real-time or near real-time 2-D median filter with reasonable cost. For the efficient VLSI implementation, the algorithm should have characteristics such as small memory requirements, regular computations, and local data transfers. This paper presents an architecture of the real-time two-dimensional separable median filter which has appropriate characteristics for the VLSI implementation. For the efficient two-dimensional median filter, a separable two-dimensional median filtering structure and a bit-sliced pipelined median searching algorithm are used. A behavioral simulator is implemented with C language and used for the analysis of the presented architecture.

  • PDF

Token-Based Classification and Dataset Construction for Detecting Modified Profanity (변형된 비속어 탐지를 위한 토큰 기반의 분류 및 데이터셋)

  • Sungmin Ko;Youhyun Shin
    • The Transactions of the Korea Information Processing Society
    • /
    • v.13 no.4
    • /
    • pp.181-188
    • /
    • 2024
  • Traditional profanity detection methods have limitations in identifying intentionally altered profanities. This paper introduces a new method based on Named Entity Recognition, a subfield of Natural Language Processing. We developed a profanity detection technique using sequence labeling, for which we constructed a dataset by labeling some profanities in Korean malicious comments and conducted experiments. Additionally, to enhance the model's performance, we augmented the dataset by labeling parts of a Korean hate speech dataset using one of the large language models, ChatGPT, and conducted training. During this process, we confirmed that filtering the dataset created by the large language model by humans alone could improve performance. This suggests that human oversight is still necessary in the dataset augmentation process.

Query Analysis Using Information Extraction (정보추출을 이용한 질의분석)

  • Jung, Han-Min;Min, Kyung-Koo;Sung, Won-Kyung;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.290-295
    • /
    • 2004
  • 본 논문에서는 네비게이션 도메인 상에서의 자연어 질의를 분석하기 위한 방법으로 정보추출을 이용한다. 목적지향성 대화문을 처리하기 위해 도입한 정보추출은 미리 정의된 필드들의 값을 채우는 방식으로 대화를 이끌 수 있도록 한다. Lexico-semantic pattern 기반의 언어처리와 추출/필터링/랭킹 규칙들을 사용하여 강건하면서도 애매성 처리가 용이한 정보추출 기법을 이용한다. 네비게이션 도메인 상에서의 실험은 목적지까지의 이동을 위한 사용자와의 대화집합 256개에 대해 문장레벨 97%의 정확율을 보여준다.

  • PDF

A Study on the internet ethics in the computer game (컴퓨터 게임에서의 인터넷 윤리 확립에 관한 연구)

  • Park, Won-Cheol;Park, Koo Rack
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.401-402
    • /
    • 2012
  • 오늘날 인터넷은 모든 분야에서 활용되고 있다. 그러나 일상생활의 일부분이 된 인터넷 상에서 인터넷 윤리의식은 부족한 상태에 놓여있다. 특히 성장기에 있는 청소년들 사이에서 익명성이 보장되는 점을 악용하여, 악플이나 무분별한 욕의 사용 등 사이버 폭력으로 이어져 여러 사회 문제가 발생하고 있다. 이러한 문제점들을 예방하기 위해 많은 홍보와 공익광고 등이 진행되고 있으나, 그 기대 효과는 미흡한 실정이다. 본 논문은 청소년들이 많이 이용하는 fps온라인 게임에 적용할 언어 변환 프로세스를 제안한다. 제안된 언어 변환 프로세스를 적용하면 악플이나 무분별한 욕의 사용으로 인한 사이버 폭력이 줄어들 것으로 예상된다.

  • PDF

The Recommendation System for Programming Language Learning Support (프로그래밍 언어 학습지원 추천시스템)

  • Kim, Kyung-Ah;Moon, Nam-Mee
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.47 no.4
    • /
    • pp.11-17
    • /
    • 2010
  • In this paper, we propose a recommendation system for supporting self-directed programming language education. The system is a recommendation system using collaborative filtering based on learners' level and stage. In this study, we design a recommendation system which uses collaborative filtering based on learners' profile of their level and correlation profile between learning topics in order to increase self-directed learning effects when students plan their learning process in e-learning environment. This system provides a way for solving a difficult problem, that is providing programming problems based on problem solving ability, in the programming language education system. As a result, it will contribute to improve the quality of education by providing appropriate programming problems in learner"s level and e-learning environment based on teaching and learning method to encourage self-directed learning.

Numerical Reasoning Dataset Augmentation Using Large Language Model and In-Context Learning (대규모 언어 모델 및 인컨텍스트 러닝을 활용한 수치 추론 데이터셋 증강)

  • Yechan Hwang;Jinsu Lim;Young-Jun Lee;Ho-Jin Choi
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.203-208
    • /
    • 2023
  • 본 논문에서는 대규모 언어 모델의 인컨텍스트 러닝과 프롬프팅을 활용하여 수치 추론 태스크 데이터셋을 효과적으로 증강시킬 수 있는 방법론을 제안한다. 또한 모델로 하여금 수치 추론 데이터의 이해를 도울 수 있는 전처리와 요구사항을 만족하지 못하는 결과물을 필터링 하는 검증 단계를 추가하여 생성되는 데이터의 퀄리티를 보장하고자 하였다. 이렇게 얻어진 증강 절차를 거쳐 증강을 진행한 뒤 추론용 모델 학습을 통해 다른 증강 방법론보다 우리의 방법론으로 증강된 데이터셋으로 학습된 모델이 더 높은 성능을 낼 수 있음을 보였다. 실험 결과 우리의 증강 데이터로 학습된 모델은 원본 데이터로 학습된 모델보다 모든 지표에서 2%p 이상의 성능 향상을 보였으며 다양한 케이스를 통해 우리의 모델이 수치 추론 학습 데이터의 다양성을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

Implementation of Java-based Personal Web Information Gathering Agent (자바 기반 개인용 웹 정보 수집 에이전트의 구현)

  • 박민규;한정기;유태명;김중섭;최석민;김준태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.186-188
    • /
    • 1998
  • 본 논문에서는 웹에서 사용자의 취향에 부합하는 정보를 지속적으로 수집하여 추천해주는 지능적인 개인용 웹 정보 수집 에이전트의 구현에 대하여 기술한다. 본 논문에서 구현한 에이전트 시스템은 자바언어로 구현되었으며, 인터넷에서 페이지를 모아오는 수집 단계, HTML 문서 색인 단계, 필터링 단계, 사용자가 모니터링 단계, 학습 단계 등 다섯 단계로 구성되어 있다. 웹 페이지는 기존의 검색 엔진으로부터 수집하도록 하였으며, 사용자의 관심에 부합되는 웹 페이지들을 추천하고, 추천된 페이지들에 대한 사용자의 행동을 모니터링하여 사용자의 취향을 학습함으로써 사용자 프로파일을 재구성한다. 본 웹 에이전트 시스템은 암시적인 피드백에 의한 학습을 수행하고 백그라운드에서 동작함으로써 사용자에게 기존의 검색 작업에 따른 시간과 수고를 덜어 주었다.

  • PDF

Malicious Cross Site Script Filtering Using ACL (접근 제어를 이용한 교차 사이트 스크립트 필터링)

  • 김형주;예홍진;조은선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.799-801
    • /
    • 2002
  • 최근 웹 메일은 사용과 관리의 편리함 등으로 그 사용이 점점 더 늘어나고 있다. 그러나 웹 메일은 본래 보안 기능을 중시해서 만들지 않았다는 보안 취약점으로 인해 탈법적인 해킹이나 토정 같은 악의적인 공격의 대상이 되고 있다. 특히 e-메일과 HTML, 스크립트 언어들을 함께 사용할 수 있게 된 이후로 스크립트를 이용만 인터넷 범죄가 증가하고 있다. 본 논문은 스크립트 공격 중 상호 교차된 사이트 스크립트 공격에 대해서 기술하고 이 공격의 실행을 성공적으로 막을 수 있는 대응 방안을 제시한다.

  • PDF

Design of Module for Assembling DSM-CC PS Packet from MPEG-2 TS (MPEG-2 TS로부터 DSM-CC PS 패킷을 추출하여 재구성하는 모듈 설계)

  • Lee, hyung
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2010.05a
    • /
    • pp.393-395
    • /
    • 2010
  • 본 논문은 PID 필터링된 MPEG-2 TS 데이터로부터 DSM-CC PS 패킷을 추출하여 원래의 섹션으로 구성한 후 이더넷 프레임으로 재구성하는 모듈에 전송하는 패킷변환모듈을 위한 하드웨어 모듈 설계를 제안한다. 제안된 모듈은 ALTERA 사의 IP를 토대로 수정하고 보완한 것으로써 하드웨어 기술언어인 Verilog를 이용하여 설계하였으며 모의실험을 통해 결과를 검증하였다.

  • PDF