• 제목/요약/키워드: 비속어 차단

검색결과 6건 처리시간 0.021초

웹 게시판 비속어 처리 프로그램의 설계 및 구현 (Design and Implementation of a Slang Remover Program on Web board)

  • 조아영;옥철영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (하)
    • /
    • pp.1075-1078
    • /
    • 2001
  • 현재까지 게시판의 비속어 처리프로그램은 비속어를 발견하면 입력을 할 수 없도록 차단하는 차단식 프로그램이었다. 이런 프로그램은 사이버 상의 의사표현의 자유를 차단한다. 또한 어떤 단어의 경우는 비속어가 아닌데도 차단되어 입력을 원천봉쇄하기도 한다. 그래서 비속어를 차단하지 않고 처리해 주며 신생 비속어도 처리를 쉽게 해 주며 검출에 유연성을 제공하는 프로그램이 필요하다. 본 논문에서는 데이터베이스 상에서 구현된 게시판을 대상으로 비차단식, 유연성이 있는 비속어 추출 프로그램을 설계하고 구현하였다.

  • PDF

웹 게시판에서 비속어사용실태와 문제 해결 방안의 제시 (Usage Analysis of Swearing Words on Web Board and Proposal of Problems Resolution Method)

  • 조동욱
    • 한국콘텐츠학회논문지
    • /
    • 제3권4호
    • /
    • pp.1-10
    • /
    • 2003
  • 최근 인터넷상의 웹 자유게시판에 쓰여지는 글들이 비속어를 많이 사용함으로써 인터넷 역기능의 대표적인 문제로 대두되고 있다. 이를 위해 본 연구에서는 웹 게시판에서 사용되는 비속어에 대한 실태 파악을 통해 비속어가 쓰여진 단어나 문장을 기술적으로 차단하는 방법론을 개발하고자 한다. 이는 크게 세 단계로 나누어 개발이 진행된다. 첫째가 비속어 사용 실태 및 이를 차단키 위한 알고리즘의 개발, 둘째가 비속어의 정도 차이를 파악키 위한 구체적이고 방대한 설문조사의 수행, 셋째가 이를 프로그램하여 실제 웹 상에서 비속어가 어느 정도 효과적으로 차단이 가능한지에 대한 시스템 구현 등으로 나누어진다. 본 논문은 이 같은 전체 시스템 중 첫째 단계인 웹 게시판에서의 비속어 사용 실태와 이를 해결키 위한 알고리즘 개발 부분에 대해 다루고자 한다.

  • PDF

웹 게시판 비속어 처리 프로그램의 설계 및 구현 (Design and Implementation of a Swearing Remover Program on Web board)

  • 조아영
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권10호
    • /
    • pp.1317-1328
    • /
    • 2001
  • 기존의 웹 게시판 비속어 처리 프로그램들은 입력 차단형이라는 한계성 때문에 비속어의 모양이 조금만 변형이 되어도 비속어를 차단하지 못하는 문제점이 있었다. 이러한 한계성을 극복하기 위하여 본 논문에서는 인터넷의 열려있는 게시판에 대해 분석 및 삭제/치환하는 감시형 프로그램을 개발하였다. 이를 위해 먼저 웹 상의 비속어 패턴을 분류하였고 이를 바탕으로 이러한 패턴들을 분석할 수 있는 토크나이저를 개발하였다. 그리고 각 게시판에 대한 토크나이징 및 비속어 삭제/치환 모듈을 스레드로 구현하여 각각 병렬적으로 작업제어가 되도록 구현하였다. 이 프로그램을 웹 게시판의 데이터에 실험적으로 작동시킨 결과 대부분의 비속어를 검출하여 91.9%의 재현율을 보였으나 형태소적 변형 비속어와 문맥적 비속어의 검출에는 다소 미흡함을 나타내었다. 이 프로그램은 품사적, 의미적 중의어와 문맥적 비속어의 처리에 있어서 이 프로그램의 수동모드의 확장을 통해 앞으로 더욱 보완되어야 할 것이다. 이 프로그램은 게시판 사용자들을 적절한 단어사용에로 유도하며, 공공기관, 학교, 방송국 등의 게시판 관리자의 수작업을 대체해 줄 수 있을 것으로 기대된다.

  • PDF

온라인게임 채팅에서의 비속어 차단시스템 (A Swearword Filter System for Online Game Chatting)

  • 이성욱
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1531-1536
    • /
    • 2011
  • 온라인 게임의 활성화로 온라인 게임의 폐해도 증가하고 있는데 온라인 게임의 대표적인 폐해 중 하나인 언어 폭력 문제가 심각한 사회문제를 야기하고 있다. 본 논문은 온라인 게임의 채팅에 나타나는 비속어를 자동으로 차단하는 시스템을 제안한다. 우리는 온라인 게임의 채팅창에 나타나는 문장을 수집하였고 비속어 포함 문장과 정상 문장으로 수동으로 분류하였다. 음절 n-gram과 어휘-품사 쌍을 자질로 사용하며 카이제곱 통계량을 이용하여 자질을 선택한다. 선택된 자질들을 이진가중치로 표현하여 지지벡터기계(SVM)를 학습한 후, SVM 분류기로 각 문장의 차단 여부를 결정하였다. 실험 결과, 수집된 데이터에 대해 약 90.4%의 F1 정확률을 얻었다.

올바른 언어사용을 위한 인공지능형 캐릭터 아바타에 관한 연구 (Research on a AI character Avatar for teenager’s right language using)

  • 박정은;이동연
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.396-402
    • /
    • 2006
  • 최근 청소년층의 인터넷 이용이 급격히 증가하면서, 초등학생 중 90% 이상이 인터넷을 이용하고 있으며, 그 연령대도 낮아져 저학년 어린이의 이용률이 지속적으로 높아지고 있다. 또한 청소년의 30%가 인터넷 중독 또는 중독 직전에 있는 것이 실태이기도 하다. 10대가 현재 가장 많이 사용하고 있는 정보매체인 컴퓨터는, 그것을 사용함에 있어 교육적으로 도움이 되는 면도 있지만 반면에 무분별한 인터넷 용어나 비속어의 사용, 무절제한 지속적인 이용, 유해사이트에의 노출 등 많은 문제가 산재해 있다. 기존의 유해사이트 차단과 컴퓨터 사용시간 제한 등의 사용 관리를 위한 프로그램들이 많이 선보여진 상태이지만 그 활용 면에서 보면, 좀 더 사용자의 특성을 이해하여 어른들보다 절제가 어려운 어린이 사용자를 위해 부모 혹은 선생님과 같은 관리자와 가르침의 역할을 해줄 수 있는 부분이 더욱 필요하다. 본 연구에서는 무형의 소프트웨어 프로그램이 사용자에게 명령을 내리고 그것을 수행하게 하는 것 보다, 사용자가 친숙하게 받아들이고 정서적으로 접근할 수 있는 사용자와 인터렉션이 가능한 캐릭터 형태의 물리적 아바타를 제안하고자 한다. 또한 비속어나 그와 비슷한 단어들을 사용할 시 의미적으로 비속어인지 아닌지 아바타가 추론할 수 있는 기능으로, 인공지능을 부여하여 사용자가 인터넷 채팅이나 게임을 할때 아바타로 하여금 사용자와의 인터렉션을 통해서 올바르지 않은 언어사용에 대한 인지를 쉽게 하고 개선의 효과를 높이며 지속적인 관심을 이끌 수 있는 인공지능을 가진 캐릭터 아바타를 제안하고자 한다.

  • PDF

반전역(Semi-Global) 문자 정열을 이용한 비속어 수집 기법 (A Collecting Method for Swear Words Using Semi-Global Text Alignment)

  • 김성환;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.414-417
    • /
    • 2011
  • 단어 필터링 기법의 개발에 있어서 가장 큰 난제는 정상단어를 금지어로 인식하여 이를 차단하는 오탐지 문제이다. 이를 방지하기 위하여 다양한 문장에 대한 면밀하고 광범위한 검사가 필수적이나 일반적으로 쉽게 접근할 수 있는 데이터는 주로 단어 위주로 구성된 검증 데이터로 문장 또는 구절로 구성된 데이터의 양은 실제 검증에 활용하기에는 충분하지 못하다. 본 논문에서는 웹에서 수집한 방대한 양의 말뭉치 데이터에 반전역정열(Semi-Global Alignment)을 적용하여 주어진 금지어가 사용되거나 금지어와 유사한 단어가 존재하는 구간을 탐색함으로써 단어 필터링 시스템에서 범용적으로 사용될 수 있는 문장형 평가 데이터를 수집하는 시스템을 제안하고 해당 기법을 통하여 수집한 문장 단위 데이터를 분석하고 단어 필터링 시스템이 오탐지 방지를 위해 가져야할 요소들에 대하여 검토해 본다.