• 제목/요약/키워드: 비속어

검색결과 40건 처리시간 0.022초

소셜 데이터의 주된 감성분석에 대한 연구 (Study on Principal Sentiment Analysis of Social Data)

  • 장필식
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.49-56
    • /
    • 2014
  • 본 논문에서는 대용량의 문서, 인터넷 댓글, 소셜 데이터, 메시지 텍스트 등으로부터 표준, 일상적 언어, 및 은어(隱語), 비속어, 약어, 이모티콘 등을 감성 분석함으로써, 복합적인 감성 중 근간이 되는 주 감성들을 측정하고 평가하는 방법을 제안한다. 제안된 방법론은 IRLBA(Implicitly Restarted Lanczos Bidiagonalization Algorithm)을 활용하여 규모가 큰 희소행렬에 대한 주성분분석을 실시하며, 데이터 취합, 메시지 분석, 감성 평가, 감성 분석 및 통합 그리고 결과물 시각화 모듈로 구성된다. 본 연구를 통해 제안된 방법론은 소셜 데이터의 감성분석의 정확도를 향상시키고 감성분석의 활용범위를 확장시키는데 있어 도움을 줄 수 있을 것으로 기대된다.

현대 러시아 광고언어에 있어서의 '언어유희' 현상에 대한 연구 (A Study on Phenomenon 'Play of Words' in Modern Russian Advertising Language)

  • 김성완
    • 비교문화연구
    • /
    • 제42권
    • /
    • pp.241-260
    • /
    • 2016
  • 이 글의 목표는 현대 러시아 광고언어에 있어서 어떤 유형의 '언어유희'(игра слов) 현상이 나타나고 있으며, 이는 광고의 어떤 특징 때문에 연유하는지에 대해 밝히는 것이다. 이러한 목표를 달성하기 위해 광고의 정의 및 광고언어의 특징을 살펴보고, 광고의 효과를 극대화하기 위해 언어를 어떻게 이용하고 있는지를 밝힐 것이다. 광고 연구에 있어서 필요한 학문은 언어학을 비롯하여 경제학, 심리학, 사회학, 마케팅, 문학, 예술학, 음악 등으로 아주 다양하다. 이는 현대의 광고가 화면과 소리, 그리고 텍스트가 결합되는 기호학적 대상이기 때문이다. 본 연구에서는 비록 이렇게 다양한 부분을 한꺼번에 연구할 수 없지만 광고 텍스트들에서 나타나는 언어유희 현상을 중심으로 광고 기획자와 소비자가 인식하는 언어유희 현상에 대한 인식에 대해 밝히고자 한다. 광고는 언어학자들에 의해 그 해당 언어를 파괴하는 주범으로 인식되어 온 측면도 있는데, 이는 광고에 사용되어지는 비문법적인 문장 생성이나 비문법적인 단어 표현, 외국어의 남발 및 잘못된 외래어 표기, 비속어 및 은어의 잦은 사용, 맞춤법 등 어문규범의 파괴가 그 원인이다. 이러한 것들이 광고의 어떤 목적을 위해 이루어지는 것인지 밝히고자 한다.

휴대전화에서 단문 메시지로부터 일정 자동 등록 (Automatically Registering Schedules from SMS Messages on Handheld Devices)

  • 김재훈;김형철
    • 인지과학
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2011
  • 휴대전화가 대중에게 널리 보급됨에 따라, 단문 서비스(SMS)가 새로운 의사소통 수단으로 등장하고 있다. 단문 서비스는 가격이 저렴할 뿐 아니라 단문 메시지를 쉽게 저장할 수 있어 약속이나 일정 알림용으로 널리 사용된다. 본 논문은 단문 메시지로부터 일정 정보(시간과 장소)를 추출하여 자동으로 일정 관리 시스템에 등록하는 시스템을 개발한다. 단문 메시지는 짧고 간결하지만 비속어나 준말 등이 많이 사용된다. 이것이 일정 정보를 추출하는데 더욱 어렵게 한다. 또한 휴대전화에는 계산 능력과 저장 공간이 충분하지 못하므로 형태소 분석과 같은 일반적인 자연언어 처리 모듈을 그대로 사용하는 것은 다소 무리가 있다. 이 문제를 해결하기 위해서 본 논문에서는 형태소 분석과 같이 복잡한 언어 처리 모듈을 사용하지 않고 기계학습 기반으로 일정 정보를 추출하고 추출된 정보를 휴대전화의 일정 관리 시스템에 등록한다. 본 논문에서 제안된 자동 일정 등록 시스템은 삼성전자 옴니아 휴대전화에 탑재되어 정상적으로 잘 동작함을 확인할 수 있었다.

  • PDF

양방향 장단기 메모리 신경망을 이용한 욕설 검출 (Abusive Detection Using Bidirectional Long Short-Term Memory Networks)

  • 나인섭;이신우;이재학;고진광
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.35-45
    • /
    • 2019
  • 욕설과 비속어를 포함한 악성 댓글에 대한 피해는 최근 언론에 나오는 연애인의 자살뿐만 아니라 사회 전반에서 다양한 형태로 증가하고 있다. 이 논문에서는 양방향 장단기 메모리 신경망 모델을 이용하여 욕설을 검출하는 기법을 제시하였다. 웹 크룰러를 통해 웹상의 댓글을 수집하고, 영어나 특수문자 등의 사용하지 않은 글에 대해 불용어 처리를 하였다. 불용어 처리된 댓글에 대해 문장의 전·후 관계를 고려한 양방향 장단기 메모리 신경망 모델을 적용하여 욕설 여부를 판단하고 검출하였다. 양방향 장단기 메모리 신경망을 사용하기 위해 검출된 댓글에 대해 형태소 분석과 벡터화 과정을 거쳤으며 각 단어들에 욕설 해당 여부를 라벨링하여 진행하였다. 실험 결과 정제하고 수집된 총 9,288개의 댓글에 대해 88.79%의 성능을 나타내었다.

  • PDF

초등학생을 대상으로 한 융복합 스마트 안전지킴이 앱 개발 (Development of Conversion Smart Monitoring App for Elementary School Student)

  • 조한진;김진묵
    • 디지털융복합연구
    • /
    • 제13권4호
    • /
    • pp.211-217
    • /
    • 2015
  • 최근 학교 내 폭력문제가 심각하게 증가하고 있고 사회적인 문제로 발전하고 있다. 더욱이 현실에서의 물리적인 폭력 행위뿐만 아니라, 스마트폰을 이용한 사이버 폭력의 심각성은 매우 높아지고 있어 더욱 심각하다. 초등학생과 같이 사물에 대한 식별이나 인간에 대한 이해가 완전하지 못한 상태에서 위와 같은 사이버폭력에 노출될 경우, 그 심각성은 매우 높다. 본 논문에서는 초등학생을 대상으로 집단 따돌림이나 욕설 등과 같은 사이버폭력으로부터 보호할 수 있는 대비책으로 스마트 안전 지킴이 앱을 제안하고 설계 및 구현하였다. 제안한 융복합 스마트 안전지킴이 앱은 초등학생 어린이를 가진 가정에서 아동의 위치를 파악하여 안전한 귀가를 도울 수 있을 뿐만 아니라, 아동들이 사용하는 메신저에서 욕설이나 비속어 등에 대한 사용을 언어지수와 관계지수로 정의하고 이에 대해 분석하는 실험 시나리오를 제안하였다. 향후 본 연구에 대한 금지어 검색율과 응답시간을 측정함으로써 제안 시스템에 대한 타당성 검토를 수행하고자 한다.

"바른말 고운말" 교실 웹기반 학습시스템 개발 및 적용 (The Development and Application of Web-Based Learning System for Correct Use of Internet Communication Words in Elementary Schools)

  • 윤희수;김동호
    • 정보교육학회논문지
    • /
    • 제8권2호
    • /
    • pp.191-201
    • /
    • 2004
  • 컴퓨터의 보급과 네트워크 망의 확대로 인터넷 사용이 보편화되면서 인터넷을 이용하여 문자에 의존한 의사소통 방식이 음성이나 그림보다는 보편화되어 있다. 이에 따라 나타나는 통신 언어의 부작용으로 인해 계층 간의 이질화, 세대간의 의사소통 단절, 언어폭력, 청소년들의 심성발달 저해 등 많은 문제점을 야기시키고 있고, 비속어, 은어, 비어, 어문규범 일탈형의 표기로 어린이에 대한 국어 교육이나 실제 언어 생활에 부정적으로 작용하는 측면이 강하다. 이러한 문제를 해결하기 위하여 학생들의 요구분석을 통하여 $\ulcorner$바른말 고운말 교실$\lrcorner$ 이라는 웹기반 학습시스템을 개발하여 효과를 검증하기 위해 현장에 적용하였다. 적용 결과 많은 학생들에게 선호도와 교육적 효과가 높게 나타났으며 바른 언어 사용의 유의미한 결과가 나타났다.

  • PDF

소셜네트워크서비스에 활용할 비표준어 한글 처리 방법 연구 (Research on Methods for Processing Nonstandard Korean Words on Social Network Services)

  • 이종화;레환수;이현규
    • 한국산업정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.35-46
    • /
    • 2016
  • 특정한 관심이나 활동을 공유하는 관계망을 구축해주는 온라인 서비스인 소셜네트워크서비스(SNS), 자신의 관심사에 따라 자유롭게 글, 사진, 동영상 등을 올릴 수 있는 공간인 블로그(Blog) 등은 자신을 알리고 표현하는 사회현상으로 자리 매김하고 있다. 이러한 SNS나 블로그를 통해 사용자들이 자유롭게 표현한 글들을 분석하여 의미있는 정보와 가치, 그리고 패턴을 찾기 위한 텍스트 마이닝(Text Mining), 오피니언 마이닝(Opinion Mining), 의미 분석(Semantic Analysis) 등의 연구가 활발히 이루어지고 있다. 또한, 연구자들의 연구 효율을 보다 높이기 위하여 키워드 기반 연구들도 이루어져있다. 하지만 대부분의 연구들은 한글의 맞춤법에 많은 한계점을 나타내고 있다. 본 연구는 어근을 찾기 힘든 이상한 외계 언어, 무분별하게 표현되는 속어, 알기 힘든 한글 이모티콘 인터넷 언어, 마이닝 처리 과정에서 파악하기 어려운 단어들을 데이터베이스에 구축하여 데이터 사전 기반 마이닝 처리 기법의 한계를 극복하고자 한다. 특정 주제에 대한 주관적 견해로 구성된 블로그를 사례 분석 대상으로 연구를 진행하였으며 유니코드를 활용한 비표준어 추출은 텍스트 마이닝 처리에 유용함을 발견할 수 있었다.

형태소 분석을 통한 악성 댓글 필터링 방안 (A Filtering Method of Malicious Comments Through Morpheme Analysis)

  • 하예람;천준석;왕인서;박민욱;우균
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.750-761
    • /
    • 2021
  • 인터넷 기사에 대한 댓글은 토론 및 소통 등 긍정적 효과도 있지만, 악성 댓글은 사람의 목숨을 앗아가는 정도로 심각한 문제이다. 이런 측면에서 악성 댓글을 자동으로 검출하는 것은 중요한 문제이다. 그러나 현재 채택되고 있는 금칙어 바탕의 댓글 필터 방안은, 특히 한글 댓글의 경우 효과적이지 못한 실정이다. 이 논문에서는 형태소 분석을 통해 비속어 형태소와 존대어 형태소를 구별함으로써 댓글 필터링을 수행하는 방법을 제안한다. 이들 두 형태소를 바탕으로 댓글 건전도를 계산하고, 또한 건전도를 바탕으로 한 댓글 충격량 계산방법을 여럿 제안한다. 악성 댓글을 대상으로 한 실험을 수행한 결과, 포털에서 수행되고 있는 클린봇보다 재현율이 37.93% 포인트 개선되었으며 F-지수 값은 47.66 포인트 개선된 것으로 나타났다. 이 결과에 따르면, 형태소 분석을 기초로 한 새로운 필터 방법이 금칙어를 바탕으로 한 방법의 좋은 대안이 될 수 있을 것으로 기대된다.

6.25전쟁 이후의 중·북부지역 가면극의 변화양상 (The changes in the Korean Mask Dramas of the Central and Northern Regions after the Korean War)

  • 전경욱
    • 공연문화연구
    • /
    • 제22호
    • /
    • pp.5-43
    • /
    • 2011
  • 한국의 가면극은 대부분 세시풍속의 하나로 연행되었으며, 동제·줄다리기·지신밟기·횃불싸움·길놀이·사또놀음 등 여러 세시행사와 연계되어 전승되었다. 6.25전쟁 이후에는 이러한 세시행사와 관계없이 독립적으로 연행하기 때문에 원래의 기능과 의미를 상실하게 되었다. 또한 연행시간이 대폭 줄어들었기 때문에 연희내용, 노래, 대사를 많이 생략하고 있다. 북청사자놀이는 6.25전쟁 이후 사자춤이 한 마리에서 두 마리로 늘어났고, 애원성춤·사당춤·넉두리춤·칼춤을 새로 추가했다. 사자가 아이를 잡아먹던 내용도 토끼인형을 잡아먹는 내용으로 바뀌었다. 사자가면은 원래 여러 유형이 있었으나, 현재는 호랑이 모습의 가면으로 획일화되었다. 양주별산대놀이는 '애사당 법고놀이'에서 먹중 8명과 왜장녀·애사당 등 모두 10명이 등장하는 것이 이치에 맞는데, 현재는 이외에 말뚝이 가면을 쓴 배역이 등장한다. 현재의 연희에서는 성(性)과 관련된 노골적인 부분을 생략하고 있다. 또한 신할아비·미얄할미 과장에서 할미의 죽음 후에 예전에는 신할아비가 넋타령을 했는데, 최근에는 무당굿을 한다. 대사에서는 비속어와 육담을 대폭 생략하고 있다. 가면은 특히 연잎·옴중·샌님가면이 큰 변화를 보인다. 봉산탈춤은 6.25전쟁 이후 노장과장에서 가장 큰 변화를 보인다. 예전에는 소무가 두명 등장했으나 현재는 한 명만 등장하고, 신장수와 원숭이의 퇴장도 차이를 보인다. 예전의 가면들은 연희자가 내다볼 수 있는 구멍을 코 양옆으로 크게 뚫었지만, 현재의 가면들은 가면의 눈동자에 구멍을 뚫어놓았다. 특히 먹중가면이 큰 변화를 보인다. 봉산탈춤을 복원할 당시에 봉산 출신의 연희자가 적었기 때문에, 다른 해서탈춤의 연희자들과 함께 연희를 복원했다.

취업준비생 토픽 분석을 통한 취업난 원인의 재탐색 (Revisiting the cause of unemployment problem in Korea's labor market: The job seeker's interests-based topic analysis)

  • 김정수;이석준
    • 경영과정보연구
    • /
    • 제35권1호
    • /
    • pp.85-116
    • /
    • 2016
  • 본 연구는 개인-환경 부합 관점에서 취업시장변화에 따른 취업준비생의 관심사를 토대로 의사결정과정에 영향을 미치는 취업난의 원인을 탐색적으로 고찰하였다. 이를 위해, 최근 3개년(2013~2015) 간 취업 관련 커뮤니티 내 이용자 게시글(소셜미디어)을 웹 크롤링을 통해 수집하고, 텍스트 마이닝 기법 중 토픽 분석을 통해 취업준비생의 주요 관심사 유형 및 심리적 반응 변화추이를 분석하였다. 분석결과, 취업준비생의 주요 관심사가 '희망직업(세계)에 대한 인식, 취업사전준비활동, 노동시장에 대한 인식, 취업 스트레스'의 네 가지 유형으로 나타나는 것을 발견하였다. 구체적으로 이들은 직업가치나 미래 진로에 대한 탐색보다 희망직업과 관련하여 금전적 보상이나 직장근무형태(근무 및 생활환경)에 관해 관심을 두고 있어 불확실한 환경에 직면하면서 특정 언어적 사용(예: 비속어, 은어)을 토대로 불안정한 심리적 상태를 표현하는 것으로 나타났다. 또한 현재 취업준비생들은 취업 성공을 위한 전략적 선택차원에서 주로 스펙준비에 치중하고 있어 취업불안에 따른 스트레스를 받는 것으로 나타났다. 이러한 결과를 토대로 현재 취업난은 총체적으로 개인과 사회 조직의 가치추구 부재에 기인한다고 볼 수 있다. 결국 개인은 자신의 직업 가치관을 확립하지 못한 상황에서 일부 기업들은 인적자원의 중요성에 대해 자각하지 못하며, 사회적으로는 직업위세란 장애요인이 복합적으로 작용하여 나타난 문제라고 볼 수 있다. 따라서 취업난이란 특정 상황과 현상의 원인을 다각적으로 이해하고 다수의 취업준비생 관심사를 도출하기 위한 토픽분석과 이들의 다양한 반응의 의미를 언어 심리적 이론을 토대로 해석하는 접근방법의 필요성을 제기한다.

  • PDF