• 제목/요약/키워드: 댓글

검색결과 294건 처리시간 0.029초

Topic signatur e와 n-gram을 이용한 댓글 분류 시스템 (Comments Classification System using Topic Signature and n-gram)

  • 배민영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-194
    • /
    • 2008
  • 본 논문에서는 토픽 시그너처(Topic Signature)와 n-gram을 이용한 댓글 분류 시스템을 개발한다. 토픽 시그너처는 문서요약이나 문서분류에서 자질 선택을 위한 방법으로 많이 사용되어지며, n-gram은 모든 언어에 적용 가능한 장점이 있다. 악성댓글은 대체로 문장 길이가 짧고 유행어나 변형어의 출현 빈도가 높으며 비정형화된 특징이 있다. 따라서 우리는 댓글을 n-gram으로 나누어 자질로 선택한다. 분류를 위해 베이지안(Bayesian)모델을 사용하였다. 본 논문에서는 한글과 영어 댓글에 대한 판별 실험을 통하여 구현한 시스템이 복잡한 전처리 과정이 필요한 기존에 제안된 방법들보다 더 나은 성능을 보이며, 언어에 관계없이 적용 가능하다는 것을 실험 결과를 통해 확인할 수 있었다.

  • PDF

지지 벡터 기계와 토픽 시그너처를 이용한 댓글 분류 시스템 언어에 독립적인 댓글 분류 시스템 (Comments Classification System using Support Vector Machines and Topic Signature)

  • 배민영;은지현;장두성;차정원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.263-266
    • /
    • 2009
  • 댓글은 일반적인 글에 비해 작성가능한 문장의 길이가 짧고, 띄어쓰기나 마침표를 잘 쓰지 않는 등 비정형화된 형식 구조를 가진다. 이러한 댓글의 악성 여부를 판별하기 위하여 본 논문에서는 문장을 n-gram으로 나누고 문서요약이나 문서분류에서 자질 선택에 많이 사용되는 토픽 시그너처(Topic Signature)를 이용하여 자질을 추출한다. 또한 지지 벡터 기계(Support Vector Machines)을 사용하여 댓글의 악성 여부를 판별한다. 본 논문에서는 한글과 영어 댓글에 대한 악성 여부를 판별하는 실험을 통하여 복잡한 전처리과정을 요구하는 기존에 제안된 방법들 보다 우수한 성능을 보이는 것을 확인할 수 있었다.

  • PDF

자질 가중치의 재조정을 통한 감정 분류 (Sentiment Classification Using Feature Reweighting)

  • 서형원;김형철;김재훈;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-150
    • /
    • 2009
  • 이 논문은 한글 뉴스 기사의 댓글에 대한 감정 분류 방법을 제안한다. 제안된 방법은 기계학습을 이용하는데 본 논문에서는 자질의 가중치를 재조정하는 좀 색다른 방법을 제안한다. 일반적으로 댓글은 독자들이 특정 기사에 대해서 어떠한 감정을 가지고 있는지를 파악하는 중요한 단서가 된다. 그런데 독자들의 감정은 가사에 어떤 분야에 속하느냐에 영향을 받는다. 예를 들면 정치 기사는 부정적인 댓글은 많이 포함하고 있으며 인물 기사는 긍정적인 기사를 많이 포함한다. 이 논문은 이와 같은 댓글의 속성을 이용해서 기사의 원문과 기사의 분야 정보를 이용하여 가중치를 조정한다. 제안된 시스템의 성능을 평가하기 위해 신문 기사와 댓글을 수집하여 감정 말뭉치를 구축하였으며 감정자질을 추출하기 위해 감정 사전을 구축하였다. 제안된 시스템의 $F_1$ 척도는 92.2%였으며 원문의 감정 단어와 분야 정보가 댓글의 감정을 분류하는데 중요한 자질임을 알 수 있었다.

  • PDF

정보 중립성 확보를 위한 인터넷 뉴스 댓글의 정치성향 분석 (Political Information Filtering on Online News Comment)

  • 최혜봉;김재홍;이지현;이민구
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.575-582
    • /
    • 2020
  • 본 연구는 인터넷 뉴스 댓글 빅데이터 분석을 통해 뉴스 댓글 사용자의 정치적 성향을 추정하는 방법을 제안한다. 인터넷 뉴스 댓글과 작성자의 정치 성향을 함께 제공하여 디지털 매체를 통한 정보 전달의 객관성과 중립성을 확보하고자 한다. 250만 건 이상의 인터넷 뉴스 댓글의 특성을 분석하고 사용자의 정치적 성향을 효과적으로 추정하기 위한 특징을 추출한다. 어휘사전 기반 알고리즘과 유사도 기반 알고리즘을 제안하고 실험을 통해 두 알고리즘을 비교하고 효과를 검증한다.

기업가 연설문의 주제와 시청자 댓글 간의 관계 분석: 유튜브 콘텐츠를 중심으로 (Entrepreneur Speech and User Comments: Focusing on YouTube Contents)

  • 김성범;이정환
    • 한국콘텐츠학회논문지
    • /
    • 제20권5호
    • /
    • pp.513-524
    • /
    • 2020
  • 최근 유튜브의 성장이 주목받고 있다. 유튜브는 콘텐츠를 소비하는 채널일 뿐만 아니라 소비자의 의사를 표시하는 공간이 되고 있다. 소비자들은 댓글이라는 형식으로 유튜브 안에서 그들의 의견을 표출한다. 이 연구는 유튜브에 업로드되어 시청되는 글로벌 기업가 연설문과 영상을 시청하고 작성한 댓글의 텍스트를 연구대상으로 한다. 텍스트 마이닝 소프트웨어인 Leximancer를 사용하여 각각의 연설문과 댓글을 대상으로 내용 분석(content analysis)을 시행하였다. 각 기업가 연설문의 주제는 대응분석(correspondence analysis)을 사용하여 분석하였고 기업가 개인의 성향과 특성과 관련 있는 주제를 도출하였다. 댓글에서는 각 연설문의 내용과는 관계없이 공통적으로 money, work, need의 주제를 발견하였다. 텍스트의 길이가 다름을 고려하여 추가로 중요도 지표 (Prominence Index) 분석을 실행하였고 연설문 내용과 시청자 댓글의 공통적인 주제를 구성하는 핵심어로 time, future, better, best, change, life, business, need를 도출하였다. 유튜브 연설문의 시청자는 인생과 시간, 미래, 고객의 니즈, 긍정적 변화에 대한 메시지에 대하여 동일한 주제로 반응하는 것으로 나타났다.

'스크린 위의 글쓰기' 과정에 나타난 아동의 예상독자 고려 전략 및 댓글에 반영된 의사소통 특성 (Children's Writing on the Screen : Focused on the PAIR Strategies for the Audiences and the Feature of Communication Reflected in Comments)

  • 현은자;김현경;유진경
    • 한국콘텐츠학회논문지
    • /
    • 제14권12호
    • /
    • pp.1100-1116
    • /
    • 2014
  • 본 연구에서는 '스크린 위의 글쓰기' 과정에서 아동이 예상독자를 어떻게 고려하며, 글쓰기 공동체의 의사소통의 중심에 있는 댓글은 독자와의 관계에서 어떤 수행성을 나타내는지 조사하였다. 이를 위해 초등학교 4-6학년 아동의 게시 글에서 635개의 문장과 424개의 댓글을 수집하여 분석하였다. 연구 결과, 아동의 예상독자를 고려한 글쓰기 전략은 끌어들이기 전략이 가장 많이 나타났고, 세부 전략으로는 감정에 호소하는 전략이 가장 많이 사용되었으며, 댓글의 수행행위는 표출 행위가 가장 많이 나타났다. 또한 아동의 PAIR 전략은 회기가 진행되면서 증가하였다가 다시 감소하는 양상을 보였으며, 아동은 게시 글을 작성할 때 다양한 방식으로 복합양식을 사용하는 것으로 나타났다. 한편, 댓글에 나타나는 의사소통의 특성 역시 감정적이고 정서적인 표현에 치우쳐져 있었으며, 아동의 댓글에는 저자 및 제 3의 독자들을 예상한 의사소통이 이루어졌고, 게시 글과 관련된 의견 교류뿐만 아니라, 아동의 일상적인 문화가 반영되어 나타났다.

영상광고 유형별 디지털 이용자의 댓글 내용분석에 관한 연구: 바이럴 동영상 광고와 케이블 방송광고를 중심으로 (A Content Analysis of Digital Audience Replies to Video Advertising Types: Focused on Viral Video and Cable Broadcasting Advertisement)

  • 지원배;김운한
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권7호
    • /
    • pp.1303-1312
    • /
    • 2018
  • 본 연구의 목적은 최근 증가하고 있는 영상광고에 대한 디지털 이용자의 반응 내용을 파악하는 것이다. 분석 대상은 온라인 광고 시청자가 영상광고의 주 유형인 바이럴 동영상 광고와 케이블 방송광고에 대한 댓글이다. 내용분석 결과는 다음과 같다. 첫째, 바이럴 동영상 광고가 케이블 방송광고에 비해 광고댓글 수가 더 많은 것으로 나타났다. 둘째, 영상광고 유형에 따라 광고 길이를 제외한 광고댓글 속성요인(댓글방향, 반응유형, 반응영역)에서 바이럴 동영상 광고에 대해 더 긍정적으로 평가하며, 감성적인 반응과 핵심적 속성 반응이 더 많은 것으로 나타났다. 셋째, 디지털 이용자의 성별 특성에 따라 댓글길이에서 여성이 남성보다 장문이 더 많으며, 긍정적으로 평가하며, 이성적인 반응과 핵심적 속성반응을 더 많이 보이는 것으로 나타났다.

온라인 토론의 댓글 응답 구조를 이용한 사용자 특성 분석 (User Characterization from Replying Comment Structures in Online Discussion)

  • 김성환;탁해성;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.135-145
    • /
    • 2018
  • 온라인 커뮤니티에서는 사용자들이 댓글을 이용하여 다양한 주제에 대한 의견과 감정을 교환한다. 댓글을 통한 의사소통은 신속하고 편리하지만 때로는 이러한 무게감이 덜한 특성이 사용자로 하여금 무례하고 공격적인 언사를 쉽게 행하도록 만들어 분쟁을 쉽게 유발하기도 한다. 따라서 이러한 분쟁을 미리 예측하고 대응하기 위하여 사용자들의 특성을 미리 파악하고 분류하는 작업이 중요하다. 본 논문에서는 이러한 사용자의 특성이 해당 사용자들이 참여한 발제글을 나타내는 댓글트리의 구조적인 특징에 나타난다는 가정을 바탕으로 댓글트리 구조를 서술하기 위한 여러 가지 정량적인 지표를 제안한다. 제안하는 정량 지표들의 분포를 통하여 발제글 작성자 및 댓글 작성자에 따른 지표의 분포를 살펴보고, 추가적으로 관리자에 의하여 경고를 받은 사용자들을 분류하는 실험을 통하여 제안하는 구조적 지표의 효과성을 보인다.

명품 하울 유튜브 영상 댓글에 나타난 상대적 박탈감 여부와 특징 분석 - TF-IDF, Word2vec, LDA, LSTM을 이용한 현대인의 감정 분석을 중심으로 - (Analysis of whether the feeling of relative deprivation is shown in the comments of the Luxury Howl YouTube video - Focusing on modern sentiment analysis using TF-IDF, Word2vec, LDA and LSTM -)

  • 최정민;오하영
    • 한국정보통신학회논문지
    • /
    • 제25권3호
    • /
    • pp.355-360
    • /
    • 2021
  • 최근 유튜브가 큰 인기를 얻고 있다. 많은 연구에 따르면 소셜 미디어에서 상대적 박탈감이 나타나듯이 본 연구에서는 유튜브에서도 상대적 박탈감이 나타나는지 확인해보고자 한다. 그중에서도 유튜버의 경제적 지위를 잘 드러내는 명품 하울 영상을 중심으로 연구를 진행하였다. 명품 하울이란 많은 양의 명품 제품을 구매하여 보여주는 콘텐츠를 의미한다. LDA, TF-IDF, Word2Vec 기법을 이용하여 유튜브 댓글 분석을 진행하였다. 추가로 LSTM 학습 모델을 기반으로 댓글을 긍정적 그룹과 부정적 그룹으로 분류하였다. 연구 결과에 따르면 다수의 댓글이 긍정적인 의미를 내포하지만, 상대적 박탈감 등을 나타내는 부정적 의미의 키워드를 가진 댓글도 나타났다. 이러한 댓글에서는 자신과 유튜버의 경제적 모습을 비교하는 표현이 등장하였다. 특히 유튜버의 나이가 상대적으로 어리거나 스스로 명품제품을 구매할 능력이 되지 않은 것으로 보이면 상대적 박탈감을 표현하는 댓글이 증가하였다. 따라서 본 연구에서는 유튜브도 다른 소셜 미디어와 같이 이용자가 상대적 박탈감을 느낀 다는 것을 확인 할 수 있었다.

어텐션임베딩과 다채널 CNN 기반 반시민성 검출 알고리즘 (Detection of Incivility based on Attention-embedding and multi-channel CNN)

  • 박윤정;이세영;금희조
    • 한국정보통신학회논문지
    • /
    • 제26권12호
    • /
    • pp.1880-1889
    • /
    • 2022
  • 온라인 포털 플랫폼은 뉴스 기사와 온라인 댓글을 제공하고 있으나, 온라인 댓글의 익명성은 반시민적 표현을 증가시켜 사회적 문제점으로 간주되고 있다. 댓글의 반시민성 검출 연구가 많이 이루어진 국외와 달리, 국내에서는 비시민성을 세분화한 한국어 데이터셋이 구현되지 않아 심도있는 연구가 이루어지지 못하였다. 본 연구에서는 댓글의 반시민성에 대한 라벨링을 총 13가지 항목으로 시행하였으며 반시민적 표현으로 요약하였다. 또한 어텐션 알고리즘을 이중으로 적용하여 임베딩 벡터를 추출하였고 이후 2-d CNN으로 반시민성 항목을 분류하였다. 그 결과, 제안한 알고리즘이 무례한 호칭 및 공격적 어조 등의 반시민성 검출에 유용하다는 것을 보여주었다. 본 연구는 민주적 담론을 저해하는 반시민적 댓글들을 탐지함으로써 건전한 온라인 댓글 문화 형성에 기여할 것으로 기대된다.