• 제목/요약/키워드: 의견탐지

검색결과 23건 처리시간 0.026초

블로고스피어에서 주제에 관한 의견을 찾는 융합적 의견탐지방법 (Fusion Approach to Targeted Opinion Detection in Blogosphere)

  • Yang, Kiduk
    • 한국도서관정보학회지
    • /
    • 제46권1호
    • /
    • pp.321-344
    • /
    • 2015
  • 이 논문은 여러가지 자료를 결합해 어떤 주제에 관한 의견이 실려있는 블로그를 찾는 융합적 의견탐지방법을 소개한다. 주제에 관한 의견이 담긴 블로그를 찾기위해 이 연구는 기존의 IR 방법으로 주제에 관한 블로그를 검색한 후 여러가지 의견탐지 방법을 합산한 의견점수로 검색결과의 순위를 조정하는 방법을 쓴다. 의견탐지 모듈의 주요 구성 요소는 의견이 실려있는 블로그에 자주 나오는 단어들을 활용한 고빈도 모듈, 강한 감정을 표현하는 희귀 한 용어들을 (e.g., "sooo good") 활용한 저빈도 모듈, "I"와 "you"에 묶인 n-gram을 (e.g., I believe, You will love) 활용한 IU모듈, 윌슨의 주관 용어 목록을 바탕으로 한 윌슨의 어휘모듈, 그리고 소수의 의견 약어를 (e.g., imho) 이용한 의견 약어 모듈들 이다. 본 연구의 결과는 여러 가지 방법을 융합하는 것이 의견 검출 성능을 향상시키는데 효과적이 다는 것을 보여주었다.

온라인 공간에서 관심집단 대상 비정상 정보의 특징 분석과 탐지 (Characterization and Detection of Opinion Manipulation on Common Interest Groups in Online Communities)

  • 이시형
    • 인터넷정보학회논문지
    • /
    • 제21권6호
    • /
    • pp.57-69
    • /
    • 2020
  • 인터넷 포털과 사회관계망 서비스(SNS) 등의 온라인 공간에서 사용자 간의 의견 공유가 활발해짐에 따라 이를 악용하여 특정 개인이나 집단의 이익을 위해 유포되는 비정상 정보도 증가하고 있다. 특히 비정상 정보가 정치적인 목적으로 유포되면 선거 결과뿐 아니라 다양한 사회 정책과 시민 생활에도 영향을 미친다. 이러한 비정상 정보는 불특정 다수에 대한 유포에서 시작하였으며 이들의 특성을 분석하고 탐지하기 위한 기존 연구도 이러한 불특정 다수 대상 유포에 초점을 맞추었다. 하지만 최근에는 더욱 효과적으로 영향을 미치기 위해 공통 관심사를 가진 집단(예: 부동산에 관심 있는 사람들의 모임)을 대상으로 내용과 형식을 조정한 맞춤형 정보를 유포하고 있다. 본 논문에서는 이러한 관심 집단을 대상으로 한 비정상 정보의 특성을 분석하고 이를 탐지하는 방법을 제시한다. 이를 위해 선거 전후에 10개의 공통 관심 집단에 게시된 의견을 수집하여 분석하였다. 그 결과, 각 집단에 맞춤화된 정보가 실제 유포되고 있으며 선거일이 가까워짐에 따라 점차 증가함을 보였다. 또한, 비정상 정보를 탐지하기 위한 시스템을 제안하였는데, 이 시스템은 개별 의견에서 보이는 특징뿐 아니라 의견 게시자의 전반적인 행위 및 게시자와 협력한 사용자의 특성을 종합적으로 분석한다. 제안한 시스템을 수집한 데이터에 적용한 결과 90% 이상의 정확도로 비정상 의견을 탐지하였으며 다수의 사용자가 조직적으로 비정상 의견을 유포한 정황을 발견하였다. 제안한 시스템으로 관심 집단에 게시된 의견을 주기적으로 검사한다면 비정상 정보의 유포를 더 빠르게 차단하고 영향을 줄일 수 있을 것이다. 또한, 탐지에 활용한 특징은 정치적인 목적 이외의 비정상 정보 판별에도 활용될 수 있을 것이다.

의견 문서의 단어 통계 분석을 통한 의견 검색 특성에 관한 연구 (A Study on the Characteristics of Opinion Retrieval Using Term Statistical Analysis in Opinion Documents)

  • 한경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권11호
    • /
    • pp.21-29
    • /
    • 2010
  • 문서에 표출된 사용자의 의견을 검색하는 의견 검색의 성능이 일반 사실을 검색하는 기존 주제 검색의 성능을 크게 향상시키지 못하고 있다. 이에 본 연구는 블로그를 대상으로 의견 문서와 비의견 문서의 단어 통계를 비교 분석함으로써 의견 검색에 활용할 수 있는 통계적 특성을 파악하고자 한다. TREC의 블로그 트랙에서 사용했던 Blogs06 컬렉션과 150개의 TREC 토픽을 실험 데이터로 사용하였다. JS divergence를 이용하여 의견 문서에서의 단어 확률 분포 간의 상이성을 비교 분석하였으며, TREC 토픽의 유형 및 주제 영역별로 의견 문서를 구분하여 확률 분포의 차이점을 살펴보았고, 의견 단어별 확률을 비교 분석하였다. 실험을 통해 토픽별 특성을 고려한 의견 탐지 방법의 필요성, 토픽별 긍/부정 의견 단어 추출의 효과성, 유형과 주제 영역의 상호 보완적인 특징, 긍정 의견 단어 사용의 유의점 등을 알아내었다.

트윗 문서에서 의견 바이어스 탐지를 위한 HITS 그래프 기반 핵심 자질 추출 (Target Extraction Based on HITS Graph for Opinion Bias Detection in Twitter)

  • 권아롱;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.58-61
    • /
    • 2012
  • 본 논문에서는 트위터 사용자들의 의견을 바이어스 탐지 하기 위해, 핵심 자질 추출 방법으로 HITS 그래프를 이용한 방법을 제안한다. 제안하는 핵심 자질 추출 방법은 사람이 직접 추출하지 못하는 자질도 추출할 수 있는 장점을 보였다. 제안한 핵심 자질 추출이 바이어스 탐지에 유효함을 검증하기 위해 4개의 토픽에 대해 평가 했을 때 제안 모델이 기존 모델보다 우수한 성능을 보였다.

  • PDF

편향된 의견 문서 검출을 위한 이상치 탐지 기법 (Outlier Detection Techniques for Biased Opinion Discovery)

  • 연종흠;심준호;이상구
    • 한국전자거래학회지
    • /
    • 제18권4호
    • /
    • pp.315-326
    • /
    • 2013
  • 소셜 미디어에서는 상품평, 영화평 등의 다양한 종류의 의견이 표현되고 있으며, 사용자들이 물품 구매 등에 있어 이러한 의견을 참고로 하여 결정을 내리는 것은 일반적이 되었다. 하지만 의견 정보의 활용도가 높아질수록 이를 부적절하게 왜곡하는 사례 또한 증가하고 있다. 예를 들어, 홍보를 목적으로 과도하게 긍정적인 의견이 포함된 리뷰를 작성하거나, 반대로 일반적인 평가에서 벗어나 과도하게 부정적인 의견을 게시하는 경우 등이다. 편향된 의견은 소셜 미디어의 신뢰성과 연결 되기 때문에 이를 검출하는 것은 점차 중요한 문제로 대두되고 있다. 기존의 오피니언 마이닝 혹은 감성 분석은 문서를 분석하여 그 문서가 가지고 있는 의견의 성향을 판단하는 기법이다. 하지만 기존의 연구는 의견을 단순히 긍정/부정으로만 분류하는 방향으로 연구가 이루어져 왔으며, 특히 사전에 의견 성향에 따라 분류된 충분한 양의 학습 데이터가 필요하다는 단점이 있다. 본 논문에서는 학습데이터가 없는 경우에, 전체 문서의 의견 성향 분포에서 벗어난 의견 문서를 검출하는 기법을 제안한다. 여기에는 각도기반 이상치 탐지와, 개인화된 페이지랭크 방법을 활용한다. 또한 영화 리뷰 문서를 대상으로 실험을 수행하여 제안한 방법들의 성능을 분석하였다.

은닉마코프모델을 이용한 이상징후 탐지 기법 (An Anomaly Detection based on Probabilistic Behavior of Hidden Markov Models)

  • 이은영;한찬규;최형기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.1139-1142
    • /
    • 2008
  • 인터넷의 이용이 증가함에 따라 네트워크를 통한 다양한 공격 역시 증가 추세에 있다. 따라서 네트워크 이상징후를 사전에 탐지하고 상황에 따라 유연하게 대처할 수 있도록 하기 위한 연구가 절실하다. 본 연구는 은닉마코프모델을 이용해 트래픽에서 이상징후를 탐지하는 기법을 제안한다. 제안하는 기법은 시계열 예측 기법을 이용해 트래픽에서 징후를 추출한다. 징후추출 과정의 결과를 은닉마코프모델을 활용한 징후판단과정을 통해 네트워크 이상징후인지를 판단하고 결정한다. 일련의 과정을 perl로 구현하고, 실제 공격이 포함된 트래픽을 사용하여 검증한다. 하지만 결과가 확연히 증명되지는 않는데, 이는 학습과정의 부족과 실제에 가까운 트래픽의 사용으로 인해 나타나는 현상으로 연구의 본질을 흐리지는 않는다고 판단된다. 오히려 실제 상황을 가정했을 때 접근이나 적용을 판단함에 관리자의 의견을 반영할 수 있으므로 공격의 탐지와 판단에 유연성을 증대시킬 수 있다. 본 연구는 실시간 네트워크의 상황 파악이나 네트워크에서의 신종 공격 탐지 및 분류에 응용가능할 것으로 기대된다.

온라인 공간에서 비정상 정보 유포 기법의 시간에 따른 변화 분석 (Temporal Analysis of Opinion Manipulation Tactics in Online Communities)

  • 이시형
    • 인터넷정보학회논문지
    • /
    • 제21권3호
    • /
    • pp.29-39
    • /
    • 2020
  • 인터넷 포털 사이트와 사회 관계망 서비스 등의 온라인 공간(online communities)은 시간과 공간의 제약 없이 접속 가능하다는 장점 때문에 많은 사용자들이 의견을 교환하고 정보를 얻기 위해 사용하고 있다. 이와 함께 특정 개인이나 집단의 이익을 위해 의도적으로 유포하는 비정상 정보도 증가하고 있는데 허위 상품 평이나 정치적 선동 의견이 이에 해당한다. 기존에는 이러한 비정상 정보 탐지를 위해 한 시점에서의 비정상 정보를 수집하고 특징을 분석하여 검열 시스템을 제안하였다. 그러나 비정상 정보를 유포하는 기법은 기존의 탐지 시스템을 회피하고 보다 효율적으로 정보를 전파하기 위해 지속적으로 변화하므로 탐지 시스템도 이에 맞추어 변화할 필요가 있다. 따라서 본 논문에서는 비정상 정보 유포 기법의 시간에 따른 변화를 관찰하는 시스템을 제시한다. 이 시스템은 클러스터링(clustering)을 활용해 비정상 정보를 유포 방식에 따라 군집(cluster)으로 분류하며 이러한 군집의 변화를 분석하여 유포 방식의 변화를 추적한다. 제안한 시스템을 검증하기 위해 3번의 선거 기간 전후에 포털 사이트에서 수집된 백만 개 이상의 의견을 대상으로 실험하였으며, 그 결과 비정상 정보 게재에 자주 사용되는 시간, 추천수 조작 방법, 다수의 ID 활용 방법 등에 대한 변화를 관찰할 수 있었다. 이 시스템을 주기적으로 사용해 탐지 시스템을 개선한다면 보다 빠르고 정확하게 비정상 정보의 유포를 탐지할 수 있을 것이다.

LSA 유사도 비교를 통한 트랙백 스팸 탐지 (Trackback Spam Detection using Similarity Analysis by LSA)

  • 전혁수;김태환;최중민
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.339-344
    • /
    • 2010
  • 오늘날 인터넷 사용자들은 블로그나 뉴스 등의 매체에서 트랙백을 사용해 자신의 의견을 보다 자유롭게 나타낸다. 그러나 이러한 자유로움을 악용해 트랙백 스팸을 유발하여 네트워크의 자원을 낭비하고 방문자들에게 잘못된 정보를 전달해 해당 포스트의 신뢰를 떨어뜨린다. 트랙백 스팸은 유명한 포스트와 연계하여 자신의 포스트로 사용자들을 유도하는 특징을 가지기 때문에 일반적인 웹 스팸을 탐지하는 기술을 적용하기 어렵다. 따라서 본 논문에서는 자신이 작성한 글이 다른 사람의 글과 관련이 있다고 생각하여 다른사람의 글에 자신의 글을 링크시키는 트랙백의 특성을 이용하여 원본 페이지와 트랙백 페이지 그리고 트랙백 페이지의 아웃링크 내용상의 유사도와 동시 출현(co-occurrence) 정보를 이용하여 트랙백 스팸을 처리하고자 한다.

  • PDF

다변량 관리도를 활용한 블로거 정서 변화 탐지 (Detection of the Change in Blogger Sentiment using Multivariate Control Charts)

  • 문정훈;이성임
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.903-913
    • /
    • 2013
  • 최근 소셜 네크워크 서비스의 발달로 인해 개인의 감정이나 의견을 표현하는 소셜 데이터들이 하루에도 수백만 건씩 생산되고 있다. 또한 소셜 데이터는 개인의 의견에 또 다른 생각을 더하는 등 정보의 생산과 소비가 누구나 가능해짐으로써 사회현상을 잘 반영해주는 도구로 성장하고 있다. 본 연구에서는 블로그에 올라온 부정적인 감성어들을 분석하여 블로거의 감성변화를 탐지하기 위해 다변량 관리도를 이용하고자 한다. 이를 위해 2008년 1월 1일부터 2009년 12월 31일 사이에 생성되었던 모든 블로그를 사용하였다. 품질 특성치가 다변량으로 주어지는 경우 호텔링의 $T^2$ 관리도가 널리 사용된다. 그러나 이 관리도는 품질 특성치들의 분포가 다변량 정규분포라는 가정을 하고 있어, 비정규 다변량 자료에 대한 관리도의 성능은 좋지 않다. 이에 본 논문에서는 Sun과 Tsung (2003)이 제안한 써포트 벡터머신에서 단일 집합 분류 기법 중 하나인 SVDD(support vector data description) 알고리즘과 이를 확장한 K-관리도를 소개하고, 실제 데이터 분석에 적용해 보았다.

전문가 의견 기반 사이버 침해 예측 방법론 연구 (Research for Expert Opinion-Based Cyber Infringement Prediction Methodology)

  • 강영길;윤종현;이수원;박인성
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.112-117
    • /
    • 2007
  • 사이버 침해란 정보시스템의 취약한 부분을 공격하여 시스템 내부에 침입하거나 시스템을 마비/파괴하는 등의 사고를 유발하는 모든 행위를 말한다. 이러한 사이버 침해의 피해를 줄이기 위해 국내외 많은 연구 기관과 업체에서는 침입탐지시스템과 같은 정보보호 기술을 연구 개발하여 상용화하고 있다. 그러나 기존의 정보보호 기술은 이미 발생한 침해를 탐지하여 피해의 확산을 막는 데만 한정적으로 사용되고, 침해의 발생 가능성을 예측하지는 못하기 때문에 점차 첨단화, 다양화되고 있는 사이버 침해에 대응하기 힘들다는 문제점을 갖는다. 본 논문에서는 보안 취약점을 이용한 사이버 침해를 대상으로 전문가 설문을 통해 사이버 침해의 발생 가능성을 예측하는 방법을 제안하고, 이를 위한 사이버 침해 예측 항목을 추출하였다. 예측 항목 추출은 3 단계로 구성되며, 첫 번째 단계에서는 기존 연구와 사례 분석을 통해 예측 항목의 계층 구조를 생성한다. 두 번째 단계에서는 첫 번째 단계를 통해 생성된 예측 항목들을 델파이 방법을 통해 개선하여 최적의 예측 항목을 결정한다. 마지막 단계에서는 각 항목들에 대한 쌍대 비교 설문을 진행하여 항목 간 가중치를 추출한다.

  • PDF