• Title/Summary/Keyword: 블로그 포스트

Search Result 37, Processing Time 0.035 seconds

An Analysis of a Blogosphere using PARAFAC Decomposition (PARAFAC 분해를 이용한 블로그 공간 분석)

  • Kim, Ki-Nam;Kim, Sang-Wook;Kim, Jin-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1253-1254
    • /
    • 2011
  • 본 논문에서는 블로그 공간을 텐서로 표현하고, 이를 분석한다. 분석 결과에 따르면, PARAFAC 분해를 통하여 특정 주제를 나타내는 커뮤니티들을 올바르게 파악할 수 있었으며, 각 커뮤니티에서 영향력 있는 블로그들과 키워드들, 그리고 권위 있는 포스트들을 식별할 수 있었다.

블로그 검색을 위한 태그 기반 피드 포스트 랭킹 알고리즘

  • Han, Seung-Gyun;Lee, Sang-Jin;Park, Jong-Heon
    • 한국경영정보학회:학술대회논문집
    • /
    • 2007.11a
    • /
    • pp.623-628
    • /
    • 2007
  • 본 논문은 Web 2.0시대의 새로운 컨텐츠 매체로 각광받고 있는 블로그와 관련하여 태그 기반의 검색 알고리즘을 제안하고자 한다. 최근 블로그 검색과 관련하여 태그 기반의 블로그 검색 서비스가 등장하기 시작했지만, 현재 제공되는 태그 기반의 검색 서비스는 태그의 유무와 컨텐트의 최신성을 주요 기준으로 삼고, 태그와 컨텐트 간의 관련성을 제대로 고려하지 않아 검색 결과가 만존스럽지 못하는 경우가 많다. 따라서 본 논문에서는 태그와 컨텐트와의 관련성을 실수화하고 이를 주요 기준으로 검색 결과의 순위를 결정하는 PTRank 알고리즘을 제안하였다. PTRank 알고리즘에서는 1) 태그가 피드의 제목에 포함되었는지 여부, 2) 태그가 피드의 설명에 나타나는 회수, 3) 태그가 아이템의 제목에 포함되었는지 여부, 4) 태그가 아이템의 설명에 나타나는 횟수, 5) 피드 내에서 태그의 IDF값, 6) 사용자의 검색 행위를 이용해 태그와 컨텐트간의 관련성을 실수화하였다. 실험 결과, PTRank 모델 및 학습 알고리즘이 태그 기반의 피드 검색에서 잘 작동하며 검색에 효과적으로 활용될 수 있다는 것을 알 수 있었다.

  • PDF

A Wikipedia-based Query Expansion Method for In-depth Blog Distillation (주제를 깊이 있게 다루는 블로그 피드 검색을 위한 위키피디아 기반 질의 확장 방법)

  • Song, Woo-Sang;Lee, Ye-Ha;Lee, Jong-Hyeok;Yang, Gi-Joo
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.16 no.11
    • /
    • pp.1121-1125
    • /
    • 2010
  • This paper proposes a Wikipedia-based feedback method for in-depth blog distillation whose goal is to find blogs that represent in-depth thoughts or analysis on a given query. The proposed method uses Wikipedia articles which are relevant to the query. TREC Blogs08 collection which is a large-scale blog corpus and English Wikipedia dump were used for experiments, The proposed method significantly increased the retrieval performance including MAP over the conventional post based feedback method.

Spam Classification by Analyzing Characteristics of a Single Web Document (단일 문서의 특징 분석을 이용한 스팸 분류 방법)

  • Sim, Sangkwon;Lee, Soowon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.845-848
    • /
    • 2014
  • 블로그는 인터넷에서 개인의 정보나 의견을 표출하고 커뮤니티를 형성하는데 사용되는 중요한 수단이나, 광고 유치, 페이지 순위 올리기, 쓰레기 데이터 생성 등 다양한 목적을 가진 스팸블로그가 생성되어 악용되기도 한다. 본 연구에서는 이러한 문제를 해결하기 위해 웹 문서에서 나타나는 특징들을 이용한 스팸 탐지 기법을 제안한다. 먼저 블로그 본문의 길이, 태그의 비율, 태그 수, 이미지 수, 랭크의 수 등 하나의 웹 문서에서 추출할 수 있는 특징을 기반으로 각 문서에 대한 특징 벡터를 생성하고 기계학습을 통해 모델을 생성하여 스팸 블로그를 판별한다. 제안 방법의 성능 평가를 위해 블로그 포스트 데이터를 사용하여 제안방법과 기존의 스팸 분류 연구를 비교 실험을 진행하였다. Bayesian 필터링 기법을 사용하는 기존연구와 비교 실험 결과, 제안방법이 더 좋은 정확도를 가지면서 특징 추출 속도 및 메모리 사용 효율성을 보였다.

Post Ranking Algorithms Based on HITS: Improvement and Performance Evaluation (HITS에 기반한 포스트 랭킹 알고리즘: 개선 방안 및 성능 평가)

  • Hwang, Won-Seok;Do, Young-Joo;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.1243-1244
    • /
    • 2011
  • 블로그 이용이 활성화됨에 따라 포스트 랭킹 방법의 필요성이 증가하고 있다. 기존 연구에서는 HITS 에 기반을 둔 포스트 랭킹 방법인 BAITS 와 BAITS 를 수정한 포스트 랭킹 방법들을 제안한바 있다. 본 논문에서는 이러한 포스트 랭킹 방법들을 다양한 척도를 이용한 비교 실험을 통해 비교하여 가장 정확도가 높은 랭킹 방법을 판별하고자 한다.

The Landscape of Seonyoo-do Park Captured in One-Person Media Focusing on Blogs (1인 미디어 블로그(Blog)가 포착한 선유도공원 경관)

  • Bark, Sun-Hee;Kim, Yun-Geum
    • Journal of the Korean Institute of Landscape Architecture
    • /
    • v.39 no.3
    • /
    • pp.64-73
    • /
    • 2011
  • This study starts from the hypothesis that the information society has affected the layman's interpretation and production of content. Specifically, the manner and contents of communication concerning the landscape of Soonyoo-do Park in blogs are surveyed and the possibilities and limitations of this phenomenon are discussed. The following topics are dealt with. Firstly, what is the landscape of Seonyoodo Park as captured by bloggers? What type of landscape do bloggers respond to? Secondly, what is the unique way that bloggers capture and interpret the landscape? Thirdly, What are the possibilities and limitations discovered from the landscape as captured and interpreted by bloggers? Thus, 1,000 blog posts concerning Soonyoo-do Park, as culled from the Internet, were categorized into three areas, First are blog posts browsed by keywords such as 'photo', 'a photographer's visit', 'a good p1ace for taking photos', and 'landscape'. These are focused on the visual aspects of the landscape. The second category is posts under the keywords 'domestic travel', 'Seoul travel', 'travel', and 'recommendation'. They contain introductory information on Seonyoodo Park; that is, they focus cm the more utilitarian functions of Seonyoodo Park as a place. The third one is posts that record personal experiences. The subjects for photography are the bloggers themselves and their companions. As a result of studying the way bloggers deal with landscape, it was found that first, people have developed the ability to capture the landscape and interpret the landscape actively and independently. This process can be regarded as the reproduction of landscape and place. In addition, the recording of their appreciation and feeling overlaps with evaluation and assumption. One negative aspect, however, is that many bloggers dramatize and repeat similar scenes. This can be seen as a make-up of image. The limitations of this study include difficulty in interpretation because blogs, which are the objects of this study, are very subjective and personal. In addition, it was not easy to categorize posts because there were diverse images and a broad range of writing. Nevertheless, practitioners of landscape architecture should continue to monitor and use one-person media like blogs, because the relationship between modern man and the landscape can be better understood through them.

Trackback Spam Detection using Similarity Analysis by LSA (LSA 유사도 비교를 통한 트랙백 스팸 탐지)

  • Jun, Hyek-Su;Kim, Tae-Hwan;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.339-344
    • /
    • 2010
  • 오늘날 인터넷 사용자들은 블로그나 뉴스 등의 매체에서 트랙백을 사용해 자신의 의견을 보다 자유롭게 나타낸다. 그러나 이러한 자유로움을 악용해 트랙백 스팸을 유발하여 네트워크의 자원을 낭비하고 방문자들에게 잘못된 정보를 전달해 해당 포스트의 신뢰를 떨어뜨린다. 트랙백 스팸은 유명한 포스트와 연계하여 자신의 포스트로 사용자들을 유도하는 특징을 가지기 때문에 일반적인 웹 스팸을 탐지하는 기술을 적용하기 어렵다. 따라서 본 논문에서는 자신이 작성한 글이 다른 사람의 글과 관련이 있다고 생각하여 다른사람의 글에 자신의 글을 링크시키는 트랙백의 특성을 이용하여 원본 페이지와 트랙백 페이지 그리고 트랙백 페이지의 아웃링크 내용상의 유사도와 동시 출현(co-occurrence) 정보를 이용하여 트랙백 스팸을 처리하고자 한다.

  • PDF

Analysis of Posting Preferences and Prediction of Update Probability on Blogs (블로그에서 포스팅 성향 분석과 갱신 가능성 예측)

  • Lee, Bum-Suk;Hwang, Byung-Yeon
    • Journal of KIISE:Databases
    • /
    • v.37 no.5
    • /
    • pp.258-266
    • /
    • 2010
  • In this paper, we introduce a novel method to predict next update of blogs. The number of RSS feeds registered on meta-blogs is on the order of several million. Checking for updates is very time consuming and imposes a heavy burden on network resources. Since blog search engine has limited resources, there is a fix number of blogs that it can visit on a day. Nevertheless we need to maximize chances of getting new data, and the proposed method which predicts update probability on blogs could bring better chances for it. Also this work is important to avoid distributed denial-of-service attack for the owners of blogs. Furthermore, for the internet as whole this work is important, too, because our approach could minimize traffic. In this study, we assumed that there is a specific pattern to when a blogger is actively posting, in terms of days of the week and, more specifically, hours of the day. We analyzed 15,119 blogs to determine a blogger's posting preference. This paper proposes a method to predict the update probability based on a blogger's posting history and preferred days of the week. We applied proposed method to 12,115 blogs to check the precision of our predictions. The evaluation shows that the model has a precision of 0.5 for over 93.06% of the blogs examined.