• Title/Summary/Keyword: 블로그 포스트

Search Result 37, Processing Time 0.022 seconds

Automatic Classification of Blog Posts Considering Category-specific Information (범주별 고유 정보를 고려한 블로그 포스트의 자동 분류)

  • Kim, Suah;Oh, Sungtak;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.11-14
    • /
    • 2015
  • 많은 블로그 제공 사이트는 블로그 포스트 작성자에게 미리 정의된 범주 (category)에 따라 포스트의 주제에 대하여 범주를 선택할 수 있는 환경을 제공한다. 그러나 블로거들은 작성한 포스트의 범주를 매번 수동으로 선택해야 하는 불편함이 있다. 이러한 불편함의 해결을 위해 블로그 포스트를 자동으로 분류해주는 기능을 제공한다면 블로그의 활용성이 증가할 것이다. 기존의 블로그 문서 분류의 연구는 각 범주의 고유 정보를 반영하는 것에 한계가 있었다. 이러한 문제를 해결하기 위해, 본 논문에서는 범주별 고유 정보를 반영한 어휘 가중치를 제안한다. 어휘 가중치의 분석을 위하여 범주별로 블로그 문서를 수집하고, 수집한 문서에서 어휘의 빈도와 문서의 빈도, 범주별 어휘빈도 등을 고려하여 새로운 지표인 CTF, CDF, IECDF를 개발하였다. 이러한 지표를 기반으로 기존의 Naive Bayes 알고리즘으로 학습하여, 블로그 포스트를 자동으로 분류하였다. 실험에서는 본 논문에서 제안한 가중치 방법인 TF-CTF-CDF-IECDF를 사용한 분류가 가장 높은 성능을 보였다.

  • PDF

Do Users Always Trust More when Blog Posts are Related to the Blog's Theme?: The Degree of Relevance and Its Effect on Message Credibility (블로그의 포스트가 블로그의 테마와 관련이 있을 때 항상 더 사용자의 신뢰를 받는가?: 관련성의 정도가 메시지 신뢰성에 미치는 영향)

  • Jiyeol Kim;Cheul Rhee
    • Information Systems Review
    • /
    • v.20 no.2
    • /
    • pp.163-188
    • /
    • 2018
  • When people try to find restaurant information via search engine results, they look at posts not only from sites with solely restaurant reviews but also from sites with restaurant unrelated contents. This study aims to investigate whether relevance between post and blog type affects users' trust toward a review. This study also attempts to check if the above effects interact with age. We designed a restaurant review post for two different blogs: one featuring restaurant review and another that does not feature restaurant reviews. After our participants visited one restaurant review post, they answered our questionnaire. We conducted an online survey on 206 participants to test our research model. Results show that 1) the effect of relevance between post and blog type on message credibility, which is users' trust toward restaurant reviews, is not greater when posts are consistent with the theme of a blog. 2) Among users who are over 30 years old, relevance between post and blog type moderates the relationship between media skepticism, which is users' feeling of mistrust toward blog, and belief in expertise, that is, users' belief that the review post provides sufficient restaurant information. 3) Users' perceived value of the restaurant review post mediates the relationship between users' belief in the expertise in a post and users' intention to seek additional information.

On Extracting a Community in the Blog World (블로그 월드를 위한 커뮤니티 추출 방안)

  • Jung-Hwan Shin;Sang-Wook Kim;Seok-Ho Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.283-285
    • /
    • 2008
  • 블로그 월드에는 동일한 주제와 관련된 포스트들에 공통적으로 관심을 보이는 블로거들이 존재한다. 본 논문에서는 이러한 블로거들의 집합을 블로그 커뮤니티(blog community)라 정의한다. 블로그 커뮤니티는 타겟 마케팅, 양질의 정보 공유, 블로그 월드의 활성화 등 다양한 블로그 비즈니스 정책을 수립하는데 활용될 수 있다. 그러나 블로그 커뮤니티는 카페 등과 달리 멤버쉽으로 운영되는 집단이 아니기 때문에 커뮤니티에 속하는 멤버를 쉽게 파악할 수 없다. 본 논문에서는 주어진 주제와 관련된 블로그 커뮤니티를 추출하는 효과적인 방법을 제안한다. 먼저, 주어진 주제에 대한 시드 포스트들을 선택하고, 이 시드 포스트들을 통해서 주제와 관련된 블로거들을 선택한다. 다음으로, 선택된 블로거들을 통해서 주제와 관련된 포스트들을 선택한다. 위와 같은 과정을 반복해 나가면서 블로그 월드에 존재하는 주어진 주제와 관련된 모든 블로거들을 선발한다. 실제 블로그 데이터를 이용한 실험을 통하여 제안하는 방법의 우수성을 검증하였다.

Post Ranking Algorithms in Blog Environment (블로그 환경을 위한 포스트 랭킹 알고리즘)

  • Hwang, Won-Seok;Do, Young-Joo;Bae, Duck-Ho;Kim, Sang-Wook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.189-193
    • /
    • 2008
  • 블로그는 개인의 생각을 온라인상의 문서인 포스트로 남기는 일종의 개인 홈페이지이다. 웹 문서와 포스트는 다른 특징을 가지고 있기 때문에 웹 문서 랭킹 알고리즘을 포스트에 적용하기에는 문제점이 존재한다. 본 논문에서는 포스트의 랭킹을 위한 포스트-블로거 그래프를 정의하고, 기존의 웹 문서 랭킹 알고리즘을 포스트-블로거 그래프에 적합하게 변형한 포스트 랭킹 알고리즘을 제안한다. 그리고 실제 블로그 데이터를 통하여 포스트 랭킹 알고리즘의 성능을 분석하고, 이를 바탕으로 블로그에 적합한 포스트 랭킹 알고리즘을 선별한다.

  • PDF

Extraction of Latent Topic-based Communities in Blogspace (블로그 월드에서 주제 중심의 잠재적 커뮤니티 추출 방안)

  • Shin, Jung-Hwan;Yoon, Seok-Ho;Kim, Sang-Wook;Park, Sun-Ju
    • Journal of KIISE:Databases
    • /
    • v.37 no.1
    • /
    • pp.56-69
    • /
    • 2010
  • In blogspace, there are posts that deal with a common topic and bloggers that are interested in these posts. In this paper, we define a blog community as a group of these bloggers and posts. With a blog community, we can establish various business policies for target marketing, sharing high quality data, and mobilizing the activities in the blogspace. Unlike internet cafes, bloggers participate in blog communities without explicit membership. So, it is not easy to identify the members of a community. In this paper, we propose an effective approach for extracting a blog community that is related to a given topic. First, we choose seed posts that is highly related to a given topic, and select bloggers that are related to the topic with the seed posts. Then, we select posts that are related to the topic with the selected bloggers. By repeating this, we find all the posts and bloggers that are members of the community related to a given topic in blogspace. We verify the superiority of the proposed approach by analyzing extracted blog communities.

Post Ranking in a Blogosphere with a Scrap Function: Algorithms and Performance Evaluation (스크랩 기능을 지원하는 블로그 공간에서 포스트 랭킹 방안: 알고리즘 및 성능 평가)

  • Hwang, Won-Seok;Do, Young-Joo;Kim, Sang-Wook
    • The KIPS Transactions:PartD
    • /
    • v.18D no.2
    • /
    • pp.101-110
    • /
    • 2011
  • According to the increasing use of blogs, a huge number of posts have appeared in a blogosphere. This causes web surfers to face difficulty in finding the quality posts in their search results. As a result, post ranking algorithms are required to help web serfers to effectively search for quality posts. Although there have been various algorithms proposed for web-page ranking, they are not directly applicable to post ranking since posts have their unique features different from those of web pages. In this paper, we propose post ranking algorithms that exploit actions performed by bloggers. We also evaluate the effectiveness of post ranking algorithms by performing extensive experiments using real-world blog data.

Automatic Classification of Blog Posts using Various Term Weighting (다양한 어휘 가중치를 이용한 블로그 포스트의 자동 분류)

  • Kim, Su-Ah;Jho, Hee-Sun;Lee, Hyun Ah
    • Journal of Advanced Marine Engineering and Technology
    • /
    • v.39 no.1
    • /
    • pp.58-62
    • /
    • 2015
  • Most blog sites provide predefined classes based on contents or topics, but few bloggers choose classes for their posts because of its cumbersome manual process. This paper proposes an automatic blog post classification method that variously combines term frequency, document frequency and class frequency from each classes to find appropriate weighting scheme. In experiment, combination of term frequency, category term frequency and inversed (excepted category's) document frequency shows 77.02% classification precisions.

Splog Detection Using Post Structure Similarity and Daily Posting Count (포스트의 구조 유사성과 일일 발행수를 이용한 스플로그 탐지)

  • Beak, Jee-Hyun;Cho, Jung-Sik;Kim, Sung-Kwon
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.2
    • /
    • pp.137-147
    • /
    • 2010
  • A blog is a website, usually maintained by an individual, with regular entries of commentary, descriptions of events, or other material such as graphics or video. Entries are commonly displayed in reverse chronological order. Blog search engines, like web search engines, seek information for searchers on blogs. Blog search engines sometimes output unsatisfactory results, mainly due to spam blogs or splogs. Splogs are blogs hosting spam posts, plagiarized or auto-generated contents for the sole purpose of hosting advertizements or raising the search rankings of target sites. This thesis focuses on splog detection. This thesis proposes a new splog detection method, which is based on blog post structure similarity and posting count per day. Experiments based on methods proposed a day show excellent result on splog detection tasks with over 90% accuracy.

Using Action Occurrence Orders in Blog Post Ranking (블로그 포스트 랭킹을 위한 액션 발생의 순서 활용 방안)

  • Hwang, Won-Seok;Do, Young-Joo;Kim, Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.866-867
    • /
    • 2010
  • 블로그 이용이 활성화됨에 따라 포스트 랭킹 알고리즘의 필요성이 증가하고 있다. 본 논문에서는 액션의 발생 순서를 이용하여 포스트에 랭킹을 부여하는 방법을 제안한다. 또한, 실제 블로그 데이터를 이용한 실험을 통하여 본 논문에서 제안하는 방법의 성능의 우수성을 보인다.

Link-Based Clustering in Blogosphere (블로그 공간에서의 링크 기반 클러스터링 방안)

  • Song, Suk-Soon;Yoon, Seok-Ho;Kim, Sang-Wook
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.46 no.3
    • /
    • pp.42-49
    • /
    • 2009
  • This paper addresses clustering of blogs and posts in blogosphere. First, we model blogosphere as a social network where blogs and posts correspond to nodes and interactions on posts by blogs corresponds to links. Next, for clustering in blogosphere, we employ LinkClus, a link based algorithm that finds clusters of nodes in a network effectively and efficiently. For more accurate clustering, we propose two refinements: (1) change of granularity from blogs to folders, and (2) removal of blogs and posts being highly likely to incur noises. Finally, we verify the effectiveness of the proposed approach by showing how the posts and blogs in the same cluster are similar to one another in terms of their contents.