• 제목/요약/키워드: 블로그 포스트

검색결과 37건 처리시간 0.027초

범주별 고유 정보를 고려한 블로그 포스트의 자동 분류 (Automatic Classification of Blog Posts Considering Category-specific Information)

  • 김수아;오성탁;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.11-14
    • /
    • 2015
  • 많은 블로그 제공 사이트는 블로그 포스트 작성자에게 미리 정의된 범주 (category)에 따라 포스트의 주제에 대하여 범주를 선택할 수 있는 환경을 제공한다. 그러나 블로거들은 작성한 포스트의 범주를 매번 수동으로 선택해야 하는 불편함이 있다. 이러한 불편함의 해결을 위해 블로그 포스트를 자동으로 분류해주는 기능을 제공한다면 블로그의 활용성이 증가할 것이다. 기존의 블로그 문서 분류의 연구는 각 범주의 고유 정보를 반영하는 것에 한계가 있었다. 이러한 문제를 해결하기 위해, 본 논문에서는 범주별 고유 정보를 반영한 어휘 가중치를 제안한다. 어휘 가중치의 분석을 위하여 범주별로 블로그 문서를 수집하고, 수집한 문서에서 어휘의 빈도와 문서의 빈도, 범주별 어휘빈도 등을 고려하여 새로운 지표인 CTF, CDF, IECDF를 개발하였다. 이러한 지표를 기반으로 기존의 Naive Bayes 알고리즘으로 학습하여, 블로그 포스트를 자동으로 분류하였다. 실험에서는 본 논문에서 제안한 가중치 방법인 TF-CTF-CDF-IECDF를 사용한 분류가 가장 높은 성능을 보였다.

  • PDF

블로그의 포스트가 블로그의 테마와 관련이 있을 때 항상 더 사용자의 신뢰를 받는가?: 관련성의 정도가 메시지 신뢰성에 미치는 영향 (Do Users Always Trust More when Blog Posts are Related to the Blog's Theme?: The Degree of Relevance and Its Effect on Message Credibility)

  • 김지열;이철
    • 경영정보학연구
    • /
    • 제20권2호
    • /
    • pp.163-188
    • /
    • 2018
  • 검색엔진을 통해서 맛집(레스토랑)에 대한 정보를 찾는 경우 유저들은 맛집을 주제로 한 블로그에 있는 맛집 리뷰 포스트만이 아니라 맛집이 아닌 다른 것들을 주제로 한 블로그에 위치한 맛집 리뷰 포스트에도 방문할 수 있다. 이 연구의 목적은 검색 엔진을 통해 맛집 리뷰 포스트에 방문 했을 때 포스트와 블로그의 주제 사이의 관련성이 해당 맛집 리뷰에 대한 유저의 신뢰에 영향을 미치는지를 알아보는 것이다. 또한, 우리는 유저의 연령이 이 결과에 영향을 미치는 지도 알아보려고 한다. 이 연구를 위해서 우리는 동일한 맛집 리뷰 포스트가 있는 2개의 다른 주제를 가진 블로그들을 제작하였다. 하나는 포스트와 블로그 주제 간의 관련성 높은 맛집을 주제로 한 블로그이고, 다른 하나는 포스트와 블로그 주제 간의 관련성 낮은 맛집을 주제로 하지 않은 블로그다. 실험참가자들은 2개의 그룹으로 나누어져 각각 다른 블로그에 있는 동일한 맛집 리뷰를 방문한 후 설문 조사에 응답했다. 이 연구는 총 206명의 실험 참가자들을 대상으로 한 온라인 설문 조사를 통해 연구를 검증했다. 본 연구의 결과는 1) 리뷰 포스트와 블로그 주제의 관련성의 높고 낮음에 따라서는 두 그룹 간의 메시지 신뢰도(리뷰에 대한 유저의 신뢰)에 큰 차이가 없었으며 2) 30세 이상 유저 그룹에서는, 포스트와 블로그 주제 간의 관련성이 유저의 블로그에 대한 매체 의구심과 전문성(리뷰 포스트가 충분한 레스토랑 정보를 제공한다는 유저의 믿음) 사이의 관계에서 조절 효과를 보였으며 3)맛집 리뷰에 대한 유저의 지각된 가치는 전문성과 추가적인 정보를 검색하려는 의도 간의 관계에서 매개 효과가 있는 것으로 검증되었다.

블로그 월드를 위한 커뮤니티 추출 방안 (On Extracting a Community in the Blog World)

  • 신정환;김상욱;윤석호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.283-285
    • /
    • 2008
  • 블로그 월드에는 동일한 주제와 관련된 포스트들에 공통적으로 관심을 보이는 블로거들이 존재한다. 본 논문에서는 이러한 블로거들의 집합을 블로그 커뮤니티(blog community)라 정의한다. 블로그 커뮤니티는 타겟 마케팅, 양질의 정보 공유, 블로그 월드의 활성화 등 다양한 블로그 비즈니스 정책을 수립하는데 활용될 수 있다. 그러나 블로그 커뮤니티는 카페 등과 달리 멤버쉽으로 운영되는 집단이 아니기 때문에 커뮤니티에 속하는 멤버를 쉽게 파악할 수 없다. 본 논문에서는 주어진 주제와 관련된 블로그 커뮤니티를 추출하는 효과적인 방법을 제안한다. 먼저, 주어진 주제에 대한 시드 포스트들을 선택하고, 이 시드 포스트들을 통해서 주제와 관련된 블로거들을 선택한다. 다음으로, 선택된 블로거들을 통해서 주제와 관련된 포스트들을 선택한다. 위와 같은 과정을 반복해 나가면서 블로그 월드에 존재하는 주어진 주제와 관련된 모든 블로거들을 선발한다. 실제 블로그 데이터를 이용한 실험을 통하여 제안하는 방법의 우수성을 검증하였다.

블로그 환경을 위한 포스트 랭킹 알고리즘 (Post Ranking Algorithms in Blog Environment)

  • 황원석;도영주;배덕호;김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.189-193
    • /
    • 2008
  • 블로그는 개인의 생각을 온라인상의 문서인 포스트로 남기는 일종의 개인 홈페이지이다. 웹 문서와 포스트는 다른 특징을 가지고 있기 때문에 웹 문서 랭킹 알고리즘을 포스트에 적용하기에는 문제점이 존재한다. 본 논문에서는 포스트의 랭킹을 위한 포스트-블로거 그래프를 정의하고, 기존의 웹 문서 랭킹 알고리즘을 포스트-블로거 그래프에 적합하게 변형한 포스트 랭킹 알고리즘을 제안한다. 그리고 실제 블로그 데이터를 통하여 포스트 랭킹 알고리즘의 성능을 분석하고, 이를 바탕으로 블로그에 적합한 포스트 랭킹 알고리즘을 선별한다.

  • PDF

블로그 월드에서 주제 중심의 잠재적 커뮤니티 추출 방안 (Extraction of Latent Topic-based Communities in Blogspace)

  • 신정환;윤석호;김상욱;박선주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권1호
    • /
    • pp.56-69
    • /
    • 2010
  • 블로그 월드에는 동일한 주제와 관련된 포스트들과 이 포스트들에 공통적으로 관심을 보이는 블로거들이 존재한다. 본 논문에서는 이러한 블로거들과 포스트들의 집합을 블로그 커뮤니티로 정의한다. 블로그 커뮤니티는 타겟 마케팅, 양질의 정보 공유, 블로그 월드의 활성화 등 다양한 블로그 비즈니스 정책을 수립하는데 활용될 수 있다. 블로그 커뮤니티는 카페 등과 달리 멤버십으로 운영되는 집단이 아니기 때문에 커뮤니티에 속하는 멤버를 쉽게 파악할 수 없다. 본 논문에서는 주어진 주제와 관련된 블로그 커뮤니티를 추출하는 효과적인 방법을 제안한다. 먼저, 주어진 주제에 대한 시드 포스트들을 선택하고, 이 시드 포스트들을 통해서 주제와 관련된 블로거들을 선택한다. 다음으로, 선택된 블로거들을 통해서 주제와 관련된 포스트들을 선택한다. 이와 같은 과정을 반복해 나가면서 블로그 월드에 존재하는 주어진 주제와 관련된 블로거들과 포스트들을 선발한다. 본 논문에서는 추출된 블로그 커뮤니티 주제의 정확도를 측정함으로써 제안하는 방법의 우수성을 검증하였다.

스크랩 기능을 지원하는 블로그 공간에서 포스트 랭킹 방안: 알고리즘 및 성능 평가 (Post Ranking in a Blogosphere with a Scrap Function: Algorithms and Performance Evaluation)

  • 황원석;도영주;김상욱
    • 정보처리학회논문지D
    • /
    • 제18D권2호
    • /
    • pp.101-110
    • /
    • 2011
  • 블로그의 사용량이 증가함에 따라 다수의 포스트들이 블로고스피어 내에 작성되고 있으며, 이는 검색에서 웹 서퍼가 양질의 포스트를 찾기 어렵게 하는 문제를 가져왔다. 이로 인하여 포스트 검색에서 랭킹을 부여하기 위한 랭킹 알고리즘의 필요성이 부각되고 있다. 기존에 웹 문서를 위한 다양한 랭킹 알고리즘들이 있었으나, 웹 문서와 포스트의 차이로 인하여 직접 적용하기 어렵다는 문제점이 존재한다. 본 논문에서는 블로거들이 포스트에 남긴 블로그 액션을 이용하여 포스트에 랭킹을 부여하는 방안인 포스트 랭킹 알고리즘들을 제안한다. 그리고 실제 블로그 데이터를 이용하여 포스트 랭킹 알고리즘들의 성능을 분석하고, 이를 바탕으로 블로그에 적합한 포스트 랭킹 알고리즘을 선별한다.

다양한 어휘 가중치를 이용한 블로그 포스트의 자동 분류 (Automatic Classification of Blog Posts using Various Term Weighting)

  • 김수아;조희선;이현아
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권1호
    • /
    • pp.58-62
    • /
    • 2015
  • 대부분의 블로그 사이트에서는 미리 정의된 분류 체계에 따른 내용 기반 분류 환경을 제공하고 있으나, 작성된 포스트의 분류를 수동으로 선택해야하는 번거로움 때문에 대부분의 블로거들은 포스트에 대한 분류를 입력하지 않고 있다. 본 논문에서는 블로그 포스트의 자동 분류를 위해 블로그 사이트에서 분류별 문서를 수집하고 수집된 분류별 문서의 어휘빈도와 문서빈도, 분류별 빈도 등의 다양한 어휘 가중치 조합하여 블로그 포스트의 특성에 적합한 가중치 방식을 찾고자 한다. 실험에서는 본 논문에서 제안한 TF-CTF-IECDF를 어휘 가중치로 사용한 분류 모델이 77.02%의 분류 정확률을 보였다.

포스트의 구조 유사성과 일일 발행수를 이용한 스플로그 탐지 (Splog Detection Using Post Structure Similarity and Daily Posting Count)

  • 백지현;조정식;김성권
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.137-147
    • /
    • 2010
  • 블로그는 웹과 로그의 합성어로, 개개인의 생각이나 관심사 등을 일기처럼 기록할 수 있는 웹 서비스이다. 블로그에는 문자 외에, 그림이나 비디오 파일 등 다양한 컨텐츠를 올릴 수 있다. 일반적으로 블로그의 포스트는 시간상의 역순으로 정렬되어 표현된다. 블로그 검색 엔진은 웹 검색 엔진처럼 블로그를 대상으로 사용자의 질의에 따라 정보를 찾아주는 서비스이다. 블로그 검색 엔진은 때때로 만족스럽지 못한 결과를 내곤 하는데, 이것은 스플로그라고 불리는 블로그 스팸에 의해 발생한다. 스플로그는 다른 블로그나 웹 페이지를 무단 도용하거나 자동으로 생성된 컨텐츠로 구성된 스팸 포스트를 가지고 있다. 스플로그는 검색 엔진의 검색 순위를 높이거나, 회원 가입 사이트로 보다 많은 사람들을 유치하기 위해 사용된다. 본 논문은 스플로그 탐지를 목적으로 한다. 본 논문에서 제안하는 스플로그 탐지 기법은 블로그 포스트의 구조 유사성과 일일 포스트 발행수에 따른 분석으로 토대로 이루어진다. 본 논문에서 제안하는 기법을 바탕으로 한 실험의 결과, 스플로그 탐지에 있어 90% 이상의 높은 정확도를 가지며, 만족할만한 수준을 보여준다.

블로그 포스트 랭킹을 위한 액션 발생의 순서 활용 방안 (Using Action Occurrence Orders in Blog Post Ranking)

  • 황원석;도영주;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.866-867
    • /
    • 2010
  • 블로그 이용이 활성화됨에 따라 포스트 랭킹 알고리즘의 필요성이 증가하고 있다. 본 논문에서는 액션의 발생 순서를 이용하여 포스트에 랭킹을 부여하는 방법을 제안한다. 또한, 실제 블로그 데이터를 이용한 실험을 통하여 본 논문에서 제안하는 방법의 성능의 우수성을 보인다.

블로그 공간에서의 링크 기반 클러스터링 방안 (Link-Based Clustering in Blogosphere)

  • 송석순;윤석호;김상욱
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.42-49
    • /
    • 2009
  • 본 논문에서는 블로그 공간에 존재하는 블로거와 포스트들을 클러스터링하고자 한다. 먼저 블로그 공간의 블로거와 포스트들을 각각 하나의 타입으로, 블로거와 포스트 사이의 액션을 링크로 사상한다. 다음으로, 블로그 공간의 클러스터링을 위하여 블로그 환경에 가장 적합하고 효율적인 링크 기반 클러스터링 방법인 LinkClus를 선택한다. 정확한 클러스터링을 위하여 두 가지 방법을 제시한다. 첫 번째는 클러스터의 대상을 여러 주제에 관심을 가지는 블로거 대신 하나의 주제만을 나타내는 폴더로 한다. 두 번째는 노이즈의 발생 가능성을 높이는 링크가 아주 적은 블로거와 포스트를 클러스터링 과정에서 제외시킨다. 실험을 통하여 제안하는 방안을 이용한 클러스터링 결과가 내용적으로도 유사한지 검증한다.