• 제목/요약/키워드: Tag Ranking

검색결과 15건 처리시간 0.019초

태그쌍의 의미유사도 기반 태그 랭킹 시스템 (Tag Ranking System based on Semantic Similarity of Tag-pair)

  • 이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1305-1314
    • /
    • 2013
  • 기존의 태그 기반 시스템들은 콘텐츠에 태깅된 태그들을 활용한 단일 태그 매칭을 통해 검색결과를 제공함에 따라 정확도가 낮은 검색결과를 제공하고 있으며, 또한 사용자들이 콘텐츠에 태깅 시 태그간의 연관관계 및 우선순위는 고려하지 않아 태그가 가지고 있는 콘텐츠와 관련된 정보들을 효율적으로 제공하지 못하고 있다. 이에 본 논문에서는 위의 문제점을 해결하기 위해 태그 기반 시스템에 적합한 태그간 의미 유사도를 추출하여 콘텐츠에 태깅된 태그들을 재 랭킹하기 위한 태그 랭킹 시스템을 제안하였다. 제안 시스템의 성능 평가는 이미지에 태깅된 태그(baseline)와 태그 동시출현 빈도수 기법을 적용한 랭킹(frequency) 결과를 본 논문에서 제안한 태그 랭킹 시스템에 의해 추출된 랭킹 결과와 비교 실험하였다.

소셜 북마킹 시스템에서의 북마크와 태그 정보를 활용한 웹 콘텐츠 랭킹 알고리즘 (A Web Contents Ranking Algorithm using Bookmarks and Tag Information on Social Bookmarking System)

  • 박수진;이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제13권8호
    • /
    • pp.1245-1255
    • /
    • 2010
  • 현재 웹 2.0 환경에서의 핵심 기술 중 하나는 사용자가 관심 있는 웹페이지를 태깅 및 북마킹 하는 소셜 북마킹 기술이다. 소셜 북마킹은 웹 콘텐츠에 태깅된 북마크 정보 및 태깅 결과를 기반으로 검색, 분류, 공유를 통해 효율적인 정보 제공을 주목적으로 하고 있다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하는 방식을 사용하고 있다. 이는 소셜 북마킹 시스템에서 중요한 특징을 가지는 북마크와 태깅 기술을 효율적으로 활용하지 못하는 결과가 된다. 이에 본 연구에서는 태그 클러스터링을 통한 연관 태그 추출에 관한 선행연구를 기반으로, 북마크 정보와 혼합하기 위한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론들과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 북마크와 태그 정보를 함께 활용한 소셜 북마크 시스템이 기존 시스템보다 효율적인 검색결과를 도출하였다.

연관 태그 및 유사 사용자 가중치를 이용한 웹 콘텐츠 랭킹 시스템 (A Web Contents Ranking System using Related Tag & Similar User Weight)

  • 박수진;이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.567-576
    • /
    • 2011
  • 웹 2.0의 발전에 따라 다양한 기술들이 제공되며 그 중 대두되는 기술로 사용자가 관심 있는 웹페이지를 태깅 및 북마킹하는 소셜 북마킹 기술이다. 그러나 현재 소셜 북마킹 시스템들은 웹 콘텐츠의 중요 정보인 다른 사용자들의 관심 정도를 측정할 수 있는 북마크 수 및 검색과 분류를 목적으로 하는 태그 정보를 각각 독립적으로 검색에 활용하며 또한, 다른 사용자들과의 유사도를 반영하지 못하여 소셜 북마킹 시스템의 특징을 반영하지 못한 검색결과를 도출하고 있는 실정이다. 이에 본 연구에서는 선행 연구를 기반으로 태그 클러스터링을 통한 연관 태그 추출 및 북마크 정보와 다른 사용자의 유사도를 혼합한 웹 콘텐츠 랭킹 알고리즘을 제안하였다. 또한 제안 알고리즘의 효율성 분석을 위해 기존 검색 방법론 및 선행 연구의 방법론과의 비교평가를 시행하였으며, 그 결과 본 연구의 핵심적인 특징인 태그 정보 및 북마크 수와 유사도를 활용한 방법이 기존 방법론보다 효율적인 결과를 도출하였다.

Tensor-based tag emotion aware recommendation with probabilistic ranking

  • Lim, Hyewon;Kim, Hyoung-Joo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권12호
    • /
    • pp.5826-5841
    • /
    • 2019
  • In our previous research, we proposed a tag emotion-based item recommendation scheme. The ternary associations among users, items, and tags are described as a three-order tensor in order to capture the emotions in tags. The candidates for recommendation are created based on the latent semantics derived by a high-order singular value decomposition technique (HOSVD). However, the tensor is very sparse because the number of tagged items is smaller than the amount of all items. The previous research do not consider the previous behaviors of users and items. To mitigate the problems, in this paper, the item-based collaborative filtering scheme is used to build an extended data. We also apply the probabilistic ranking algorithm considering the user and item profiles to improve the recommendation performance. The proposed method is evaluated based on Movielens dataset, and the results show that our approach improves the performance compared to other methods.

다차원 인덱스를 위한 벡터형 태깅 연구 (A Vector Tagging Method for Representing Multi-dimensional Index)

  • 정재윤;진현철;김종근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.749-757
    • /
    • 2009
  • 인터넷 사용이 대중화되면서 개인이 정보의 또는 검색할 주제에 따라 원하는 정보에 쉽게 접근할 수 있다. 이때 다양한 구조를 갖는 자료들의 속성을 잘 나타내는 메타데이터를 이용하면 검색의도에 보다 정확하게 부합하는 검색 결과를 얻을 수 있어 다양한 연구가 지속되고 있다. 본 연구는 소그룹의 사용자들이 공동으로 관심 있는 웹 콘텐츠의 즐겨 찾기를 공동으로 유지 관리하는 용도로 다차원 벡터형 태그를 제안한다. 제안하는 벡터형 태그는 정보 유용성을 나타내는 색인을 벡터방식으로 기술하고 이것을 활용해 정보의 분류 관리 재활용의 효율을 높이는 표현법이다. 벡터방식 태깅은 대상 키워드에 사용자들이 두 개 이상의 요소에 대한 우선순위를 부여하고 벡터 방식으로 표현한다. 이 때 벡터의 기본이 되는 벡터공간은 정보생성시간, 선호순위 등으로 구성한다. 벡터성분으로 산출할 수 있는 벡터크기가 정보의 유용성을 나타내며 순위측정의 기준이 된다. 제안방식에 의한 순위측정은 단순한 링크구조에 의해 측정된 순위와 비교하였을 때, 사용자의 검색의도에 부합하는 순위 정보를 제공하고 있다.

Ranking Tag Pairs for Music Recommendation Using Acoustic Similarity

  • Lee, Jaesung;Kim, Dae-Won
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제15권3호
    • /
    • pp.159-165
    • /
    • 2015
  • The need for the recognition of music emotion has become apparent in many music information retrieval applications. In addition to the large pool of techniques that have already been developed in machine learning and data mining, various emerging applications have led to a wealth of newly proposed techniques. In the music information retrieval community, many studies and applications have concentrated on tag-based music recommendation. The limitation of music emotion tags is the ambiguity caused by a single music tag covering too many subcategories. To overcome this, multiple tags can be used simultaneously to specify music clips more precisely. In this paper, we propose a novel technique to rank the proper tag combinations based on the acoustic similarity of music clips.

TextRank를 이용한 키워드 정련 -TextRank를 이용한 집단 지성에서 생성된 콘텐츠의 키워드 정련- (Keywords Refinement using TextRank Algorithm)

  • 이현우;한요섭;김래현;차정원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.285-289
    • /
    • 2009
  • 태그는 콘텐츠를 대표하는 신뢰도가 높은 키워드이다. 하지만 일부 기업과 사람들이 콘텐츠와 관련이 없는 키워드를 태그로 사용하여 본 논문에서는 무분별하게 사용된 키워드를 정련하는 알고리듬을 제안한다. 키워드 정련과 관련된 연구는 진행되지 않았지만, 본 논문에서는 단어와 단어사이에 가상의 링크를 생성, TextRank 알고리듬을 적용하여 콘텐츠에서 단어의 중요도를 계산하여 중요도가 낮은 단어의 일부를 콘텐츠의 제작자가 작성한 키워드에서 제거하여 키워드 정련을 하였다. 그 결과, 단순히 단어의 중요도가 낮은 하위 n%의 단어를 제거하는 방법보다는 신뢰도 구간을 만족할 때까지 제거하는 방법이 훨씬 좋은 키워드 정련 결과를 보였다.

  • PDF

블로그 포스팅을 이용한 방송 콘텐츠 영상의 타임라인 단위 태그 클라우드 생성 (Timeline Tag Cloud Generation for Broadcasting Contents using Blog Postings)

  • 손정우;김화숙;김선중;조기성
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.637-641
    • /
    • 2015
  • 최근 SNS, 블로그 등 사용자 참여형 인터넷 매체가 늘어나면서, 방송 콘텐츠에 대한 사용자의 재생산이 활발히 일어나고 있다. 특히, 드라마와 같은 장르에서는 배우가 착용한 옷, 시계 등에서부터, 자동차, 촬영 장소 등 다양한 종류의 정보들이 블로그를 통해 다른 사용자에게 전달되고 있다. 이러한 정보들은 방송 콘텐츠에 대한 직접적인 부가 정보가 되기 때문에, 이를 활용할 경우 양질의 서비스를 제공할 수 있다. 본 논문에서는 이를 위해, 블로그 포스팅을 이용하여 방송 콘텐츠의 특정 타임라인에 태그 클라우드를 생성하는 기술을 제안한다. 제안한 방법에서는 방송 콘텐츠에 대한 블로그 포스팅을 수집하고, 수집된 포스팅으로부터 이미지 주변 단어를 활용하여 태그 셋을 구축한다. 구축된 태그 클라우드는 방송 콘텐츠 프레임과의 이미지 매칭을 통해 특정 타임라인에 태깅된다. 실험에서는 이미지 매칭의 성능과 생성된 태깅된 태그 클라우드를 보임으로써 제안한 방법의 성능을 입증한다.

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.

사용자 활동과 시간 정보를 적용한 추천 기법에 관한 연구 (A Study on Recommender Technique Applying User Activity and Time Information)

  • 윤소영;윤성대
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.543-551
    • /
    • 2015
  • 인터넷과 모바일 기기의 사용이 보편화되면서 사용자들이 다양한 웹 사이트에서 자신이 원하는 정보를 찾기 위해 검색과 추천을 이용하는 것이 일상화되고 있다. 본 논문에서는 사용자에게 보다 적합한 아이템을 추천하기위해 사용자의 활동과 시간 정보를 적용하여 시간의 흐름에 따른 사용자의 선호도 변화를 반영한 추천 기법을 제안한다. 제안하는 기법은 아이템 선택 시 고려되는 태그 정보를 포함한 데이터를 카테고리별로 분류한 후 시간 변화에 따른 사용자 선호도 변화 정보를 반영한 데이터만을 사용한다. 해당 카테고리를 선호하는 사용자에게는 협업 필터링 기법에 태그 정보를 적용하여 추출한 아이템을 추천하고, 일반 사용자에게는 태그 정보를 사용하여 계산한 순위를 기반으로 아이템을 추천한다. 제안하는 기법은 hetrec2011-movielens-2k 데이터셋을 사용하여 실험하였으며 실험을 통해 제안한 기법이 기존의 아이템 기반, 사용자 기반 기법보다 추천의 정확성과 적합성이 향상되는 것을 확인하였다.