• 제목/요약/키워드: 연관 태그

검색결과 65건 처리시간 0.025초

연관 태그의 군집화를 위한 클러스터링 기법 비교 연구 (A Comparative Study on Clustering Methods for Grouping Related Tags)

  • 한승희
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.399-416
    • /
    • 2009
  • 본 연구에서는 태그 공간에서 정보의 효율적 탐색을 위해 이용자에게 제공될 수 있는 연관 태그 클러스터의 생성을 위해 다양한 유사계수와 클러스터링 기법을 적용한 후 그 결과를 평가하고 비교 분석함으로써 연관 태그의 클러스터링에 가장 적합한 클러스터링 알고리즘을 확인하고자 하였다. Delicious에서 임의의 태그 10개를 대상으로 각각 300개의 문서에서 추출한 연관 태그를 대상으로 태그쌍 간의 연관성을 측정한 후 계층적 기법과 비계층적 기법을 적용하여 생성된 클러스터를 대상으로 클러스터 적합도를 측정한 결과, 일반적으로 용어 클러스터링에서 널리 활용되는 것으로 알려진 워드 기법이 코사인 유사계수와 결합했을 때 거의 모든 실험 대상에 대해 유사한 경향을 보이면서 가장 우수한 성능을 나타내는 것으로 나타났다. 연관 태그 클러스터는 정보관리 측면에서 유사한 합목적성을 갖는 태그끼리 군집을 이루면서 용어의 중의성을 해소함으로써 태그 공간에서의 이용자의 정보 탐색에 유용하게 활용될 것이다.

의미 있는 태그 클러스터 구축을 위한 설계 방안 (A Design of Building a Meaningful Tag Cluster)

  • 박병재;우종우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.658-661
    • /
    • 2008
  • 태깅은 웹 2.0의 핵심 기술 중 하나로, 매우 유연하고 역동적인 분류 체계를 제공한다. 하지만 유연성과 역동성의 확보에 의해 계층 구조나 연관 관계와 같은 태그의 관계성이 부족하거나 존재하지 않는 한계점을 가지고 있는 것 또한 사실이다. 이런 한계점을 보완하기 위한 방법으로 계층 관계를 형성하기 위한 계층 클러스터링 방법과, 연관 관계를 형성하기 위한 협업 필터링 방법이 존재한다. 이 두 가지 방법은 태그의 관계성을 제공하지만, 연관 관계와 계층 관계 중 하나만 제공한다는 단점을 가진다. 본 논문에서는 태그 검색 시 연관 관계뿐 아니라 계층 구조의 탐색을 제공해주기 위한 태그 클러스터링 알고리즘을 설계하였다. 제안한 알고리즘은 사용자 태그셋을 활용하여 태그의 유사성을 계산하는 방법을 제시하고, 기존의 시각화 방법(태그 구름)과 다른 새로운 형태로 시각화 할 수 있는 결과 데이터를 제공한다.

위키피디아 기반의 의미 연관성을 이용한 태깅된 웹 이미지의 검색순위 조정 (Tagged Web Image Retrieval Re-ranking with Wikipedia-based Semantic Relatedness)

  • 이성재;조수선
    • 한국멀티미디어학회논문지
    • /
    • 제14권11호
    • /
    • pp.1491-1499
    • /
    • 2011
  • 오늘날 이미지, 동영상과 같은 멀티미디어 데이터를 웹 공간에 저장하고 검색할 때, 태그를 이용하는 추세는 보편화되어 있다. 본 논문에서는 태깅된 웹 이미지의 검색에서 태그들의 의미적 중요도를 계산하고, 이를 이용하여 검색 순위를 조정하는 시도를 소개한다. 일반적으로 웹상에 저장된 대부분의 사진 이미지들은 실제로는 중요하지 않지만 사용자의 주관적인 판단으로 추가된 태그들을 다수 포함하고 있으며, 이들은 태그의 단순 비교방식으로 이미지를 검색할 때 정확도를 떨어트리는 주요 원인이 된다. 따라서 어떤 이미지에 붙은 수많은 태그들 중에서 의미적으로 보다 중요한 태그들을 찾아내어 검색에 이용한다면 더욱 만족스러운 검색 결과를 얻을 수 있다. 본 논문에서는 위키피디아 기반의 의미 연관성을 활용하여 검색어 또는 다른 태그들과의 의미 연관성이 높은 태그를 해당 이미지의 대표 태그로 판단하고 이를 이용하여 검색 순위를 조정하는 방법을 제안한다. 실험 결과, 방대한 온라인 백과사전인 위키피디아를 이용하여 계산된 의미적 연관성을 이용함으로써 기존의 연구에 비해 향상된 결과를 얻을 수 있었다.

의미적 연관태그와 이미지 내용정보를 이용한 웹 이미지 분류 (Web Image Classification using Semantically Related Tags and Image Content)

  • 조수선
    • 인터넷정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.15-24
    • /
    • 2010
  • 본 논문에서는 대용량 온라인 이미지 공유 사이트를 적용 도메인으로 하여 이미지 검색의 만족도를 높이고자 태그의 의미적 연관성과 이미지 자체의 내용 정보를 결합하는 이미지 분류 방법을 제안한다. 이미지 검색 및 분류 알고리즘이 플리커와 같은 대용량 이미지 공유 사이트에서 활용될 수 있으려면 실제 웹상의 태깅된 이미지를 대상으로 한 적용이 가능해야 한다. 제안된 알고리즘은 'bag of visual word'기반의 이미지 내용으로 웹 이미지를 분류하기 위한 것으로서, 의미적 연관태그를 이용해 일차 검색된 이미지들을 훈련 데이터로 사용하여 카테고리 모델을 훈련하고, PLSA를 적용하여 평가 이미지들을 분류하는 것이다. 제안된 방법으로 플리커의 웹 이미지들을 대상으로 실험한 결과, 태그 정보를 이용한 기존의 방법에 비해 우수한 검색 정확도 및 재현율을 확인할 수 있었다.

HTML 문서의 테이블 식별 (Detecting Tables in HTML Documents)

  • 김연석;이경호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.163-165
    • /
    • 2004
  • HTML의 <TABLE> 태그는 연관된 정보를 기술하기 위한 테이블은 물론이고 웹 문서의 레이아웃을 표현하기 위하여 사용된다 본 논문에서는 웹으로부터 유용한 정보를 추출하기 위한 목적의 일환으로 HTML 문서로부터 테이블을 식별하는 효율적인 방법을 제안한다. 제안된 방법은 전처리와 속성-값 연관관계에 추출의 두 단계로 구성된다. 전처리 단계에서는 진짜 테이블 또는 레이아웃용으로 사용된 <TABLE> 태그의 일반적인 특징을 반영한 규칙을 적용하여 진짜 또는 가짜로 명확히 식별이 가능한 <TABLE> 태그를 추출한다. 속성-값 연관관계 추출 단계에서는 테이블 영역을 속성 및 값 영역으로 구분한 후. 값 영역에 대하여 구문적 일관성 검사를 수행한다 또한 값 영역의 크기가 작아서 구문적 일관성 검사를 수행할 수 없는 경우, 속성-칸 영역의 의미적 일관성을 검사한다. 제안된 방법의 성능을 명가하기 위하여 1,393개의 HTML 문서로부터 추출한 11,477개의 <TABLE> 태그를 대상으로 실험한 결과. 평균적으로 97.54%의 정확률과 99.22%의 재현률을 보여 기존 연구보다 우수하였다.

  • PDF

Web2.0 환경에서의 효율적인 이미지 검색을 위한 태그 클러스터링 시스템의 설계 및 구현 (Design and Implementation of Tag Clustering System for Efficient Image Retrieval in Web2.0 Environment)

  • 이시화;이만형;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제11권8호
    • /
    • pp.1169-1178
    • /
    • 2008
  • 웹 2.0에서 대부분의 정보는 사용자에 의해 생산되고, 사용자가 붙인 태그에 의해 분류되어진다. 현재 태그와 연관된 서비스 및 연구들은 자동 태깅 기법이나 태그 클라우드 구성 기술에 초점이 맞춰 진행되어짐에 따라, 태그에 의해 분류되어진 정보 및 리소스들을 효율적으로 분류하여 사용자에게 제공하는 연구는 미흡한 실정이다. 이에 본 논문에서는 웹상에 산재되어있는 리소스 및 그에 따른 태그 정보들을 수집하여 태그들 간의 연관성에 따라 맵핑하고, 이를 클러스터링하여 검색에 적용하기 위한 시스템을 설계 및 구현하였다. 또한 제안 시스템의 성능평가를 위해 태그 기반 대표사이트인 플리커 사이트의 이미지 검색 결과와의 정확성과 재현율을 비교 평가함으로서 향상된 검색결과를 제시하였다.

  • PDF

웹2.0의 참여형 아키텍쳐 환경에서 그래픽 기반 포크소노미 태그 연관 검색의 설계 및 구현 (Design and Implementation of the Graphical Relational Searching for Folksonomy Tags in the Participational Architecture of Web 2.0)

  • 김운용;박석규
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 최근 인터넷의 급격한 확장을 통해 대두되는 웹2.0 기술은 웹의 구조적 진화인 질적 변화와 사용자 증가라는 양적인 변화로 해석할 수 있으며, 이 구조는 사용자 참여형 아키텍쳐를 근간으로 하고 있다. 블로그, UCC, SNS(Social Networking Service), 매쉬 업, 롱테일 등으로 대표되는 웹2.0기술은 웹의 구조화에 중심적인 역할을 담당하고 있으며, 이곳에 포함된 사용자 참여형 자료의 분류와 검색은 포크소노미(Folksonomy)방식을 통해 널리 이용되고 있다. 포크소노미는 웹 페이지에 공개되고 있는 정보나 관련 주제를 고전적 분류학 기술로 나누는 것이 아니라 꼬리표(태그)에 따라 구분하는 새로운 분류방식으로 사용자 참여로 구성된다. 현재 이러한 분류를 통한 검색은 단순 텍스트 태그검색이나 태그클라우드 방식 등을 통해 특정 태그에 대한 검색이 이루어지고 있으나 태그들 간의 관계를 표현하고, 이들 관계를 고려한 검색은 미비한 실정이다. 이에 본 논문에서는 등록되는 태그들 간의 관계를 고려하여 태그들 간의 연관 그래프를 동적으로 형성하고 이를 기반으로 연관 검색을 제공한다. 이를 통해 태그 검색의 신뢰성을 높이고 검색의 편이성을 제공할 수 있을 것이다.

  • PDF

위키피디아 의미정보를 이용한 태깅된 웹 이미지 검색 (Tagged Web Image Retrieval with Wikipedia Semantic Information)

  • 이성재;조수선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.361-364
    • /
    • 2011
  • 오늘날, 웹 공간에서는 사진과 같은 멀티미디어 자료를 공유하기 위하여 다양한 방법으로 문서의 정보를 표현하고 있다. 이러한 정보를 이용하기 위해 제목, 내용등에서 형태소 분석을 통해 의미가 있는 단어들을 이용하는 경우도 있지만 그 문서 혹은 자료와 관련있는 태그를 기입하고 활용하는 것이 보편화 되어 있다. 본 연구에서는 위키피디아 문서를 이용하여 이미지 태그들 사이의 연관성을 활용하여 이미지 검색 순위를 조정하였다. 약 1000만건의 문서로 이루어진 위키피디아를 이용하여 태그들의 연관성을 계산하였으며, 실험결과 태그 기반의 이미지를 검색 할 때 향상된 결과를 얻을 수 있었다.

Web2.0 환경에서의 Topic Map 생성을 위한 Tag Clustering에 관한 연구 (A Study on Tag Clustering for Topic Map Generation in Web 2.0 Environment)

  • 이시화;무효려;이만형;황대훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.525-528
    • /
    • 2007
  • 기존의 웹서비스가 정적이고 수동적인데 반해 최근의 웹 서비스는 점차 동적이고 능동적으로 변화하고 있다. 이러한 웹서비스 변화의 흐름을 잘 반영하는 것이 웹 2.0이다. 웹 2.0에서 대부분의 정보는 사용자에 의해 생산되고, 사용자가 붙인 태그(tag)에 의해 분류되어진다. 그러나 현재 태그에 관한 서비스 및 연구들은 태깅(tagging) 방법에 대한 연구를 비롯해 이를 표현하기 위한 tag cloud에 초점이 맞춰져 진행됨에 따라, 다양한 태그 정보자원 간의 체계와 연결 관계인 지식체계를 제공하지 못하고 있다. 이에 본 논문에서는 체계화된 지식표현을 위해 웹상에 편재되어 있는 학습 관련 리소스(resources) 및 태그들를 수집한다. 이를 사용자가 요청한 검색 키워드와 연관성이 있는 태그 정보들을 맵핑 및 클러스터링하여 최적화된 표현 형식인 토픽 맵(topic map)화하기 위한 시스템을 제안하며, 이 중 토픽 맵 생성을 위한 초기 연구 단계로서, 연관 태그들 간의 맵핑 및 클러스터링을 위한 알고리즘 제시를 중심으로 소개한다.

  • PDF

웹 2.0을 위한 효율적인 태그 관리 시스템의 설계 및 구축 (A Design and Implementation of Effective Tag Management System for WEB 2.0)

  • 강필구;김남중;이예슬;채진석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (D)
    • /
    • pp.472-476
    • /
    • 2006
  • 웹 2.0이 등장하게 되면서 태그를 사용하는 사람들이 점차 늘어나고 있다. 이렇게 태그를 사용하는 사람이 점차 늘어나게 되면 태그를 효율적으로 관리하는 시스템이 필요하게 된다. 본 논문에서는 태그의 장단점을 알아보고 이를 통해서 태그의 장점을 극대화 하고 태그의 단점을 보안할 수 있는 모델링 방법을 제시하였다. 또한, 대표 태그를 설정하는 방법, 대표 태그를 이용하여 연관 태그를 검색하는 방법에 대한 구현 방안을 제안하였다.

  • PDF