• Title/Summary/Keyword: subtopic mining

Search Result 3, Processing Time 0.029 seconds

Subtopic Mining of Two-level Hierarchy Based on Hierarchical Search Intentions and Web Resources (계층적 검색 의도와 웹 자원을 활용한 2계층 구조의 서브토픽 마이닝)

  • Kim, Se-Jong;Lee, Jong-Hyeok
    • KIISE Transactions on Computing Practices
    • /
    • v.22 no.2
    • /
    • pp.83-88
    • /
    • 2016
  • Subtopic mining is the extraction and ranking of possible subtopics, which disambiguate and specify the search intentions of an input query in terms of relevance, popularity, and diversity. This paper describes the limitations of previous studies on the utilization of web resources, and proposes a subtopic mining method with a two-level hierarchy based on hierarchical search intentions and web resources, in order to overcome these limitations. Considering the characteristics of resources provided by the official subtopic mining task, we extract various second-level subtopics reflecting hierarchical search intentions from web documents, and expand and re-rank them using other provided resources. Terms in subtopics with wider search intentions are used to generate first-level subtopics. Our method performed better than state-of-the-art methods in almost every aspect.

Subtopic Mining from the View of Dependency Structure (의존 구문 구조 관점으로 본 서브토픽 마이닝)

  • Kim, Se-Jong;Lee, Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.294-296
    • /
    • 2012
  • 본 논문은 일본어 웹 문서 말뭉치로부터 의존 구문 구조 관점으로 바라본 단어들의 동시발생(co-occurrence) 정보를 사용하여 서브토픽 마이닝(subtopic mining)을 수행하는 방법론을 제안한다. 우리는 의존 구문 구조를 반영하는 간단한 패턴들을 사용하여 서브토픽들을 추출 및 생성하고, 제안한 수식을 바탕으로 순위화한다. 본 방법론은 기존의 주요 상용 검색 서비스에서 제공하는 연관 검색어 및 추천 검색어를 사용한 방법론보다 좋은 성능을 보였다.

Proposal of the Evaluation Method Based on Query Types and Semantic Relations in Subtopic Mining (질의어의 종류와 의미 관계를 고려한 서브토픽 마이닝 평가 방법 제안)

  • Kim, Se-Jong;Lee, Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.285-287
    • /
    • 2012
  • 서브토픽 마이닝(subtopic mining)이란 사용자 의도를 반영하는 서브토픽을 찾아내고 순위화하는 연구분야이다. 본 논문은 서브토픽 마이닝의 결과를 평가하는 기존 방법의 한계점을 제시하고, 이를 해결하기 위해 질의어의 종류를 고려하여 보다 명확한 의도 항목(intent)의 나열을 유도하고, 질의어와 의도 항목 사이에 'is-a' 및 'part-of' 관계를 적용하여 보다 일관성 있고 의도 항목의 의미적 중복을 최소화하는 평가 방법을 제안하였으며, 평가 대상을 3종류로 구분하여 평가 결과의 활용도를 높였다.