• 제목/요약/키워드: 스니핏

검색결과 8건 처리시간 0.022초

개인화 문서를 위한 스니핏 추출 방법 (Snippet Extraction Method for Personalized Document)

  • 박선;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1403-1405
    • /
    • 2012
  • 검색엔진은 사용자에 사이트의 우선순위와 함께 웹 페이지의 요약된 정보인 스니핏(snippet)을 제공한다. 스니핏은 사용자의 검색 사이트 방문에 많은 영향을 주고 있으나, 스니핏의 요약 정보와 사용자가 원하는 사이트 간에 의미 차이가 발생하여서 실제 사용자의 의도와는 다르게 잘못된 사이트에 방문할 수 있다. 본 논문은 의사연관 피드백과 퍼지 관련 곱(fuzzy relational product)를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 관련 곱을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비하여서 스니핏 추출에 더 좋은 성능을 보인다.

연관 피드백과 퍼지 함의 연산자를 이용한 스니핏 추출 방법 (Snippet Extraction Method using Fuzzy Implication Operator and Relevance Feedback)

  • 박선;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.424-431
    • /
    • 2012
  • 정보 검색 시 검색엔진은 사용자에게 웹페이지 순위와 웹페이지의 요약정보를 제공한다. 이중 웹 페이지를 대표 할 수 있는 요약된 정보를 스니핏(snippet)이라한다. 스니핏은 사용자의 웹페이지 방문에 큰 영향을 준다. 정확한 방문 페이지의 정보를 모르고 단지 스니핏 만을 이용할 때에 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 검색엔진에서 지원하는 스니핏에 사용자의 의도를 정확하게 반영하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 연관 피드백과 퍼지 함의 연산자를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 연관 피드백을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 웹 페이지 사이에 퍼지 함의 연산자를 이용하여 질의와 확장된 질의의 포함관계가 반영된 스니핏을 추출함으로써 사용자의 의도를 스니핏에 더 잘 반영할 수 있다. 실험결과에서 제안방법이 다른 방법보다 스니핏 추출에 더 좋은 성능을 보인다.

의사연관 피드백과 퍼지 연관을 이용한 개인화 문서 스니핏 추출 방법 (Personalized Document Snippet Extraction Method using Fuzzy Association and Pseudo Relevance Feedback)

  • 박선;조광문;양후열;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.137-142
    • /
    • 2012
  • 스니핏(snippet)이란 검색엔진이 사용자에게 제공하는 웹 페이지를 대표할 수 있는 요약된 정보이다. 스니핏은 검색엔진의 페이지 순위와 함께 사용자의 페이지 방문에 큰 영향을 준다. 스니핏을 이용시 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 스니핏을 추출하는 방법이 사용자의 의도를 정확히 이해하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 의사연관 피드백과 퍼지 연관을 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 연관을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비하여서 스니핏 추출에 더 좋은 성능을 보인다.

퍼지와 의미특징을 이용한 스니핏 추출 향상 방법 (Enhancing Snippet Extraction Method using Fuzzy and Semantic Features)

  • 박선;이연우;조광문;양후열;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2374-2381
    • /
    • 2012
  • 본 논문은 퍼지와 의미특징을 이용한 새로운 스니핏 추출의 성능향상 방법을 제안한다. 제안방법은 문장집합의 의미특징을 이용하여 대표문장을 생성하고, 대표문장과 문장집합의 퍼지관계를 이용함으로써 질의를 잘 나타내는 스니핏을 추출한다. 또한 의사연관 피드백을 이용하여 질의를 확장함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비해서 스니핏 추출에 더 좋은 성능을 보인다.

퍼지를 이용한 스니핏 추출 방법 (Snippet Extraction Method using Fuzzy)

  • 박선;최명수;김정호;김정욱;나희근;최석환;시우 쿠마;이성로
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.387-388
    • /
    • 2012
  • 본 논문은 스니핏을 이용시 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문하는 문제를 해결하기 위해 퍼지를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 연관을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다.

  • PDF

일반적, 영역 의존적 특성을 반영한 감정 자질의 의미지향성 추정 방법 (A Semantic Orientation Prediction Method of Sentiment Features Based on the General and Domain-Dependent Characteristics)

  • 황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-159
    • /
    • 2009
  • 본 논문은 한국어 문서 감정분류를 위한 중요한 어휘 자원인 감정자질(Sentiment Feature)의 의미지향성(Semantic Orientation) 추정을 위해 일반적인 특성과 영역(Domain) 의존적인 특성을 반영하여 한국어 문서 감정분류(Sentiment Classification)의 성능 향상을 얻을 수 있는 기법을 제안한다. 감정자질의 의미지 향성은 검색 엔진을 통해 추출한 각 감정 자질의 스니핏(Snippet)과 실험 말뭉치를 이용하여 추정할 수 있다. 검색 엔진을 통해 추출된 스니핏은 감정자질의 일반적인 특성을 반영하며, 실험 말뭉치는 분류하고자 하는 영역 의존적인 특성을 반영한다. 이렇게 얻어진 감정자질의 의미지향성 수치는 각 문장의 감정강도를 추정하기 위해 이용되며, 문장의 감정 강도의 값을 TF-IDF 가중치 기법에 접목하여 감정자질의 가중치를 책정한다. 최종적으로 학습 과정에서 긍정 문서에서는 긍정 감정자질, 부정 문서에서는 부정 감정자질을 대상으로 추가 가중치를 부여하여 학습하였다. 본 논문에서는 문서 분류에 뛰어난 성능을 보여주는 지지 벡터 기계(Support Vector Machine)를 사용하여 제안한 방법의 성능을 평가한다. 평가 결과, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 3.1%의 성능향상을 보였다.

  • PDF

LiveTwitter: 트위터 기반 핫이슈 검색 시스템 (LiveTwitter: Hot Issue Search system Based on Twitter)

  • 성병기;오진영;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.179-182
    • /
    • 2010
  • 트위터, 페이스북 등의 소설 네트워크가 이슈가 되는 사건에 의견을 표시하는 수단으로 많이 활용되고 있다. 본 논문에서는 이슈 키워드 추출 및 트위터와 유투브에 기반한 실시간 검색 시스템을 구현한다. 본 시스템에서는 가장 최근 신문 기사들의 제목과 스니핏을 이용하여 이슈가 되는 키워드를 실시간으로 추출하여 사용자들에게 보여주고 트위터와 유투브 OpenAPI를 이용하여 추출된 키워드에 대한 컨텐츠들을 실시간으로 사용자들에게 보여준다, 본 시스템을 통해서 이슈가 되는 사건에 대한 실시간 반응을 찾을 수 있다.

  • PDF

감정 단어의 의미적 특성을 반영한 한국어 문서 감정분류 시스템 (A Korean Document Sentiment Classification System based on Semantic Properties of Sentiment Words)

  • 황재원;고영중
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권4호
    • /
    • pp.317-322
    • /
    • 2010
  • 본 논문은 감정단어(Sentiment Word)의 의미적 특성을 반영하여 한국어 문서 감정분류 시스템의 성능을 향상시킬 수 있는 방법을 제안한다. 감정단어는 감정을 가지는 단어를 의미하며, 감정단어들의 집합은 감정자질(Sentiment Feature)로써 감정분류를 위한 중요한 어휘 자원이다. 감정자질은 일반적으로 사용될 때와 특정 영역(Domain)에서 사용될 때에 그 감정 정도의 차이를 가진다. 감정자질이 일반적으로 사용될 때 그 감정 정도는 검색 엔진을 통해 얻을 수 있는 스니핏(Snippet)을 통해 추정할 수 있으며, 특정 영역에서 사용될 때의 감정 정도는 실험 말뭉치를 이용하여 추정할 수 있다. 이렇게 추정된 감정자질의 감정 정도 수치를 의미지향성이라고 하며, 문서내의 문장의 감정 강도를 추정하기 위해 이용된다. 문장의 감정 강도가 추정되면 문장 감정 강도를 감정자질의 가중치에 반영하게 된다. 본 논문은 지지 벡터 기계(Support Vector Machine)를 이용하여 일반적, 영역 의존적, 일반적/영역 의존적 의미지향성을 반영한 경우에 대해 성능을 평가한다. 평가 결과, 앞의 3가지 경우에 모두 성능 향상을 얻었으며 일반적/영역 의존적 의미지향성을 반영한 경우, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 3.1%의 성능 향상을 얻을 수 있었다.