• 제목/요약/키워드: snippet

검색결과 14건 처리시간 0.023초

연관 피드백과 퍼지 함의 연산자를 이용한 스니핏 추출 방법 (Snippet Extraction Method using Fuzzy Implication Operator and Relevance Feedback)

  • 박선;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.424-431
    • /
    • 2012
  • 정보 검색 시 검색엔진은 사용자에게 웹페이지 순위와 웹페이지의 요약정보를 제공한다. 이중 웹 페이지를 대표 할 수 있는 요약된 정보를 스니핏(snippet)이라한다. 스니핏은 사용자의 웹페이지 방문에 큰 영향을 준다. 정확한 방문 페이지의 정보를 모르고 단지 스니핏 만을 이용할 때에 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 검색엔진에서 지원하는 스니핏에 사용자의 의도를 정확하게 반영하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 연관 피드백과 퍼지 함의 연산자를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 연관 피드백을 이용하여 사용자의 질의를 확장하고, 확장된 질의와 웹 페이지 사이에 퍼지 함의 연산자를 이용하여 질의와 확장된 질의의 포함관계가 반영된 스니핏을 추출함으로써 사용자의 의도를 스니핏에 더 잘 반영할 수 있다. 실험결과에서 제안방법이 다른 방법보다 스니핏 추출에 더 좋은 성능을 보인다.

의사연관 피드백과 퍼지 연관을 이용한 개인화 문서 스니핏 추출 방법 (Personalized Document Snippet Extraction Method using Fuzzy Association and Pseudo Relevance Feedback)

  • 박선;조광문;양후열;이성로
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.137-142
    • /
    • 2012
  • 스니핏(snippet)이란 검색엔진이 사용자에게 제공하는 웹 페이지를 대표할 수 있는 요약된 정보이다. 스니핏은 검색엔진의 페이지 순위와 함께 사용자의 페이지 방문에 큰 영향을 준다. 스니핏을 이용시 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문할 수 있다. 이것은 스니핏을 추출하는 방법이 사용자의 의도를 정확히 이해하는 것이 어렵기 때문이다. 본 논문은 이러한 문제를 해결하기 위해 의사연관 피드백과 퍼지 연관을 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 연관을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비하여서 스니핏 추출에 더 좋은 성능을 보인다.

퍼지와 의미특징을 이용한 스니핏 추출 향상 방법 (Enhancing Snippet Extraction Method using Fuzzy and Semantic Features)

  • 박선;이연우;조광문;양후열;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권11호
    • /
    • pp.2374-2381
    • /
    • 2012
  • 본 논문은 퍼지와 의미특징을 이용한 새로운 스니핏 추출의 성능향상 방법을 제안한다. 제안방법은 문장집합의 의미특징을 이용하여 대표문장을 생성하고, 대표문장과 문장집합의 퍼지관계를 이용함으로써 질의를 잘 나타내는 스니핏을 추출한다. 또한 의사연관 피드백을 이용하여 질의를 확장함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비해서 스니핏 추출에 더 좋은 성능을 보인다.

퍼지를 이용한 스니핏 추출 방법 (Snippet Extraction Method using Fuzzy)

  • 박선;최명수;김정호;김정욱;나희근;최석환;시우 쿠마;이성로
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.387-388
    • /
    • 2012
  • 본 논문은 스니핏을 이용시 가끔 사용자의 의도와는 다른 잘못된 웹 페이지를 방문하는 문제를 해결하기 위해 퍼지를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 연관을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다.

  • PDF

개인화 웹 검색 시스템 기반의 문서 요약 시스템 (A Document Summary System based on Personalized Web Search Systems)

  • 김동욱;강수용;김한준;이병정;장재영
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권3호
    • /
    • pp.357-365
    • /
    • 2010
  • 개인화 웹 검색 시스템은 사용자의 검색의도에 따라 질의어 확장, 검색 결과의 재순위화 등의 방법을 통하여 사용자에게 개인화된 검색 결과를 제공한다. 이를 위해 검색 시스템은 질의어와 사용자의 프로파일 정보를 활용하여 사용자의 검색 의도를 파악하고 분석하여, 검색 결과 페이지에 반영하여 보여주게 된다. 이때 검색 결과 페이지는 문서의 URL과 문서의 제목, 작은 텍스트 조각을 표시한다. 여기서 작은 텍스트 조각은 검색 질의어가 포함된 문서의 요약이며, 스니펫이라고 알려져 있다. 사용자는 이러한 문서의 요약을 통하여 웹 문서가 자신이 원하는 정보를 가진 문서인지를 판단하거나, 해당 URL에 직접 접속하지 않고도 원하는 정보를 얻을 수 있게 된다. 따라서 문서 요약은 사용자가 문서를 볼 것인지 아닌지에 대한 중요한 판단 기준이 되며, 만약 문서 요약 시스템이 개인화된 요약 결과를 제공한다면 사용자의 만족도는 더욱 증가할 것이다. 본 논문은 전체 웹 검색 시스템에서 검색 속도의 큰 하락없이 사용자의 만족도를 증가시킬 수 있는 개인화 문서 요약 시스템을 제안한다.

Document Classification Model Using Web Documents for Balancing Training Corpus Size per Category

  • Park, So-Young;Chang, Juno;Kihl, Taesuk
    • Journal of information and communication convergence engineering
    • /
    • 제11권4호
    • /
    • pp.268-273
    • /
    • 2013
  • In this paper, we propose a document classification model using Web documents as a part of the training corpus in order to resolve the imbalance of the training corpus size per category. For the purpose of retrieving the Web documents closely related to each category, the proposed document classification model calculates the matching score between word features and each category, and generates a Web search query by combining the higher-ranked word features and the category title. Then, the proposed document classification model sends each combined query to the open application programming interface of the Web search engine, and receives the snippet results retrieved from the Web search engine. Finally, the proposed document classification model adds these snippet results as Web documents to the training corpus. Experimental results show that the method that considers the balance of the training corpus size per category exhibits better performance in some categories with small training sets.

개인화 문서를 위한 스니핏 추출 방법 (Snippet Extraction Method for Personalized Document)

  • 박선;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1403-1405
    • /
    • 2012
  • 검색엔진은 사용자에 사이트의 우선순위와 함께 웹 페이지의 요약된 정보인 스니핏(snippet)을 제공한다. 스니핏은 사용자의 검색 사이트 방문에 많은 영향을 주고 있으나, 스니핏의 요약 정보와 사용자가 원하는 사이트 간에 의미 차이가 발생하여서 실제 사용자의 의도와는 다르게 잘못된 사이트에 방문할 수 있다. 본 논문은 의사연관 피드백과 퍼지 관련 곱(fuzzy relational product)를 이용한 새로운 스니핏 추출 방법을 제안한다. 제안방법은 의사연관 피드백을 이용하여 사용자의 질의를 확장학고, 확장된 질의와 웹 페이지 사이에 퍼지 관련 곱을 이용함으로써 사용자의 의도가 의미적으로 더 잘 포함되는 스니핏을 추출할 수 있다. 실험결과 제안방법이 다른 방법에 비하여서 스니핏 추출에 더 좋은 성능을 보인다.

유사 적합성 피드백 기반의 문서 요약 기법을 이용한 효과적인 스니펫 생성 (An Effective Snippet Generation Method using Text Summarization Techniques based on Pseudo Relevance Feedback)

  • 안홍국;고영중;서정연
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.174-181
    • /
    • 2007
  • 정보 검색의 결과로 나타나는 요약문을 스니펫(snippet)이라 한다. 사용자는 자신이 원하는 정보를 얻기 위해 문서를 검색하는데, 이 때 스니펫은 사용자가 원하는 문서를 찾는데 중요한 역할을 한다. 본 논문에서는 정보검색 분야에서 높은 성능을 보이는 유사 적합성 피드백을 자동 문서 요약에 맞게 적용하여 높은 성능의 스니펫 생성 시스템을 구현한다. 우선, 사용자의 질의가 포함된 문장들을 일차적으로 요약 문장 후보로 추출한다. 그리고 추출된 문장 후보로부터 명사들을 질의 후보로 고려한다. 각 문장이 질의의 포함 여부에 따라 문장의 적합성을 판단하게 되고, 유사 적합성 피드백 확률 모델에 적용한 후 질의 후보들의 가중치를 추정하여 가중치 순위를 통해 확장할 질의들을 결정한다. 확장된 질의들과 기존의 질의들의 가중치를 합산하여 각 문장의 순위를 매기게 되고 가장 높은 순위의 문장들이 스니펫으로 제시된다. 논문에서 제안한 기법은 추가적인 핵심 질의들을 자동으로 확장하여 중요한 문장을 추출할 수 있다. 이 연구를 위해서 일반 상용 정보 검색 서비스에서 제공하는 스니펫을 수집하였고 이들의 정확도와 시스템의 정확도를 비교하였다. 실험 결과를 통해 살펴본 제안된 시스템의 성능은 상용 정보 검색기에서 제공되고 잇는 스니펫의 정확도 보다 우수한 성능을 보였다.

  • PDF

3-D High Resolution Ultrasonic Transmission Tomography and Soft Tissue Differentiation

  • Kim Tae-Seong
    • 대한의용생체공학회:의공학회지
    • /
    • 제26권1호
    • /
    • pp.55-63
    • /
    • 2005
  • A novel imaging system for High-resolution Ultrasonic Transmission Tomography (HUTT) and soft tissue differentiation methodology for the HUTT system are presented. The critical innovation of the HUTT system includes the use of sub-millimeter transducer elements for both transmitter and receiver arrays and multi-band analysis of the first-arrival pulse. The first-arrival pulse is detected and extracted from the received signal (i.e., snippet) at each azimuthal and angular location of a mechanical tomographic scanner in transmission mode. Each extracted snippet is processed to yield a multi-spectral vector of attenuation values at multiple frequency bands. These vectors form a 3-D sinogram representing a multi-spectral augmentation of the conventional 2-D sinogram. A filtered backprojection algorithm is used to reconstruct a stack of multi-spectral images for each 2-D tomographic slice that allow tissue characterization. A novel methodology for soft tissue differentiation using spectral target detection is presented. The representative 2-D and 3-D HUTT images formed at various frequency bands demonstrate the high-resolution capability of the system. It is shown that spherical objects with diameter down to 0.3㎜ can be detected. In addition, the results of soft tissue differentiation and characterization demonstrate the feasibility of quantitative soft tissue analysis for possible detection of lesions or cancerous tissue.

의학문서 질의응답을 위한 정답 스닛핏 검색 (Answer Snippet Retrieval for Question Answering of Medical Documents)

  • 이현구;김민경;김학수
    • 정보과학회 논문지
    • /
    • 제43권8호
    • /
    • pp.927-932
    • /
    • 2016
  • 온라인 의학 문서의 폭발적 증가와 함께 질의응답 시스템에 대한 필요성이 늘어나고 있다. 최근에는 기계학습에 기반 한 질의응답 모델들이 다양한 영역에서 좋은 결과를 보여 왔다. 그러나 의학 영역에서 질의응답 모델들은 학습 데이터의 부족으로 인해 여전히 정보 검색 기술에 기반을 두고 있다. 본 논문에서는 다양한 정보검색 기술에 기반 한 의학문서 질의응답용 정답 스닛핏 검색 모델을 제안한다. 제안 모델은 먼저 클러스터 기반 검색 기술을 이용하여 의학 문서로부터 많은 정답 후보 문장을 검색한다. 그리고 다양한 문장 검색 기술들에 기반 한 정답 후보 문장 재순위화 모델을 사용하여 신뢰성 있는 정답 스닛핏을 생성한다. BioASQ 4b 데이터를 이용한 실험에서 제안 모델은 기존 모델보다 좋은 성능(MAP 0.0604)을 보였다.