• Title/Summary/Keyword: 검색 성과

검색결과 5,455건 처리시간 0.04초

확률적 정보 검색 모델에서의 유사 적합성 피드백 실험 (Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model)

  • 조봉현;이창기;안주희;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

확률적 부울(Boolean) 모델과 연관성 학습을 통한 내용기반 영상 검색 성능 향상 (Performance Improvement For Content-Based Image Retrieval Using Probabilistic Bollean Model And Relevance Learning)

  • 고병철;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.556-558
    • /
    • 2001
  • 전체 영상을 이용하지 않고 영상 안에 포함된 특정 객체 혹은 영역만을 이용하는 "영역에 의한 질의(query-by-region)" 방법은 내용기반 영상 검색 중 상위개념의 방법 이지만, 영상 분할의 한계, 여러개로 분할된 영역을 모두 검색하기 위한 인덱싱 문제, 유사성 측정 시 선형적으로 분리되지 않는 특징 값들에 대한 무리한 선형 조합으로 인한 검색 오류와 같은 많은 문제점을 안고 있다. 따라서 본 논문에서는 영역 기반 영상 검색 시스템인 FRIP에 대하여 영상 분할의 한계를 극복하고, 사용자의 주관성을 영상 검색에 적용하기 위해 확률적 연관성 학습 모델(MPFRL)을 유사성 측정 단계에서 적용 하였고, 아울러 검색 모델로는 기존에 일반적으로 사용되어 오던, 선형 모델을 사용하지 않고 선형 모델보다 유연한 검색 결과를 보여주는 확률적 이접 부울 모델(PDB)을 사용하였다. 또한, 검색 시간을 단축 시키기 위해, 선형 검색 방법에 부울 AND 연산자를 적용 시킴으로써, 검색 시간을 상당부분 단축 할 수 있었다. 실험 결과, 본 논문에서 제안하는 방법(MPFRL+PDB)을 사용할 경우 검색 결과가 선형 조합 보다 향상되는 것을 알 수 있었다. 아울러 사용자 피드백을 통해 사용자가 특징 가중치를 일일이 조절하지 않더라도 단순한 몇 번의 클릭만으로 사용자의 주관성을 반영하고 보다 정확한 검색 결과를 보여 줄 수 있는 시스템을 설계 할 수 있었다.

  • PDF

적합성 가중치 검색 및 P-NORM 검색에 관한 연구 -불 논리 검색의 개선을 중심으로- (A Comparative Analysis of the Relevance Weighted Boolean Model and the P-NORM Model: An Improvement on the Boolean Retrieval)

  • 이효숙
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.31-56
    • /
    • 1994
  • 본 연구에서는 검색실험을 통하여 질문 변환에 의한 불 논리 검색, 적합성 가중치 검색, P-NORM 검색에 대해 평가하였다. 적합성 가중치 검색은 질문 변환에 의한 불 논리 검색 및 P-NORM 검색보다 정확률과 검색순위에 있어 효과적이었다. 정보 탐색과정에서 적합성 정보의 이용수준과 용어에 대한 가중치방법은 검색성능에 영향을 주는 것으로 밝혀졌다.

  • PDF

청소년 대상 과학정보시스템의 구축 및 사용성 평가 연구

  • 곽승진
    • 한국문헌정보학회 학술발표논집
    • /
    • 한국문헌정보학회 2004년도 학술발표논집 제17집
    • /
    • pp.61-89
    • /
    • 2004
  • 지식정보자원의 급속한 증가에 따른 정보문제를 보다 효율적으로 해결하기 위해 다양한 기능을 갖춘 검색엔진들이 개발되고 있다. 메타검색은 다른 웹 검색서비스보다 더 포괄적인 검색을 수행할 뿐만 아니라 더욱 안정된 검색 기술로써, 다양한 검색 정보원들에 대한 검색결과를 시스템이 통합하여 제공하기 때문에 검색에 소요되는 시간과 노력이 덜 든다는 점에서 효율적이고 사용하기 용이한 장점이 있다(Selberg 1999). 그러나 이러한 메타검색의 장점에도 불구하고 기존의 연구에서는 많은 이용자들이 각 데이터베이스를 통합하여 검색하는 것보다 개별적으로 검색하고 그 결과를 스스로 통합하는 분리 인터페이스를 더 선호하고 검색결과에 더 만족하였으며, 검색 효율성도 더 높은 것으로 나타나고 있다.(박소연 1999). (중략)

  • PDF

질의분해 적합성 피드백을 이용한 검색시스템의 성능 증진에 관한 연구 (A Study on Improving the Effectiveness of Retrieval System Using Query Splitting Relevance Feedback)

  • 김영천;박병권;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.231-235
    • /
    • 2001
  • 순수한 부울 검색 시스템은 문서와 질의 사이의 유사도를 나타내는 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정보에 따라 정렬할 수 없다. 부울 검색 시스템의 이러한 단점을 보완하는 방법으로 MMM 모델, Paice 모델, P-norm 모델이 개발되었다. 본 논문에서는 높은 검색 효과를 제공하는 질의분해 적합성 피드백(QSRF) 모델을 제안한다. 질의 분해 적합성 피드백 모델의 연산 특성이 MMM, Paice, P-norm 모델보다 우수함을 설명하고, 또한 성능 비교를 통하여 이를 입증한다.

  • PDF

한국어 정보검색 시스템을 위한 다양한 적합성 피드백 방법의 실험 (Relevance Feedback Experiments for Korean Information Retrieval Systems)

  • 박수현;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.682-691
    • /
    • 1999
  • 정보검색 시스템의 검색 효율 향상을 위해서 다양한 적합성 피드백 방법이 개발되었다. 그러나 한국어 정보검색 시스템을 위한 적합성 피드백에 대한 연구는 거의 이루어지지 않은 실정이다. 이 논문에서는 기존에 개발된 적합성 피드백 방법을 한국어 정보 시스템에 적용하여 검색 효율을 비교하고, 새로운 적합성 피드백 방법을 개발 적용하여 기존의 방법들과 검색 효율을 비교분석하였다. 적합성 피드백은 원질의문을 확장할 단어 선택과 선택된 단어 가중치 부여로 이루어진다. 원질의문이 입력되면 검색된 적합문서에서 원질의문을 단어와 밀접한 관계가 있는 단어를 선택하기 위하여 가중치를 부가한후, 원질의문에 추가하여 질의문을 확장한다. 이 논문에서는 원질의문 확장을 위한 단어 선택과 단어 가중치 부여를 위해 3가지 값을 사용한다. 첫째, TF는 적합문서 내의 단어 빈도의 총합이다. 둘째, idf는 해당 문서집단의 역문헌빈도이다. 셋째, r/R은 검색된 적합문서 중에서 해당단어가 있는 적합문서의 비율을 나타낸다. TF와 idf는 정보검색 시스템에서 일반적으로 사용되고있는 값이고 r/R은 이 논문에서 제안한 새로운 값이다.

소셜 관계 랭크 및 토픽기반_소셜 관계 랭크 알고리즘; 소셜 검색을 향해 (SRR(Social Relation Rank) and TS_SRR(Topic Sensitive_Social Relation Rank) Algorithm; toward Social Search)

  • 박건우;정재학;이상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.364-368
    • /
    • 2009
  • "소셜 네트워크(Social Network)와 검색(Search)의 만남"은 현재 인터넷 상에서 매우 의미 있는 두 영역의 결합이다. 이와 같은 두 영역의 결합을 통해 소셜 네트워크 내에서 친구들의 생각이나 관심사 및 활동을 검색하고 공유함으로써 검색의 효율성과 적합성을 높이기 위한 연구들이 활발히 수행되고 있다. 본 논문에서는 일반적인 소셜 관계 랭크(SRR : Social Relation Rank) 및 토픽이 반영된 소셜 관계 랭크(TS_SRR : Topic Sensitive_Social Relation Rank) 알고리즘을 제안한다. SRR은 소셜 네트워크 내에 존재하는 웹 사용자들의 내재적인 특성 및 검색 성향 등에 대한 관련성(또는 유사정도)을 수치로 산정한 '소셜 관계 지수(SRV : Social Relation Value)'에 랭킹(Ranking)을 부여한 것을 의미한다. 제안하는 알고리즘의 검색 적용 가능성을 검증하기 위해 첫째, 웹 사용자간 직접 또는 간접적인 연결로 구성된 소셜네트워크를 구성 한다. 둘째, 웹 사용자들의 속성에 내재된 정보를 이용하여 토픽별 SRV를 산정한 후 랭킹을 부여하고, 토픽별 변화되는 랭킹에 따라 소셜 네트워크를 재구성 한다. 마지막으로 (TS_)SRR과 웹 사용자들의 검색 패턴(Search Pattern)을 비교 실험 한다. 실험 결과 (TS_)SRR이 높은 웹 사용자 간에는 검색 패턴 또한 유사함을 확인 하였다. 결론적으로 (TS_)SRR 알고리즘을 기반으로 관심분야에 연관성이 높은, 즉 상위에 랭크 된 웹 사용자들을 검색하여 검색 패턴을 공유 또는 상속받는 다면 개인화 검색(Personalized Search) 및 소셜 검색(Social Search)의 효율성과 신뢰성 향상에 기여 할 수 있다.

이미지 인지 유형 및 검색질의 방식에 따른 검색 효율성에 관한 연구 (A Study on the Retrieval Effectiveness Based on Image Query Types)

  • 김성희;이근영
    • 한국문헌정보학회지
    • /
    • 제47권3호
    • /
    • pp.321-342
    • /
    • 2013
  • 본 연구에서는 이미지 인지유형 및 질의방식에 따른 검색방법의 효율성을 분석하기 위해 32명의 대학생들이 구글 이미지 검색시스템을 이용하여 검색실험을 실시하였다. 이미지 인지유형은 구체적(specific), 일반적(generic), 추상적(abstract) 유형으로 구분하였으며, 각 유형별 이미지를 텍스트검색, 예제에 따른 검색(QBE: Query by example), 하이브리드검색 등 3가지 질의방식으로 구분하여 실험을 실시하였다. 독립변수는 이미지 인지유형 및 질의방식이며 종속변수는 검색된 적합한 이미지의 수이다. 데이터 분석은 일원배치 분산분석(One-way ANOVA)과 이원배치분석(Two way ANOVA)을 이용하여 검증하였다. 분석결과로는 구체적 이미지와 일반적 이미지 인지유형에서는 텍스트 및 하이브리드 방식이 검색효율성이 높게 나타났고 추상적 이미지 인지유형에서는 QBE이 검색효율성이 높은 것으로 나타났다. 본 연구 결과는 이미지 검색에서 검색효율성을 높이기 위한 방안을 마련하는데 기초자료로 활용될 수 있을 것이다.

블로그 검색을 위한 태그 기반 피드 포스트 랭킹 알고리즘

  • 한승균;이상진;박종헌
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 추계학술대회
    • /
    • pp.623-628
    • /
    • 2007
  • 본 논문은 Web 2.0시대의 새로운 컨텐츠 매체로 각광받고 있는 블로그와 관련하여 태그 기반의 검색 알고리즘을 제안하고자 한다. 최근 블로그 검색과 관련하여 태그 기반의 블로그 검색 서비스가 등장하기 시작했지만, 현재 제공되는 태그 기반의 검색 서비스는 태그의 유무와 컨텐트의 최신성을 주요 기준으로 삼고, 태그와 컨텐트 간의 관련성을 제대로 고려하지 않아 검색 결과가 만존스럽지 못하는 경우가 많다. 따라서 본 논문에서는 태그와 컨텐트와의 관련성을 실수화하고 이를 주요 기준으로 검색 결과의 순위를 결정하는 PTRank 알고리즘을 제안하였다. PTRank 알고리즘에서는 1) 태그가 피드의 제목에 포함되었는지 여부, 2) 태그가 피드의 설명에 나타나는 회수, 3) 태그가 아이템의 제목에 포함되었는지 여부, 4) 태그가 아이템의 설명에 나타나는 횟수, 5) 피드 내에서 태그의 IDF값, 6) 사용자의 검색 행위를 이용해 태그와 컨텐트간의 관련성을 실수화하였다. 실험 결과, PTRank 모델 및 학습 알고리즘이 태그 기반의 피드 검색에서 잘 작동하며 검색에 효과적으로 활용될 수 있다는 것을 알 수 있었다.

  • PDF

구글 검색연산자 활용성 향상을 위한 기능성 Web/App 프로그램 개발 (Development of Functional Web/App Program for Improving Google Search Operator Utilization)

  • 윤경섭;최진혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.181-184
    • /
    • 2020
  • 사용자들은 필요한 자료 검색을 위해서 다양한 포털 사이트를 활용하고 있으며, 현재 구글을 이용한 활용이 증가하고 있다. 그러나 일반적으로 필터링을 위하여 사용자들은 구글에서 제공 되는 검색 연산자의 활용에 어려움을 격고 있다. 검색 연산자를 활용하여 검색의 효율성을 극대화 시켜 불필요한 검색 결과를 필터링하고 원하는 검색 결과를 획득 할 수 있는 효율적인 검색연산자의 사용 방법의 필요성이 제기 된다. 본 논문에서는 이러한 문제를 해결하고자 크롬의 확장 프로그램기능을 이용해서 일반인들이 크롬 환경에서 편히 검색 연산자들을 통해서 검색 결과를 필터링 할 수 있는 크롬 확장 프로그램을 Web/App으로 개발 하였다.

  • PDF