• 제목/요약/키워드: 검색 성능 평가

검색결과 777건 처리시간 0.035초

공간유사도와 XML을 이용한 이미지 검색기법 (Image Retrieval scheme using Spatial Similarity and XML)

  • 이수철;황인준
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.1063-1068
    • /
    • 2002
  • 공간 관계는 이미지나 멀티미디어 데이터를 검색하기 위한 시스템에서 오브젝트들을 표현하는데 중요한 요소이다. 본 논문에서는 기존의 검색 방식과 다르게 이미지에 있는 여러 오브젝트들간의 공간 관계와 각 오브젝트들이 가지고 있는 특징을 이용한 새로운 방식의 이미지 데이터 검색기법을 제안한다. 이것은 질의와 데이터베이스 내에 있는 이미지들간의 유사성을 효율적으로 계산하는데 유용하다. 또한 각 오브젝트의 공간정보와 특징들에 대한 정보들이 XML형태로 주석 처리되어 있기 때문에 이전 검색 기법보다 정확도가 높다. 마지막으로 제안한 검색기법을 이용한 이미지 검색 시스템을 구현하여, 실제 데이터를 검색함으로써 성능을 평가하였다.

  • PDF

한국어 테스트 컬렉션 HANTEC의 확장 및 보완 (Extension and Validation of Hangul Text Collection(HANTEC))

  • 김지영;장동현;맹성현;이석훈;서정현;김현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.210-215
    • /
    • 2000
  • HANTEC1.0은 12만 건의 문서집합과 30개의 질의집합, 그리고 각 질의에 대한 적합문서로 구성된 정보검색용 한글 테스트 컬렉션이다. 본 연구에서는 HANTEC1.0의 확장 및 보완하기 위해 과학기술분야 20개의 질의를 추가하였는데, 질의 추가를 위해서 일본 NACSIS 테스트 컬렉션의 질의를 번역하여 사용함으로써 한일 교차언어 검색환경을 조성하고자 하였다. 추가된 각 질의에 대해서는 여러 검색기에서 총 41가지 검색방법으로 검색한 후, 각 검색조합의 상위 50개 문서로 구성된 중간 결과집합을 만들었으며, 이를 대상으로 적합성판정에 대한 평가기준 및 절차 교육이 이루어진 평가자가 각 질의에 대한 적합성평가를 실시하였다 이렇게 구축된 HANTEC 테스트 컬렉션의 적합문서 집합의 객관적 품질 평가와 시스템 성능평가를 위하여 통계적인 방법을 적용하므로써 공신력있고 일반화된 테스트 컬렉션을 구축하고자 하였다. 현재 HANTEC2.0은 검색분야 연구자 및 개발자에게 자유롭게 배포 중이며 정보검색 시스템의 신뢰도 측정을 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용되어질 것이다.

  • PDF

주제분류 기반의 개인화 검색시스템에 관한 연구 (A Study on Personalized Search System Based on Subject Classification)

  • 김광영;곽승진
    • 한국문헌정보학회지
    • /
    • 제45권4호
    • /
    • pp.77-102
    • /
    • 2011
  • 본 연구의 목적은 이용자의 자신의 성향 정보에 맞는 정확한 검색결과를 제공하기위한 개인화 검색시스템을 설계, 구현, 평가하는 것이다. 이를 위해서 주제 분류와 하이브리드기반의 이용자 프로파일을 구성하였다. 제안한 개인화 검색시스템의 성능 평가를 위해서 전문가들이 직접 국내과학기술 DB의 논문의 적합성을 판별하기위해서 MRR, MAP과 사용성 평가를 측정하였다. 그 결과 전문가가 직접 "컴퓨터공학"과 "문헌정보학" 분야에서 평가한 국내과학기술논문 결과에서도 제안한 개인화 검색시스템이 일반 검색시스템보다 정확도가 더 높았다. 특히 중의성을 가진 키워드 부분에서 더 높은 정확도를 보였다. 질적 평가인 심층면담을 통한 평가에서도 개인화 검색시스템이 이용자가 선호하는 문서들을 우선적으로 제공함으로써 정보검색 시간 및 정보 획득에 용이하다고 응답하였다. 또한 다양한 추천 시스템을 제공함으로써 새로운 정보 탐색에 도움이 된다하였으며, 개인화 검색시스템이 일반 검색시스템보다 이용자의 만족도가 높음을 알 수 있었다. 따라서 본 연구에서 전문가 직접 평가 결과 모두 제안한 개인화 검색시스템이 일반 검색시스템보다 더 높은 효율성을 제공하는 것을 입증하였다.

자동색인기 성능시험을 위한 Test Set 개발 (A Development of the Test Set for Estimating the Retrieval Performance of an Automatic Indexer)

  • 김성혁;서은경;이원규;김명철;김영환;김재군
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.81-102
    • /
    • 1994
  • 다양한 정보를 신속, 정확하게 제공할 수 있는 정보검색시스템은 선진국에서 일찍이 개발되어 현재 우리나라에서도 한국어 데이타베이스를 검색할 수 있는 정보검색시스템이 실험적으로 또는 상업적으로 개발되고 있다. 이에 따라 개발된 시스템의 실행 가능성 테스트 (feasibility test)가 계속 부수적으로 수행되어 왔으나 평가 테스트들의 객관성 부족으로 인하여 개발된 정보검색시스템의 성능 또한 논쟁이 되어왔다. 이에 본 연구는 한국어 정보검색시스템과 자동색인기의 객관적인 성능평가를 위하여 실험 데이타 컬렉션을 개발하였다. 실험데이타 컬렉션은 정보과학회논문지, 한국정보과학회 1993 proceedings, 정보관리학회지에 수록된 1,053개의 논문으로 구성되었다. 입력된 모든 데이타는 국문 및 영문 저자, 서명, 서지사항, 초록, 분류번호, 색인어 등 18개의 access point를 지니며, 한국어 문헌 set 구축이외에 test set과 관련된 질의문을 작성하였고 질의문에 해당하는 적합문헌을 제시해 주었다.

  • PDF

문헌 클러스터링 결과의 성능 평가 방법에 관한 비교 연구 (A Comparative Study on Performance Evaluation of Document Clustering Results)

  • 김정하;이재윤
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.45-50
    • /
    • 2000
  • 자동분류나 정보검색에 활용되는 문헌 클러스터링 결과의 성능을 평가하는 방법에는 여러가지가 있다. 본 논문에서는 제시된 몇 가지 평가방법의 개념과 특징에 대해 알아본다 학술논문 초록 집합인 KTSET과 신문기사 집합인 KFCM-CL을 대상으로 각각 유사계수를 변화시켜가며 클러스터링한 결과에 대해 각 평가방법을 적응해본 후, 특징과 문제점을 살려 보았다.

  • PDF

국가기록포털 검색 품질 개선을 위한 파일럿 시스템 구축 및 실효성 검증 (Construction of Pilot System to Improve Search Quality in National Archives of Korea Portal and Effects Validation)

  • 소현기;염경록;오효정
    • 한국기록관리학회지
    • /
    • 제23권2호
    • /
    • pp.117-135
    • /
    • 2023
  • 국가기록원에서는 국민에게 소장하고 있는 공공기록물에 대한 접근점을 제공하기 위해 국가기록포털이라는 대국민 검색서비스를 운영 중이다. 그러나 지속적으로 검색 결과에 대한 이용자 만족도가 낮다는 의견들이 수렴되고 있으며, 그와 더불어 포털 이용률도 감소하고 있는 추세이다. 본 연구는 이러한 상황을 극복하기 위해 수행한 국가기록포털 검색서비스 품질 점검 연구의 후속 연구로, 국가기록포털의 문제점을 규명하고 그에 따른 개선안을 제안하고, 나아가 그 실효성을 검증하는 것을 목표로 한다. 선행된 품질 평가를 통해 국가기록포털의 주요 문제점으로 검색 도구의 저조한 성능, 검색 결과의 일관성 결여, 기본검색 기능 부재를 비롯한 6가지 문제점을 도출하였으며 이에 대한 개선방안을 규명했다. 제안한 방안의 실효를 검증하기 위해 이 중에서 현실적으로 당장 도입 가능한 방안을 적용한 파일럿 시스템을 구축, 국가기록포털과 검색 성능 비교를 수행하였다. 평가 결과, 파일럿 시스템 검색 도구의 정확률, 재현율, MRR 모든 측면에서 유의미한 상승을 확인하였으며 그 효과를 입증하였다.

다중 쓰레드 환경에서 웹 크롤러의 성능 분석 (Performance Analysis of Web-Crawler in Multi-thread Environment)

  • 박정우;김준호;이원주;전창호
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제39차 동계학술발표논문집 16권2호
    • /
    • pp.473-476
    • /
    • 2009
  • 본 논문에서는 다중 쓰레드 환경에서 동작하는 웹 크롤러를 구현하고 성능을 분석한다. 이 웹 크롤러의 특징은 검색시간을 단축하기 위하여 크롤링, 파싱 및 페이지랭킹, DB 저장 모듈을 서로 독립적으로 다른 작업을 수행하도록 구현한 것이다. 크롤링 모듈은 웹상의 데이터를 수집하는 기능을 제공한다. 그리고 파싱 및 페이지랭크 모듈은 수집한 데이터를 파싱하고, 웹 페이지의 상대적인 중요도를 수치로 계산하여 페이지랭크를 지정한다. DB 연동 모듈은 페이지랭크 모듈에서 구한 페이지랭크를 데이터베이스에 저장한다. 성능평가에서는 다중 쓰레드 환경에서 쓰레드 수와 웹 페이지의 수에 따른 검색 시간을 측정하여 그 결과를 비교 평가한다.

  • PDF

긍정/부정 비대칭도를 이용한 소수상품평의 검색 (Retrieving Minority Product Reviews Using Positive/Negative Skewness)

  • 조희련;이종석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권3호
    • /
    • pp.121-128
    • /
    • 2015
  • 소수 의견을 포함하는 온라인 상품평은 긍정 또는 부정 일변도인 상품평에서는 찾기 어려운 유익한 정보를 내포하기도 한다. 본 논문에서는 주어진 상품평 집합 속에서 소수상품평을 검색하는 방법을 제안한다. 제안방법은 개별 상품평을 먼저 긍정/부정 상품평으로 자동분류한 뒤, 주어진 상품평 집합의 긍정/부정 상품평의 비대칭도를 계산하여 소수상품평을 검색한다. 소수상품평 검색에서는 긍정/부정 자동분류 성능이 소수상품평 검색성능에 영향을 주는데, 본 논문에서는 도메인에 특화된 감성사전과 그렇지 않은 일반적인 감성사전을 가지고 상품평을 긍정/부정으로 감성분류한 뒤 비대칭도를 계산하여 소수상품평 검색성능을 비교한다. 스마트폰과 영화를 다룬 온라인 영문 상품평에 대하여 도메인에 특화된 감성사전을 가지고 소수상품평 검색성능을 평가한 결과, F1점수는 각각 24.6%와 15.9%였고, 정확도는 각각 56.8%와 46.8%였다. 이는 스마트폰과 영화의 개별 상품평 긍정/부정 분류 정확도가 각각 85.3%와 78.8%일 때의 성능이다. 본 논문에서는 또 긍정/부정 자동분류 성능이 주어졌을 때의 이론적인 소수상품평 검색성능에 대해서도 논의한다.

기획 - Text Mining을 이용한 영문 특허텍스트 DB의 텍스트 경제성 및 피검색성을 평가하는 기법에 관한 연구

  • 김현태
    • Patent21
    • /
    • 통권89호
    • /
    • pp.2-15
    • /
    • 2010
  • 본 연구보고서는 Text Mining 가법을 기반으로 영문 특허텍스트 DB를 구성하는 텍스트 (Text) 부분의 경제성 및 피검색성을 정량적으로 평가하는 모델을 제시하고, 이를 바탕으로 2차 가공된 영문 특허텍스트 DB의 성능을 일정범위 내에서 관리하는 품질관리모델의 개발 가능성을 탐색하는데 그 목적이 있다.

  • PDF

MPEG-2 AAC를 위한 허프만 디코더 구현기법에 관한 연구 (A novel method of Huffman decoding for MPEG-2 AAC)

  • 정종훈;김병일;장태규
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.477-480
    • /
    • 2001
  • 본 논문에서는 허프만 코딩의 기본 원리인 이진트리로부터 생성된 효율적인 일차원 검색테이블 구성과, 프로세싱 효율을 증가시키기 위한 수치연산 기법의 도입을 통하여 도출된 효율적인 허프만 디코딩 방법을 제시한다. 제안된 방법에서는 허프만 코드화 된 비트스트림으로부터 읽어 들인 비트 데이터를 직접 이진트리를 검색하기 위한 주소연산에 적용함으로써, 기존의 이진트리 검색을 위하여 수행되던 비교 및 분기문의 제거를 가능토록 하였다. 본 논문에서 제안하는 허프만 디코딩 기법은 기존의 비교 및 분기구분에 의하여 수행되던 허프만 디코딩 기법대비 30%이상의 검색속도 증가 및 이진트리 방식의 검색을 수행하기 위하여 필요로 하는 검색테이블에서 존재하던 데이터 및 노드간의 연결주소를 저장하기 위하여 사용되던 메모리 공간을 효율적으로 제거할 수 있는 일차원 검색테이블을 구성함으최써, 기존 방법대비 1/3의 메모리 공간만을 사용하도록 하였다. 제안된 허프만 디코딩 기법의 성능평가를 위하여 MPEG-2 AAC의 허프만 디코더에 적용한 결과 기존의 순차검색방법에 의한 디코딩 기법대비 198%의 성능향상 결과를 확인할 수 있었다.

  • PDF