• 제목/요약/키워드: 검색가중치

Search Result 400, Processing Time 0.025 seconds

유즈넷 정보검색시스템에서 단어 가중치 적용방법에 관한연구 (Research of Term-Weighting Method in an Usenet Information Retrieval System)

  • 최재덕;최진석;박민식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (1)
    • /
    • pp.339-341
    • /
    • 1998
  • 다양한 정보교환 수단의 하나인 유즈넷은 방대한 정보량을 가진다. 사용자는 유즈넷에서 필요한 정보를 쉽게 찾지 못하므로 뉴스그룹 전체와 본문에서 정보 검색의 필요성을 인식하고 있다. 이 논문에서는 정보검색시스템을 유즈넷으로 확장시 단어 가중치 적용방법의 개선을 통해 검색효율을 향상시키고자 한다. 정보검색에서 단어의 중요도에 영향을 미치는 tf, idf 이외의 다른 요소인 카테고리빈도(category frequency, cf)를 활용하여 tf*idf방법에 역카테고리빈도(inverted categoary frequency, icf)를 고려한 유사도 계산 방법을 제시하고 이를 검증하였다. 실험 결과에서 상위 30위 내의 평균 적합문서의 수가 tf*{{{{ SQRT {idf$^2$+icf$^2$} }}}}방법이 tf*idf 방법보다 4.6% 향상됨을 알 수 있다.

가중치 칼라 히스토그램을 통한 이미지 검색의 성능평가 (An Evaluation of Image Retrieval used Weighted Color Histogram)

  • 이용환;이유경;이준환;이상범;김영섭
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.397-398
    • /
    • 2006
  • 본 논문에서는 이미지 검색을 위해 가장 기본적인 요소인 이미지 색상에 따른 칼라 분포정보를 이용하고 다양한 요소에 따라 가중치를 부여한 칼라기반의 검색 기술자를 제안하였고 실험적 평가를 통하여 제안 기술자의 성능을 평가하였다. 칼라 히스토그램을 통한 이미지 검색 기술자를 설계하는데 있어 칼라모델은 HSV, 웨이블릿 변환 필터는 D9/7, 웨이블릿 분해는 2 레벨을 적용하였을 때 가장 좋은 검색효율성을 보였다.

  • PDF

연관률 기반 복합어를 이용한 개선된 정보검색 시스템 (Improved Information Retrieval System Using Multi word Based On Association Ratio)

  • 이병희;최종필;박승규;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.163-165
    • /
    • 2004
  • 복합어의 추출은 정보 검색 및 온톨로지 분야의 연구에 있어서 중요한 비중을 차지하고 있다. 이 분야의 연구는 언어학적인 필터링 및 통계적 기법에 기반 한 연구와 최근의 문맥정보 및 사전 점보를 이용하는 기법 등으로 구분될 수 있다. 복합어를 정보 검색 및 온톨로지 분야에 응용하기 위해서는 복합어의 정확한 추출뿐만 아니라 그 복합어가 문서를 표현할 수 있는 정도를 측정하는 기법이 필요하다. 특히 정보검색 분야에서는 추출된 복합어에 대해 어떻게 가중치를 부여할 것인 가가 중요한 문제이다. 본 논문에서는 연관률(Association Ratio)에 기반 하여 복합어를 추출하고, 추출된 복합어에 대친 적절한 가중치를 부여함으로써 검색 시스템의 성능을 향상시킬 수 있는 방법을 제안한다.

  • PDF

XML 태그를 분류에 따른 가중치 결정 (An XML Tag Indexing Method Using on Lexical Similarity)

  • 정혜진;김용성
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.71-78
    • /
    • 2009
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

자동화된 추론을 이용한 퍼지 조건연산자의 비교 분석 (Comparison of Fuzzy Implication Operators using Automated Reasoning)

  • 김용기
    • 한국지능시스템학회논문지
    • /
    • 제5권4호
    • /
    • pp.18-32
    • /
    • 1995
  • 퍼지 정보 검색 기법을 이용한 가중치 선정 전락은,주어진 입력 문제로 부터 가중치의 패턴과 가중치를 자동적으로 선정함으로써, 추론 시간과 공간을 줄인다. 퍼지 가중치 선정 전략은 퍼지 삼각 관계곱 및 퍼지 신속관계 알고리즘을 사용하기 때문에 선택하는 퍼지 조건연산자와 $-cut에 따라서 결론을 추출하는 시간과 추론 단계의 수가 틀린다. 본 논문에서는, 퍼지 정보 검색을 이용한 추론 전략의 조절 방법에 대하여 개괄적으로 보이고, 잘 알려진 블럭 문제에 적용하여 주어진 영역에서 가장 적합한 퍼지 조건연산자와 $-cut을 선정한다.

  • PDF

대용량 멀티미디어 데이터의 효율적인 검색엔진 설계

  • 이광형;민소연
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 춘계학술발표논문집
    • /
    • pp.503-506
    • /
    • 2009
  • 본 논문에서는 대용량 멀티미디어 데이터에 대한 사용자의 다양한 의미검색을 지원하는 비디오 검색 시스템의 설계를 제안한다. 제안하는 시스템은 주석기반검색과 특징기반 검색을 각각의 에이전트를 통하여 자동으로 처리하였다. 먼저 주석기반검색은 사용자의 검색어를 입력하게 되면 가중치를 적용하여 의미를 더욱 구체화 하여 오류율을 최소화 하였으며, 특징기반검색은 주석기반검색에서 선택된 키프레임에 의해 데이터베이스의 영상들과 유사도를 검사하여 검색하였다. 시스템의 구현결과 기본시스템보다 0.5%의 재현율의 향상과 97.8%의 정확률을 나타내었다.

  • PDF

도메인 온톨로지를 이용한 개인화된 개념기반 검색 기법 (A Personalized Concept-based Retrieval Technique Using Domain Ontology)

  • 문현정;이수진;김영지;우용태
    • 한국전자거래학회지
    • /
    • 제12권3호
    • /
    • pp.269-282
    • /
    • 2007
  • 본 논문에서는 도메인 온톨로지를 사용하여 개인화 된 개념 기반의 검색 기법을 제안하였다. 제안 모델은 도메인 온톨로지를 이용한 컨텐츠의 대표 개념 추출, 컨텐츠 가중치와 개념 가중치를 이용한사용자 프로파일 구성 그리고 개인화 된 개념 기반 검색 과정으로 구성된다. 컨텐츠의 대표 개념은 TScore 기법을 이용하여 추출하였고, 사용자 프로파일은 개인 정보 수집 모듈을 통해 개념 가중치가 높은 개념을 대상으로 구성하였다. 개념 기반 검색을 위해 사용자 프로파일의 개념 집합과 컨텐츠의 대표 개념 집합간에 유사도를 비교하여 개인이 선호하는 개념의 우선순위에 의해 컨텐츠를 검색하였다. 본 논문에서 제안한 기법의 효율성을 검증하기 위하여 인터넷 사이트에서 컨텐츠를수집하고사용자프로파일을구성하여 실험하였다. 실험 결과, 제안한 검색기법이 기존의 기반의 검색 기법에 비해 우수함을 보였다. 제안된 기법은 개인화 된 추천 시스템이나 전자 도서관 등과 같은 분야에서 효율적으로 적용할 수 있으리라 기대된다.

  • PDF

문서필터링을 위한 질의어 확장과 가중치 부여 기법 (Query Expansion and Term Weighting Method for Document Filtering)

  • 신승은;강유환;오효정;장명길;박상규;이재성;서영훈
    • 정보처리학회논문지B
    • /
    • 제10B권7호
    • /
    • pp.743-750
    • /
    • 2003
  • 본 논문에서는 문서 필터링을 위한 질의어 확장과 가중치 부여 기법을 제안한다. 문서 필터링은 웹 검색 엔진들에 대한 검색 결과의 정확률 향상을 목적으로 한다. 문서 필터링을 위한 질의어 확장은 개념망, 백과사전, 유사도 상위 10% 문서를 이용하며, 각각의 확장 질의어에 가중치를 부쳐하여 질의어와 문서들간의 유사도를 계산한다. 첫 번째 단계에서 개념망과 백과사전을 이용하여 초기 질의어에 대한 1차 확장 질의어를 생성하고, 1차 확장 질의엉 가중치를 부여하여 질의어와 문서들간의 유사도를 계산한다. 다음 단계에서는 높은 유사도를 갖는 상위 10% 문서들을 이용하여 2타 확장 질의어를 생성하고, 2차 확장 질의어에 가중치를 부쳐하여 질의어와 문서들간의 유사도를 계산한다. 다음으로 1차 유사도와 2차 유사도를 결합하여 문서들을 재순위화하고, 임계치보다 낮은 유사도를 갖는 문서들을 필터링함으로써 웹 검색 엔진들의 검색 결과 정확률을 향상시킨다. 실험에서 이러한 문서 필터링을 위한 질의어 확장과 가중치 부여 기법은 정확률-재현율과 F-measure를 이용하여 성능 평가를 할 때 정보 검색 효율성에서 주목할 만한 성능 향상을 보였다.

가변적인 길이의 특성 정보를 지원하는 특성 가중치 조정 기법 (A Feature Re-weighting Approach for the Non-Metric Feature Space)

  • ;김상희;박호현;이석룡;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권4호
    • /
    • pp.372-383
    • /
    • 2006
  • 이미지 데이타베이스 분야에 대한 다양한 기법들 가운데, 내용 기반 영상 검색 기법 (Content Based Image Retrieval)은 대용량의 영상을 효율적으로 검색하고 탐색할 수 있도록 한다. 기존의 내용 기반 영상 검색 시스템은 사용자가 입력한 질의 이미지에서 낮은 레벨의 특성 (low-level feature)을 추출하고 그에 기반하여 데이타베이스로부터 유사한 영상을 검색한다. 하지만 컴퓨터에서 사용하는 낮은 레벨의 특성은 실제 인간이 영상을 인식하는 방법과 다르게 영상을 인식한다는 단점이 있다. 이러한 단점을 보완하기 위하여 각 특성에 대한 가중치를 적합성 피드백 (relevance feedback)을 통하여 재조정하는 기법이 개발되었다. 기존의 특성 가중치 조정 (feature re-weighting) 기법은 모든 영상에 대하여 특성은 항상 고정된 길이의 벡터 데이타로 표현된다고 가정한다, 이러한 가정을 전제로 하여 기존의 기법은 특성 표현 (feature representation)의 각 부분을 n 차원 공간의 각 축에 할당한다. 하지만 특성 표현 기법의 발전에 따라 가변적인 길이의 벡터로 표현되는 특성이 출현하였으며 이로 인하여 기존의 제한된 길이의 벡터로 표현되는 특성 표현에 기반한 특성 가중치 조정 기법의 유효성은 감소하게 되었다. 본 논문에서는 가변적인 크기의 벡터로 표현되는 특성에 대해서도 특성 가중치를 효과적으로 조정할 수 있는 기법을 제안한다. 본 기법은 특성에 기반하여 계산된 질의 영상과 데이타베이스 내부의 영상간의 거리와 양방향 신뢰구간을 이용하여 특성 가중치를 조정한다. 이 때 각 특성의 거리 계산 방법에 대해서는 제한을 두지 않는다. 또한 각 특성의 표현에 있어서도 고정적인 크기뿐만이 아니라 가변적인 크기의 데이타 역시 사용할 수 있도록 한다. 본 논문에서는 실험을 통하여 제안한 기법의 유효성을 입증하였으며, 다른 연구 결과와의 비교를 통하여 제안한 기법의 성능이 보다 우수함을 보였다.

내용기반 영상 검색을 위한 최적의 퍼지측도 (The Optimized Values of Fuzzy Measure for Content-based Image Retrieval)

  • 김동우;송영준;김영길;장언동
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.612-615
    • /
    • 2006
  • 멀티미디어 시대의 도래와 함께 영상 정보의 관리는 중요한 분야로 자리 잡았고, 이러한 영상 정보의 체계적인 관리에 효과적인 내용기반 영상 검색 시스템이 등장하였다. 내용기반 영상 검색은 색상, 질감, 모양의 특징을 이용한다. 오늘날 특징은 한 가지만 사용하기보다는 3가지 특징을 병합하여 사용한다. 기존의 다중 특징을 사용하는 방법들은 가중치를 수동으로 설정하여 검색 과정이 복잡한 단점이 있다. 우리는 이러한 문제점을 퍼지 적분 가중치 할당 방법으로 보완하여 가중치를 자동으로 설정한다. 본 논문에서는 실험에 의해 최적의 퍼지 측도를 구하였다.

  • PDF