• Title/Summary/Keyword: 검색가중치

Search Result 400, Processing Time 0.025 seconds

질감의존 색 특징을 이용한 내용기반 영상검색 (A Texture-Dependent Color Feature for CBIR)

  • 정재웅;권태완;박섭형
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1819-1822
    • /
    • 2003
  • 내용 기반 영상검색에서 다중 특징을 사용하여 영상을 검색하는 기존의 방법들은 영상에서 특징간의 상관관계를 고려하지 않고 각 특징을 개별적으로 추출하여 검색에 사용한다. 따라서 특징간의 최적의 가중치를 찾아야 하는 문제가 있다. 이 논문에서는 내용기반 영상검색을 위해 색과 질감 특징을 효과적으로 표현할 수 있는 새로운 특징 벡터인 CCE (channel color energy)를 제안한다. 실험을 통하여 제안하는 방법이 정규 가중거리 비교 방법에 비해 우수한 성능을 보이는 것을 확인하였다.

  • PDF

한국어 정보검색 시스템의 성능 향상을 위한 용언 색인 (Predicates Indexing for efficiency improvement in Korean Information Retrieval System)

  • 박진희;박대원;박민식;남현숙;김광영;권혁철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.164-166
    • /
    • 2000
  • 지금까지 대부분의 정보검색 시스템은 명사만을 색인어로 추출하여 사용하였다. 명사는 문서를 대표할 수 있는 어휘 요소이다. 그러나 명사 색인어만 가지고는 문서의 주제를 정확하게 나타낼 수 없다. 본 논문은 명사 색인어와 함께 용언도 색인어로 추출하여 사용하는 한국어 정보 검색시스템을 제시한다. 또한, 용역 색인어와 명사 색인어의 상대적 가중치를 검색에 이용하여 사용자의 질의에 적합한 문서를 검색할 수 있도록 한다. 이러한 과정에서 발견된 문제점은 향후 연구 과제로 계속 향상시켜나갈 것이다.

  • PDF

자동 문서 클러스터링을 위한 디스크립터 추출 방안 (A Method of Descriptor Extraction for Automatic Document Clustering)

  • 윤보현;강현규;고형대
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.230-233
    • /
    • 2000
  • 기존의 검색엔진은 검색결과를 적합도 순서로 나열하여 사용자가 원하는 문서를 찾는데 어려움이 있다. 이러한 문제의 해결책으로 검색결과 문서에 대해 자동 클러스터링을 수행하여 문서 내용이 유사한 문서가 하나의 클러스터내에 존재하도록 한다. 본 논문에서는 검색 결과 문서의 클러스터링에서 필요한 디스크립터 추출 방안을 제안한다. 각 클러스터 내에서 디스크립터를 추출하기 위해 정보검색의 색인과정에서 사용하는 용어 가중치 계산 방법을 이용한다.

  • PDF

일반적, 영역 의존적 특성을 반영한 감정 자질의 의미지향성 추정 방법 (A Semantic Orientation Prediction Method of Sentiment Features Based on the General and Domain-Dependent Characteristics)

  • 황재원;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.155-159
    • /
    • 2009
  • 본 논문은 한국어 문서 감정분류를 위한 중요한 어휘 자원인 감정자질(Sentiment Feature)의 의미지향성(Semantic Orientation) 추정을 위해 일반적인 특성과 영역(Domain) 의존적인 특성을 반영하여 한국어 문서 감정분류(Sentiment Classification)의 성능 향상을 얻을 수 있는 기법을 제안한다. 감정자질의 의미지 향성은 검색 엔진을 통해 추출한 각 감정 자질의 스니핏(Snippet)과 실험 말뭉치를 이용하여 추정할 수 있다. 검색 엔진을 통해 추출된 스니핏은 감정자질의 일반적인 특성을 반영하며, 실험 말뭉치는 분류하고자 하는 영역 의존적인 특성을 반영한다. 이렇게 얻어진 감정자질의 의미지향성 수치는 각 문장의 감정강도를 추정하기 위해 이용되며, 문장의 감정 강도의 값을 TF-IDF 가중치 기법에 접목하여 감정자질의 가중치를 책정한다. 최종적으로 학습 과정에서 긍정 문서에서는 긍정 감정자질, 부정 문서에서는 부정 감정자질을 대상으로 추가 가중치를 부여하여 학습하였다. 본 논문에서는 문서 분류에 뛰어난 성능을 보여주는 지지 벡터 기계(Support Vector Machine)를 사용하여 제안한 방법의 성능을 평가한다. 평가 결과, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우보다 3.1%의 성능향상을 보였다.

  • PDF

퍼지 적분을 이용한 내용기반 영상 검색 (Content- based Image Retrieval using Fuzzy Integral)

  • 김동우;송영준
    • 한국지능시스템학회논문지
    • /
    • 제16권2호
    • /
    • pp.203-208
    • /
    • 2006
  • 멀티미디어 시대의 도래와 함께 영상 정보의 관리는 중요한 분야로 자리 잡았고, 이러한 영상 정보의 체계적인 관리에 효과적인 내용기반 영상 검색 시스템이 등장하였다. 본 논문은 기존의 컬러 히스토그램 방식의 단점인 공간 정보의 부재로 인한 문제점을 특징들의 영역을 할당하여 보완하고, 질감 정보와 모양 정보를 추가하여 정확율을 높인다. 또한 기존의 다중 특징을 사용하는 방법들은 가중치를 수동으로 설정하여 검색 과정이 복잡한 단점이 있다. 우리는 이러한 문제점을 퍼지 적분 가중치 할당 유사도 비교 방법으로 보완하여 가중치를 자동으로 설정하게 한다. 컬러 영상1,000개에 대해 실험한 결과, 퍼지 적분을 사용한 제안 방법이 기존의 방법보다. 정확율과 재현율의 측면에서 보다 우수함을 보인다.

XLinks를 이용한 하이퍼텍스트 검색 시스템 (Hypertext Retrieval System Using XLinks)

  • 김은정;배종민
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.483-494
    • /
    • 2001
  • 일반적인 하이퍼텍스트 검색 모델은 문서와 문서사이의 관계나 링크의 의미를 무시하고, 모든 문서를 독립적인 존재로 간주하여 검색한다. 그러나 하이퍼텍스트 검색 시스템에 있어 링크 정보를 이용하며 검색의 성능을 향상시킬 수 있다. 기존의 링크 기반 하이퍼텍스트 검색 모델은 문서의 색인 과정에서 링크 정보를 무시하고, 검색 결과 집합에 대하여 문서의 우선 순위를 제조정하는데 링크 정보를 활용한다. 이는 링크정보의 활용이 검색 결과 집합의 문서들에만 한정된다는 단점이 있다. 본 논문에서는 링크 정보를 문서의 색인 과정에서 활용한다. 색인 과정에서 링크 정보를 이용하여 문서 내 용어의 가중치와 문서 내 inLinks의 가중치를 정의하고, 이들의 이용하여 문서의 우선 순위를 위한 확장된 RSV 계산식을 제시한다. 실험 결과에서 링크 의미에 따른 검색 조회율과 정확도를 제시하고 기존 링크 기반 검색 모델과의 비교, 분석 결과를 제시한다.

  • PDF

관계성 확률을 이용한 XML 태그의 가중치 결정 (Weight decision of the XML Tag using Relationship Probability)

  • 정혜진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.699-702
    • /
    • 2007
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하거나 HTML 문서 태그의 중요도 결정에 관한 연구들이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그의 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 인용된 문서간의 관계를 알아보고 서로 연관이 있을 확률을 계산하여 그 기대치만큼 색인어에 대한 가중치에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

  • PDF

질의 감성 표시자와 유사도 피드백을 이용한 감성 영상 검색 (Emotion Image Retrieval through Query Emotion Descriptor and Relevance Feedback)

  • 유헌우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.141-152
    • /
    • 2005
  • 본 논문에서는 새로운 감성기반 영상검색방법을 제안한다. 서로 다른 색상, 명도, 도트크기를 나타내는 30개의 랜덤 패턴이 제시될 때 인간이 느끼는13가지 감성("like", "beautiful", "natural", "dynamic", "warm", "gay", "cheerful", "unstable", "light", "strong", "gaudy", "hard", "heavy") 평가 데이타로부터 질의 칼라코드와 질의 그레이코드로 명명한 질의 감성 표시자를 설계한다. 감성영상검색을 위해서 질의 감성을 선택하면 질의를 표현하는 칼라코드와 그레이코드가 선택되고 데이타베이스의 영상의 색상 정보를 나타내는 DB 칼라코드와 명도와 도트크기 정보를 나타내는 DB그레이코드값을 추출하여, 칼라코드간의 매칭과 그레이 코드간의 매칭을 통해 유사도를 판단한다. 또한 검색과정에 사용자의 의도를 반영하여 질의 칼라코드와 질의 그레이코드사이의 가중치와 칼라코드내의 가중치를 자동적으로 갱신하는 새로운 유사도 피드백 방법을 제안한다. 430개의 영상에 대해 실험한 결과 최초 질의에 대해 적합한 영상이 부적합한 영상보다 많았으며 유사도 피드백을 사용함에 따라 적합한 영상의 개수가 증가하였다.

하이퍼 텍스트의 가중치 조절과 링크 구조 분석 기법을 통한 검색 엔진 성능 개선 (Performance Improvement of Information Retrieval System through Weight Adjustment of Hypertext and Link Structure Analysis)

  • 이상호;강승식
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.108-112
    • /
    • 2003
  • 웹 문서의 가장 큰 특징 중 하나는 링크 구조이다. 이 링크들을 이용하여 전체 웹 문서를 커다란 하나의 네트워크로 구성할 수 있으며 이러한 네트워크를 분석함으로써 보다 중요한 문서, 보다 유용한 사이트를 찾아낼 수 있다. 전통적인 검색 모델인 벡터 모델의 성능 개선을 위해 이러한 링크 분석 기법을 활용하여 검색 정확도를 향상시키기 위한 방법을 제안한다. 또한 하이퍼 텍스트는 보다 정확한 키워드를 포함할 확률이 높으므로, 이를 가중치 계산에 적용하여 보다 정확한 결과를 산출한다.

  • PDF

정보검색 모델에서 개념적 거리를 이용한 추론 (Reasoning with Conceptual Distance in an Information Retrieval Model)

  • 김영환;김진형
    • 인지과학
    • /
    • 제2권1호
    • /
    • pp.193-204
    • /
    • 1990
  • 본 논문은 계층적 시소러스를 이용한 정보검색 추론모델을 제안하였다.제안된 모델은 계층적 시소러스를 구성하는 색인어들과 이들의 가중치로써 표현되는 사용자의 질의오와 정보요소 간의 개념적 거리를 계산한다. 사요자질의어에 부울리언 연산자를 사용할 수 있도록 하여 검색 요구의 표현력을 향상시켰고,계층적 시소러스에 에지(edge)가중치를 허용하여 색인어들간의 상관관계를 보다 정확하게 표현할 수 있도록 하였다. 제안한 모델의 성능 평가를 위한 실험 결과, 인간의 적합도 판정과 상당히 유사함을 알 수 있었다.