• 제목/요약/키워드: relevant information retrieval

검색결과 189건 처리시간 0.029초

콘텐트 기반의 이미지검색을 위한 분류기 접근방법 (Image Classification Approach for Improving CBIR System Performance)

  • 한우진;손경아
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.816-822
    • /
    • 2016
  • 콘텐트 기반 이미지 검색은 기존의 태그 또는 레이블이 있는 텍스트 기반의 검색이 아닌 이미지의 특징을 이용하여 검색하는 방법이다. 실생활 이미지 데이터는 태그나 레이블이 달려있는 경우가 많지 않기 때문에 텍스트 기반의 검색 방법을 사용하기 힘든 경우가 있다. 또한, 기존에 주로 사용되는 이미지 특징 벡터의 유사도를 사용하여 검색하는 방법은 추출 벡터의 유사도 기준으로 사용자가 의도한 결과가 나올지 확신할 수 없다. 예를 들어 사용자가 입력한 질의 이미지와 검색된 이미지들의 종류가 일치하는지의 문제가 있다. 본 논문에서는 사용자가 질의 이미지의 클래스를 예상하고 결과도 동일한 클래스를 원한다는 가정에 착안하여 이미지 검색 엔진의 성능을 개선하였다. 기존의 유사도 기반의 검색에 머신 러닝 기법을 사용한 이미지 분류기를 적용하여 질의와 동일한 클래스의 결과를 찾는 방법을 제안하였으며, 그 성능을 20개 카테고리에 속하는 11,530개의 이미지로 구성되어 있는 PASCAL VOC 공개 데이터를 이용하여 검증하였다.

정보검색(情報檢索)에 있어서 용어(用語)의 통계적(統計的) 관련성(關聯性)을 응용(應用)한 클러스터링기법(技法) (A Study on the Clustering Technique Associated with Statistical Term Relatedness in Information Retrieval)

  • Jeong, Jun-Min
    • 정보관리연구
    • /
    • 제18권4호
    • /
    • pp.98-117
    • /
    • 1985
  • 본(本) 논문(論文)에서는 통계적(統計的) 용어조합(用語組合)과 클러스터링기법(技法)에 관한 문헌(文獻)을 간단히 살펴보았다. 선행연구(先行硏究)들로부터 통계적(統計的) 용어조합(用語組合)은 조합기법(組合技法)의 비효율성(非效率性)때문이 아니라 문헌집단(文獻集團)의 이질성(異質性) 때문에 검색(檢索)과 분류(分類)에 적당치 않다는 사실(事實)을 발견(發見)할 수 있다. 그 결과(結果)로부터 정보검색(情報檢索)의 최적화(最適化)를 위한 조합기법(組合技法)으로서 클러스터링과 통계적(統計的) 색인(索引)의 개념(槪念)을 이용(利用)할 수 있다. 본(本) 논문(論文)의 가설(假說)은 클러스터파일내(內)에서 통계적(統計的) 용어조합(用語組合)을 사용(使用)함으로써 정보검색(情報檢索)시스템의 성능(性能)을 상당히 향상(向上)시킬 수 있다는 것이다. 달리말해서, 파일들을 모으고 의미적(意味的)으로 관련(關聯)있는 모든 문헌(文獻)들을 함께 모아줌으로써, 유사조합(類似組合)(spurious association)의 문제(問題)를 상당히 해결(解決)할 수 있을 것이다. 실제적(實際的)으로, 본(本) 논문(論文)에서는 조합기법(組合技法)의 방법론(方法論)을 어떻게 생성(生成)할 수 있을 것인가를 고려했다. 자동용어(自動用語) 상관성(相關性)을 위하여 스타일(stiles)의 조합인자(組合因子)를 이용(利用)했으며 클러스터링 환경(環境)을 위해 커널기법(技法)(kernel method)을 사용(使用)했다.

  • PDF

질의 감성 표시자와 유사도 피드백을 이용한 감성 영상 검색 (Emotion Image Retrieval through Query Emotion Descriptor and Relevance Feedback)

  • 유헌우
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권3호
    • /
    • pp.141-152
    • /
    • 2005
  • 본 논문에서는 새로운 감성기반 영상검색방법을 제안한다. 서로 다른 색상, 명도, 도트크기를 나타내는 30개의 랜덤 패턴이 제시될 때 인간이 느끼는13가지 감성("like", "beautiful", "natural", "dynamic", "warm", "gay", "cheerful", "unstable", "light", "strong", "gaudy", "hard", "heavy") 평가 데이타로부터 질의 칼라코드와 질의 그레이코드로 명명한 질의 감성 표시자를 설계한다. 감성영상검색을 위해서 질의 감성을 선택하면 질의를 표현하는 칼라코드와 그레이코드가 선택되고 데이타베이스의 영상의 색상 정보를 나타내는 DB 칼라코드와 명도와 도트크기 정보를 나타내는 DB그레이코드값을 추출하여, 칼라코드간의 매칭과 그레이 코드간의 매칭을 통해 유사도를 판단한다. 또한 검색과정에 사용자의 의도를 반영하여 질의 칼라코드와 질의 그레이코드사이의 가중치와 칼라코드내의 가중치를 자동적으로 갱신하는 새로운 유사도 피드백 방법을 제안한다. 430개의 영상에 대해 실험한 결과 최초 질의에 대해 적합한 영상이 부적합한 영상보다 많았으며 유사도 피드백을 사용함에 따라 적합한 영상의 개수가 증가하였다.

웹에서의 전거통제:디지털 도서관의 지식조직 시스템(KOS)과 전거 통제 (Authority Control on the Web : Knowledge Organization Systems and Authority Control for Digital Libraries)

  • 윤정옥
    • 정보관리연구
    • /
    • 제33권4호
    • /
    • pp.85-105
    • /
    • 2002
  • 이 연구의 목적은 디지털 도서관에서 지식조직 시스템을 사용함으로써 전통적인 전거 파일의 역할을 확대하여 활용하는 사례를 살펴보는 것이다. 지식조직 시스템은 정보를 조직하고 지식경영을 조장하는 모든 유형의 체계로서 디지털 도서관의 핵심적 요소 중의 하나이다. 다양한 지식조직 시스템은 웹에서 목록과 디지털 자원 사이의 링크를 제공하고 이용자의 정보요구와 자원 사이의 다리 역할을 수행하면서 디지털 콜렉션으로부터 상관된 아이템의 검색을 지원하도록 콘텐츠를 조직한다. 지식조직 시스템이 코드를 전문으로, 객체를 기술 레코드로, 그리고 물리적 객체를 소재와 실물정보로 링크시키기 위하여 어떻게 사용될 수 있는가를 서술하였다.

웹 사이트 구조를 이용한 토픽 검색 연구 (An Experimental Study on Topic Distillation Using Web Site Structure)

  • 이지숙;정영미
    • 정보관리학회지
    • /
    • 제24권3호
    • /
    • pp.201-218
    • /
    • 2007
  • 이 연구에서는 TRBC이 제시한 토픽 검색의 정의에 따라 질의에 적합한 웹 사이트를 검색하는 효과적인 토픽 검색 알고리즘을 제안하고 실험을 통해 그 성능을 평가하였다. 이 연구의 토픽 검색 알고리즘은 먼저 질의에 대한 웹 페이지 검색 결과로부터 적합한 웹 사이트를 선정한 다음, 선정된 사이트의 구조를 이용하여 질의에 대한 적합성 점수를 산출한다. TREC의 .GOV 실험 문헌 집단과 TREC-2004 실험의 질의 및 적합문헌 리스트를 이용한 검색 실험 결과 이 토픽 검색 알고리즘은 상위 10위 안에 최소 2개 이상의 적합 사이트를 검색하여 비교적 높은 수준의 성능을 보였다. 또한 TREC-2004의 적합문헌 리스트 분석을 통해 적합문헌 선정에 토픽 검색의 정의가 엄격하게 적용되지 않은 경우가 있음을 확인하고, 수정된 적합문헌 리스트를 이용하여 토픽 검색 성능을 재평가한 결과 이 연구에서 제안한 토픽 검색 알고리즘의 성능이 월등히 향상되었다.

한국어 정보 검색에서 의미적 용어 불일치 완화 방안 (Alleviating Semantic Term Mismatches in Korean Information Retrieval)

  • 윤보현;박성진;강현규
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3874-3884
    • /
    • 2000
  • 정보검색시스템은 색인어와 질의어가 정확히 일치하지 않더라도 사용자 질의에 적합한 문서를 검색할 수 있어야 한다. 그러나, 색인어와 질의어간의 용어 불일치는 검색성능의 개선에 심각한 장애요소로 작용해 왔다. 따라서, 본 논문에서는 문서 코퍼스의 단어들간에 자동 용어 정규화를 수행하고, 용어 정규화의 산물을 한국어 정보검색 시스템에 적용하는 방안을 제시한다. 용어 불일치를 완화하기 위해 두가지 용어 정규화, 동치부류와 공기단어 클러스터를 수행한다. 첫째, 음역어, 절차오류, 그리고 동의어를 위해 문맥 유사도를 이용하여 동치부류로 구축하는 작업이다. 둘째, 상호정보와 단어 문맥의 조합을 이용하여 단어 유사도를 계산하고 문맥 기반 용어를 정규화한다. 그런 다음, K-means 알고리즘을 이용하여 자율 클러스터링을 수행하고 공기단어 클러스터를 구축한다. 본 논문에서는 이러한 용어 정규화의 산물들을 용어 불일치를 완화하기 위해 질의어 확장과정에서 사용한다. 다시 말해서 동치부류와 공기단어 클러스터는 새로운 용어로 질의를 확장하는 자원으로서 사용된다. 이러한 질의확장으로 사용자는 질의어에 음역어를 추가하여 질의어를 포괄적으로 만들거나 특정어를 추가하여 질의어를 세밀하게 만들 수 있다. 질의어 확장을 위해 두 가지 상호보완적인 방법인 용어 제시와 용어 적합성 피드백을 이용한다. 실험 결과는 제안된 시스템이 의미적 용어 불일치를 완화할 수 있고, 적절한 유사도 값을 제공할 수 있음을 보여준다. 결과적으로 제안한 시스템이 정보 검색 시스템의 검색 효율을 향상시킬 수 있음을 알 수 있다.

  • PDF

지능형 내용기반검색을 이용한 시각정보 자동추출 (Automatic Selection of Visual Information using Intelligent Content-Based Retrieva)

  • 송점동
    • 정보학연구
    • /
    • 제4권2호
    • /
    • pp.69-81
    • /
    • 2001
  • 지능형 기본구조에 의존하는 내용기반 정보검색 시스템을 발전시키기 위한 많은 노력들이 진행중이다. 실세계에 존재하는 상황을 구축하고 유지하며, 동적 지식 표현을 실용화하고, 문맥을 이용하고, 그리고 진보된 추론과 학습능력을 이용하여 실세계에 존재하는 상황을 구축하고 유지하는 능력을 지능이라고 간주하여 이 지능을 채택한 진보된 내용기반 정보검색시스템을 제안하였다. 지능의 이러한 요소들은 인간의 지각과 인지에 정합하는 의미적 수준에서 시각 정보를 검색하기 위한 효과적인 시스템을 만들어내기 위해 필요로 하는 것들이다. 본 논문에서는 인간이 가지고 있는 지능과 인지 심리학, 인공지능, 기호학의 분야에 존재하는 지능시스템의 구축에 관련한 연구들을 조사해 본 후, 기존의 내용기반 정보검색 시스템의 능력을 개선하기 위해 본 논문에서 제안한 멀티미디어 지식 표현 모형인 MMNet을 알아보고, 이것을 이용하여 시각 정보를 자동적으로 추출하기 위한 지능형 내용기반검색시스템 모형을 만들어 보았다.

  • PDF

디지털 도서관에서 사용자 질의어와 컴렉션 사이의 관련성 분포정보를 이용한 컬렉션 융합 (Collection Fusion using Relevance Distribution Information between Queries and Collections in Digital Libraries)

  • 김현주;김상준;배종민;강현석
    • 한국정보처리학회논문지
    • /
    • 제6권10호
    • /
    • pp.2728-2739
    • /
    • 1999
  • This paper proposes an effective fusion algorithm for retrieval results from heterogeneous information sources in federated digital libraries. The algorithm determines the population of documents retrieved from involved information sources for a given query and evaluates the degree of relevance between the query and the population. The evaluated results are used as relevance distribution information for collection fusion. The main informations used for the fusion are relevance distribution among collections, the population size N, and ranking information of relevant documents in their origin. We also present th performance evaluation of the algorithm by developing the prototype of a meta-searcher.

  • PDF

MPEG-7 Homogeneous Texture Descriptor

  • Ro, Yong-Man;Kim, Mun-Churl;Kang, Ho-Kyung;Manjunath, B.S.;Kim, Jin-Woong
    • ETRI Journal
    • /
    • 제23권2호
    • /
    • pp.41-51
    • /
    • 2001
  • MPEG-7 standardization work has started with the aims of providing fundamental tools for describing multimedia contents. MPEG-7 defines the syntax and semantics of descriptors and description schemes so that they may be used as fundamental tools for multimedia content description. In this paper, we introduce a texture based image description and retrieval method, which is adopted as the homogeneous texture descriptor in the visual part of the MPEG-7 final committee draft. The current MPEG-7 homogeneous texture descriptor consists of the mean, the standard deviation value of an image, energy, and energy deviation values of Fourier transform of the image. These are extracted from partitioned frequency channels based on the human visual system (HVS). For reliable extraction of the texture descriptor, Radon transformation is employed. This is suitable for HVS behavior. We also introduce various matching methods; for example, intensity-invariant, rotation-invariant and/or scale-invariant matching. This technique retrieves relevant texture images when the user gives a querying texture image. In order to show the promising performance of the texture descriptor, we take the experimental results with the MPEG-7 test sets. Experimental results show that the MPEG-7 texture descriptor gives an efficient and effective retrieval rate. Furthermore, it gives fast feature extraction time for constructing the texture descriptor.

  • PDF

자료편집기법과 사례기반추론을 이용한 한국종합주가지수 예측 (Prediction of KOSPI using Data Editing Techniques and Case-based Reasoning)

  • 김경재
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.287-295
    • /
    • 2007
  • 본 연구에서는 한국종합주가지수 (KOSPI)의 예측을 위하여 사례기반추론에서의 유전자 알고리즘을 이용한 새로운 자료편집기법을 제안한다. 사례기반추론은 복잡한 문제 해결에서의 편의성과 강점으로 인하여 여러 분야에서 광범위하게 활용되고 있다. 그럼에도 불구하고 사례기반추론은 다른 기계학습기법에 비하여 낮은 예측정확도를 나타내기에 비판을 받아 왔다. 일반적으로 사례기반추론으로부터 성공적인 성과를 도출하기 위해서는 주어진 문제에 유용한 선행 사례를 효과적으로 추출하는 것이 핵심이다. 그러나 사례기반추론 시스템에서 우수한 대응과 추출방법을 설계하는 것은 여전히 논란이 있는 연구 주제이다. 본 연구에서는 사례기반추론 시스템에서 우수한 대응과 추출을 위하여 유전자 알고리즘이 동시에 속성 가중치와 적합한 사례를 선택하는 것을 최적화한다. 본 연구에서는 제안된 모형을 주식시장분석에 응용한다. 실험결과는 유전자 알고리즘 접근법이 사례기반추론에서 유망한 사례편집기법이라는 것을 보여준다.

  • PDF