• 제목/요약/키워드: Fuzzy information retrieval

검색결과 86건 처리시간 0.027초

2단계 퍼지 지식베이스를 이용한 질의 처리 모델 (Query Processing Model Using Two-level Fuzzy Knowledge Base)

  • 이기영;김영운
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.1-16
    • /
    • 2005
  • 웹 기반의 학술분야 전문 검색 시스템은 사용자의 정보 요구 표현을 극히 제한적으로 허용함으로써 검색된 정보의 내용 분석과 정보 습득의 과정이 일관되지 못해 무분별한 정보 제공이 이루어진다. 따라서 본 논문에서는 문서 지식 구조를 파악하여 사용자 질의 용어와 색인어 사이의 내용 기반 유사도를 반영한 순위 재조정 모델을 제안한다. 이를 위해 전자는 시소러스 및 유사관계 행렬을 구축하여 주제 분석 메커니즘을 제공하고, 후자는 사용자 요구를 분석하기 위해 질의 확장 등의 탐색 모형을 수립하는 알고리즘을 제안한다. 따라서 본 논문에서 제안한 알고리즘은 검색 시스템의 정보 구조를 활용한 검색으로 재현율을 유지하면서 동시에 기존 퍼지 검색 모델의 단점인 정확률을 향상시키는 2단계 탐색모형을 수립하는 내용 기반검색 기법이라 할 수 있다.

  • PDF

퍼지 논리를 이용한 사용자 중심적인 Full-Text 검색방법에 관한 연구 (Consideration of a Robust Search Methodology that could be used in Full-Text Information Retrieval Systems)

  • 이원부
    • Asia pacific journal of information systems
    • /
    • 제1권1호
    • /
    • pp.87-101
    • /
    • 1991
  • The primary purpose of this study was to investigate a robust search methodology that could be used in full-text information retrieval systems. A robust search methodology is one that can be easily used by a variety of users (particularly naive users) and it will give them comparable search performance regardless of their different expertise or interests In order to develop a possibly robust search methodology, a fully functional prototype of a fuzzy knowledge based information retrieval system was developed. Also, an experiment that used this prototype information retreival system was designed to investigate the performance of that search methodology over a small exploratory sample of user queries To probe the relatonships between the possibly robust search performance and the query organization using fuzzy inference logic, the search performance of a shallow query structure was analyzes. Consequently the following several noteworthy findings were obtained: 1) the hierachical(tree type) query structure might be a better query organization than the linear type query structure 2) comparing with the complex tree query structure, the simple tree query structure that has at most three levels of query might provide better search performance 3) the fuzzy search methodology that employs a proper levels of cut-off value might provide more efficient search performance than the boolean search methodology. Even though findings could not be statistically verified because the experiments were done using a single replication, it is worth noting however, that the research findings provided valuable information for developing a possibly robust search methodology in full-text information retrieval.

  • PDF

Fuzzy Indexing and Retrieval in CBR with Weight Optimization Learning for Credit Evaluation

  • Park, Cheol-Soo;Ingoo Han
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2002년도 추계정기학술대회
    • /
    • pp.491-501
    • /
    • 2002
  • Case-based reasoning is emerging as a leading methodology for the application of artificial intelligence. CBR is a reasoning methodology that exploits similar experienced solutions, in the form of past cases, to solve new problems. Hybrid model achieves some convergence of the wide proliferation of credit evaluation modeling. As a result, Hybrid model showed that proposed methodology classify more accurately than any of techniques individually do. It is confirmed that proposed methodology predicts significantly better than individual techniques and the other combining methodologies. The objective of the proposed approach is to determines a set of weighting values that can best formalize the match between the input case and the previously stored cases and integrates fuzzy sit concepts into the case indexing and retrieval process. The GA is used to search for the best set of weighting values that are able to promote the association consistency among the cases. The fitness value in this study is defined as the number of old cases whose solutions match the input cases solution. In order to obtain the fitness value, many procedures have to be executed beforehand. Also this study tries to transform financial values into category ones using fuzzy logic approach fur performance of credit evaluation. Fuzzy set theory allows numerical features to be converted into fuzzy terms to simplify the matching process, and allows greater flexibility in the retrieval of candidate cases. Our proposed model is to apply an intelligent system for bankruptcy prediction.

  • PDF

퍼지 K-Nearest Neighbor에 의한 정보검색시스템의 성능 향상 (Performance Improvement of Information Retrieval System using Fuzzy K-Nearest Neighbor)

  • 현우석
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.367-369
    • /
    • 2005
  • 현대인들이 계속 쏟아지는 정보로부터 자신에게 필요한 정보만을 제한된 시간 안에 검색하는 일은 쉬운 일이 아니다. 컴퓨터를 이용하여 제한된 시간 내에 원하는 정보를 검색하고자 하는 정보검색 분야에서는 성능을 향상시키기 위한 연구가 활발히 진행되어 오고 있다. 본 논문에서는 정보검색 시스템의 성능을 향상시키고자 퍼지 K-Nearest Neighbor에 의한 정보검색시스템(IRS-FKNN: Information Retrieval System using Fuzzy K-Nearest Neighbor)을 제안한다. 제안하는 시스템은 기존의 시스템과 비교했을 때 검색결과의 신뢰성을 높이게 되어 시스템의 성능을 향상시키게 되었다.

  • PDF

퍼지관계곱 기반 퍼지정보검색시스템 구현 (Implementation of Fuzzy Information Retrieval System Based on Fuzzy Relational Products)

  • 김창민;김용기
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.115-122
    • /
    • 2001
  • 퍼지관계 개념에 기반한 BK-FIRM(Bandler-Kohout 퍼지정보검색기법)은 형태론에 입각한 기존의 정보검색기법과는 달리 문서와 용어의 상대적 의미에 근거한 퍼지정보검색기법이다. BK-FIRM은 시소러스 자동 구축 기능, 검색 결과의 퍼지화된 우선 순위 제공과 같은 장점을 가지고 있다. 그러나, BK-퍼지정보검색기법은 높은 시간복잡도(time complexity)의 검색 연산을 내재하고 있어 다양한 분야 적용이 불가능하다. 본 논문에서는 축소용어집합을 이용하여 BK-FIRM의 시간복잡도를 낮춘 A-FIRM(개선된 Bandler-Kohout 퍼지정보검색모델)을 소개하고 이를 정보검색시스템으로 설계 및 구현한 A-FIRS(개선된 Bandler-Kohout 퍼지정보검색시스템)를 구현한다. A-FIRS는 크게 문서베이스와 시소러스를 구축하는 전처리부(preprocess unit)와 사용자의 검색요구를 처리하여 문서를 검색하는 실시간처리부(real-time process unit)로 나누어지며, 각 처리부는 기능적 특성에 따라 4개의 처리단계로 구성된다. A-FIRS는 WWW 기반 환경과 연동하도록 설계되었으며, WWW 환경의 사용자로부터 주어진 검색요구를 처리하여 검색결과를 제공한다.

  • PDF

내용기반 영상 검색을 위한 최적의 퍼지측도 (The Optimized Values of Fuzzy Measure for Content-based Image Retrieval)

  • 김동우;송영준;김영길;장언동
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.612-615
    • /
    • 2006
  • 멀티미디어 시대의 도래와 함께 영상 정보의 관리는 중요한 분야로 자리 잡았고, 이러한 영상 정보의 체계적인 관리에 효과적인 내용기반 영상 검색 시스템이 등장하였다. 내용기반 영상 검색은 색상, 질감, 모양의 특징을 이용한다. 오늘날 특징은 한 가지만 사용하기보다는 3가지 특징을 병합하여 사용한다. 기존의 다중 특징을 사용하는 방법들은 가중치를 수동으로 설정하여 검색 과정이 복잡한 단점이 있다. 우리는 이러한 문제점을 퍼지 적분 가중치 할당 방법으로 보완하여 가중치를 자동으로 설정한다. 본 논문에서는 실험에 의해 최적의 퍼지 측도를 구하였다.

  • PDF

퍼지 적분을 이용한 내용기반 영상 검색 (Content- based Image Retrieval using Fuzzy Integral)

  • 김동우;송영준
    • 한국지능시스템학회논문지
    • /
    • 제16권2호
    • /
    • pp.203-208
    • /
    • 2006
  • 멀티미디어 시대의 도래와 함께 영상 정보의 관리는 중요한 분야로 자리 잡았고, 이러한 영상 정보의 체계적인 관리에 효과적인 내용기반 영상 검색 시스템이 등장하였다. 본 논문은 기존의 컬러 히스토그램 방식의 단점인 공간 정보의 부재로 인한 문제점을 특징들의 영역을 할당하여 보완하고, 질감 정보와 모양 정보를 추가하여 정확율을 높인다. 또한 기존의 다중 특징을 사용하는 방법들은 가중치를 수동으로 설정하여 검색 과정이 복잡한 단점이 있다. 우리는 이러한 문제점을 퍼지 적분 가중치 할당 유사도 비교 방법으로 보완하여 가중치를 자동으로 설정하게 한다. 컬러 영상1,000개에 대해 실험한 결과, 퍼지 적분을 사용한 제안 방법이 기존의 방법보다. 정확율과 재현율의 측면에서 보다 우수함을 보인다.

불확정적으로 색인된 이미지 데이터베이스를 개념 기반으로 검색하기 위한 자료형 (A Data Type for Concept-Based Retrieval against Image Databases Indefinitely Indexed)

  • 양재동
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.27-33
    • /
    • 2002
  • 트리플 이미지 색인 기법에는 두 가지 문제점이 있는 데 그 하나는 개념기반 이미지 검색을 지원하지 않는다는 것이고 다른 하나는 이접 레이블링(labeling)이 허용되지 않는다는 점이다. 이 문제점들을 해결하기 위해서 본 논문에서는 불확정적 퍼지 트리플(I-퍼지 트리플)이라는 새로운 이미지 색인 자료 형을 제안한다. I-퍼지 트리플에 의한 이미지 색인 방식에서는 이접 레이블링을 허용하기 때문에, 이미지 내 객체들이 꼭 확정적으로 인식될 필요가 없으며, 또 확정적으로 인식되지 않는 이미지들에 대해서도 개념 기반 이미지 정합이 가능하다. 본 논문에서 제안하는 이접 레이블링은 확장된 폐 세계 가정에 기반을 두고 있으며, 기념 기반 이미지 검색은 퍼지 술어에 의한 정합에 근거를 두고 있다. 본 논문에서는 또한 이접 레이블링에 의해 불확정적으로 색인된 이미지 데이터베이스로부터 원하는 답을 $\alpha$$\in$[0,1]확정도로 구해내는 개념기반 질의 평가 방식도 제안한다.

웨이브릿 계수의 퍼지 동질성과 고주파 에너지를 이용한 영상 검색용 특징벡터 추출 (Visual Feature Extraction for Image Retrieval using Wavelet Coefficient’s Fuzzy Homogeneity and High Frequency Energy)

  • 박원배;류은주;송영준
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.18-23
    • /
    • 2004
  • 본 논문에서는 공간주파수 특성과 다중 해상도 특성을 모두 갖는 웨이브릿 변환을 이용하여 각 대역의 특성에 맞는 비주얼 특징을 추출하고 이를 내용기반 영상 검색에 이용하는 새로운 방법을 제시하였다. 웨이브릿 변환된 영상의 최저주파 대역은 원 영상의 근사한 형태로 공간 정보를 충분히 활용할 수 있다. 이를 위해 웨이브릿 계수값과 각 계수간의 공간 정보를 모두 고려한 퍼지 동질성(FH : Fuzzy Homogeneity)를 이용하여 L개의 특징 벡터를 추출하였고, 나머지 고주파 대역의 에너지 값을 이용하여 3개의 특징 벡터를 추출하여 이를 영상 데이터베이스에 저장한다. 질의 시에는 L개의 FH 벡터 중 가장 크기가 큰 10개의 값과 3개의 고주파 대역의 에너지 값을 이용하여 가장 유사한 영상을 검색하였다. 90개의 텍스쳐 영상을 사용해 실험한 결과 좋은 정확성을 보였다.

  • PDF

의미기반 인덱스 추출과 퍼지검색 모델에 관한 연구 (A Study on Semantic Based Indexing and Fuzzy Relevance Model)

  • Kang, Bo-Yeong;Kim, Dae-Won;Gu, Sang-Ok;Lee, Sang-Jo
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.238-240
    • /
    • 2002
  • If there is an Information Retrieval system which comprehends the semantic content of documents and knows the preference of users. the system can search the information better on the Internet, or improve the IR performance. Therefore we propose the IR model which combines semantic based indexing and fuzzy relevance model. In addition to the statistical approach, we chose the semantic approach in indexing, lexical chains, because we assume it would improve the performance of the index term extraction. Furthermore, we combined the semantic based indexing with the fuzzy model, which finds out the exact relevance of the user preference and index terms. The proposed system works as follows: First, the presented system indexes documents by the efficient index term extraction method using lexical chains. And then, if a user tends to retrieve the information from the indexed document collection, the extended IR model calculates and ranks the relevance of user query. user preference and index terms by some metrics. When we experimented each module, semantic based indexing and extended fuzzy model. it gave noticeable results. The combination of these modules is expected to improve the information retrieval performance.

  • PDF