• 제목/요약/키워드: semantic retrieval

검색결과 396건 처리시간 0.032초

의미적 연결 관계에 기반한 전자 카탈로그 검색용 유사도 척도 (A New Similarity Measure for e-Catalog Retrieval Based on Semantic Relationship)

  • 서광훈;이상구
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권6호
    • /
    • pp.554-563
    • /
    • 2007
  • 전자 상거래의 발달과 함께 B2B Market Place의 등장과 통합으로 전자 상거래의 중심 단위인 전자 카탈로그의 양도 급증하고 있다. 이러한 전자 카탈로그의 정보의 질적, 양적 증가는 상품 정보 검색의 난이도를 높이고 있다. 특히, 대량 거래를 하는 상품 전문가의 의사 결정을 위해 단일 분류 체계가 아닌 다양한 분류체계 내에서의 상품 정보 검색을 지원하는 시스템의 필요성이 증가하고 있다. 하지만 기존의 검색 시스템은 일반 문서 검색 시스템이 대다수이며, 이러한 전자 카탈로그의 특성을 반영하지 못하고 있어 이를 지원하기에는 한계가 있다. 따라서 본 논문에서는 전자 카탈로그가 지니고 있는 속성적, 어휘적인 특성을 반영하고 의미적 연결관계에 기반한 검색을 통하여 해당 요구 사항을 충족시킬 수 있는 시스템의 토대를 마련하고자 하였다. 이를 위해, 전자 카탈로그의 특징을 반영한 전자 카탈로그 기본 모델을 제시하고, 검색을 결과 제시를 위한 유사도 평가 요소를 도출하였으며, 정확성 향상을 위해 이를 어휘적 특성을 고려한 데이타 확장 모델 및 어휘 기반 유사도 평가 요소로 확장하였다. 그리고 제시한 모델을 통해 의미적 연결 관계에 기반한 전자 카탈로그 유사도 평가 함수를 제시하고 이를 전자 카탈로그 정보 검색시스템으로 구현하고 검증하였다.

온톨로지 기반 대학정보 검색 시스템의 설계 및 구현 (Implementation and Design of College Information Retrieval System Based On Ontology)

  • 박종훈;김철원
    • 한국정보통신학회논문지
    • /
    • 제16권2호
    • /
    • pp.296-301
    • /
    • 2012
  • 오늘날 효과적인 정보검색을 위해 지능형 검색에 대한 다양한 기법들을 사용하고 있다. 이중에서 효과적인 검색 방법은 온톨로지 기술을 적용하는 것이다. 온톨로지는 시맨틱웹에서의 핵심기술이라 할 수 있다. 시맨틱웹에서 온톨로지 기술은 간단하면서 정확하게 추론엔진을 통하여 관련 정보를 검색하는데 사용될 수 있다. 본 논문에서는 대학, 대학원, 구성원을 중심으로 정보를 검색할 수 있는 온톨로지 기반 대학정보검색 시스템을 설계 및 구현을 하고자 한다. 대학, 대학원, 구성원 정보들의 계층구조를 수집하였으며, 온톨로지 개발도구인 protege 에디터를 이용하였다. 대학정보를 온톨로지로 설계하기 위해 설계된 대학정보 온톨로지를 protege 에디터의 추론기능을 이용하여 검증하였으며, 검증된 온톨로지는 지나 추론엔진을 적용하여 웹서비스 할 수 있도록 대학정보검색 시스템을 구현하였다.

정보검색 성능 향상을 위한 단어 중의성 해소 모형에 관한 연구 (Improving the Retrieval Effectiveness by Incorporating Word Sense Disambiguation Process)

  • 정영미;이용구
    • 정보관리학회지
    • /
    • 제22권2호
    • /
    • pp.125-145
    • /
    • 2005
  • 이 연구에서는 문헌 및 질의의 내용을 대표하는 주제어의 중의성 해소를 위해 대표적인 지도학습 모형인 나이브 베이즈 분류기와 비지도학습 모형인 EM 알고리즘을 각각 적용하여 검색 실험을 수행한 다음 주제어의 중의성 해소를 통해 검색 성능의 향상을 가져올 수 있는지를 평가하였다. 실험문헌 집단은 약 12만 건에 달하는 한국어 신문기사로 구성하였으며, 중의성 해소 대상 단어로는 한국어 동형이의어 9개를 선정하였다. 검색 실험에는 각 중의성 단어를 포함하는 18개의 질의를 사용하였다. 중의성 해소 실험 결과 나이브 베이즈 분류기는 최적의 조건에서 평균 $92\%$의 정확률을 보였으며, EM 알고리즘은 최적의 조건에서 평균 $67\%$ 수준의 클러스터링 성능을 보였다. 중의성 해소 알고리즘을 통합한 의미기반 검색에서는 나이브 베이즈 분류기 통합 검색이 약 $39.6\%$의 정확률을 보였고, EM 알고리즘 통합 검색이 약 $36\%$의 정확률을 보였다. 중의성 해소 모형을 적용하지 않은 베이스라인 검색의 정확률 $37\%$와 비교하면 나이브 베이즈 통합 검색은 약 $7.4\%$의 성능 향상률을 보인 반면 EM 알고리즘 통합 검색은 약 $3\%$의 성능 저하율을 보였다.

시맨틱 웹을 이용한 분산 시각미디어 검색 프레임워크 아키텍쳐 (Distributed Visual Media Retrieval Framework Architecture Using Semantic Web)

  • 손영수;양명미;김정선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.136-138
    • /
    • 2004
  • 대부분의 Ontology를 이용한 이미지 검색 시스템들은 중앙 집중적(Centralization)으로 구성되어 있어, 단일, 소수의 이미지 제공자의 특화된 Semantic기반의 이미지 검색을 제공한다. 이에 반해 간단한 구조물 가진 메타데이터 기반의 분산 이미지 검색 시스템들은 이미지 제공자들의 자율성을 보장하기 용의 하지만, Semantic 기반의 이미지 검색을 제공하지 못한다. 본 논문은 위 시스템들의 단점들을 극복하기 위해 다양한 이미지 제공자들의 자율성을 보장하면서, Semantic 기반의 이미지 검색을 지원하는 프레임워크의 아키텍쳐를 제안한다.

  • PDF

The Concept and Application Methods of Intelligent Content

  • Yoon Yong-Bae;Chae Song-Hwa;Kim Won-Il
    • International Journal of Contents
    • /
    • 제2권3호
    • /
    • pp.1-5
    • /
    • 2006
  • Intelligent Content is defined as detailed information or fragment of content which contains a semantic data structure. This semantic structure makes possible to do various intelligent operations. There are wide range of content-oriented applications such as classification, retrieval, extraction, translation, presentation and question-answering. The concept of Intelligent Content is applied to various fields like MPEG and Semantic Web. In this paper, we discuss the several important researches of Intelligent Content and how to apply this conception to these fields.

  • PDF

Learning Similarity with Probabilistic Latent Semantic Analysis for Image Retrieval

  • Li, Xiong;Lv, Qi;Huang, Wenting
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권4호
    • /
    • pp.1424-1440
    • /
    • 2015
  • It is a challenging problem to search the intended images from a large number of candidates. Content based image retrieval (CBIR) is the most promising way to tackle this problem, where the most important topic is to measure the similarity of images so as to cover the variance of shape, color, pose, illumination etc. While previous works made significant progresses, their adaption ability to dataset is not fully explored. In this paper, we propose a similarity learning method on the basis of probabilistic generative model, i.e., probabilistic latent semantic analysis (PLSA). It first derives Fisher kernel, a function over the parameters and variables, based on PLSA. Then, the parameters are determined through simultaneously maximizing the log likelihood function of PLSA and the retrieval performance over the training dataset. The main advantages of this work are twofold: (1) deriving similarity measure based on PLSA which fully exploits the data distribution and Bayes inference; (2) learning model parameters by maximizing the fitting of model to data and the retrieval performance simultaneously. The proposed method (PLSA-FK) is empirically evaluated over three datasets, and the results exhibit promising performance.

의미적 언어자원을 활용한 과학기술정보 검색 서비스 개선 (Improvement of Science and Technology Information Retrieval Service using Semantic Language Resource)

  • 조민희;최성필;최호섭;윤화묵
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.570-574
    • /
    • 2006
  • 현재 한국과학기술정보연구원의 과학기술정보 포털 서비스는 방대한 전문용어를 포함한 문서를 서비스하고 있으므로 포괄적인 질의어만으로는 사용자의 의도를 반영한 검색 결과를 얻을 수 없다. 따라서 본 연구에서는 의미적 언어자원으로 알려진 사용자 어휘지능망(U-WIN)의 동의어, 유의어, 관련어, 하위어, 상위어 관계 정보를 활용하여 검색어 자동 추천, 관련 단어 제시, 질의어 확장 등을 서비스에 반영하는 사용자 중심의 검색 서비스 요소를 제안한다. 이러한 어휘지능망의 의미 관계 정보를 활용한 서비스 요소를 통해 현재의 과학기술정보서비스의 검색 만족도를 향상시키는 동시에 사용자가 요구하는 정보를 빠르고 정확하게 검색할 수 있는 서비스 환경으로 개선시키고자 한다.

  • PDF

시맨틱 검색을 위한 디지털 비디오 라이브러리 구축에 관한 연구 (A Study on Digital Video Library Development for Semantic-Sensitive Retrieval)

  • 장상현;임석종
    • 정보관리연구
    • /
    • 제37권4호
    • /
    • pp.93-104
    • /
    • 2006
  • 디지털 비디오 압축과 인터넷 기술의 발전으로 비디오에 대한 수요가 폭발적으로 늘어나고 있으며, 사용자 제작 콘텐트(UCC)도 대량으로 생산되고 있다. 따라서, 디지털 비디오 라이브러리 구축과 검색에 대한 기술 연구가 어느 때보다 시급하게 요구되고 있다. 그러나 사용자가 전체 비디오의 일부 내용을 의미기반으로 검색해서 보고 싶은 욕망을 충족시켜주기는 매우 어려운 상황이다. 본고에서는 디지털 비디오를 의미 검색하기 위하여 장면을 뽑아내고, 내용을 분석하는 방법을 제안하고, 5개의 스포츠(축구, 야구, 골프, 농구, 배구) 뉴스 비디오를 자동 분류한 실험 결과를 소개하였다.

전자정부내 의미기반 기술 도입에 따른 기능 및 정책 연구 (Research on Function and Policy for e-Government System using Semantic Technology)

  • 장영철
    • 한국산업정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.22-28
    • /
    • 2008
  • 본 논문에서는 전자정부 시스템의 대 국민 사용성과 효율성을 증진시키기 위한 의미기반 문서 분류 방법(CoWDC)을 제시한다. 기존 의미기반 문서분류 방법에서 많은 양의 키워드들의 계층적 컨셉들을 이용하는 것을 지양하고 사용자들이 사용하는 키워드들 간의 관계를 중심으로 문서를 분류한다. 즉, 문서의 컨텍스트(context)에 근거하여 깊고 정확한 의미를 키워드 간 관계를 분석하여 적은 양의 정보로 효율적인 문서분류를 하게 된다. 이를 위해 제안한 CoWDC(Concept Wright Document Classification) 시스템은 기존의 시소러스/온톨로지의 의존도를 줄이고 키워드 관계, 관계의 경중 고려, 상하위 개념으로 변환 등을 통한 실험과 평가가 이루어졌다. 전자정부 시스템의 구조 및 특징 분석을 통해 CoWDC 실험 결과는 대국민 서비스 향상을 위해 매우 필요함을 인지하고 이를 접목하기 위한 기술적, 정책적 제언을 제시하였다. CoWDC를 통해 의미기반 검색기술의 우수함을 입증하였고 이는 전자정부 시스템의 지식베이스 구축, 운영체제의 운용, 시소러스의 구성 등의 과정에서 체계적으로 통합 운영되어야 한다.

  • PDF

소프트웨어 부품의 검색을 위한 의미 유사도 측정 (A Semantic Similarity Measure for Retrieving Software Components)

  • 김태희;강문설
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1443-1452
    • /
    • 1996
  • 본 논문에서는 재사용가능한 소프트웨어 부품의 분류 과정을 자동화하여 라이브 러리에 구조적으로 저장하고, 사용자의 요구사항을 만족하는 부품을 효율적으로 검색 하기 위하여 부품들 사이의 의미 유사도를 측정하는 방법을 제안한다. 자연어로 기술 된 부품 설명서로부터 정보를 획득하여 부품의 특성을 표현하는 패싯을 결정하고, 각 패싯에 해당하는 항목을 자동으로 추출하여 부품 식별자를 구성하며, 분류된 부품들 의 유사성에 따라 비슷한 특성을 갖는 부품들을 인접한 위치에 저장한다. 그리고 사 용자의 요구사항을 만족하는 부품들을 검색하기 위하여 질의와 소프트웨어 라이브러 리에 저장된 부품들 사이의 의미 유사도를 측정한다. 재사용가능한 부품의 검색을 위 하여 의미유사도를 이용함으로써 단순히 사용자의 질의를 만족하는 부품들의 집합을 검색할 뿐만 아니라 질의를 만족하는 정도에 따라 검색된 부품들의 상관순위를 부여 하여 사용자들이 요구하는 부품의 검색 시간이 줄어들고 전체적인 검색 효율이 개선 되었다.

  • PDF