• Title/Summary/Keyword: 유사검색

Search Result 1,675, Processing Time 0.031 seconds

Cluster-based Image Retrieval Method Using RAGMD (RAGMD를 이용한 클러스터 기반의 영상 검색 기법)

  • Jung, Sung-Hwan;Lee, Woo-Sun
    • The KIPS Transactions:PartB
    • /
    • v.9B no.1
    • /
    • pp.113-118
    • /
    • 2002
  • This paper presents a cluster-based image retrieval method. It retrieves images from a related cluster after classifying images into clusters using RAGMD, a clustering technique. When images are retrieved, first they are retrieved not from the whole image database one by one but from the similar cluster, a similar small image group with a query image. So it gives us retrieval-time reduction, keeping almost the same precision with the exhaustive retrieval. In the experiment using an image database consisting of about 2,400 real images, it shows that the proposed method is about 18 times faster than 7he exhaustive method with almost same precision and it can retrieve more similar images which belong to the same class with a query image.

A Design and Implementation of Photo Searching System Based on the Compositional Line (구도선 기반 사진 검색 시스템의 설계 및 구현)

  • Hwang, Joo-Yeon;Lim, Dong-Sup;Paik, Doo-Won
    • 한국HCI학회:학술대회논문집
    • /
    • 2009.02a
    • /
    • pp.637-641
    • /
    • 2009
  • In this paper, we propose a line composition based searching system which retrieves compositionally similar photo from the DB of the line-compositional photos. To develop the measure of compositional similarity, we carried out a survey to find which feature is discriminative for retrieving. Based on the results of the survey, we developed the measure of compositional similarity and it was applied the proposed searching system. We also show the results of the recall and the precision to evaluate the performance of the proposed system.

  • PDF

A Music Retrieval Scheme based on Variation of Musical Mood (음악 무드의 변화 기반 유사 음악 검색 기법)

  • Sanghoon Jun;Byeong-jun Han;Eenjun Hwang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.760-762
    • /
    • 2008
  • 음악에서는 다양한 감정의 표현을 시간에 따른 음악 무드의 전이로 표현한다. 본 연구에서는 Longest Common Subsequence (LCS) 알고리즘 및 k-Means 알고리즘에 기반한 유사 음악 검색 기법을 제안한다. 우선, 음악 무드의 흐름을 무드 세그먼트 단위로 나누고, 이를 추출된 다양한 음악 특성을 k-Means 알고리즘으로 분류하여 무드 시퀀스로 변환한다. 또한, 유사한 무드의 흐름을 가지는 음악을 검색하기 위해 LCS 알고리즘에 기반한 무드 시퀀스의 유사도를 정의한다. 본 논문은 제안된 내용을 바탕으로 실험과 설문 조사를 통해, 기존의 전역적 특성 검색 방식보다 시퀀스를 이용한 검색방식이 좀 더 효율적임을 증명하였다.

Question Retrieval using Deep Semantic Matching for Community Question Answering (심층적 의미 매칭을 이용한 cQA 시스템 질문 검색)

  • Kim, Seon-Hoon;Jang, Heon-Seok;Kang, In-Ho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.116-121
    • /
    • 2017
  • cQA(Community-based Question Answering) 시스템은 온라인 커뮤니티를 통해 사용자들이 질문을 남기고 답변을 작성할 수 있도록 만들어진 시스템이다. 신규 질문이 인입되면, 기존에 축적된 cQA 저장소에서 해당 질문과 가장 유사한 질문을 검색하고, 그 질문에 대한 답변을 신규 질문에 대한 답변으로 대체할 수 있다. 하지만, 키워드 매칭을 사용하는 전통적인 검색 방식으로는 문장에 내재된 의미들을 이용할 수 없다는 한계가 있다. 이를 극복하기 위해서는 의미적으로 동일한 문장들로 학습이 되어야 하지만, 이러한 데이터를 대량으로 확보하기에는 어려움이 있다. 본 논문에서는 질문이 제목과 내용으로 분리되어 있는 대량의 cQA 셋에서, 질문 제목과 내용을 의미 벡터 공간으로 사상하고 두 벡터의 상대적 거리가 가깝게 되도록 학습함으로써 의사(pseudo) 유사 의미의 성질을 내재화 하였다. 또한, 질문 제목과 내용의 의미 벡터 표현(representation)을 위하여, semi-training word embedding과 CNN(Convolutional Neural Network)을 이용한 딥러닝 기법을 제안하였다. 유사 질문 검색 실험 결과, 제안 모델을 이용한 검색이 키워드 매칭 기반 검색보다 좋은 성능을 보였다.

  • PDF

Study of Rotation invariant similarity measurement for content based image indexing using Texture (영상의 질감 정보를 이용한 검색에서 회전 불변 유사도 측정에 대한 연구)

  • 강호경;유기원;최정윤;노용만
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2000.11b
    • /
    • pp.155-159
    • /
    • 2000
  • 본 논문에서는 MPEG-7 질감 기술자에 기반한 영상의 내용기반 검색 시스템에서 유사도 검색 알고리즘에 대하여 다룬다. 제안하는 알고리즘은 영상의 회전에 대하여 변화하지 않는 특성을 지닌다. 실제적으로 영상이나 비디오에서 질감 정보를 이용하여 검색을 수행하고자 하는 영상에 대하여 회전 불변 알고리즘은 반드시 필요하다. 본 논문에서 제한된 알고리즘을 이용하여 질감 영상회전 불변 유사도 측정에 따른 검색을 수행하였다. 본 논문의 실험은 회전 불변 성능을 측정하는 MPEG-7 질감 데이터베이스에서 검색 율을 측정하였다. 실험결과 본 영상 회전 불변 질감 기술자 표현 방법은 우수한 검색 성능과 빠른 특징 추출 능력을 보였다.

  • PDF

Ontology-based Semantic Information Extraction Using An Advanced Content-based Image Retrieval (향상된 콘텐츠 기반 이미지 검색을 이용한 온톨로지 기반 의미적 정보 추출)

  • Shin, Dong-Wook;Jeon, Ho-Chul;Jeong, Chan-Back;Kim, Tae-Hwan;Choi, Joong-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.348-353
    • /
    • 2008
  • 이미지의 사용이 증가함에 따라 이미지 중 사용자가 원하는 이미지를 효율적으로 검색하기 위한 방법들이 연구되어 왔다. 본 논문에서는 질의 이미지를 분석하여 이미지 특징(feature)을 추출한 후 이미지 특징에 대한 유사도 평가를 통한 이미지 검색 및 온톨로지를 기반으로 검색된 이미지들과 유사하다고 판단된 이미지와 그러한 이미지들의 의미적 정보를 추출하는 방법을 제안한다. 제안된 시스템은 질의 이미지에서 색상, 질감, 모양 등의 특징을 추출하여 유사도 평가를 통해 검색된 이미지를 제공하고, 내용기반 이미지 검색 방식을 통해 이미지를 검색하고, 온톨로지를 이용해 이미지의 의미적 정보를 추출하여 사용자에게 이미지와 관련된 의미적 정보를 제공한다.

  • PDF

Cell-based Signature Tree: Efficient Indexing Structures for Similarity Search in High-Dimensional Feature Space (셀기반 시그니쳐 트리: 고차원 데이터의 유사어 검색을 위한 효율적인 색인 구조)

  • 송광택;장재우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.134-136
    • /
    • 2000
  • 본 논문에서는 고차원의 특징 벡터 공간에서의 객체에 대한 효율적인 검색을 지원하는 셀기반 시그니쳐 트리 색인 구조(CS-트리, CI-트리)를 제안한다. 특징 벡터 공간을 셀로써 분할하고 특징 벡터는 셀의 시그니쳐로 표현되며 트리에 저장된다. 특징 벡터 대신 시그니쳐를 사용하여 트리의 깊이가 낮아짐으로서 검색을 효율적으로 수행할 수 있다. 또한 셀에 적합한 새로운 가지치기 거리를 이용한 유사성 검색 알고리즘으로 수행할 수 있다. 또한 셀에 적합한 새로운 가지치기 거리를 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 성능 비교를 수행하여, 성능비교 결과 본 논문에서 제안하는 CS-트리와 CI-트리가 검색 시간 측면에서 최대 30%의 검색 성능이 개선됨을 보인다.

  • PDF

A Study on Similar Document Retrieval for National R&D Information (국가 R&D 정보 유사문서 검색에 대한 연구)

  • Han, Hee-Jun;Joo, Won-Kyun;Seok, Jung-Ho;Choi, Kiseok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.283-286
    • /
    • 2012
  • 국가과학기술지식정보서비스(NTIS)는 국가 R&D와 관련된 과제, 성과, 인력, 시설 장비, 기술산업 정보에 대해 이용자에게 통합검색서비스를 제공한다. 이용자는 질의어를 입력하여 원하는 정보를 선별하게 되고, 한 건의 상세 메타정보 및 원문을 검색서비스의 최종 목적지로 삼는다. 이 때 이용 중인 정보와 유사한 다른 유형의 R&D 정보를 함께 제공한다면 이용자의 검색 및 탐색노력을 줄임으로써 정보획득의 요구를 쉽게 충족시킬 수 있다. 본 논문에서는 국가 R&D 정보의 메타데이터와 검색엔진의 부스팅 기법을 이용하여 이종 정보간 유사문서 검색 방법에 대해 논한다. 이는 이용자가 원하는 정보를 서비스 최종 화면(메타 상세보기)에서 제공함으로써 검색 서비스의 효율성을 증대시킨다.

A Study on the Development of Search Algorithm for Identifying the Similar and Redundant Research (유사과제파악을 위한 검색 알고리즘의 개발에 관한 연구)

  • Park, Dong-Jin;Choi, Ki-Seok;Lee, Myung-Sun;Lee, Sang-Tae
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.11
    • /
    • pp.54-62
    • /
    • 2009
  • To avoid the redundant investment on the project selection process, it is necessary to check whether the submitted research topics have been proposed or carried out at other institutions before. This is possible through the search engines adopted by the keyword matching algorithm which is based on boolean techniques in national-sized research results database. Even though the accuracy and speed of information retrieval have been improved, they still have fundamental limits caused by keyword matching. This paper examines implemented TFIDF-based algorithm, and shows an experiment in search engine to retrieve and give the order of priority for similar and redundant documents compared with research proposals, In addition to generic TFIDF algorithm, feature weighting and K-Nearest Neighbors classification methods are implemented in this algorithm. The documents are extracted from NDSL(National Digital Science Library) web directory service to test the algorithm.

Accuracy Improvement Methods for String Similarity Measurement in POI(Point Of Interest) Data Retrieval (POI(Point Of Interest) 데이터 검색에서 문자열 유사도 측정 정확도 향상 기법)

  • Ko, EunByul;Lee, JongWoo
    • KIISE Transactions on Computing Practices
    • /
    • v.20 no.9
    • /
    • pp.498-506
    • /
    • 2014
  • With the development of smart transportation, people are likely to find their paths by using navigation and map application. However, the existing retrieval system cannot output the correct retrieval result due to the inaccurate query. In order to remedy this problem, set-based POI search algorithm was proposed. Subsequently, additionally a method for measuring POI name similarity and POI search algorithm supporting classifying duplicate characters were proposed. These algorithms tried to compensate the insufficient part of the compensate set-based POI search algorithm. In this paper, accuracy improvement methods for measuring string similarity in POI data retrieval system are proposed. By formulization, similarity measurement scheme is systematized and generalized with the development of transportation. As a result, it improves the accuracy of the retrieval result. From the experimental results, we can observe that our accuracy improvement methods show better performance than the previous algorithms.