• 제목/요약/키워드: content- based retrieval

검색결과 717건 처리시간 0.028초

Visual Feature Extraction Technique for Content-Based Image Retrieval

  • Park, Won-Bae;Song, Young-Jun;Kwon, Heak-Bong;Ahn, Jae-Hyeong
    • 한국멀티미디어학회논문지
    • /
    • 제7권12호
    • /
    • pp.1671-1679
    • /
    • 2004
  • This study has proposed visual-feature extraction methods for each band in wavelet domain with both spatial frequency features and multi resolution features. In addition, it has brought forward similarity measurement method using fuzzy theory and new color feature expression method taking advantage of the frequency of the same color after color quantization for reducing quantization error, a disadvantage of the existing color histogram intersection method. Experiments are performed on a database containing 1,000 color images. The proposed method gives better performance than the conventional method in both objective and subjective performance evaluation.

  • PDF

내용에 기반한 이미지 인덱싱 방법에 관한 연구 (A Study on Image Indexing Method based on Content)

  • 유원경;정을윤
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.903-917
    • /
    • 1995
  • 대부분의 데이타베이스 시스템에서, 이미지는 캡션(caption), 주석(annotation), 속성(attribute)과 같이 그 이미지와 관련된 텍스트를 이용하여 간접적으로 인덱스 되었다. 그러나, 이미지에 포함된 정보를 직접적으로 사용하여 내용에 기반한 이미 지의 저장과 검색을 지원하는 이미지 데이타베이스 시스템의 요구가 점점 증가하고 있다. 내용에 기반한 몇몇 인덱싱 방법들이 있는데 그중에서 Petrakis는 이미지를 구성하는 오브젝트들의 공간관계와 속성을 고려한 이미지 인덱싱 방법을 제안했다. 이것은'2-D string'에 기반한 인덱싱 연구의 확장인데. 이 방법은 많은 저장공간을 필요로 하며 융통성이 부족하다. 본 논문은 페이징 기법을 사용하는 kd-trr를 이용한 인덱스 화일구조를 제안한다. 그리고 정규화 과정을 사용해서 실제 이미지로부터 키를 추출하는 예를 보이고 시뮬레이션을 통해 비교하였다. 실험 결과는 제안된 방법이 훨씬 적은 저장공간을 요구하고, 융통성면에서 개선이 되었음을 보여준다.

  • PDF

시간 관계성을 기반으로 한 비디오 데이터 모델의 설계 및 구현 (Design and Implementation of the Video Data Model Based on Temporal Relationship)

  • 최지희;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제2권3호
    • /
    • pp.252-264
    • /
    • 1999
  • 비디오 데이터 자체가 시간적 구조와 공간적 구조로 이루어져 있기 때문에 비디오 데이터에 대한 내용 기반 검색은 두 관계를 중섬으로 이루어 질 수 있다. 본 논문에서는 비디오 데이터 구조가 시간의 흐름에 따라 논리적 계충 구조로 표현 가능하며, 각각의 계층은 각기 시간의 흐름에 따라 시간 관계성을 지닌다는 특성을 반영한 검색 기능을 설계하였다 그리고 비디오 데이터의 시간적 관계를 계승, 캡슐화, 함수 중복 등의 객체 지향 특성을 이용하여 객체 관계 DBMS로 구현하였다 기존의 제한적인 시간 함수가 아닌 본 논문에서 제시한 다양한 비디오 데이터의 시간 관계성에 따른 좀 더 확장되고 다양한 시간 함수를 제공함으로 써, 사용하기 편리한 인터페이스와, 여러 가지 시간 질의어를 제공한다.

  • PDF

StrokePortal: a Complete Stroke Information Resource Based on Oriental and Western Medicine

  • Kim, Jin-Ho;Kim, Young-Uk;Bang, Ok-Sun;Cha, Min-Ho;Park, Young-Kyu;Lee, Sun-Young;Kim, Young-Joo
    • Interdisciplinary Bio Central
    • /
    • 제2권3호
    • /
    • pp.7.1-7.3
    • /
    • 2010
  • Stroke, also called an attack on the brain, is a complex disease that results from the interaction of many genetic and environmental factors. StrokePortal is a comprehensive resource for information on stroke that integrates and provides essential findings regarding stroke pathology, diagnostics, and treatments, based on Oriental and Western medicine. The stroke information was collected from various sources, such as journal articles, books, websites, and news stories, and it was refined, classified, and stored into a relational database system by automatic classification and manual curation. To provide the stored information effectively to users, a specialized retrieval system, based on web interfaces, was implemented. StrokePortal provides cutting-edge information to experts; interested people, including patients and their families; and investigators to broaden their knowledge of effective treatments for patients and offer many preventive measures. It provides a specialized feature with which users can upload their information and opinions to StrokePortal, which will enrich and mature the content even further. StrokePortal is freely accessible at http://genomics.kribb.re.kr/StrokePortal/.

Description-Based Multimedia Clipart Retrieval in WWW

  • Kim, Hion-Gun;Sin, Bong-Kee;Song, Ju-Won
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 Proceedings of International Workshop on Advanced Image Technology
    • /
    • pp.111-115
    • /
    • 1998
  • The Internet today is teemed with not only text data but also other media such as sound, still and moving images in a variety of formats. Unlike text, however, that can be retrieved easily with the help of numerous search engines, there has been few way to access data of other media unless the exact location or the URL is known. Multimedia data in the WWW are contained in or linked via anchors in the hyper-documents. They can most reliably be retrieved by analyzing the binary data content, which is far from being practical yet by the current state of the art. Instead we present another technique of searching based on textual descriptions which are found at or around the multimedia objects. The textual description used in this research includes file name (URL), anchor text and its context, alternative descriptions found in ALT HTML tage. These are actually the clues assumedly relevant to the contents. Although not without a possibility of missing or misinterpreting images and sounds, the description-based search is highly practical in terms of computation. The prototype search engine will soon be deployed to the public service through the prestige search engine, InfoDetective, in Korea.

  • PDF

Patent Document Similarity Based on Image Analysis Using the SIFT-Algorithm and OCR-Text

  • Park, Jeong Beom;Mandl, Thomas;Kim, Do Wan
    • International Journal of Contents
    • /
    • 제13권4호
    • /
    • pp.70-79
    • /
    • 2017
  • Images are an important element in patents and many experts use images to analyze a patent or to check differences between patents. However, there is little research on image analysis for patents partly because image processing is an advanced technology and typically patent images consist of visual parts as well as of text and numbers. This study suggests two methods for using image processing; the Scale Invariant Feature Transform(SIFT) algorithm and Optical Character Recognition(OCR). The first method which works with SIFT uses image feature points. Through feature matching, it can be applied to calculate the similarity between documents containing these images. And in the second method, OCR is used to extract text from the images. By using numbers which are extracted from an image, it is possible to extract the corresponding related text within the text passages. Subsequently, document similarity can be calculated based on the extracted text. Through comparing the suggested methods and an existing method based only on text for calculating the similarity, the feasibility is achieved. Additionally, the correlation between both the similarity measures is low which shows that they capture different aspects of the patent content.

주 키워드와 부 키워드를 이용한 자연언어 정보 검색 모델 (A Model of Natural Language Information Retrieval Using Main Keywords and Sub-keywords)

  • 강현규;박세영
    • 한국정보처리학회논문지
    • /
    • 제4권12호
    • /
    • pp.3052-3062
    • /
    • 1997
  • 정보 검색이란 사용자의 정보 요구를 만족하는 관련 정보를 검색하는 것이다. 그러나 정보 검색 시스템의 하나의 역활은 관련 정보의 집합들을 단순히 제시하는 것이 아니라 주어진 요구 사항에 가장 가까운 문서를 결정하는데 도움을 주는 것이다. 최근에 여러 가지 텍스트 분석 시스템들에서 내용을 인식하기 위해 구문 분석 방법 사용이 시도되고 있다. 불행히도 단독의 구문 이해 방법으로는 임의의 텍스트 예들을 완벽하게 분석하기 위해 불충분한 것으로 알려지고 있다. 이 논문에서는 2단계 문서 순위에 기반한 문서 순위 결정 방법에 대하여 논한다. 1단계는 문서를 검색하기 위해 사용하고 2단계는 검색된 문서를 재순서화하는데 사용한다. 1단계에서 이용된 주키워드는 문서를 구별할 수 있는 좋은 능력을 가지는 명사나 복합명사로서 정의될 수 있다. 2단계에서 이용된 부 키워드는 주키워드나 기능어가 아닌 형용사나 부사 또는 동사로 정의 될 수 있다. 실험은 23,113 항목을 가지는 한국어 백과사전과 일반 사용자들로부터 수집된 161개의 한국어 자연언어 질의로부터 이루어졌다. 자연언어 질의의 85%가 부 키워드를 가지고 있었다. 2단계 문서 순위 방법은 일반 문서 순위 방법보다 현격한 검색 효율의 향상을 제공한다.

  • PDF

MPEG-7 시각 정보 기술자의 인덱싱 및 결합 알고리즘 (Algorithms for Indexing and Integrating MPEG-7 Visual Descriptors)

  • 송치일;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권1호
    • /
    • pp.1-10
    • /
    • 2007
  • 본 논문에서는 MPEG-7 시각 정보 기술자인 Dominant Color와 Contour Shape 기술자에 대한 새로운 인덱싱 알고리즘을 제안한다. Dominant Color 기술자에서 사용되는 비교 연산 식은 가우스 혼합 모델에 기초하고 있기 때문에 기술자의 각 속성들을 하나의 칼라 히스토그램 형태로 변형시켜서 인덱스로 사용한다. Contour Shape 기술자는 두 단계 형태의 알고리즘을 사용하는데, 첫 번째 단계에서는 글로벌 변수인 Eccentricity와 Circularity를 사용한 대략적인 비교를 통해서 비슷하지 않은 이미지 오브젝트를 배제시키고 두 번째 단계에서 남겨진 오브젝트들과 질의 오브젝트들간의 Peak 변수를 사용한 비교 연산을 통해 인덱싱을 수행한다. 또한 본 논문은 효율적인 멀티미디어 데이타 검색을 위해서 두 가지의 MPEG-7 시각 정보 기술자 결합 알고리즘을 제안한다. 첫 번째 결합 알고리즘은 가중치를 확률로 변환해서 반영하는 것이고 두 번째는 가중치를 각 비교 연산 결과값의 중요도로 간주하는 방법이다. 실험을 통해서 결과를 분석해 보면 근사화를 통한 인덱스 생성으로 100%의 정확도를 유지 할 수는 없지만 논문에서 제안된 각 기술자의 인덱싱 알고리즘과 기술자들의 결합 알고리즘은 기본 검색 알고리즘과 비교했을 때 매우 빠른 속도 향상을 보여주었다. 본 논문에서 제안된 알고리즘은 MPEG-7을 사용하는 검색 시스템의 데이타베이스 구축에 효율적으로 사용될 수 있다.

스토리 정보의 검색을 위한 웹 기반의 협업적 스크립트 분석 플랫폼 개발 (Development of Collaborative Script Analysis Platform Based on Web for Information Retrieval Related to Story)

  • 박승보;김현식;백영태;유은순
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권9호
    • /
    • pp.93-101
    • /
    • 2014
  • 영화의 스토리에 대한 분석은 영화의 설계도와 같은 스크립트를 분석하여 용이하게 이루어질 수 있다. 영화의 스크립트는 파이널 드래프트(Final Draft)의 형식화된 구조로 기술되어 있지만, 웹상에 공개된스크립트들은 대부분 형식이 파괴되어 문장 내용에 대한 분석이 없으면 형식을 복원하기 힘든 상황이다. 이를 위해 자동으로 스크립트를 파싱한 후에 사용자들이 협업적으로 결과물의 오류를 자유롭게 점검하고 수정할 수 있도록 웹기반의 스크립트 분석 소프트웨어를 개발하고 제공할 필요가 있다. 따라서 본 논문에서는 사용자에 의해 스크립트의 형식 오류가 수정되고 걸러지게 하여 완성도 높은 영화 데이터 축적을 가능케 하는 웹 기반의 협업적 스크립트 분석 플랫폼의 구조를 제시하고, 구현 결과에 대한 성능평가를 진행하였다. 실험을 통해 자동 파싱 성공률이 64.95%로 나타났고, 협업적 오류 수정은 5단계를 거친 후에 대부분의 오류가 수정되어 99.58%의 파싱 정확도를 보여주었다.

텍스트 내용 기반의 철학 온톨로지 구축 및 교육에의 응용 (Building a Philosophy Ontology based on Content of Texts and its Application to Learning)

  • 정현숙;최병일
    • 정보교육학회논문지
    • /
    • 제9권2호
    • /
    • pp.257-270
    • /
    • 2005
  • 철학을 비롯한 인문학의 연구에 있어서 연구자들에게 텍스트는 지식을 습득하는 중요한 매체이다. 그러나 현재의 서지정보 중심의 문헌 검색으로는 연구자들이 여러 텍스트들로부터 필요한 지식만을 선택적으로 습득하는데 많은 시간과 노력을 들인다. 본 논문에서는 텍스트 내용에 의거한 지식 검색이 가능하도록 철학 고전 텍스트를 대상으로 철학 온톨로지를 구축하였다. 철학 온톨로지는 전문가에 의해 동서양의 철학 고전 텍스트로부터 분석된 주요 철학 개념과 의미 기반 계층관계 및 연관관계 정의하고 있으며 개념 해설서를 비롯한 온오프라인의 철학 지식 자원들을 연결하고 있다. 본 논문에서는 철학 온톨로지 구축 과정을 3개의 단계와 14개의 세부과정으로 나열함으로써 다른 분야의 학문 온톨로지 구축을 위한 하나의 가이드라인을 제시하고 있으며 철학 온톨로지의 응용사례로서 대학의 철학 수업에서의 교수자와 학습자 사이의 철학 온톨로지에 기반한 지식 습득 및 교류가 가능함을 보였다.

  • PDF