• 제목/요약/키워드: Multimedia Information Retrieval

검색결과 378건 처리시간 0.023초

형태 인덱스와 정규 곡률을 이용한 3차원 모델 검색 (3D Models Retrieval Using Shape Index and Curvedness)

  • 박기태;황혜정;문영식
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.33-41
    • /
    • 2007
  • 멀티미디어 기술과 통신 기술의 발달로 다양한 멀티미디어 데이터를 쉽게 접할 수 있게 되었고 그 양도 급격하게 증가하고 있다. 이에 따라 3차원 모델을 검색하기 위한 시스템의 필요성이 부각되고 있으며 이를 위해서는 3차원 모델의 형태 정보를 효과적으로 기술하는 형태 기술자가 필요하다. 본 논문에서는 3차원 모델을 검색하기 위한 형태 기반 기술자를 추출하는 새로운 방법을 제안한다. 제안하는 형태 기반 기술자는 객체의 지역적인 특성을 나타내는 형태 인덱스와 곡면의 굽은 정도를 결합한 기술자이다. 형태 인덱스의 분포를 사용하는 기존의 3차원 형태 스펙트럼 기술자는 표면의 모양만 고려할 뿐 곡면의 굽은 정도는 고려하지 않는다. 그렇기 때문에 곡면의 굽은 정도가 다른 경우에도 그 특징값이 같을 수도 있다는 단점이 있다. 본 논문에서는 곡면의 굽은 정도를 나타낼 수 있는 특징값을 추가함으로써 이를 해결한다. 형태 인덱스와 곡면의 굽은 정도를 결합한 새로운 기술자는 매우 적은 특징 정보만을 추가함으로써 성능 향상 효과를 얻을 수 있다. 제안하는 방법을 기존의 방법과 비교하여 검색 성능을 평가한 결과 23.6%의 성능 향상을 보이고 있다.

적합성 피드백을 이용한 멀티미디어 검색 (Multimedia Retrieval using Relevance Feedback)

  • 이팔진;윤보현;최은화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.101-104
    • /
    • 2002
  • 본 문서에서는 사용자 적합성 피드백을 적용한 멀티미디어검색 기법을 제안한다. 적합성 피드백은 멀티미디어검색에 있어 사용자가 요구하는 정보를 반영할 수 있어 영상의 검색 효율을 높일 수 있다. 이 실험에서는 긍정적 피드백과 부정적 피드백을 함께 사용하였다. 실험결과, 적합성 피드백을 이용하면 적은 횟수의 반복검색으로 우수한 결과를 얻을 수 있음을 알 수 있다.

  • PDF

XML 기반 멀티미디어 데이터의 효율적인 구조 정보 검색 (Effective Structure Information Retrieval of Multimedia Data Based on XML)

  • 임정윤;황부현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.129-132
    • /
    • 2001
  • 웹의 대중화와 컴퓨터 기술의 발달로 멀티미디어 데이터의 사용이 크게 증가하고 있지만, 사용자가 원하는 멀티미디어 데이터의 일부분과 해당 데이터의 구조정보를 검색하는 기능은 제공되고 있지 않다. 본 논문에서는 사용자가 원하는 내용을 포함하고 있는 멀티미디어 데이터를 검색하고, 그 데이터의 구조정보를 XML 문서 형태로 보여주기 위하여, 객체지향 데이터베이스 시스템을 이용하여 대용량의 멀티미디어 데이터와 해당 데이터를 표현한 XML 문서를 저장하고, 사용자의 질의를 처리하기 위한 효율적인 구조정보 검색 방법을 제안한다.

  • PDF

Frequency-Temporal Filtering for a Robust Audio Fingerprinting Scheme in Real-Noise Environments

  • Park, Man-Soo;Kim, Hoi-Rin;Yang, Seung-Hyun
    • ETRI Journal
    • /
    • 제28권4호
    • /
    • pp.509-512
    • /
    • 2006
  • In a real environment, sound recordings are commonly distorted by channel and background noise, and the performance of audio identification is mainly degraded by them. Recently, Philips introduced a robust and efficient audio fingerprinting scheme applying a differential (high-pass filtering) to the frequency-time sequence of the perceptual filter-bank energies. In practice, however, the robustness of the audio fingerprinting scheme is still important in a real environment. In this letter, we introduce alternatives to the frequency-temporal filtering combination for an extension method of Philips' audio fingerprinting scheme to achieve robustness to channel and background noise under the conditions of a real situation. Our experimental results show that the proposed filtering combination improves noise robustness in audio identification.

  • PDF

Server-Based User-Created Contents Processing System

  • Yeo, Myung-Ho;Kim, Hak-Sin;Roh, Kyu-Jong;Cho, Yong-Jun;He, Li;Kim, Hak-Cheol;Bok, Kyung-Soo;Yoo, Jae-Soo
    • International Journal of Contents
    • /
    • 제4권4호
    • /
    • pp.12-17
    • /
    • 2008
  • The web 2.0 is leading a rapid change of internet services. The UCC(User Created Contents) service is one of the representative internet services with web 2.0 paradigm. In this paper, we design and implement the UCC services prototype system for image and video. The proposed system does not need to install ActiveX and client programs on devices of users to edit their contents. All processes for editing UCC are conducted on the server. Our proposed system consists of the two components such as the multimedia editing subsystem and the metadata management system. They provide the API to UCC service developers or vendors. The multimedia editing subsystem supports editing for image and video, and the streaming services of video. The metadata management subsystem supports the metadata management and retrieval of image and video.

시맨틱 갭을 줄이기 위한 딥러닝과 행위 온톨로지의 결합 기반 이미지 검색 (Image retrieval based on a combination of deep learning and behavior ontology for reducing semantic gap)

  • 이승;정혜욱
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권11호
    • /
    • pp.1133-1144
    • /
    • 2019
  • 최근 스마트 기기의 발전으로 인터넷상에 존재하는 이미지 데이터의 양이 급속하게 증가하는 상황에서 효과적인 이미지 검색을 위한 다양한 방법들이 연구되고 있다. 기존의 이미지 검색 방법들은 이미지에 존재하는 물체들을 단순하게 검출하여 각 물체들의 라벨 정보에 근거한 검색을 수행하기 때문에 사용자가 원하는 이미지와 검색 결과로 얻은 이미지 간에 의미적 차이인 시맨틱 갭(Semantic Gap)이 발생된다. 이미지 검색에서 발생하는 시맨틱 갭을 줄이기 위해, 본 논문에서는 딥러닝 기반의 다중 객체 분류 모듈과 사람의 행위를 분류하는 모듈을 연결하고, 이 모듈들에 행위 온톨로지를 결합하였다. 즉, 딥러닝과 행위 온톨로지의 결합을 기반으로 객체들 간의 연관성을 고려한 이미지 검색 시스템을 제안한다. 이미지에 포함된 동적인 행위를 고려하기 위해 Walking과 Running 데이터를 이용하여 실험한 결과를 분석하였다. 제안한 방법은 향후 이미지 검색 결과의 정확도를 높일 수 있는 영상의 자동 주석 생성 연구에 확장하여 적용할 수 있다.

허밍 질의 기반 음악 검색 시스템의 유사도 계산 알고리즘 (A Similarity Computation Algorithm for Music Retrieval System Based on Query By Humming)

  • 오동열;오해석
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.137-145
    • /
    • 2006
  • 사람은 음악에서의 선율을 악보의 기보법과 같이 음표의 높이와 음표의 길이가 조합된 형태로서 기억하는 것이 아니라, 전반적인 음표간의 높낮이의 흐름과 음표 사이의 상대적인 지속시간으로 구성된 음조 곡선 형태로 기억한다. 이와 같은 선율의 기억 방식으로 인해 기존 음악 검색 시스템과 같이 건반을 이용한 주선율 입력이나 악보에 기보된 형태로 음악 검색의 질의를 이용하는 방법을 그대로 적용하기 어려운 점이 있다. 이에 본 논문에서는 사용자의 허밍을 질의로 사용하는 음악 검색 시스템에서의 고려 대상들과 기존에 연구된 허밍 질의 기반의 음악 검색 시스템을 살펴본다. 또한 사람이 선율을 기억하는 방식인 상대적인 음표 간 높낮이와 음표 지속 시간을 이용하여 음악 내에 특징 정보를 추출하고 이를 기반으로 허밍 질의와 단음과의 유사도 계산 알고리즘을 제안한다. 제안된 유사도 계산 알고리즘은 선율내의 음높이 차만 가지고 선율의 유사도를 비교하는 경우 발생할 수 있는 문제를 연속된 음간에 길이 차이를 이용하여 해결하였다.

  • PDF

공간 유사도와 주석을 이용한 이미지 검색 기법 (Image Retrieval Scheme using Spatial Similarity and Annotation)

  • 이수철;황인준
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.134-144
    • /
    • 2003
  • 이미지를 비롯한 멀티미디어 데이타의 검색시스템에서 객체들 간의 공간 관계는 이미지를 표현하는 중요한 요소 중의 하나이다. 본 논문에서는 기존의 검색 방식과는 달리 이미지에 나타나 있는 객체들간의 다양한 공간 관계와 각 객체들이 가지고 있는 특징을 이용한 새로운 방식의 이미지 검색 기법을 제안한다. 이것은 질의 이미지와 데이타베이스 내에 있는 이미지들 간의 유사성을 효율적으로 계산하는데 유용하다. 특히 각 객체들 간의 공간 정보와 그들의 특징들에 대한 정보들이 XML 형태로 주석 처리되어 있기 때문에 이전 검색 기법보다 정확하고 신속하게 질의를 처리한다. 마지막으로 제안된 검색기법을 이용한 이미지 검색 시스템을 구현하여, 실제 실험을 통하여 성능을 평가하였다.

사용자 정보를 활용한 개인 맞춤형 에이전트의 설계 및 구현 (The design and implementation of the personalized service agent using user information)

  • 이종설;신사임;김윤상;이석필
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.503-505
    • /
    • 2006
  • In this paper we introduce a design and implementation of an agent for multimedia retrieval and personalized broadcasting service. It is compliant with TV Anytime Forum specifications and supports searching location resolving, storing and streaming of remote multimedia contents. For this service, we implemented a contents server, a 메타데이터 database server, a location resolution server and a client terminal is implemented The Client terminal gathers content information by SOAP of operation, and it has a user preference module and usage history module that make user information. The personalize service agent recommends suitable contents to user by similarity algorithm.

  • PDF

COSMIC : 영역지식과 시각정보를 이용한 내용기반 멀티미디어 검색 시스템의 설계 및 구현 (COSMIC : Design and Implementation of a Content-Based Multimedia Retrieval System using Domain Knowledge and Visual Information)

  • 김덕환;김시우;박광순;이병구;차광호;정진완
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권1호
    • /
    • pp.14-28
    • /
    • 1999
  • 최근 멀티미디어 데이터로부터 내용에 대한 정보를 추출하여 데이터베이스에 저장하고 내용에 기반한 질의를 수행하도록 하는 내용 기반 검색 시스템이 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용 기반 멀티미디어 검색 시스템인 COSMIC(Content Based Multimedia Information Processor)의 설계 및 구현에 관하여 기술한다. COSMIC은 대용량 이미지 데이터로부터 자동으로 추출된 시각적 특징 데이터들을 다차원 점접근 방법(Point Access Method)인 HG-트리를 이용하여 색인하고 예제 이미지와 사용자가 그린 스케치에 의한 시각적 질의를 제공한다. 또한 COSMIC은 비디오 데이터로부터 추출된 다양한 의미 정보를 이용하여 의미 질의를 제공한다. COSMIC의 유효성을 입증하기 위해서 다양한 시각적 질의와 이미 질의를 이용한 실험을 수행하였다.