• Title/Summary/Keyword: 오디오 검색

Search Result 119, Processing Time 0.025 seconds

A Music Retrieval Scheme based on Fuzzy Inference on Musical Mood and Emotion (음악 무드와 감정의 퍼지 추론을 기반한 음악 검색 기법)

  • Jun, Sang-Hoon;Rho, Seung-Min;Hwang, Een-Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.51-53
    • /
    • 2008
  • 최근 오디오 압축 기술의 발전에 힘입은 디지털 음원과 웹 스트리밍의 보급으로, 사용자가 음악 정보에 손쉽게 접할 수 있게 되었다. 이에 따라 음악을 보다 쉽고 효율적인 방법으로 검색하는 방법뿐 아니라 사용자의 환경에 따라 적절한 음악을 검색할 수 있는 기능의 필요성이 증가하게 되었다. 본 논문에서는 음악의 특징에 따라 분류된 데이터베이스를 사용하고, 사용자의 감정을 분석하여 적절한 음악을 검색하는 시스템을 제안한다. 본 시스템은 사용자의 감정 입력을 효율적으로 처리하기 위한 방법으로 Thayer의 2D emotional space를 적용하여 Valence-Arousal model의 두 가지의 입력을 처리한다. 가장 적합한 음악의 정보를 얻기 위해 사용된 Fuzzy Inference System의 IF-THEN 규칙을 정의하기 위하여 언어적으로 정의된 기존의 음악 감정 연구 결과를 적용하였고, 도출된 결과와 가장 유사도가 깊은 음악을 우선적으로 검색하도록 설계하였다. 이와 같이 구현된 시스템의 타당성을 검증하기 위해 사용자 설문조사를 수행하였다.

A Scheme for Content-based Music Element Retrieval Using Probabilistic Latent Component Analysis and Acoustic Descriptor (확률적 은닉 성분 분석 및 음향 기술자를 사용한 내용 기반 음악 요소 검색 방법)

  • Han, Byeong-Jun;Lee, Kyo-Gu;Rho, Seung-Min;Hwang, Een-Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.475-478
    • /
    • 2011
  • 지금까지 음악 정보 검색을 위한 다양한 내용 기반 음악 검색 및 비교 방법이 제안되었다. 그런데, 기존 연구들은 질의 방식 및 검색 카테고리가 변화함에 따라 상이한 방법을 제시하고 있어 음악 검색 방법을 통합하는 데에 한계가 있다. 이러한 문제를 해결하기 위해, 본고에서는 내용 기반 음악 검색의 일반화를 위한 내용 기반 음악 요소 검색(CBMER) 방법을 제안하였다. 제안 방법에서는 확률적 은닉 성분 분석(PLCA)을 사용하여 음원을 분해하고, 각 분해 요소로부터 오디오 특성을 추출하였다. 제안 방법을 사용하여 다양한 질의 방식 및 검색 카테고리로 내용 기반 음악 요소 검색이 가능함을 보이기 위해, 남성/여성의 목소리로부터 질의를 생성하여 목소리 성별에 따른 음악을 검색하는 실험을 수행하고 그 결과를 분석하였다.

Content Based Video Retrieval by Example Considering Context (문맥을 고려한 예제 기반 동영상 검색 알고리즘)

  • 박주현;낭종호;김경수;하명환;정병희
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.30 no.12
    • /
    • pp.756-771
    • /
    • 2003
  • Digital Video Library System which manages a large amount of multimedia information requires efficient and effective retrieval methods. In this paper, we propose and implement a new video search and retrieval algorithm that compares the query video shot with the video shots in the archives in terms of foreground object, background image, audio, and its context. The foreground object is the region of the video image that has been changed in the successive frames of the shot, the background image is the remaining region of the video image, and the context is the relationship between the low-level features of the adjacent shots. Comparing these features is a result of reflecting the process of filming a moving picture, and it helps the user to submit a query focused on the desired features of the target video clips easily by adjusting their weights in the comparing process. Although the proposed search and retrieval algorithm could not totally reflect the high level semantics of the submitted query video, it tries to reflect the users' requirements as much as possible by considering the context of video clips and by adjusting its weight in the comparing process.

Development of a SMIL Player Supporting the Retrieval F acility (검색 기능을 지원하는 SMIL 플레이어의 개발)

  • 이훈범;백인구;한기준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10a
    • /
    • pp.98-100
    • /
    • 2000
  • 현대 사회는 웹이라는 것을 통하여 수많은 정보들을 얻을 수 있으며 시간과 공간을 초월하고 있다. 이러한 정보들 가운데 이미지, 동영상, 오디오, 텍스트 등을 실시간으로 동시에 제공받는 것은 아직도 웹 상에서는 한계가 있다. 이러한 한계를 극복하기 위해 W3C(World Wide Web Consortium)에서 XML 어플리케이션의 하나로서 SMIL (Synchronized Multimedia Integration Language)이란 표준화한 방안과 기술을 개발하였고, 이러한 표준화된 SMIL을 바탕으로 기존의 디지털 T.V, VOD, 웹 상에서의 멀티미디어 프리젠테이션 등과 같은 분야와 연계하고자 하는 연구가 활발히 진행되고 있다. 그러나, 리얼시스템사의 G2나 애플사의 QuickTime과 같은 SMIL을 지원하는 상용 플레이어들을 비롯한 기존의 다양한 SMIL 플레이어에는 SMIL 문서를 검색할 수 있는 해결책을 제시하지 못하고 있다. 현재와 같으 기하급수적인 웹의 발전은 기본적인 웹의 기능 외에 웹에 대한 다양한 검색 기능이 제공되면서부터 이며 웹의 이러한 발전 과정을 미뤄볼 때 SMIL 또한 이러한 검색 기능의 제공은 필수적이라 할 수 있다. 그러므로, 본 논문에서는 기존의 SMIL 플레이어들이 지원하지 못했던 검색 기능을 지원하기 위해 SMIL에서 의미를 가지는 엘리먼트와 컨텐트를 가지고 인덱스를 구축하고, 또한 이를 이용하여 산재해 있는 SMIL 문서와 문서내의 미디어 객체 등에 대한 검색을 수행한 후 선별적으로 디스플레이할 수 있게 하는 검색 기능을 갖는 SMIL 플레이어를 설계 및 구현한다.

  • PDF

Design and Implementation of Multimedia Data Retrieval System using Image Caption Information (영상 캡션 정보를 이용한 멀티미디어 데이터 검색 시스템의 설계 및 구현)

  • 이현창;배상현
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.8 no.3
    • /
    • pp.630-636
    • /
    • 2004
  • According to the increase of audio and video data utilization, the presentation of multimedia data contents and the work of retrieving, storing and manipulating a multimedia data have been the focus of recent work. The display for multimedia data should retrieve and access the contents easily that users want to present. This study is about the design and implementation of a system to retrieve multimedia data based on the contents of documentation or the caption information of a multimedia data for retrieving documentation including multimedia data. It intends to develop an filtering step to retrieve all of keyword within the caption information of multimedia data and text of a documentation. Also, the system is designed to retrieve a large amount of data quickly using an inverted file structure available for B+ tree.

Enhanced Adjustment Strategy of Masking Threshold for Speech Signals in Low Bit-Rate Audio Coding (저전송률 오디오 부호화에서 음성 신호의 성능 개선을 위한 마스킹 임계값 적응기법 향상)

  • Lee, Chang-Heon;Kang, Hong-Goo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.29 no.1
    • /
    • pp.62-68
    • /
    • 2010
  • This paper proposes a new masking threshold adjustment strategy to improve the performance for speech signals in low bit-rate audio coding. After determining formant regions, the masking threshold is adjusted by using the energy ratio of each sub-band to the average energy of each formant. More quantization noises are added to the bands that have relatively large energy, but less distortion is allowed in spectral valley regions by allocating more bits, which reflects the concept of perceptual weighting widely used in speech coding. From the results of objective speech quality measure, we verified that the proposed method improves quality for the speech input signals compared to the conventional one.

A study on the file format for the recording data search efficiency improvement of DVR systems (DVR 시스템의 녹화 데이터 검색 성능 향상을 위한 파일 포맷에 관한 연구)

  • Lee, Hyun-Suk;Kim, Hyo-Gon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06d
    • /
    • pp.196-201
    • /
    • 2010
  • 영상보안 시장은 DVR(Digital Video Recorder)을 중심으로 아날로그 시스템을 디지털로 빠르게 대체하며 네트워크를 이용한 고화질 시장으로 발전을 거듭하고 있다. DVR의 핵심적인 기능인 녹화, 검색 기능은 시스템에서 상대적으로 속도가 느린 디스크 자원의 의존도가 높은 기능으로 성능에 직접적인 영향을 미치는 녹화 파일 포맷이 최적화 되지 않을 경우 심각한 성능 문제를 일으킬 수 있다. 본 논문에서는 인덱스를 이용하여 고속 탐색 및 재생 성능을 유지하면서 비디오와 오디오 데이터 외에도 다양한 형태의 이벤트 데이터를 수용하여 DVR의 녹화와 검색 기능의 실제 운용 환경에 적합한 AMS (Advanced Multi-channel Streaming) 파일 포맷을 설계하고 최근 DVR 전용 파일 포맷으로 제안된 ESP 파일 포맷과의 비교 실험을 통하여 기능 및 성능이 향상되었음을 확인 하였다.

  • PDF

A Study of Practicla QbSH System Development (실용 QbSH 시스템 개발에 관한 연구)

  • Song, Chai-Jong;Jang, Sei-Jin;Park, Hochong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.637-640
    • /
    • 2012
  • 본 논문에서는 다성 음원 기반의 다양한 응용 분야에서 적용이 가능한 실용 Query by Singing/Humming (QbSH) 시스템을 구현한다. 이를 위해서 검색 서버을 위한 소프트웨어 스택을 개발하고 다양한 형태의 클라이언트와 함께 임베디드 시스템과 같은 저성능 클라이언트를 위한 허밍검색 에이전트를 개발하여 기존의 클라이언트 시스템에 플러그인 할 수 있는 모듈을 개발한다. 실용 QbSH 시스템을 개발하기 위하여 각각의 핵심 알고리즘들의 최적의 조합을 이루어 통합된 전체시스템의 성능을 평가한다. 학술적인 연구에만 그쳤던 허밍기반 오디오 검색 서비스를 상업적으로 이용하기 위해 다양한 응용분야의 프로토타입을 구현한다.

대화형 멀티미디어 정보통신 서비스를 위한 단말기

  • 오승준
    • Information and Communications Magazine
    • /
    • v.11 no.12
    • /
    • pp.71-93
    • /
    • 1994
  • 본고에서는 멀티미디어 정보통신 서비스를 일반사용자에게 제공하기 위하여 제공될 각 종 단말기들의 기본적인 아키텍쳐와 그를 구성하는 핵심 모듈들을 살펴보고, 각 종 단말기들이 서로 호환성을 가지고 동작하기 위하여 필요한 코덱의 표준화와 망과의 접속문제 특히 ATM과의 접속문제를 알아본다. 멀티미디어 정보통신 서비스용 단말기 아키텍쳐를 살펴보고, ISDN 단말기, B-ISDN 단말기, 대화형 멀티미디어 정보검색용 단말기 구조를 설명한다. 단말기의 핵심을 이루는 오디오-비쥬얼 코덱과 코덱의 표준 알고리즘인 MPEG 알고리즘, 특히 MPEG-2와 각종 서비스 질에 맞추기 위한 MPEG-2 확장형 알고리즘을 살펴본다. 그리고 ATM 망에서 MPEG-2 비트스트림을 수용하기 위한 방법에 대하여 AAL 관점에서 살펴보고, 오디오-비쥬얼 코덱이 가지는 큰 문제점 중의 하나인 지연문제에 대하여 알아본다. 멀티미디어 서비스를 위한 각 종 응용물들을 일반사용자가 손쉽게 배워서 사용토록 할 수 있는 사용자 인터페이스를 단말기에서 제공하기 위하여 고려해야 될 사항과 해결해야 할 문제점들에 대하여 살펴본다.

  • PDF

A study on searching image by cluster indexing and sequential I/O (연속적 I/O와 클러스터 인덱싱 구조를 이용한 이미지 데이타 검색 연구)

  • Kim, Jin-Ok;Hwang, Dae-Joon
    • The KIPS Transactions:PartD
    • /
    • v.9D no.5
    • /
    • pp.779-788
    • /
    • 2002
  • There are many technically difficult issues in searching multimedia data such as image, video and audio because they are massive and more complex than simple text-based data. As a method of searching multimedia data, a similarity retrieval has been studied to retrieve automatically basic features of multimedia data and to make a search among data with retrieved features because exact match is not adaptable to a matrix of features of multimedia. In this paper, data clustering and its indexing are proposed as a speedy similarity-retrieval method of multimedia data. This approach clusters similar images on adjacent disk cylinders and then builds Indexes to access the clusters. To minimize the search cost, the hashing is adapted to index cluster. In addition, to reduce I/O time, the proposed searching takes just one I/O to look up the location of the cluster containing similar object and one sequential file I/O to read in this cluster. The proposed schema solves the problem of multi-dimension by using clustering and its indexing and has higher search efficiency than the content-based image retrieval that uses only clustering or indexing structure.