• 제목/요약/키워드: 오디오 검색

검색결과 119건 처리시간 0.03초

Meta Data를 이용한 HRTF DB 설계 (An architecture for HRTF DB using Meta data)

  • 강상길;황재민;송주형;김정혁;김찬형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1078-1080
    • /
    • 2013
  • 본 논문에서는 5.1 채널 입체 음향 오디오 신호를 2채널의 헤드폰으로 재생하기 위해 사용하는 HRTF(Head-related transfer funcion) DB를 다룬다. 다양한 HRTF DB의 사례를 분석하고, 이를 통해서 더 나은 HRTF DB를 설계 한다. 기존의 HRTF DB에 Audio Meta data를 이용하여 파일의 정보를 저장하고, 이를 DB에 저장함으로써 Meta data를 비교 검색하고 저장함으로써 편의성을 높인다. 또한 기존의 HRTF DB들이 오래 되고 현재의 시스템에 맞지 않기 때문에 이를 현재의 시스템에 맞게 Converting하고 UI를 3D로 구현함으로써 UX를 높이고 직관성을 개선함으로써 사용자 접근성을 높인다. 이를 통해서 HRTF DB의 범용성을 개선하고 관련 연구에 효율적으로 사용할 수 있게 될 것이다.

이질적인 멀티미디어 메타데이터 통합 관리를 위한 시스템 구조 (Integrated System for Managing Heterogeneous Multimedia Metadata)

  • 박성규;이양구;채덕진;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.371-374
    • /
    • 2008
  • 최근 인터넷과 네트워크 기술이 급격히 발전함에 따라 대용량의 동영상 데이터에 대한 서비스 요구가 급격히 증가하고 있으며, 인터넷 사용자는 비디오, 오디오, 텍스트 등으로 표현되는 다양한 멀티미디어 컨텐츠를 쉽게 이용할 수 있게 되었다. 이러한 환경에서 동영상 컨텐츠의 저장, 교환 및 검색에 있어서 보다 나은 편리성을 요구하게 되었고, 이것은 동영상 데이터의 다양한 정보를 기술하기 위한 메타데이터의 중요성을 더욱 증대시키게 되었다. 그러나 이러한 서비스들을 데이터 포맷 및 서비스 종류에 따라 각기 다른 표준을 사용하고 있어 업계간 또는 서비스간에 다르게 표현되는 메타데이터 정보들을 통합 관리하기는 어려운 실정이다. 따라서, 이 논문에서는 기존의 메타데이터 관리 시스템의 이점을 수용하고, 이를 확장하여 각각의 표준에 따라 서로 다르게 표현되는 동영상 메타데이터를 통합 관리하기 위한 시스템을 제안한다.

정형외과 관절경 영상 저장 시스템의 설계 및 구현 (Design and Implementation of the Endoscope Image Store System in the Orthopedics)

  • 심갑식;정태영
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.8-15
    • /
    • 2002
  • 본 논문은 의료영상을 데이터베이스화 시켜 그것을 영구적으로 보관할 수 있는 시스템 개발이다. 즉, 정형외과의 관절경을 이용한 수술이나 진단 시 수집되는 영상 자료를 데이터베이스화하여 복수의 적용 업무나 응용프로그램이 데이터를 공유할 수 있도록 하며, 동일한 자료의 중복을 피하고 검색과 갱신이 효율적으로 되도록 데이터를 관리하는 시스템이다. 본 시스템은 다섯 가지 구성요소로 이루어져 있다. 즉, 내시경으로부터 영상자료를 받는 입력모듈, 입력받은 영상자료를 저장하는 모듈, 환자의 진료내역 및 영상자료를 저장하는 데이터베이스 설계 및 구현, 사용하기 편리한 인터페이스 설계 및 구현, 간단하고 편리한 데이터 검색을 위한 엔진 등이다. 시스템의 특징은 다음과 같다. DirectShow를 이용한 영상 캡쳐 프로그램은 어떤 영상 캡쳐 보드와 호환이 가능하다. 영상 캡쳐 알고리즘을 공용 모듈로 만들었기 때문에 인터넷상에서 비디오. 오디오 컨텐츠를 개발할 때 작업효율을 높일 수 있다.

  • PDF

강인한 오디오 핑거프린팅 시스템을 위한 에너지와 통계적 필터링 (Energy and Statistical Filtering for a Robust Audio Fingerprinting System)

  • 정병준;김대진
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-9
    • /
    • 2012
  • 디지털 음악과 스마트 폰이 대중화되면서 잡음에 강인한 실시간 음악 핑거프린트 시스템이 다양하게 개발되고 있다. 특히 핑거프린트 알고리즘 중 Multiple Hashing(MLH)은 잡음에 강인하고 정교한 구조로 되어 있다. 본 논문에서는 음악 데이터베이스로부터 질의 및 응답의 정확도를 개선하기 위해 에너지 집중필터를 사용하고 연속성과 중복성을 제거하는 통계적 필터를 제안한다. 에너지 집중 필터는 하위 비트에 에너지가 집중되는 Discrite Cosine Transform(DCT)의 특징을 이용하고, 통계적 필터는 검색된 핑거프린트 정보들 사이의 상관관계 특성을 이용한다. 실험 결과로 잡음 환경에서 에너지와 통계적 필터링으로 구성된 제안 알고리즘은 우수성을 보인다. 이는 제안된 필터 엔진으로 Philips Robust Hash(PRH)보다 잡음에 강인하고 Multiple Hashing(MLH)보다 간결한 핑거프린트 시스템을 구성할 수 있다.

컬러 특성을 이용한 실시간 동영상의 cut detection 기법 (Cut detection methods of real-time image sequences using color characteristics)

  • 박진남;이재덕;허영
    • 전자공학회논문지CI
    • /
    • 제39권1호
    • /
    • pp.67-74
    • /
    • 2002
  • 멀티미디어 기기의 발전과 더불어 다양한 매체로부터 다양한 종류의 영상, 오디오, 텍스트 등의 정보가 난무하고, 이들 정보를 사용자의 요구에 따라 효과적으로 검색·관리를 위한 연구가 활발히 진행되어지고 있다. 실시간 연속 영상에서 내용이 연결되는 부분과 장면전환 등에 의해 내용이 바뀌는 부분을 자동 검출 가능하다면 적은 량의 데이터 내용 표현으로 영상 검색의 효율성을 증대시키는 효과를 가져 올 수 있을 것이다. 본 논문에서는 영상의 특성에 따른 실시간 Cut detection 기술을 제안하고 이 방법의 성능을 다양한 영상 데이터를 바탕으로 정확성 평가를 하였다. 그 결과 영상데이터의 컬러 특성에 관한 통계적인 특성 정보를 필요로 하는 기존의 컬러 히스토그램 방식과는 달리 본 방식은 각 프레임 영상의 색상 분포의 변화분에 의존하므로 어떤 종류의 영상 패턴에도 적용 가능한 robust한 방식이며, 실시간 입력영상의 cut detection 이 가능한 이점이 있음을 확인할 수 있었다.

대용량 플래시 메모리를 위한 임베디드 텍스트 인덱스 시스템 (An Embedded Text Index System for Mass Flash Memory)

  • 윤상훈;조행래
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-10
    • /
    • 2009
  • 플래시 메모리는 비휘발성이고 저전력으로 동작하며 가볍고 내구성이 강하다. 이러한 특성으로 휴대용 멀티미디어 재생기(PMP)와 같은 모바일 컴퓨팅 환경에서의 저장 장치로 많이 사용되고 있다. 대용량의 플래시 메모리를 저장 장치로 가진 모바일 기기들은 비디오/오디오/사진등과 같은 다양한 종류의 멀티미디어 데이터를 저장하고 재생한다. 모바일 컴퓨팅 장치를 위한 기존의 인덱스 시스템은 노래 가사와 같은 텍스트 형태의 정보 검색에 비효육적이다. 본 논문에서는 대용량 플래시 메모리 기반 임베디드 텍스트 인덱스(Embedded Text Index: EMTEX) 시스템을 제안한다. EMTEX는 먼저 임베디드 시스템을 고려한 압축 알고리즘을 사용하며, 텍스트 인덱스가 구성된 필드에 삽입 및 삭제시 인덱스에 즉시 반영된다. 뿐만 아니라, 플래시 메모리의 특성을 고려한 효율적인 삽입, 삭제, 재구성 기능을 수행하며, DBMS의 상위 계층에서 독립적으로 동작한다는 장점을 갖는다. 제안한 시스템의 성능 평가를 위해 다양한 환경에서 실험을 수행하였다. 그 결과 EMTEX는 임베디드 환경에서 Oracle Text나 FT3와 같은 기존의 인덱스 시스템보다 더 좋은 성능을 보여주었다.

시간 지연 신경망을 이용한 음악 장르 분류 (Music Genre Classification using Time Delay Neural Network)

  • 이재원;조찬윤;김상균
    • 한국멀티미디어학회논문지
    • /
    • 제4권5호
    • /
    • pp.414-422
    • /
    • 2001
  • 본 논문에서는 오디오 데이터의 효과적인 검색을 위하여, 시간지연신경망을 이용한 음악 장르 분류 시스템을 제안한다. 분류 대상 장르는 Blues, Country, Hard Core, Hard Rock, Jazz, R&B(Soul), Techno, Trash Metal의 8종류이다. 장르를 분류하기 위한 비교단위는 곡 중에서의 한 마디이다. 이러한 마디는 리듬의 특성을 효과적으로 반영하는 스네어 드럼 소리를 기준으로 추출한다. 분류기는 시간 지연 신경망을 이용하여 구성하며 입력은 추출된 마디에 대한 주파수 특징벡터이다. 제안한 시스템의 유효성을 검증하기 위한 실험에서, 장르별 10곡씩 총 80곡의 학습 데이터와 장르별 5곡씩 총 40곡의 테스트 데이터에 대하여 각각 92.5%와 60%의 정인식율을 보였다

  • PDF

MPEG-7메타데이터 편집 시스템의 개발 (Development of A Metadata Generating & Editing System for MPEG-7)

  • 김명진;정준영;이상범
    • 한국산학기술학회논문지
    • /
    • 제6권3호
    • /
    • pp.241-248
    • /
    • 2005
  • MPEG-7은 디지털 영상과 오디오와 같은 멀티미디어 데이터에 대한 구조와 의미 정보를 제공해 줌으로써, 정보를 효율적으로 검색하고 탐색하는데 도움을 주고 있다. 본 논문에서는 MPEG-7 기반의 메타데이터 편집할 수 있는 소프트웨어 시스템을 소개하고자 하며 이는 대화형 컨텐츠제작시에 필요한 메타데이터의 편집에 필요한 기술 및 전체 프레임웍을 제공한다. 본 연구에서 개발한 시스템은 MPEG-7 DDL을 기반으로 하는 메타데이터 생성, 편집, 저장 기능, MPEG1, 2 동영상을 기반으로 하는 동영상의 메타데이터 편집 기능, 그리고 편집과정 전체를 브라우징 할 수 있는 기능도 제공한다.

  • PDF

AI 스피커의 기능별 이용 인식과 지속 이용 의도의 차이: 음악, 뉴스, 검색을 중심으로 (Differences in Perceptions of Usage and Intention to Continuous Use of AI Speakers: Focusing on Functions of Music, News, and Search)

  • 김영주;김성태;김형지
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.644-655
    • /
    • 2020
  • 연구는 오디오 콘텐츠 기반 AI 스피커 이용 인식과 지속 이용 의도를 이용 기능에 따른 차이로 살펴보았다. 구체적으로 AI 스피커 이용기능별(음악 청취, 뉴스 습득, 생활 검색) 이용량을 기준으로 이용 패턴(단일 기능 중심 집단과 다중 기능 중심 집단)구분하고, 이들에 따라 AI 스피커 이용 인식과 지속 이용 의도의 차이를 분석하였다. 분석은 AI 스피커 이용 경험이 있는 성인 남녀 335명을 대상으로 온라인 설문조사 한 응답을 활용하였다. 분석결과는 다음과 같다. 첫째, 남성이 뉴스 습득을 위해 AI 스피커 이용이 많았고, 20대와 40대 이상 간의 뉴스 습득 정도도 차이를 보였다. 둘째, AI 스피커의 유용성과 사용 용이성에 대한 인식은 다중 기능 중심(음악 청취-뉴스 습득-생활 검색) 이용 집단에서 높게 나타났다. 마지막으로 AI 스피커의 지속 이용 의도도 다중 기능 중심 이용집단에서 가장 높게 나타났으며, 음악 청취 기능에 집중된 이용자의 지속 이용 의도가 다른 기능의 이용자에 비해 상대적으로 높다는 사실도 발견했다. 본 연구의 결과는 향후 AI 스피커의 이용 확산과 브랜드별 제공 서비스 전략 수립을 위한 기초자료로 활용될 것을 기대한다.

다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축 (A Digital Library Prototype for Access to Diverse Collections)

  • Choi Won-Tae
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.295-307
    • /
    • 1998
  • 본 논문은 다양한 유형으로 구성되어 있는 디지털 도서관의 장서가 어떠한 역할을 수행하는지를 나타내는 디지털 도서관의 구축에 관한 것이다. 본 연구에서 구축된 디지털도서관의 프로토타입은 디지털 리포지토리, 필터, 색인 및 검색, 클라이언트의 구조로 되어 있다. 디지털 리포지토리는 여러 가지 유형의 문서유형과 다양한 형태의 데이터베이스로 구성된다. 필터는 다양한 문헌의 포맷을 인식하고 문헌 각각의 조직적인 요소를 지능적으로 구분하는 역할을 수행한다. 본 시스템은 관계형 데이터베이스 관리 시스템인 ORACLE과 ConText를 이용하여 구성되었으며 새로운 객체의 분석 및 조직화, 색인기술의 적용을 용이하게 처리할 수 있다. 클라이언트는 여러 유형의 데이터 포맷(이미지, 오디오 비디오 SGML, PDF, KORMARC 등)의 디스플레이를 위한 브라우저, 뷰어이다. 이용자는 이러한 도구들을 이용하여 문헌을 구분하고 각각의 아이템을 브라우징하고 탐색할 수 있다. 본 연구의 탐색 인터페이스는 HTML과 WWW의 CGI를 이용하여 구현되었다.

  • PDF