• 제목/요약/키워드: Audio Information Retrieval

검색결과 73건 처리시간 0.022초

광대역 ISDN용 MPEG 오디오-비쥬열 대화형 통신단말의 설계 및 구현 (A MPEG Audio-Visual Conversational Communication Terminal on the B-ISDN Environment)

  • 황대환;조규섭
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1960-1971
    • /
    • 1998
  • 광대역 ISDN에서 사용될 수 있는 멀티미디어 통신서비스로서 Video on Demand(V0D)와 같은 검색형 분배서비스와 영상전화, 다지점 영상회의와 같은 실시간 대화형 서비스를 대상으로 활발한 연구, 개발이 이루어지고 있다. V0D 서비스에 대한 연구는 Digital Audio-Visual Council(DAVIC)에서 V0D 서버, 전달 망, 그리고 Set-Top Box(STB) 등을 포함한 전체 시스템에 대한 규격을 확정하였고 대화형 멀티미디어 통신단말은 ITU-T SG16에서 H.300 계열 단말의 표준을 대부분 완료한 상태이다. 그러나 이들 기구에서 권고하고 있는 멀티미디어 통신단말의 구조는 주 연구대상의 차이로 인해, 검색형 분배서비스와 대화형 통신서비스를 모두 제공할 수 있는 효율적인 구성 형태를 갖고 있지 못하다. 본 논문은 ITU-T, DAVIC, ATM Forum 등의 권고 및 규격을 면밀히 분석한 후, 동일한 멀티미디어 통신단말에서 V0D 및 대화형 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안하고 설계, 구현하였다. 광대역 ISDN을 대상으로 한 통신단말은 범용 PC에 탑재되는 두 개의 add-on 카드로 구현하였으며, ATM 접속을 통한 V0D 및 일-대-일 대화형 멀티미디어 통신 세션 설정와 실험을 통해 기능의 검증을 완료하였다.

  • PDF

비디오 데이타를 위한 그리드 기반의 유사 부분 궤적 검색 기법 (Similar sub-Trajectory Retrieval Technique based on Grid for Video Data)

  • 이기영;임명재;김규호;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권5호
    • /
    • pp.183-189
    • /
    • 2009
  • 최근, PCS, PDA와 같은 이동기기 보급의 확산, GPS(Global Positioning System)의 활용, 유무선 네트워크의 급속한 발전 등으로 일반 사용자들조차 이미지, 오디오, 비디오 등과 같은 멀티미디어 데이타에 대한 활용이 증가하고 있다. 특히, 멀티미디어 데이타 중에서도 비디오 데이타는 텍스트나 이미지 데이타와는 달리 이동 객체에 대한 움직임 정보를 포함하고 있고 시간의 변화에 따라 공간의 변화를 가지는 시공간적 특성을 가진다. 객체의 공간적 위치가 시간의 흐름에 따라 계속 변하는 이동객체(Moving Object)들의 연속적인 움직임들의 모임을 궤적이라 하며, 데이타베이스에서 사용자로부터 주어진 질의 궤적과 유사한 궤적을 포함하는 데이타를 찾는 것을 유사 부분궤적 검색(Similar Sub-trajectory Retrieval)이라 한다. 그리고 이러한 유사 부분궤적 검색을 하기 위해선 사용자 질의 궤적과 주어진 유사정도(Tolerance) 내에서 유사한 데이타 궤적을 검색 할 수 있는 근사 매칭(Approximate Matching)이 가능해야 한다. 또한, 방대한 멀티미디어 데이타베이스에서 사용자가 원하는 데이타 만을 보다 빠른 시간 내에 찾을 수 있도록 기존 연구와는 다른 효과적인 검색방법이 요구된다. 이를 위해, 본 논문에서는 효과적인 검색을 위해 궤적을 그리드로 분할하여 이동 객체의 궤적에 대한 효율적인 유사 부분궤적 검색을 지원하는 새로운 그리드 기반 검색 기법을 제안한다.

  • PDF

Multimodal Approach for Summarizing and Indexing News Video

  • Kim, Jae-Gon;Chang, Hyun-Sung;Kim, Young-Tae;Kang, Kyeong-Ok;Kim, Mun-Churl;Kim, Jin-Woong;Kim, Hyung-Myung
    • ETRI Journal
    • /
    • 제24권1호
    • /
    • pp.1-11
    • /
    • 2002
  • A video summary abstracts the gist from an entire video and also enables efficient access to the desired content. In this paper, we propose a novel method for summarizing news video based on multimodal analysis of the content. The proposed method exploits the closed caption data to locate semantically meaningful highlights in a news video and speech signals in an audio stream to align the closed caption data with the video in a time-line. Then, the detected highlights are described using MPEG-7 Summarization Description Scheme, which allows efficient browsing of the content through such functionalities as multi-level abstracts and navigation guidance. Multimodal search and retrieval are also within the proposed framework. By indexing synchronized closed caption data, the video clips are searchable by inputting a text query. Intensive experiments with prototypical systems are presented to demonstrate the validity and reliability of the proposed method in real applications.

  • PDF

The Efficacy of Zoom Technology as an Educational Tool for English Reading Comprehension Achievement in EFL Classroom

  • Kim, HyeJeong
    • International Journal of Advanced Culture Technology
    • /
    • 제8권3호
    • /
    • pp.198-205
    • /
    • 2020
  • The purpose of this study is to investigate the effect of real-time remote video instruction using zoom on learners' English reading achievement. The study also sought to identify the efficiency of zoom video lectures and consider supplementing them by surveying learners' opinions and satisfaction regarding zoom video lectures. To this end, control and experimental groups were set up, and two achievement tests and a questionnaire were conducted. The study's results demonstrated that zoom video lectures have a positive effect on learners' English reading achievement. The questionnaire found that learners are satisfied with zoom video lectures for the following reasons: 'increased interest in and motivation towards learning', 'self-directed learning', 'active interaction', 'ease of access', 'ease of information retrieval'. At the same time, the questionnaire also found that some learners are dissatisfied with zoom video lectures due to 'mechanical errors or defects', 'poor audio quality', and 'the need to add customized functions for efficient classes'. In practice, zoom video lectures must be supplemented with automatic attendance processing, convenient data upload and download, and more efficient video screen management. Given the recent increase in online classes, we, as instructors, must develop teaching activities and/or strategies for video lectures that can encourage active participation by learners.

민방위 경보 방송에 대한 정보 수용자 인식 연구 (A Study on the Recognition of Information Accepter about Civil Defence Alert Broadcasting)

  • 곽천섭;경일수;이현지
    • 방송공학회논문지
    • /
    • 제20권6호
    • /
    • pp.827-836
    • /
    • 2015
  • 본 연구의 목적은 경보 전달 체계에 대한 정보 수용자의 이용 및 인식 조사를 통해 전달 시스템의 개선 방향을 제시하는 데 있다. 조사 결과에 따르면, 정보 수용자들은 민방위 경보 방송을 개인 미디어 보다는 대중 미디어를 통해 접하고 있었다. 민방위 경보 방송의 청취 빈도는 매우 낮았는데, 1년에 5회 이하로 청취하고 있는 것으로 나타났고, 4명중 1명은 경보 방송의 사이렌과 내용이 잘 안들린다는 의견이었다. 그리고 민방위 경보 방송의 사이렌은 소방차 등과 같은 다른 경보 사이렌에 비해 낮은 기억 회상과 구분 능력을 보였으며, 실제 상황 시 사전 지식에 따른 행동 보다는 방송에 따라 행동할 것이라는 응답이 높은 것으로 나타났다. 마지막으로, 민방위 경보 시스템이 나가야 할 방향으로는 사회 시스템 구축 보다는 교육 및 홍보를 통한 국민의식 개선이 중요한 것으로 나타났다.

정형외과 관절경 영상 저장 시스템의 설계 및 구현 (Design and Implementation of the Endoscope Image Store System in the Orthopedics)

  • 심갑식;정태영
    • 한국컴퓨터정보학회논문지
    • /
    • 제7권4호
    • /
    • pp.8-15
    • /
    • 2002
  • 본 논문은 의료영상을 데이터베이스화 시켜 그것을 영구적으로 보관할 수 있는 시스템 개발이다. 즉, 정형외과의 관절경을 이용한 수술이나 진단 시 수집되는 영상 자료를 데이터베이스화하여 복수의 적용 업무나 응용프로그램이 데이터를 공유할 수 있도록 하며, 동일한 자료의 중복을 피하고 검색과 갱신이 효율적으로 되도록 데이터를 관리하는 시스템이다. 본 시스템은 다섯 가지 구성요소로 이루어져 있다. 즉, 내시경으로부터 영상자료를 받는 입력모듈, 입력받은 영상자료를 저장하는 모듈, 환자의 진료내역 및 영상자료를 저장하는 데이터베이스 설계 및 구현, 사용하기 편리한 인터페이스 설계 및 구현, 간단하고 편리한 데이터 검색을 위한 엔진 등이다. 시스템의 특징은 다음과 같다. DirectShow를 이용한 영상 캡쳐 프로그램은 어떤 영상 캡쳐 보드와 호환이 가능하다. 영상 캡쳐 알고리즘을 공용 모듈로 만들었기 때문에 인터넷상에서 비디오. 오디오 컨텐츠를 개발할 때 작업효율을 높일 수 있다.

  • PDF

빠른 검색을 위한 음원 시그니처 인덱싱 방법 (Music Source Signature Indexing Method for Quick Search)

  • 김상균;이경식
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.321-326
    • /
    • 2021
  • 블록체인은 자본 거래나 보안 데이터의 안전한 전송을 위한 플랫폼으로 그 가치가 높아지고 있다. 아울러 블록체인은 동영상, 음악, 사진과 같은 대용량의 데이터를 안전하게 저장하고, 거래 내용이나 서비스 이용 명세 등을 안전하게 관리할 수 있는 새로운 플랫폼으로서의 가능성을 가지고 있다. 블록 내 대용량 미디어 데이터를 저장할 수 없기에 분산저장 시스템(IPFS)과 음원 시그니처 데이터의 해시 정보를 이용하여 블록 내 음원 정보를 저장하고, 저장된 음원 데이터를 검색하는 속도에 관한 연구가 진행되었다. 본 논문에서는 기존 연구가 제시했던 검색 속도를 향상시킬 수 있는 블룸필터를 이용한 음원 시그니처 인덱싱 방법을 제안한다. 실험 결과 기존 검색성능(O(n))보다 향상된 검색 성능 (O(1))을 달성할 수 있음을 확인할 수 있었다.

WebCam을 이용한 멀티미디어 보안시스템의 설계와 구현 (Design and Implementation of Multimedia Monitoring System Using WebCam Structure)

  • 송은성;오용선
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.161-166
    • /
    • 2003
  • 본 논문에서는 웹카메라(WebCam)을 이용한 멀티미디어 보안시스템을 설계하고 이를 구현하는 새로운 방법을 제안한다. 최근 여러 분야에서 WebCam을 응용하여 다양하고 편리한 기능의 시스템을 구현하고, 이를 웹의 편리한 기능에 접목시켜 구조적이고 향상된 성능을 실현하고 있다. 멀티미디어 동영상은 고도의 자료압축 방식과 통신회선 속도의 향상 및 인터넷을 통한 다양한 서비스가 가능해지면서 기존의 보안시스템에 대한 성능향상을 목적으로 크게 변모하고 있다. 본 논문에서 제안하는 보안시스템의 설계방식은 개방된 인터넷을 이용한 통신망 환경에서 보안시스템이 달성하고자 하는 목적을 위하여 웹의 활용성을 충분히 보여줄 수 있을 뿐 아니라 다양한 웹 서비스를 활용함으로써 기존의 것보다 뛰어난 응용성을 보장하는 형태이다. 실시간 멀티미디어 동영상 및 음성의 전송을 통한 현실감 있는 모니터링은 물론 다양한 방식으로 변환되는 정보 서비스와 멀티미디어 자료저장 및 추출을 통한 비실시간 감시 및 보안을 모두 실현할 수 있는 구조와 실현 시스템을 제시하는 것이다.

  • PDF

대학도서관 전자자원관리시스템(ERMS) 구축에 관한 연구 (A Study on the Development of Electronic Resource Management System in a University Library)

  • 김용;조수경
    • 한국문헌정보학회지
    • /
    • 제44권4호
    • /
    • pp.249-276
    • /
    • 2010
  • 정보통신기술 발전에 따라 인쇄매체로 유통되는 정보자원의 형식이 많은 부분 디지털화 되어 네트워크를 통하여 유통 소비되고 있다. 최근 각 대학도서관에서 집행하는 도서구입비에서 전자자원 구입비가 차지하는 비중과 이용자들의 전자자원에 대한 의존도가 현저히 높아지고 있는 추세이다. 따라서 본 연구에서는 ERMS의 모형 제시와 함께 각 단계별로 ERMS가 갖추어야 하는 요소를 확인하였다. 또한 대학도서관 ERMS에 있어서 필요한 기능을 다음과 같이 분석하였다. 첫째, ERMS는 다양한 전자자원에 대한 접근정보, 소장정보, 메타데이터, 이용자서비스 등이 종합적으로 관리되어야 하며 도서관에서 기존에 운영하고 있는 메타검색, 링킹시스템, 프록시서비스 시스템들과의 통합적인 기반으로 운영되어야 한다. 둘째, ERMS는 전자자원의 통합적인 자료조직과 예산관리를 위하여, 대학도서관에서 운영하고 있는 통합도서관시스템의 수서, 목록시스템과의 안정적인 연계시스템으로 구축되어야 한다. 셋째, ERMS는 전자자원이 갖고 있는 라이선스에 관한 정보를 체계적이고 효율적으로 관리할 수 있어야 한다. 넷째 ERMS는 도서관에 모든 전자자원의 이용과 평가, 접속관리를 위한 효율적인 환경을 제공할 수 있어야 하며 전자자원에 있어서 모든 것을 다루는 하나의 유기적인 시스템으로 작동을 해야 한다. 추가적으로 대학도서관에서 ERMS 구축시 인쇄자원관리 위주로 설계된 도서관조직구조 및 사서의 업무분장을 재설계할 필요성과 대학도서관들의 전자자원관리 분야 협력과 표준 마련을 위하여 DLF ERMI 사례와 같은 협의체 구성의 필요성을 제기하였다.

MAF(Multimedia Application File Format) 기반 멀티미디어 검색 시스템의 설계 및 구현 (A Design and Implementation of Multimedia Retrieval System based on MAF(Multimedia Application File Format))

  • 강영모;박주현;방형진;낭종호;김형철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권9호
    • /
    • pp.574-584
    • /
    • 2006
  • 최근 MPEG-A(ISO/IEC 23000)에서는 MAF(Multimedia Application File Format)[1]라는 새로운 멀티미디어 파일 포맷을 제안하고 있다. MAF 파일포맷은 기존의 MPEG 압축 규격을 갖는 미디어 파일에 더해, 미디어 내용 정보를 기술하는 메타데이타를 MPEG-7을 사용하여 하나의 시스템 포맷 내에 포함할 수 있도록 해준다. 하지만 현재로서는 이러한 표준을 구현한 실제 시스템이 없기 때문에, 응용 측면에서 MAF가 얼마나 유용한지 검증하기 어렵다는 문제점을 가지고 있다. 본 논문에서는 PC와 모바일 단말기상에서 MPEG-A 표준을 기반으로 한 멀티미디어 검색 시스템을 설계 및 구현한다. 또한 MPEG-A에서는 아직 동영상에 관련된 메타데이타에 대해서는 제안된 바가 없기 때문에 MPEG-7 MDS(Multimedia Description Scheme)[2]와 TV-Anytime[3]을 기반으로 모바일 환경에서도 저작 및 사용하기 편리한 메타데이타들을 설계한다. 전체 시스템을 설계하기 위해서 MAF 검색 시스템이 가져야 할 5가지 요구사항인 이식성, 확장성, 호환성, 적응성, 효율성을 정의하고 이러한 요구사항을 바탕으로 하여 MAF 검색 시스템의 전체 구조를 응용 계층, 미들웨어 계층, 플랫폼 계층으로 설계한다. 제안하는 검색 시스템은 MAF 형식의 멀티미디어 데이타를 저작, 재생, 검색할 수 있는 클라이언트 파트와, 대용량의 MAF 형식의 멀티미디어 파일과 MAF 파일로부터 추출한 MPEG-7 형태의 메타데이타를 저장, 관리할 수 있는 서버 파트로 구성된다. 그리고 설계한 MAF 검색 시스템의 유용성을 검증하기 위하여, PC에서는 MS 윈도우 플랫폼 그리고 모바일 단말기에서는 WIPI 플랫폼 상에서 클라이언트 시스템을 구현하고 시스템 요구사항들을 모두 만족하는지 여부를 확인한다. 제안하는 검색 시스템은 MPEG-A 표준을 검증하고 그 유용성을 확인하기 위해 사용될 수 있다.