• 제목/요약/키워드: object audio

검색결과 95건 처리시간 0.032초

다양한 장서 접근을 위한 디지털 도서관의 프로토타입 구축 (A Digital Library Prototype for Access to Diverse Collections)

  • Choi Won-Tae
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.295-307
    • /
    • 1998
  • 본 논문은 다양한 유형으로 구성되어 있는 디지털 도서관의 장서가 어떠한 역할을 수행하는지를 나타내는 디지털 도서관의 구축에 관한 것이다. 본 연구에서 구축된 디지털도서관의 프로토타입은 디지털 리포지토리, 필터, 색인 및 검색, 클라이언트의 구조로 되어 있다. 디지털 리포지토리는 여러 가지 유형의 문서유형과 다양한 형태의 데이터베이스로 구성된다. 필터는 다양한 문헌의 포맷을 인식하고 문헌 각각의 조직적인 요소를 지능적으로 구분하는 역할을 수행한다. 본 시스템은 관계형 데이터베이스 관리 시스템인 ORACLE과 ConText를 이용하여 구성되었으며 새로운 객체의 분석 및 조직화, 색인기술의 적용을 용이하게 처리할 수 있다. 클라이언트는 여러 유형의 데이터 포맷(이미지, 오디오 비디오 SGML, PDF, KORMARC 등)의 디스플레이를 위한 브라우저, 뷰어이다. 이용자는 이러한 도구들을 이용하여 문헌을 구분하고 각각의 아이템을 브라우징하고 탐색할 수 있다. 본 연구의 탐색 인터페이스는 HTML과 WWW의 CGI를 이용하여 구현되었다.

  • PDF

MPEG-4 영상의 화질 개선에 관한 연구 (Image Enhancement Techniques for MPEG-4)

  • 김태근;신정호;백준기
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.169-181
    • /
    • 1997
  • 초고속압축률, 내용기반 부호화, 객체 단위의 계층적 구조로 대표되는 MPEG-4, 비디오의 화질 개선 기술에 관하여 논의한다. 화질 개설은 크게 두 가지로 나누어 압축과정에서 발생하는 화질 열화(degradation) 요인을 제거하고, 제한되어 있는 공간 및 시간적 해상도를 향상시키는 기술을 제안한다. 첫째 화질 열화의 제거를 위해서, 다시 MPEG-4 비디오 압축 기술을 크게 MPEG-2와 공통되는 부분과 차별되는 부분으로 나눈 후, 전자에 대해서는 이미 개발되어 있는 화질 개선을 적용하고, 후자에 대해서는 새로운 수학적 모델을 제시하여 복원이 가능하게 한다. 둘째 공간적 해상도 향상을 위해서는 다채널 영상보건(multichannel interpolation) 기법의 구현을 위한 일반화된 구조를 제안하고, 시간 해상도 향상을 위해서는 기존의 프레임률 향상 기법을 정리한다. MPEG-4 표준 제정 단계에서 매우 다양한 고려가 이루어지고 있지만, 가장 중요한 화질에 대해서는 상대적으로 제약이 많지 않기 때문에, 사용화 단계에서 화질 개선 기술의 추가가 매우 중요할 것으로 예상된다.

  • PDF

단일 센서를 사용한 다기능 구현에 관한 연구 (A Study on Multi-function Implementation using Single Sensor)

  • 최수열;이창희
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.133-137
    • /
    • 2016
  • IoT정보중 영상과 음성 정보가 많은 부분을 차지한다. 더 정확한 상황 인식과 주 정보의 부재에서 사용할 수 있는 다양한 센서가 요구되고 있다. 다양한 센서 사용에 따른 자원 관리의 증가로 이어진다. 여러 센서의 정보 전달에서 소요되는 자원을 줄이는 방법으로서 센서정보를 가공하여 다른 센서를 대신할 수 있는 가능성을 찾아본다. 본 논문에서는 LIS302 DL MEMS 모션센서를 사용하여 탁구대로 낙하하는 탁구공, 셔틀콕, 테니스공의 데이터를 측정하였다. 3가지 대상체에서 측정한 데이터는 충격량에 비례하는 함을 확인하였다. 이 실험은 가속도 센서를 사용하여 충격량으로 변경될 수 있음을 확인하였다. 이 결과 단일 센서를 사용하여 다기능구현이 가능함을 보였다. 또한, 센서의 초기 개발단계에서 다기능센서 고려 상황을 인식하게 한다.

키넥트와 모바일 장치 알림 기반 온라인 모니터링 시스템 (Online Monitoring System based notifications on Mobile devices with Kinect V2)

  • 니욘사바에릭;장종욱
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1183-1188
    • /
    • 2016
  • 키넥트 센서 버전 2는 컴퓨터 비전과 엑스 박스와 같은 엔유아이 인터페이스로 마이크로소프트에서 출시한 카메라의 일종이다. 이는 높은 프레임 속도로 컬러 영상과 깊이 영상, 오디오 입력 및 스켈레톤 데이터를 취득 할 수 있다. 이러한 다양한 타입의 데이터 정보를 제공해 주기 때문에 이것은 다른 범위의 연구자들을 위한 리소스가 된다. 본 논문에서는 깊이 이미지를 사용하여 우리는 키넥트 범위내에서 특정 영역을 감시하는 시스템을 제시한다. 타켓 영역은 깊이의 최소, 최대 값의 크기에 따라서 그 공간을 모니터링 할 수 있다. 컴퓨터 비전 라이브러리 (Emgu CV)를 사용해서 만약 어떤 오브젝트가 타겟 영역에서 검출된다면 그것을 추적하고 키넥트 카메라는 RGB 이미지를 데이터베이스 서버에 전송한다. 따라서 안드로이드 플랫폼 기반 모바일 애플리케이션을 통해 키넥트 타켓 지역에서 수상한 움직임이 감지되었음을 사용자에게 통지하고 그 장면의 RGB 영상을 표시하기 위해 개발되었다. 사용자는 모니터링 영역 또는 제한 구역과 관련된 다른 경우에서 가치 있는 물건의 대해 최선의 방법으로 반응하고 실시간 통지를 얻는다.

장면 기술을 위한 MPEG-4 기반 XMT API 구현 (MPEG-4 based XMT APIs for Scene Description)

  • 정예선;김규헌;기명석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.91-94
    • /
    • 2001
  • MPEG-4 시스템은 장면 자체를 하나의 구성 요소로 여기는 기존의 시스템과는 달리, 그 장면을 구성하는 부호화 또는 복호화된 A/V 객체(Audio/visual Objects)들을 하나의 단위로 인식하여, 다양한 멀티미디어 컨텐츠의 장면을 구성(Scene Composition)하고 표현 하는 것에 그 특징이 있다. 이러한 MPEG-4 시스템의 객체 기반 특징은 다양한 사용자와의 대화성(Interactivity)을 가능하게 하며 , 또한 편리한 컨텐츠 편집 및 재사용 등이 가능하기에 차세대 디지털 방송 컨텐츠 제작에 중요하게 활용될 전망이다. 객체 기반 A/V 편집 도구는 MPEG-4를 기반으로 차세대 디지털 방송 컨텐츠 제작을 용이하게 하기 위한 제작/편집 도구로써 , 장면을 표현하기 위하여 BIFS(Binary Format for Scene description)와 XMT(eXtensible MPEG-4 Textual format) 포맷을 모두 사용하고 있다. BIFS 포맷은 저작된 결과물을 바이너리 형태로 표현하기 때문에, 저작된 결과물을 전송하는 데에는 용이하나, 중간에 저작된 결과물을 확인하기 어렵고, 또한 기존의 다른 어플리케이션과의 상호 작용(Interoperability)과 교환(Exchange)에도 어려움이 따른다. 이에 반해, XMT는 차세대 마크업 언어로 각광 받고 있는 XML 에 그 기반을 두고 있기에 저작된 결과물을 제작자가 쉽게 저작물을 이해할 수 있으며, SMIL 과 X3D 같은 다른 어플리케이션과의 상호작용과 교환 또한 용이하게 한다 XMT는 기술 방법에 따라 XMT-A 와 XMT-0 두 가지 형태가 있으며, XMT-A 포맷은 VRML에서 발전한 X3D(extensible 3D)를 바탕으로 MPEG-4 시스템의 특징들을 수용하여 구성되고 BIFS와 일대일로 대응된다. 반면에 XMT-0는 멀티미디어 문서를 웹문서로 표현하는 SMIL 2.0 을 그 기반으로 하였기에 MPEG-4 시스템의 특징보다는 컨텐츠를 저작하는 제작자의 초점에 맞추어 개발된 형태이다. XMT를 이용하여 컨텐츠를 저작하기 위해서는 사용자 인터페이스를 통해 입력되는 저작 정보들을 손쉽게 저장하고 조작할 수 있으며, 또한 XMT 파일 형태로 출력하기 위한 API 가 필요하다. 이에, 본 논문에서는 XMT 형태의 중간 자료형으로의 저장 및 조작을 위하여 XML 에서 표준 인터페이스로 사용하고 있는 DOM(Document Object Model)을 기반으로 하여 XMT 문법에 적합하게 API를 정의하였으며, 또한, XMT 파일을 생성하기 위한 API를 구현하였다. 본 논문에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.

  • PDF

연속적 I/O와 클러스터 인덱싱 구조를 이용한 이미지 데이타 검색 연구 (A study on searching image by cluster indexing and sequential I/O)

  • 김진옥;황대준
    • 정보처리학회논문지D
    • /
    • 제9D권5호
    • /
    • pp.779-788
    • /
    • 2002
  • 이미지, 비디오, 오디오와 같은 멀티미디어 데이터들은 텍스트기반의 데이터에 비하여 대용량이고 비정형적인 특성때문에 검색이 어렵다. 또한 멀티미디어 데이터의 특징은 행렬이나 벡터의 형태로 표현되기 때문에 완전일치 검색이 아닌 유사 검색을 수행하여 원하는 이미지와 유사한 이미지를 검색해야 한다. 본 논문에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사한 이미지는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축함으로써 이미지 근처의 클러스터를 찾아 빠른 검색 결과를 제공하는 유사 검색방법을 제시한다. 본 논문에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O 시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속적인 파일 I/O를 사용하여 클러스터를 찾는 비용을 최소화한다. 클러스터 인덱싱 접근은 클러스터링을 생성하는 알고리즘과 해싱 기법의 인덱싱을 이용함으로써 고차원 데이터가 갖는 차원의 문제를 해결하며 클러스터링 또는 인덱싱 만을 이용하는 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보인다.

다양한 재생 환경을 지원하는 XMT 저작 시스템 (An XMT Authoring System supporting Multiple Presentation Environments)

  • 김희선;임영순
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권3호
    • /
    • pp.251-258
    • /
    • 2004
  • XMT는 텍스트 형식의 MPEG-4 씬 기술 언어로 방송용 오디오/비디오 편집 및 사용자 중심의 미디어 컨텐츠 개발에 활용될 수 있다. 본 논문에서는 다양한 재생 환경에서 컨텐츠의 상호 교환을 지원하는 XMT 저작 시스템을 제안한다. XMT 저작 시스템은 XMT의 두 가지 파일 포맷인 XMT-$\alpha$와 XMT-$\Omega$를 생성한다. 두 파일 포맷은 같은 객체를 표현하는 방법이 다르므로, 추상화된 XMT-$\alpha$를 위한 저작 인터페이스와 XMT-$\Omega$를 위한 인터페이스를 제공한다. 또한, 두 개의 파일 포맷을 지원할 수 있는 내부 자료 구조를 정의하고, XMT-$\alpha$를 BIFS로 변환하는 기능과 XMT-$\Omega$를 SMIL, XMT-$\alpha$로 변환하는 기능을 제공하여 XMT의 특징인 다양한 환경에서 멀티미디어의 상호 교환성을 제공한다.

A Study on Design and Implementation of Speech Recognition System Using ART2 Algorithm

  • Kim, Joeng Hoon;Kim, Dong Han;Jang, Won Il;Lee, Sang Bae
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제4권2호
    • /
    • pp.149-154
    • /
    • 2004
  • In this research, we selected the speech recognition to implement the electric wheelchair system as a method to control it by only using the speech and used DTW (Dynamic Time Warping), which is speaker-dependent and has a relatively high recognition rate among the speech recognitions. However, it has to have small memory and fast process speed performance under consideration of real-time. Thus, we introduced VQ (Vector Quantization) which is widely used as a compression algorithm of speaker-independent recognition, to secure fast recognition and small memory. However, we found that the recognition rate decreased after using VQ. To improve the recognition rate, we applied ART2 (Adaptive Reason Theory 2) algorithm as a post-process algorithm to obtain about 5% recognition rate improvement. To utilize ART2, we have to apply an error range. In case that the subtraction of the first distance from the second distance for each distance obtained to apply DTW is 20 or more, the error range is applied. Likewise, ART2 was applied and we could obtain fast process and high recognition rate. Moreover, since this system is a moving object, the system should be implemented as an embedded one. Thus, we selected TMS320C32 chip, which can process significantly many calculations relatively fast, to implement the embedded system. Considering that the memory is speech, we used 128kbyte-RAM and 64kbyte ROM to save large amount of data. In case of speech input, we used 16-bit stereo audio codec, securing relatively accurate data through high resolution capacity.

RMR과 전기비저항의 상관성 해석에 기초하여 지시크리깅을 적용한 최적 암반 분류 기법 고찰 (Investigation of Indicator Kriging for Evaluating Proper Rock Mass Classification based on Electrical Resistivity and RMR Correlation Analysis)

  • 이경주;하희상;고광범;김지수
    • 터널과지하공간
    • /
    • 제19권5호
    • /
    • pp.407-420
    • /
    • 2009
  • 이 연구에서는 시추 조사와 물리탐사 자료와 같은 다양한 지반 정보를 통합하여 최적의 암반 분류 기법을 도출하는데 지시크리깅을 적용하였다. 최적의 지시크리깅 결과를 얻기 위해서는 효과적으로 hard data(시추조사)와 soft data(물리탐사 자료)를 통합하기 위한 알맞은 방법을 모색할 필요가 있다. 이론적인 베리오그램 모델변수를 결정하기 위해 반복적 비선형 역산 방법을 적용하였고 이 알고리즘의 타당성 검증을 위해 목적함수의 분포양상을 검토한 결과 상관거리에 따른 구배는 대단히 작은 특성을 보였다. 현장 적용지역은 지표에서 터널 계획고까지의 심도가 최대 500 m인 대규모 산악터널 예정지이다. 지시크리깅을 이용하여 soft data인 AMT (Audio frequency Magneto-Telluric) 탐사 자료와 hard data인 RMR자료를 하나로 통합하고자 하였다. 결론적으로 터널계획고와 터널 상부 1D 구간에 대한 암반등급도를 작성하여 도시하였다.

멀티미디어 서비스의 환경변화 및 COSMOS 멀티미디어 운영체제

  • 송동호;임영환
    • 정보와 통신
    • /
    • 제11권6호
    • /
    • pp.37-54
    • /
    • 1994
  • 멀티미디어 기술의 획기적 발전으로 이를 응용한 다양한 서비스가 개발되고 있다. 본 논문에서는 멀티미디어 응용 서비스를 TV, 컴퓨터, 통신, 주변기기, 소프트웨어 계열로 분류하고 설명하였다. 이중 컴퓨터 부분에서 멀티미디어 서비스를 중점적으로 설명하며 이러한 서비스가 제공되기 위한 시스템의 주요 서브시스템으로서 멀티미디어 데이터 처리를 위한 초고속 통신망, 운영체제, 지능형 에이젼트에 대한 논의를 하였다. 이중 특히 멀티미디어 운영체제 기술은 종합 멀티미디어 서비스 제공을 위한 하부 구조로서 최근 가장 활발히 발전되고 잇는 분야이다. 이에 본 논문에서는 일반적인 멀티미디어 운영체제의 발전방향 및 현재 개발 완료된 COSMOS 멀티미디어 그룹표현용 운영체제에 관한 설명을 한다. COSMOS의 특성, 모델, 추상적 데이터 구조에 관한 논의와 더불어 COSMOS상에서 개발된 3자간 영상회의시스템의 성능분석을 통하여 COSMOS와 같은 운영체제를 통한 멀티미디어 운영체제의 제공이 멀티미디어 서비스 환경변화를 주도함을 설명하였다.

  • PDF