• 제목/요약/키워드: Visual and Audio System

검색결과 148건 처리시간 0.034초

대화형 T-DMB 컨텐츠의 효율적인 전송을 위한 장면기술정보 최적화 기법 (An Optimization Technique of Scene Description for Effective Transmission of Interactive T-DMB Contents)

  • 이송록;정원식;유영재;차경애
    • 방송공학회논문지
    • /
    • 제11권3호
    • /
    • pp.363-378
    • /
    • 2006
  • 디지털멀티미디어방송(Digital Multimedia Broadcasting, DMB)은 고품질의 방송 영상 및 부가 데이터를 이동 중인 차량 내에서나 모바일폰, PDA 등과 같은 휴대형 단말에서 수신할 수 있는 이동 멀티미디어 방송 서비스이다. 미디어 및 상호작용 정보의 인코딩 규격으로는 MPEG-4 표준을 사용하며, 대화형 컨텐츠의 사용자 상호작용 등의 정보는 장면기술정보인 MPEG-4 BIFS(Binary Format for Scene)에 의해서 이루어진다. 사용자와의 상호작용이 풍부하고 장면 구성이 복잡한 컨텐츠일수록 BIFS 데이터가 전송되기 위해서 요구되는 비트율도 증가한다. 그러나 이동 단말에 고품질의 비디오 및 오디오 데이터를 전송하는 DMB 환경에서는 BIFS 스트림의 전송율은 매우 제한적이다. 한편 사용자 단말기에서 DMB 컨텐츠를 재생하려면 비디오, 오디오 등 미디어 객체들을 디코딩하기 전에 장면 구성 정보인 BIFS 스트림을 디코딩 및 파싱하여야 한다. 그러므로 MPEG-4의 높은 미디어 압축율에도 불구하고 제한된 대역폭과 장면 구성 정보 등 부가 데이터 전송 및 디코딩으로 인한 지연이 발생될 수 있다. 따라서 방송 컨텐츠의 특성 상 사용자의 임의 접근 시에도 재생될 컨텐츠의 BIFS 데이터를 파싱하여 대기 시간을 최소화하도록 초기 장면 구성 정보를 효율적으로 전송해야 한다. 본 연구에서는 지상파 DMB 대화형 컨텐츠의 장면기술정보인 BIFS 스트림을 저전송율 환경에 적응된 형태로 전달하기 위해서, 장면기술정보를 최적화하는 기법을 제안한다.

잡음 환경에 강인한 이중모드 음성인식 시스템에 관한 연구 (A Study on the Robust Bimodal Speech-recognition System in Noisy Environments)

  • 이철우;고인선;계영철
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.28-34
    • /
    • 2003
  • 최근 잡음이 심한 환경에서 음성인식을 신뢰성 있게 하기 위하여 입 모양의 움직임 (영상언어)과 음성을 같이 사용하는 방법이 활발히 연구되고 있다 본 논문에서는 영상언어 인식기의 결과와 음성인식기의 결과에 각각 가중치를 주어 결합하는 방법을 연구하였다. 각각의 인식 결과에 적절한 가중치를 결정하는 방법을 제안하였으며, 특히 음성정보에 들어있는 잡음의 정도와 영상정보의 화질에 따라 자동적으로 가중치를 결정하도록 하였다. 모의 실험 결과 제안된 방법에 의한 결합 인식률이 잡음이 심한 환경에서도 84% 이상의 인식률을 나타내었으며, 영상에 번짐효과가 있는 경우 영상의 번짐 정도를 고려한 결합 방법이 그렇지 않은 경우보다 우수한 인식 성능을 나타내었다.

Digital Color Image Watermarking for HVS(Human Visual System) using Daubechies wavelet

  • Park, Jong-Tae;Rhee, Kang-Hyeon
    • 한국정보통신학회논문지
    • /
    • 제8권7호
    • /
    • pp.1488-1492
    • /
    • 2004
  • The digital signal has been replaced the analog signal in most of every field of multimedia including still image, animation, and audio due to the enormous extension of computer supply and the fast development of computer network. The consumers of information are able to enjoy the abundance of information because of one of the digital signal traits that very easy to regenerate the original data. Because of the trait, however, it is very hard for the producers of information to keep the copyright with the merit of original copy in quality excellency. In this paper, the watermarking technology which inserts a RGB color watermark in color image using the visual characteristics of wavelet coefficient was proposed. As a result, the PSNR value of image was varied depending on perceptual parameter, but we can obtain 32dB as a whole.

MRI 검사 환자의 불안 및 불편감에 대한 영화(애니메이션)감상 효과 분석 (Effect of watching movie & animation on anxiety and discomfort of the patients during MRI exam)

  • 박명철;이무식;홍지영;배석환;임남구
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2009년도 추계학술발표논문집
    • /
    • pp.769-773
    • /
    • 2009
  • 본 연구는 MRI 검사를 받은 환자를 대상으로 영상매체(Visual equipment & Audio system)를 이용하여 영상물을 제공함으로서 불안과 불편감에 대한 효과에 대해 규명함으로써 MRI 검사로 인한 심리적, 정신적 불안과 불편 감을 감소시킬 수 있는 대체요법을 제공하기 위하여 본 연구를 시도하였다. 연구대상은 대전광역시에 위치한 K 대학병원에서 MRI 검사를 받은 환자 중 영상물을 제공받은 실험군 30명과 영상물을 제공받지 않은 대조군 30명을 대상하였다. 연구의 도구는 Spielberger의 기질불안 도구와 Cline, Herman, Shaw와 Morton이 고안한 불안점수 도구인 시각적 상사척도(VAS)를 이용하였고, 영상물을 제공하여 두 군 간의 활력징후를 측정하였고 불편감은 대상자의 주관적 불편감(어지러움, 공포감. 긴장감)점수와 객관적 불편감 행동 점수를 사용하였다. 자료 분석 방법은 SPSS12K for Windows program을 이용하였으며, 두 군의 일반적 특성 및 수술에 관련된 특성의 동질성 검증은 $\chi^2$ 검정, 가설검증은 t-test로 분석하였다. 연구결과를 요약해 보면 영상매체(Visual equipment & Audio system)를 이용하여 영상물(영화, 애니메이션)을 제공하면서 MRI 검사를 진행했을 경우 검사 대상자의 혈압 및 객관적 불편감에서는 유의한 영향을 미치지 못했으나 불안과 활력징후의 하나인 맥박의 감소, 또한 주관적 불편감이 감소됨을 알 수 있었다. 따라서 환자의 심리적인 긴장감을 완화시키며 안정감을 느끼게 하는데 효과적인 대체요법이 될 수 있을 것으로 사료 된다.

  • PDF

멀티모달 정보를 이용한 응급상황 인식 시스템의 설계 및 구현 (Design and Implementation of Emergency Recognition System based on Multimodal Information)

  • 김영운;강선경;소인미;권대규;이상설;이용주;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권2호
    • /
    • pp.181-190
    • /
    • 2009
  • 본 논문은 비주얼 정보, 오디오 정보, 중력 센서 정보에 기반한 멀티 모달 응급상황 인식 시스템을 제안한다. 제안된 시스템은 비디오 처리 모듈, 오디오 처리 모듈, 중력 센서 처리 모듈, 멀티모달 통합 모듈로 구성된다. 비디오 처리 모듈과 오디오 처리 모듈 각각은 이동, 정지 기절 등의 동작을 인식하여 멀티모달 통합 모듈에 전달한다. 멀티 모달 통합 모듈은 전달된 정보로부터 응급 상황을 인식하고 오디오 채널을 통하여 사용자에게 질문을 하고 대답을 인식함으로써 응급 상황을 재확인한다. 실험결과 영상에서는 91.5%, 착용형 중력센서는 94% 인식률을 보였으나 이들을 통합하면 응급상황을 100% 인식하는 결과를 보였다.

MPEG 시스템 스트림상에서 오디오 정보를 이용한 장면 경계 검출 방법 (A Scene Boundary Detection Scheme using Audio Information in MPEG System Stream)

  • 김재홍;낭종호;박수용
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권8호
    • /
    • pp.864-876
    • /
    • 2000
  • 본 논문에서는 일반적인 영화를 인코딩한 MPEG 형식의 비디오 데이타에 대해 장면과 장면 사이의 경계점에서 나타나는 여러 오디오 특성을 이용하는 새로운 장면 경계 검출 방법을 제안하고 실험을 통해서 그 유용성을 보인다. 일반적인 영상에서 장면 경계 지점에서는 영상의 내용이 크게 바뀜에 따라 오디오 정보도 같이 변화한다는 특성이 있으며, 본 논문에서는 이러한 장면경계에서의 오디오 정보 변화를 각각 급진변화(Radical Change), 점진변화(Gradual Change), 미세변화(Micro Change)로 분류하였으며, 각 변화의 특성을 분석하고 이를 검출하는 알고리즘을 제안하였다. 급진변화는 장면과 장면의 경계점에서 오디오가 음량의 급격한 증감이 발생하고 음색 또한 급격히 달라지는 형태를 취하고 있으며, 점진변화는 긴 시간에 걸쳐서 음량 및 음색이 달라지는 형태를, 미세변화는 음량의 변화없이 일부 음색과 주파수 분포가 달라지는 특성을 가지고 있다. 본 논문에서는 이러한 특성을 토대로 시간축을 따라 진행하는 윈도우를 설정하여 이 윈도우 내에서의 오디오 변화를 추적함으로써 위의 세 가지 형태의 장면 경계를 추출하는 방법을 제안한다. 다양한 영화를 통한 실험에서 실제 샘플로 사용된 영화들에서 가장 많은 부분을 차지하는 급진변화에 대하여 본 논문에서 제안한 방법이 높은 검출율을 얻을 수 있음을 알 수 있었다. 본 논문에서 제안한 오디오 정보를 이용한 장면 경계 검출 방법은 비디오 정보를 이용한 장면 경계 검출과 같이 병행하여 사용함으로써 MPEG 형식의 영상정보에 대한 데이타 베이스 구축에 유용하게 사용될수 있을 것이다.관 주위에 많았다.findings suggest that compounds 6 and 11 are modulating various elements of the host immune response.%로서, carbofuran 단독투여와 carbofuran과 PB 또는 3-MC 투여사이에 대사산물의 종류는 같았으나 생성율에는 큰 차이가 있었다. 이와 같은 결과는 쥐에 carbofuran 투여 후 PB나 3-MC를 투여함으로써 carbofuran의 대사가 빠르게 이루어지고, 주 대사산물 중3-hydroxycarbofuran보다 독성 이 낮은 3-ketocarbofuran으로의 대사가 빠르게 이루어지기 때문에 carbofuran의 독성이 경감되어 쥐가 생존할 수 있는 것으로 판단된다.시장젓갈${\lrcorner}$에는 글루타민산, leucine, alanine, lysine의 4종류, ${\ulcorner}$반찬젓갈${\lrcorner}$에는 글루타민산, leucine, alanine의 3종류, ${\ulcorner}$일본병조림젓갈${\lrcorner}$은 글루타민산이 현저하게 많다.회하였다.ollowed fro all Sullungtang samples from Hanwoo. The results showed that the overall quality of Sullungtang significantly decreased as the parity increased for Hanwoo cows. The Sullungtang

  • PDF

광대역 ISDN용 MPEG 오디오-비쥬열 대화형 통신단말의 설계 및 구현 (A MPEG Audio-Visual Conversational Communication Terminal on the B-ISDN Environment)

  • 황대환;조규섭
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1960-1971
    • /
    • 1998
  • 광대역 ISDN에서 사용될 수 있는 멀티미디어 통신서비스로서 Video on Demand(V0D)와 같은 검색형 분배서비스와 영상전화, 다지점 영상회의와 같은 실시간 대화형 서비스를 대상으로 활발한 연구, 개발이 이루어지고 있다. V0D 서비스에 대한 연구는 Digital Audio-Visual Council(DAVIC)에서 V0D 서버, 전달 망, 그리고 Set-Top Box(STB) 등을 포함한 전체 시스템에 대한 규격을 확정하였고 대화형 멀티미디어 통신단말은 ITU-T SG16에서 H.300 계열 단말의 표준을 대부분 완료한 상태이다. 그러나 이들 기구에서 권고하고 있는 멀티미디어 통신단말의 구조는 주 연구대상의 차이로 인해, 검색형 분배서비스와 대화형 통신서비스를 모두 제공할 수 있는 효율적인 구성 형태를 갖고 있지 못하다. 본 논문은 ITU-T, DAVIC, ATM Forum 등의 권고 및 규격을 면밀히 분석한 후, 동일한 멀티미디어 통신단말에서 V0D 및 대화형 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안하고 설계, 구현하였다. 광대역 ISDN을 대상으로 한 통신단말은 범용 PC에 탑재되는 두 개의 add-on 카드로 구현하였으며, ATM 접속을 통한 V0D 및 일-대-일 대화형 멀티미디어 통신 세션 설정와 실험을 통해 기능의 검증을 완료하였다.

  • PDF

MPEG-4 Shape Decoder의 적합성 검사 (Conformance Test for MPEG-4 Shape Decoders)

  • 황혜전;박인수;박수현;이병욱
    • 한국통신학회논문지
    • /
    • 제25권6B호
    • /
    • pp.1060-1067
    • /
    • 2000
  • MPEG-4 영상압축 방식은 객체지향적이다. 기존의 H.261, MPEG-1, MPEG-2에서 화면 전체를 부호화 해주는 것과 달리 MPEG-4에서는 한 화면을 물체, 배경 등 여러 객체들로 나누어 각각의 객체를 따로 부호화한다. 이렇게 전송된 객체들은 수신 단말기에서 다시 합성하여 완성된 화면으로 보여준다. MPEG-4의 형상 부호화는 화면에서 visual 객체에 해당하는 부분만을 부호화 해주는 부분이다. 본 논문에서는 MPEG-4 디코더가 형상 복호화의 표준 규격을 따르는지를 시험하는 방법을 제안한다. 본 논문은 BAB type을 결정하는 mode 복호화의 모든 경우와 Context-based Arithmetic 복호화의 Context computation에 대한 모든 경우에 대해 확인하는 방법을 제안하였다.

  • PDF

비형식적 교육장소에서 개별적 과학기술학습을 위한 모바일 관람 가이드 시스템의 설계 및 구현 (A Design and Implementation of Mobile Visit Guide System for the Individual Science & Technology Learning in the Museum)

  • 권효순;최완식
    • 대한공업교육학회지
    • /
    • 제30권1호
    • /
    • pp.120-132
    • /
    • 2005
  • The major purpose of this study was to provide a basic model of mobile guide system for visitor's individual learning, self-regulated learning in a museum. System model realized by this study was as follows; 1) This system distributed exhibit information to tourists in place of existing audio guides or curators. Using wireless communications, the PDA automatically delivered information about the exhibit. The artistic and visual displays maximized effective and quick transmission of information to the user. 2) It made visiting a museum fun, exciting and entertaining. With the PDA guide the museum visitor can interact with detailed descriptions of exhibits, videos and images. The museum visitor, can also play a quiz game, take photos, record voices and send e-mail.

Development of Interactive Data Broadcasting System Compliant with ATSC Standards

  • Jeong, Jong-Myeon;Lee, Yong-Ju;Park, Min-Sik;Choi, Ji-Hoon;Choi, Jin-Soo;Kim, Jin-Woong
    • ETRI Journal
    • /
    • 제26권2호
    • /
    • pp.149-160
    • /
    • 2004
  • In this paper, we present an interactive data broadcasting system compliant with the Advanced Television Systems Committee (ATSC) standards. The proposed system provides users not only with various data broadcasting services but also remote interactive services. For various data broadcasting services, we have adopted a synchronized data injector that calculates the transmission time of synchronized data accurately and multiplexes synchronized data with the data of an MPEG-2 audio-visual program according to the calculated transmission time. To support remote interactive services, we designed and implemented a return channel server connected on a bi-directional interaction channel. Test results show that the proposed system provides both an asynchronous and synchronized data broadcasting service and remote interactive service appropriately.

  • PDF