• 제목/요약/키워드: visual-audio

검색결과 424건 처리시간 0.033초

장면 기술을 위한 MPEG-4 기반 XMT API 구현 (MPEG-4 based XMT APIs for Scene Description)

  • 정예선;김규헌;기명석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2001년도 정기총회 및 학술대회
    • /
    • pp.91-94
    • /
    • 2001
  • MPEG-4 시스템은 장면 자체를 하나의 구성 요소로 여기는 기존의 시스템과는 달리, 그 장면을 구성하는 부호화 또는 복호화된 A/V 객체(Audio/visual Objects)들을 하나의 단위로 인식하여, 다양한 멀티미디어 컨텐츠의 장면을 구성(Scene Composition)하고 표현 하는 것에 그 특징이 있다. 이러한 MPEG-4 시스템의 객체 기반 특징은 다양한 사용자와의 대화성(Interactivity)을 가능하게 하며 , 또한 편리한 컨텐츠 편집 및 재사용 등이 가능하기에 차세대 디지털 방송 컨텐츠 제작에 중요하게 활용될 전망이다. 객체 기반 A/V 편집 도구는 MPEG-4를 기반으로 차세대 디지털 방송 컨텐츠 제작을 용이하게 하기 위한 제작/편집 도구로써 , 장면을 표현하기 위하여 BIFS(Binary Format for Scene description)와 XMT(eXtensible MPEG-4 Textual format) 포맷을 모두 사용하고 있다. BIFS 포맷은 저작된 결과물을 바이너리 형태로 표현하기 때문에, 저작된 결과물을 전송하는 데에는 용이하나, 중간에 저작된 결과물을 확인하기 어렵고, 또한 기존의 다른 어플리케이션과의 상호 작용(Interoperability)과 교환(Exchange)에도 어려움이 따른다. 이에 반해, XMT는 차세대 마크업 언어로 각광 받고 있는 XML 에 그 기반을 두고 있기에 저작된 결과물을 제작자가 쉽게 저작물을 이해할 수 있으며, SMIL 과 X3D 같은 다른 어플리케이션과의 상호작용과 교환 또한 용이하게 한다 XMT는 기술 방법에 따라 XMT-A 와 XMT-0 두 가지 형태가 있으며, XMT-A 포맷은 VRML에서 발전한 X3D(extensible 3D)를 바탕으로 MPEG-4 시스템의 특징들을 수용하여 구성되고 BIFS와 일대일로 대응된다. 반면에 XMT-0는 멀티미디어 문서를 웹문서로 표현하는 SMIL 2.0 을 그 기반으로 하였기에 MPEG-4 시스템의 특징보다는 컨텐츠를 저작하는 제작자의 초점에 맞추어 개발된 형태이다. XMT를 이용하여 컨텐츠를 저작하기 위해서는 사용자 인터페이스를 통해 입력되는 저작 정보들을 손쉽게 저장하고 조작할 수 있으며, 또한 XMT 파일 형태로 출력하기 위한 API 가 필요하다. 이에, 본 논문에서는 XMT 형태의 중간 자료형으로의 저장 및 조작을 위하여 XML 에서 표준 인터페이스로 사용하고 있는 DOM(Document Object Model)을 기반으로 하여 XMT 문법에 적합하게 API를 정의하였으며, 또한, XMT 파일을 생성하기 위한 API를 구현하였다. 본 논문에서 제공된 API는 객체기반 제작/편집 도구에 응용되어 다양한 멀티미디어 컨텐츠 제작에 사용되었다.

  • PDF

시청자 특성, 미디어 이용과 위성 DMB의 수용 : 지역 시청자의 인식과 평가를 중심으로 (The TV Audience's Traits, Media Usage and the Adoption of the Satellite DMB : Focus on the Understanding and Evaluation of the Local TV Audience)

  • 이시훈
    • 한국언론정보학보
    • /
    • 제28권
    • /
    • pp.141-169
    • /
    • 2005
  • 본 연구는 새로운 뉴미디어로 부상하고 있는 위성 DMB의 수용에 영향을 미치는 요인을 시청자의 인구 통계적 특성과 미디어 이용 특성을 중심으로 살펴보았다. 연구결과, 연령별로 고연령층이, 학력별로 고학력 계층이, 자동차 운전 여부에 따라서는 운전자들이 위성 DMB 가입 의향이 상대적으로 놓은 것으로 나타났다. 직업별로는 사무/관리직이나 경영/관리/전문/자유직과 같은 화이트칼라 계층의 가입 의향이 상대적으로 높았으며, 가족 소득은 중간 정도인 집단의 가입 의향이 상대적으로 높았다. 또 미디어 이용과 휴대폰 서비스 이용 정도에 따른 위성 DMB 가입 의향의 차이를 조사한 결과, 기존 미디어를 많이 이용하는 시청자가 가입 의향이 높았으며, 휴대폰부가 서비스의 기능도 많이 이용한다는 응답자들이 위성 DMB의 가입 의향이 높았다. 추가적으로 선호하는 장르와 지상파 재전송이 지역방송에 미치는 영향을 조사했다. 응답자들은 위성 DMB의 영상과 음성 서비스는 오락적 성격이 강한 장르를 선호하고 있으며, 데이터 서비스는 정보적 성격이 강한 장르를 원하고 있는 것으로 나타났다. 또 만일 지상파 재전송이 허용된다고 해도 지역방송에 부정적 영향이 크지 않을 것으로 예상하고 있었다.

  • PDF

원본정보 없이 씰영상의 추출이 가능한 이미지 워터마킹 기법 (A Watermarking Scheme to Extract the Seal Image without the Original Image)

  • 김원겸;이종찬;이원돈
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3885-3895
    • /
    • 2000
  • 디지털 이미지 기법과 디지털 네트웍의 출현으로 예술적 작품의 복사가 더욱 쉬워지고 있다. 이러한 창작품을 보호하기 위해 데이터 안에 저작권을 표시할 수 있는 표식이나 인식 가능한 데이터를 삽입하는 기술이 필요해지고 있고 지난 몇 년간 디지털 이미지나 오디오, 비디오 등의 멀티미디어 데이터에 저작권을 표시하기 위한 데이터나 기타 다른 정보를 삽입할 수 있는 많은 기법들이 제안되어 왔다. 본 논문에서는 이미지의 주파수 영역에 인식 가능한 패턴을 삽입하고 추출하는 워트마킹 기법을 제안한다. 또한 삽입된 워터마크를 원본이미지의 정보 없이 추출할 수 있도록 하여 임의의 사람이 워터마크 된 이미지로부터 가짜원본을 생성하는 것이 어렵도록 한다. 원본정보 없이 워터마크를 추출하기 위해서 화소의 원래 값을 예측하는 방법을 사용한다. 예측기법은 구하고자 하는 화소의 주위값을 평균한다는 것을 의미한다. 부가적으로 워터마크를 이미지 주파수 영역에 삽입함으로써 JPEG같은 손실압축바업에도 견딜 수 있도록 한다.

  • PDF

교차로 상황에 따른 고령운전자의 중추신경계 반응: 황색신호 딜레마를 중심으로 (The CNS Responses of Elderly Driver due to Signal Types at the Intersection: Focused on Yellow Interval Dilemma Situation)

  • 이영창;김보성;김현우;임동훈;박미선;민병찬;민윤기
    • 대한인간공학회지
    • /
    • 제29권5호
    • /
    • pp.783-788
    • /
    • 2010
  • This study was to examine to the CNS(Central Nervous System) responses of elderly drivers at the green, yellow, and red signal types. To examine this result, the older adults over age 65 who has more than 5 years of driving experience participated this experiment. In addition, we used audio-visual film clips as the stimulus than driving simulator, because the CNS reponses are sensitive to movement such as steering wheel. While subjects were watching one car's driving among green, yellow, or red signal types at the intersection, we measured their EEG(electroencephalogram) using monopolar electrodes from Fz, Cz and Pz sites. As a result, relative sizes of beta waves were changed due to the signal type conditions, and pre- and post-time of entering the intersection at the measured sites, separately. It suggests that the elderly drivers' CNS responses were different by the signal types.

문화유적지 투어를 위한 모바일 폰 가이드 시스템 (Mobile Phone Guide for Cultural Heritage)

  • 서영정;우운택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.116-121
    • /
    • 2009
  • 역사적 문화 유적지를 위한 모바일 엔터테인먼트 시스템의 디자인에 있어서 전력 요구사항, 컴퓨팅 능력, 및 네트웍 등의 연결성 등에 의해 제기되는 기술적인 난제들을 극복하는 것도 중요하지만 현장에 풍부하게 내재되어 있는 미디어 컨텐츠의 효율적 소비를 위한 그룹 경험의 공유를 지원하고 방문객 개인의 선호도를 고려하는 것 또한 매우 중요하다. 문화유적지는 모바일 미디어의 활용을 통하여 대중을 엔터테인하고 교육할 수 있는 기회를 제공한다. Java-enabled 모바일 폰 위에 구현한 본 시스템은 방문객의 유적지 방문 경험의 극대화를 위하여 오디오와 비쥬얼한 컨텐트를 모두 제공한다. 이때 제공되는 컨텐츠는 GPS를 통하여 사용자 움직임를 트래킹하고 사용자 기본 프로파일정보와 폰 인터페이스를 통한 다양한 입력 및 피드백값들을 수집 및 활용하며, 무선 네트웍을 통한 사회적으로 용인이 가능한 그룹 사용자간의 컨텐츠 엿듣기 기능을 고려함으로써 방문객의 니즈에 잘 맞춰진 컨텐츠이다. 본 논문에서는 문화 유적지 환경의 공간적, 개인적, 그리고 사회적 요소를 고려함으로써 방문객이 그 공간의 다양한 구조를 네비게이션하고, 방대한 양의 역사적 문화적 의미를 내포하는 미디어 컨텐츠를 소비하는데 도움을 주려는 데 그 목적을 두고 있다.

  • PDF

댁내 저장장치를 활용한 Anytime 멀티미디어 서비스 (Anytime Multimedia Service based on In-Home Storage)

  • 김광수;최태상
    • 한국통신학회논문지
    • /
    • 제24권7B호
    • /
    • pp.1211-1219
    • /
    • 1999
  • 1990년 중반 경에 주문형 비디오 서비스와 같은 고품질 실시간 대화형 멀티미디어 서비스가 많은 기대에도 불구하고 서비스 실용화에는 실패했었다. 실패의 주 요인으로는 충분한 대역폭 및 품질 보장 서비스를 지원하는 기반 통신망의 부재 때문이다. 한편, 컴퓨터 저장 장치 기술의 눈부신 발전으로 인해 저장장치 가격이 기하급수적으로 내리고 있다. 이러한 사실과 디지털 형태로 정적.동적 멀티미디어 정보를 댁내 저장장치로의 비실시간 전송 기술은 새로운 개념의 다양한 멀티미디어 서비스 응용을 가능하게 한다. 서비스 예로는 오락 및 교육 컨텐츠 전달, 내장 참조링크, 그리고 시청 중 방송 프로그램 캡쳐 응용들이 있다. 이는 사용자의 참여없이 임의의 시간(예, 통신망 사용율이 낮은 시간대)에 컨텐츠를 전달하고 자유로운 시간대에 서비스 사용을 가능하게 하며, 또한 멀티캐스트 기능을 활용함으로써 서버 및 통신망의 부담을 격감시키는 효과를 가진다. 이 논문에서는, 댁내 저장장치를 활용한 IMPRESS-AMS라 명명한 Anytime 멀티미디어 서비스의 설계 및 구현 방법을 제안하였다.

  • PDF

데이터 방송 환경에서의 효율적인 캐슁 정책 (An Efficient Caching Strategy in Data Broadcasting)

  • 김수연;최양희
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권12호
    • /
    • pp.1476-1484
    • /
    • 1999
  • TV 방송 분야에서 다양한 정보와 상호 작용성을 제공하기 위해서 최근 기존 방송 내용인 A/V 스트림 외 부가정보 방송이 시도되고 있다. 데이타 방송에 대한 기존 연구는 대부분 고정된 내용의 데이타를 방송하는 환경을 가정하고 있어서 그 결과가 방송 내용의 변화가 많은 환경에 부적합하다. 본 논문에서는 데이타에 대한 접근이 반복되지 않을 가능성이 높고 사용자 접근 확률을 예상하기 어려운 상황에서 응답 시간을 개선하는 방안으로 수신 데이타를 무조건 캐쉬에 반입하고 교체가 필요한 경우 다음 방송 시각이 가장 가까운 페이지를 축출하는 사용자 단말 시스템에서의 캐슁 정책을 제안하였다. 제안된 캐쉬 관리 정책은 평균적인 캐쉬 접근 실패 비용을 줄임으로써 사용자 응답 시간을 개선하며, 서로 다른 스케줄링 기법을 사용하는 다양한 방송 제공자가 공존하는 환경에서 보편적으로 효과를 가져올 수 있다.Abstract Recently, many television broadcasters have tried to disseminate digital multimedia data in addition to the traditional content (audio-visual stream). The broadcast data need to be cached by a client system, to provide a reasonable response time for a user request. Previous studies assumed the dissemination of a fixed set of items, and the results are not suitable when broadcast items are frequently changed. In this paper, we propose a novel cache management scheme that chooses the replacement victim based on the remaining time to the next broadcast instance. The proposed scheme reduces response time, where it is hard to predict the probability distribution of user accesses. The caching policy we present here significantly reduces expected response time by minimizing expected cache miss penalty, and can be applied without difficulty to different scheduling algorithms.

멀티모달 인터페이스(3차원 시각과 음성 )를 이용한 지능적 가상검객과의 전신 검도게임 (A Full Body Gumdo Game with an Intelligent Cyber Fencer using Multi-modal(3D Vision and Speech) Interface)

  • 윤정원;김세환;류제하;우운택
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권4호
    • /
    • pp.420-430
    • /
    • 2003
  • 본 논문에서는 멀티모달(multi-modal) 인터페이스를 통해 지능적 가상검객과 체감형 검도게임을 할 수 있는 시스템을 제안한다. 제안된 검도게임 시스템은 멀티모달 인터페이스(시각과 청각), 인공지능(AI), 피드백(스크린과 사운드) 등 크게 세 가지 모듈로 구성된다. 첫 번째로, 멀티모달 인터페이스는 시각기반, 3차원 인터페이스를 이용하여 사용자가 자유롭게 3차원 공간에서 움직일 수 있도록 하고, 음성기반 인터페이스를 이용하여 사용자가 현실감 있는 검도게임을 즐길 수 있도록 한다. 두 번째, 인공지능은 가상검객에게 멀티모달 인터페이스에서 입력되는 시각과 음성을 인식하여 가상검객의 반응을 유도한다. 마지막으로, 대형 스크린과 스피커를 통한 시청각 피드백은 체감형 상호작용을 통하여 사용자가 몰입감을 느끼며 검도게임을 경험할 수 있도록 한다. 따라서 제안된 시스템은 전신의 움직임으로 사용자에게 몰입감의 검도게임을 제공한다. 제안된 시스템은 오락 외에 교육, 운동, 예술행위 등 다양한 분야에 적용될 수 있다.

국내 콘텐츠산업 지식정보 지원정책에 관한 연구 -방송영상분야 이용 및 만족도 평가를 중심으로- (Evaluation of Korean Content Industry Knowledge Information Service Policy : Service Usage and Satisfaction on Video Broadcasting Area)

  • 정윤경
    • 한국콘텐츠학회논문지
    • /
    • 제14권11호
    • /
    • pp.667-677
    • /
    • 2014
  • 지식기반 경제에서 가치 생산의 중추는 지식과 정보이다. 이에 따라 국내에는 공적 지식정보 지원 정책이 잘 마련되어 있으나, 이에 대한 평가는 미흡하였다. 본 연구에서는 방송 영상 분야에 종사하는 현업인을 대상으로 지식정보 서비스 이용 및 만족도를 분석하고, 제도적 개선점을 모색해 보았다. 분석 결과, 현업인들의 공적 지식정보 지원 서비스의 이용은 높지 않았으며, 만족도 역시 낮은 것으로 나타났다. 정보 신뢰도는 높은 반면, 시의성이나 유용성에 대한 평가는 부정적이었다. 그러나 응답자들이 개별 노력을 통해 지식정보를 수집, 분석하고 있는 점에 근거할 때, 지식정보 수요는 높은 것으로 분석된다. 완성된 형태의 지식정보를 제공하기 보다는 이차적 가공이 가능한 원형의 지식정보 제공이나, 지식정보 획득 수단의 제공, 시장친화적 지식정보의 제공 등을 통해 공적 지식정보 지원 서비스의 효용을 높일 필요가 있을 것으로 보인다.

영화의 쇼트리스트 데이터를 기반한 클라이맥스 표현 분석 (The Climax Expression Analysis Based on the Shot-list Data of Movies)

  • 임양미
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.965-976
    • /
    • 2016
  • 최근 디지털영상의 발달로 시청각 몰입에 대한 정량적 연구는 진행되고 있으나, 영화에서 내용이나 클라이맥스 부분의 영상을 정량적으로 분석하는 것은 거의 연구되지 않았다. 본 연구에서는 일반적인 영상표현 구성요소들인 쇼트사이즈(shot size), 카메라 앵글(camera angle), 카메라의 움직임의 방향(camera direction), 카메라 위치(camera position), 배우들의 대립 구도(objective & subjective) 등을 사용하여 정량적 분석을 진행하였다. 이들 사용에는 규칙이 있어 원칙을 파괴하는 부분의 영상 쇼트에서 주로 클라이맥스 효과를 볼 수 있다. 본 연구는 기존에 있는 영화들을 영상표현 구성 요소 기반으로 쇼트리스트 (shot-list)분석하여 클라이맥스 효과를 내기 위해 공통적으로 사용되는 몇 가지 방법들을 정량적으로 분석한다. 이와 같은 쇼트리스트 분석 기반의 클라이맥스 부분을 찾는 방법 제안은 영화와 같은 긴 영상에서 특정 부분만 검색하고 싶을 때, 영화의 장르를 검색하거나 색인화할 때 사용될 수 있다. 또한 검색된 일부 클라이맥스 영상과 유사 관련 정보를 제공하는 등의 다양한 정보 제공 서비스 분야에서 효용성이 높다고 할 수 있다.