• 제목/요약/키워드: interactive rendering

검색결과 100건 처리시간 0.03초

최대-최소맵 기반 등위면 광선투사법을 이용한 대화식 가상 관절경 (Interactive Virtual Anthroscopy Using Isosurface Raycasting Based on Min-Max Map)

  • 임석현;신병석
    • 대한의용생체공학회:의공학회지
    • /
    • 제25권2호
    • /
    • pp.103-109
    • /
    • 2004
  • 가상 관절경은 무릎, 어깨 둥 관절에 대한 단층촬영 영상으로부터 관절 내부의 해부학적 구조를 3차원으로 재구성함으로써 광학 관절경을 모사 하는 기법이다. 이 논문에서는 볼륨 렌더링 기법의 일종인 등위면 광선투사법을 이용하여 3차원 영상을 신속하게 생성하는 가상 관절경 기법을 제안한다 여기서 제안하는 등위면 광선투사법은 최대-최소맵을 이용하여 전처리 과정 없이도 실시간에 가까운 속도로 고화질의 영상을 얻을 수 있다. 또한 물리 기반 카메라 제어 모델을 이용함으로써 사용자가 복잡한 해부구조를 가진 관절강 내부에서 가상 카메라를 자유롭게 이동시킬 수 있다. 이러한 고속 렌더링 방법과 현실감 있는 카메라 제어기법을 이용하여 대화식 가상 관절경을 개발하였다.

A 3D Audio-Visual Animated Agent for Expressive Conversational Question Answering

  • Martin, J.C.;Jacquemin, C.;Pointal, L.;Katz, B.
    • 한국정보컨버전스학회:학술대회논문집
    • /
    • 한국정보컨버전스학회 2008년도 International conference on information convergence
    • /
    • pp.53-56
    • /
    • 2008
  • This paper reports on the ACQA(Animated agent for Conversational Question Answering) project conducted at LIMSI. The aim is to design an expressive animated conversational agent(ACA) for conducting research along two main lines: 1/ perceptual experiments(eg perception of expressivity and 3D movements in both audio and visual channels): 2/ design of human-computer interfaces requiring head models at different resolutions and the integration of the talking head in virtual scenes. The target application of this expressive ACA is a real-time question and answer speech based system developed at LIMSI(RITEL). The architecture of the system is based on distributed modules exchanging messages through a network protocol. The main components of the system are: RITEL a question and answer system searching raw text, which is able to produce a text(the answer) and attitudinal information; this attitudinal information is then processed for delivering expressive tags; the text is converted into phoneme, viseme, and prosodic descriptions. Audio speech is generated by the LIMSI selection-concatenation text-to-speech engine. Visual speech is using MPEG4 keypoint-based animation, and is rendered in real-time by Virtual Choreographer (VirChor), a GPU-based 3D engine. Finally, visual and audio speech is played in a 3D audio and visual scene. The project also puts a lot of effort for realistic visual and audio 3D rendering. A new model of phoneme-dependant human radiation patterns is included in the speech synthesis system, so that the ACA can move in the virtual scene with realistic 3D visual and audio rendering.

  • PDF

효율적인 비디오 카투닝을 위한 인터랙티브 시스템 (Interactive System for Efficient Video Cartooning)

  • 홍성수;윤종철;이인권
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.859-864
    • /
    • 2006
  • Mean shift 는 데이터의 특징을 잘 살려내는 None-parametric 방법으로, 특히 영상처리분야에서 많은 각광을 받아왔다. 하지만 좋은 결과를 보장하는 뛰어난 성능에도 불구하고, 높은 메모리소요와 긴 처리시간에 기인하여, 비디오처리 등의 분야에 적용하기엔 현실적인 제약점이 있다. 상기한 제약점을 극복하기 위해, 본 시스템은 비디오를 분석하여 전경과 후경으로 나눈다. 본 논문은 전경으로 분류된 부분에 대해 각 분리된 개체를구분하고, 좌표변환(coordinate shift)을 실행하여 연산을 할 비디오의 연산의 규모를 줄이는 방법론을 제시한다. 이러한 처리로 매우 많은 처리시간이 단축됨을 실험을 통해 알 수 있었다. 다음으로, 나뉘어진 전경에 3D mean shift를 적용하여 생성된 결과물에 대하여 3D cluster data structure 를 생성하고, 이를 이동하여 인터랙티브 에디팅이 가능하도록 하였다. 후경으로 나뉜 데이터는 이미지 한 장으로 축약이 되며, 2D mean shift 기반의 interactive cartooning system 을 통하여 만화화가 된다. 본 논문은 만화 특유의 단순한 톤을 표현하기 위해, 세밀한 분할이 필요한 부분과 그렇지 않은 부분을 따로 구분하여 처리하는 레이어처리방법을 제안한다. 위의 과정을 여러 실사이미지에 적용, 실험해본 결과 기존의 연구결과에 비해 매우 짧은 시간 내에 대상의 특징이 잘 나타낸 양질의 결과물이 생성되었다. 이러한 결과물은 출판, 영상편집분야 등 여러 분야에서 요긴하고 간편하게 사용될 수 있을 것으로 생각된다.

  • PDF

대화형 광선 추적법을 위한 그림자 컬링 알고리즘 (A Shadow Culling Algorithm for Interactive Ray Tracing)

  • 나재호;박우찬;한탁돈
    • 한국게임학회 논문지
    • /
    • 제9권6호
    • /
    • pp.179-189
    • /
    • 2009
  • 본 논문은 대화형 광선 추적법에서 사용 가능한 새로운 그림자 컬링 알고리즘을 제안한다. 본 접근 방법은 그림자 자료 구조의 구축에 의한 전처리 방법 대신 프레임 간의 일관성을 이용하므로 동적 장면 상에서의 광선 추적법 처리에 적합하다. 본 알고리즘에서 그림자 계산 결과는 각각의 프리미티브 상에 저장이 되며 이 결과는 다음 프레임에 다시 사용된다. 또한 본 논문은 새로운 차폐 검사 방법을 제안한다. 이는 본 컬링 알고리즘에서 생길 수 있는 그림자 오류를 보정하며, 낮은 추가 비용을 요구한다. 실험 결과, 본 그림자 컬링 알고리즘은 7-19%의 탐색 비용 감소와 9-24%의 교차 비용 감소를 가져오는 것으로 나타났다.

  • PDF

효과적인 HCI를 위한 동적 재구성 멀티미디어 스프레드쉬트 설계 (A Design of A Dynamic Configurational Multimedia Spreadsheet for Effective HCI)

  • 지승현
    • 한국콘텐츠학회논문지
    • /
    • 제6권1호
    • /
    • pp.14-22
    • /
    • 2006
  • 비쥬얼라이제이션 스프레드쉬트(visualization spreadsheet)는 다차원 데이터집합의 다양한 비쥬얼라이제이션(visualization)환경 지원에 매우 효과적이다. 본 논문에서는 대용량 멀티미디어 데이터집합을 효율적으로 유지관리하고 동적 재구성할 수 있는 멀티미디어 스프레드쉬트 모델을 설계하였다. 제안한 모델은 실시간 재구성 가능한 셀단위 이차원 스프레드쉬트의 토대에 셀마다 프레임스택을 구비하였다. 이상의 구성으로 스프레드쉬트의 각 셀은 3차원 데이터구조로 구성된 것과 동일한 효과를 갖는다. 제안한 모델은 1) 대용량 데이터집합의 효율적인 구성 및 관리, 2) 사용자요구에 부응하는 셀구조의 실시간 재구성, 3) 사용자와 시스템 간 인터렉티브 유저인터페이스의 장점을 갖는다. 본 논문에서는 다양한 데이터집합의 그래픽랜더링을 통하여 제안한 모델이 우수한 인터렉티브 멀티미디어용 비쥬얼 툴임을 증명하였다.

  • PDF

3차원 세포 영상 데이터의 효과적인 볼륨 렌더링 및 가상 염색 프레임워크 (Effective Volume Rendering and Virtual Staining Framework for Visualizing 3D Cell Image Data)

  • 김태호;박진아
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제24권1호
    • /
    • pp.9-16
    • /
    • 2018
  • 본 논문에서는 광 회절 단층 촬영 (Optical Diffraction Tomography, ODT) 기법을 사용해 얻어진 세포 영상을 3차원 가상 공간에 시각적으로 표현하고 기존의 세포 영상들과의 일치감을 주는 색상 매핑 기술을 포함한 가시화 프레임 워크를 소개한다. 전체 볼륨을 구성하는 내부 구조에 대한 정보가 잘 알려져 있거나 명확하게 구분 가능한 인체의 장기 또는 산업 기기와 같은 기존의 볼륨 데이터와는 달리 세포 영상 데이터는 세포소기관들 간의 경계가 모호하거나 상황에 따라 형상의 변화가 다양하다는 특징을 가지고 있어, 세포의 형상에 대한 일관적인 시각 표현이 상대적으로 어렵다는 문제가 있다. 본 논문에서는 이를 해소하기 위해 세포의 3차원 형상을 실시간으로 렌더링 할 수 있는 가시화 기법을 제안한다. 제안하는 기법에서는 우선 세포의 3차원 형상을 나타내기 위해 볼륨 데이터의 가시화에서 널리 활용되고 있는 볼륨 렌더링 기법을 ODT 영상에 맞게 적용했으며, 빈 공간 교란 기법을 통한 렌더링 결과의 개선으로 세포내 구조의 연속성을 나타낼 수 있게 했다. 또한 다중 전이 함수에 대해 레이어 기반 독립 렌더링을 적용하는 것을 통해 다수의 세포내 구조를 하나의 화면에 표현하는 복합 가시화 기법을 제안했다. ODT 영상 및 염색 영상을 동시에 촬영 가능한 현미경으로부터 얻어진 세포 영상을 가시화 하는 것을 통해 제시된 가시화 기법의 유용성을 확인했다.

대화형 T-DMB 컨텐츠의 효율적인 전송을 위한 장면기술정보 최적화 기법 (An Optimization Technique of Scene Description for Effective Transmission of Interactive T-DMB Contents)

  • 이송록;정원식;유영재;차경애
    • 방송공학회논문지
    • /
    • 제11권3호
    • /
    • pp.363-378
    • /
    • 2006
  • 디지털멀티미디어방송(Digital Multimedia Broadcasting, DMB)은 고품질의 방송 영상 및 부가 데이터를 이동 중인 차량 내에서나 모바일폰, PDA 등과 같은 휴대형 단말에서 수신할 수 있는 이동 멀티미디어 방송 서비스이다. 미디어 및 상호작용 정보의 인코딩 규격으로는 MPEG-4 표준을 사용하며, 대화형 컨텐츠의 사용자 상호작용 등의 정보는 장면기술정보인 MPEG-4 BIFS(Binary Format for Scene)에 의해서 이루어진다. 사용자와의 상호작용이 풍부하고 장면 구성이 복잡한 컨텐츠일수록 BIFS 데이터가 전송되기 위해서 요구되는 비트율도 증가한다. 그러나 이동 단말에 고품질의 비디오 및 오디오 데이터를 전송하는 DMB 환경에서는 BIFS 스트림의 전송율은 매우 제한적이다. 한편 사용자 단말기에서 DMB 컨텐츠를 재생하려면 비디오, 오디오 등 미디어 객체들을 디코딩하기 전에 장면 구성 정보인 BIFS 스트림을 디코딩 및 파싱하여야 한다. 그러므로 MPEG-4의 높은 미디어 압축율에도 불구하고 제한된 대역폭과 장면 구성 정보 등 부가 데이터 전송 및 디코딩으로 인한 지연이 발생될 수 있다. 따라서 방송 컨텐츠의 특성 상 사용자의 임의 접근 시에도 재생될 컨텐츠의 BIFS 데이터를 파싱하여 대기 시간을 최소화하도록 초기 장면 구성 정보를 효율적으로 전송해야 한다. 본 연구에서는 지상파 DMB 대화형 컨텐츠의 장면기술정보인 BIFS 스트림을 저전송율 환경에 적응된 형태로 전달하기 위해서, 장면기술정보를 최적화하는 기법을 제안한다.

360도 파노라마 영상 기반 대화형 가상현실 서비스 구축 (Development of an Interactive Virtual Reality Service based on 360 degree VR Image)

  • 강병길;유석호;이완복
    • 디지털융복합연구
    • /
    • 제15권11호
    • /
    • pp.463-470
    • /
    • 2017
  • VR 영상을 활용한 가상현실 콘텐츠는 제작의 용이성과 사용자 편의성으로 인해 주목받고 있으나 상호작용이 결여된 상태이기 때문에 응용 분야와 활용성에 있어서 한계가 있다. 본 연구에서는 이러한 문제점을 극복하고자 360도 파노라마 영상과 게임엔진을 활용하여 상호작용이 가능한 고해상도 VR 서비스를 구축하는 방안을 제시한다. 특히 복잡한 연산이 소요되는 배경 영상은 파노라마 영상으로 미리 렌더링하여 생성한 것이므로 낮은 사양의 단말기에서도 높은 프레임 수를 유지하면서 서비스를 제공할 수 있는 특징이 있으며, 사용자의 시점과 움직임에 반응하여 고해상도의 배경영상을 발췌하여 보여주기 때문에 상당한 몰입감을 구현할 수 있다. 본 제안 방법의 효과성을 보이기 위해 가상 동물원 환경을 VR로 구성하여 보았으며 사용자의 상호작용과 몰입감을 증대시킬 수 있음을 보이기 위해 상호작용 게임을 사례로 보인다.

대화형 방송을 위한 3차원 오디오 방송단말 (A 3D Audio Broadcasting Terminal for Interactive Broadcasting Services)

  • 박기윤;이태진;강경옥;홍진우
    • 방송공학회논문지
    • /
    • 제10권1호
    • /
    • pp.22-30
    • /
    • 2005
  • 본 논문에서는 사용자 제어에 따라 3차원 오디오 장면을 재구성할 수 있는 대화형 오디오 방송단말에 관하여 기술한다. MPEG-4 AudioBIFS 규격에 따라 계층적으로 표현한 오디오 장면의 속성을 사용자 제어에 따라 갱신하고, 주어진 속성을 참조하여 오디오 데이터를 3차원 공간상에 재합성하는 방식을 취한다. 단말은 MPEG-4 Audio 최상위 노드와 몇몇 비디오 노드를 지원하며, 센서 노드와 라우트 요소를 이용하는 대신에 노드 유형에 따른 사용자 인터페이스를 미리 정의함으로써 필드 갱신 BIFS 명령어를 지원한다. 3차원 오디오 데이터를 재생하는 기능은 사용자의 입력에 대한 피드백을 풍부하게 하여 대화형 방송의 효과를 극대화하고, 사실감을 제고하는 데 중요한 역할을 담당한다. 본 단말에서는 3차원 오디오 기술을 이용하여 음상의 위치, 지향성, 모양, 잔향특성 등을 사용자가 제어할 수 있다. 본 논문에서는 가상 합주 프로그램 등의 서비스 예를 통해 대화형 방송단말의 서비스 모델을 제시한다.

대화형 복수시점 영상콘텐츠 저작시스템 설계 및 구현 (Design and Implementation of Interactive Multi-view Visual Contents Authoring System)

  • 이인재;최진수;기명석;정세윤;문경애;홍진우
    • 방송공학회논문지
    • /
    • 제11권4호
    • /
    • pp.458-470
    • /
    • 2006
  • 본 논문에서는 MPEG-4 Systems 기반 복수시점 영상 서비스를 위한 저작 기술에 대해 제안한다. MPE-4는 이전의 MPEG-l/2 등의 비디오 정보 압축 규격과 달리, 사용자와 콘텐츠 간의 객체 기반 대화형(interactivity) 기능에 대한 다양한 방법을 포함하고 있다. 따라서 MPEG-4 Systems 규격은 현재까지 개발된 표준들 중에서 복수시점 영상 서비스가 제공하려고 하는 목적에 가장 잘 부합하는 기능을 제공하고 있다. 본 논문에서는 MPEG-4 Systems 표준 기술을 기반으로 제공될 수 있는 복수시점 영상 서비스에 대해 기술하였고, 해당 서비스를 제공하기 위한 MPEG가 장면 기술(scene description) 프로파일을 제안하였다. 또한 제안된 프로파일에 기반을 둔 대화형 복수시점 영상콘텐츠 저작시스템을 설계하고 구현하였으며, 실험결과를 통해 그 가능성을 보여 주었다.