• Title/Summary/Keyword: 합성 시각

Search Result 188, Processing Time 0.027 seconds

사이버음향(CyberSound) - 가상세계의 음향

  • 김형교;이의택
    • Broadcasting and Media Magazine
    • /
    • v.2 no.3
    • /
    • pp.23-31
    • /
    • 1997
  • 컴퓨터 음향발생에 관한 연구는 컴퓨터 음악, 인간-컴퓨터 상호작용, 데이터 청각화등의 분야에서 오랫동안 진행되어 왔지만, 최근 들어 컴퓨터 애니메이션이나 가상세계등에서 시각적 효과와 함께 보다 입체감 있고 현실감 있는 가상환경을 제공하기 위해 더욱더 중요한 문제로 떠오르고 있다. 지금까지 음향발생을 위해 음향의 모델링이나 합성등 음향 자체에 대한 요소 기술들에 관해서는 많은 연구가 진행되었으나 컴퓨터 애니메이션, 가상세계등과 같이 영상내 동작 내지 사건과 음향이 서로 밀접하게 연관된 분야에서 필수적인 음향을 영상내 동작과 통합 처리할 수 있는 기술에 대한 연구는 초보적인 단계에 머무르고 있다. 최근 들어, 음향의 입체감과 임장감을 강화하기 위하여 3차원 음향이라는 개념이 도입되고 있고 이의 구현에 대한 연구가 활발하게 진행되고 있다. 여기서는 컴퓨터 애니메이션이나 가상현실등에서 영상내 물체의 움직임이나 사건 그와 동기된 음향의 자동생성 및 이의 3차원 음향효과 발생 기술 원리를 사이버음향(CyberSound)이라는 개념으로 묶어서 소개하면서, 이의 전망을 기술하고자 한다.

  • PDF

An Implementation of Realtime News Service Using RSS and VoiceXML (RSS와 VoiceXML을 이용한 실시간 뉴스 서비스의 구현)

  • Kwon, Hyeng-Joon;Kim, Dong-Gyu;Hong, Kwang-Seok
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2006.06a
    • /
    • pp.9-12
    • /
    • 2006
  • 높은 컴퓨터 보급률에 따른 인터넷의 대중화로 인하여 새로운 소식을 원하는 사람들은 기존의 정해진 시각에 전달되는 지면 신문보다 인터넷을 통해 새로운 소식을 접하는 경향이 높아지면서, 국내의 각 언론사들은 RSS(RDF Site Summary)문서를 제공하기 시작하였다. 차세대 웹인 시맨틱 웹의 여러 가지 규격 및 기술 중에서도 그 유용함과 편리성을 인정받아 우리 생활에 가장 먼저 적용되고 있는 RSS는 컨텐츠 배급을 위해 나온 XML형태의 규격 중 하나로서 웹사이트에서 사용자가 원하는 정보의 갱신된 내용을 신속하게 사용자에게 전달하는 자동 정보 수집 기술이다. 본 논문에서는 특정 언론사에서 제공하는 RSS문서에 음성인식 및 합성기술을 기반으로 동작하는 다른 XML형태의 규격인 음성 확장성 생성 언어(VoiceXML)를 접목하여 휴대전화 및 유선전화로 새로운 뉴스를 접할 수 있는 서비스를 제안하고 구현하였다. 실험 결과, 시간과 장소에 구애받지 않고 신뢰성 있는 언론사의 새로운 뉴스를 실시간으로 전달받을 수 있음을 확인하였다.

  • PDF

Panoramic Image Generation for the Virtual Environment (가상환경을 위한 파노라마 생성에 관한 연구)

  • Kim, Tae-Eun
    • Journal of Digital Contents Society
    • /
    • v.8 no.3
    • /
    • pp.365-370
    • /
    • 2007
  • This paper proposes a new algorithm that generates a panorama image for reconstruction of image-based virtual environment. Proposed algorithm can generate panorama image from input images using the projective transform based on the feature model and a fully immersive image-based virtual environment according to the user's view point by the sphere mapping. Especially, proposed algorithm supports robust methods of camera rotation and is applied to various images to estimate ist performance.

  • PDF

Novel 3D Stereoscopic Motion Typo Production Methods using Layer Structure (레이어를 이용한 입체모션타이포 제작에 관한 연구)

  • Lee, Jun-Sang;Lee, Imgeun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.93-94
    • /
    • 2012
  • 뉴미디어를 통한 시각적 커뮤니케이션 방법에서 타이포그래피의 역할은 모션그래픽의 발전과 함께 핵심적인 정보전달의 영역으로 자리 잡고 있다. 최근 입체영상구현 기술연구는 실재감 있는 영상을 제작하기 위해서 다양하고 새로운 영상 제작방법들이 시도되고 있다. 그러나 모션 타이포그래피를 이용한 입체영상 제작방법에 대한 연구는 많이 부족한 것이 현실이다. 따라서 본 연구에서는 모션타이포그래피에 텍스트의 움직임을 이용한 방법, 카메라이동에 의한 방법, 편집 및 합성을 이용한 방법 등 세 가지 실험을 적용하여 입체적인 모션타이포그래피 영상을 제안한다.

  • PDF

A Special MPEG-4 Authoring Tool for PDA (PDA환경에서의 MPEG-4 컨텐츠 저작도구)

  • 이송록;임영순;김상욱
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.517-519
    • /
    • 2004
  • MPEG-4는 이미지, 비디오. 오디오와 다양한 기하객체 및 텍스트객체 등 설러 가지 멀티미디어 데이터를 각 객체 단위로 합성하여 멀티미디어 컨텐츠를 구성함으로써 멀티미디어 데이터에 대한 재사용성과 효율성을 높이며, 사용자와의 상호작용이 가능한 시청각 장면을 생성하고 전송을 가능하게 한다. 유비쿼터스 컴퓨팅에 대한 연구가 개발하게 전개되고 있는 이때, PC에서뿐만 아니라 언제 어디서나 가능한 모바일 환경에서 다양한 사용자 인터랙션에 중점을 두고 카드메일, 간단 게임 저작 등을 가능하게 함으로써 poA환경에서 전문적인 저작도구를 개발하는 것이 필요하다. 본 논문은 poA환경에서 기하객체와 텍스트, 이미지 등의 객체들을 이용하여 MPEG-4 컨텐츠 저작을 위한 씬 트리를 생성하고 이에 대한 인코딩을 통하여 BIFS 파일 포맷을 형성하고 멀티플렉서를 통하여 MPEG-4 파일을 생성함으로써 PDA환경에서 직접적이고도 시각적인 저작이 가능한 MPEG-4 건텐츠 저작시스템을 제안하고 그 개발 결과를 보인다.

  • PDF

Development of Component Customization Tool (컴포넌트 재정의 도구 개발)

  • Oh, Young-Bae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.04a
    • /
    • pp.209-212
    • /
    • 2001
  • 기존의 클라이언트 컴포넌트 기술로부터 EJB(Enterprise JavaBeans)와 마이크로소프트의 DCOM 모델을 기반으로 하는 서버 환경의 컴포넌트 기술이 발표 되고있다. 이에 따라 비즈니스 분야에서 활용할 수 있는 비교적 규모가 큰 컴포넌트가 개발되고 있어 이들 컴포넌트를 새로운 소프트웨어 개발에 활용할 수 있도록 컴포넌트를 재정의(Customization)하고 합성하는 과정을 지원하는 도구의 개발이 필요하다. 본 연구에서는 컴포넌트 기반 소프트웨어 개발시 컴포넌트 저장소에 구축되어 있는 컴포넌트를 검색하여 사용자의 요구사항에 맞게 재정의 하고 기존 컴포넌트 패키지에서 컴포넌트를 조립 및 삭제할 때 컴포넌트간의 종속성을 유지할 수 있도록 하는 방법 및 도구를 개발하였다. 본 도구는 재정의 도구를 관리하는 재정의기(Customizer), 컴포넌트 저장소에 구축되어 있는 컴포넌트 패키지를 보여주고 수정, 삭제를 지원하는 컴포넌트 브라우저, 컴포넌트 브라우저로부터 선택한 컴포넌트의 속성을 나타내고 수정, 삭제 등을 지원하는 속성 편집기와 컴포넌트 브라우저로부터 가져온 컴포넌트를 시각적으로 편집할 수 있게 하는 디자이너(Designer)로 구성되며, 컴포넌트의 조립 및 삭제를 할 매 컴포넌트 인터페이스의 종속성을 확인할 수 있게 하는 종속성 브라우저(Dependency Browser), 종속성 유지를 위하여 대체 컴포넌트 및 인터페이스를 선택할 수 있게 하는 인터페이스 편집기(Interface Editor)를 제공한다.

  • PDF

Phychological Counseling Service using CNN (Convolutional Neural Network) (CNN을 이용한 심리 상담 서비스에 관한 연구)

  • Kim, Jungwook;Kang, Byunghun;Kim, Mingyu;Yoo, Seunghan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.834-837
    • /
    • 2020
  • CNN(Convolution Neural Network)은 합성곱(Convolution)을 이용해서 시각적 이미지를 분석하는데 사용되는 인공지능 기술이다. 본 논문에서는 CNN을 이용한 실시간 심리 상담 서비스에 대해 논한다. 상담 서비스에 심리학과 CNN을 접목시킴으로써 내담자의 사진을 심리학적 비언어 행동을 기반으로 분석하여 내담자의 예상 심리를 파악하고, 유의미한 상담 자료를 생성해 상담의 질을 향상시킬 수 있도록 한다.

A Method of Hole Filling for Atlas Generation in Immersive Video Coding (몰입형 비디오 부호화의 아틀라스 생성을 위한 홀 채움 기법)

  • Lim, Sung-Gyun;Lee, Gwangsoon;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.75-77
    • /
    • 2021
  • MPEG 비디오 그룹은 제한된 3D 공간 내에서 움직임 시차(motion parallax)를 제공하면서 원하는 시점(view)을 렌더링(rendering)하기 위한 표준으로 TMIV(Test Model for Immersive Video)라는 테스트 모델과 함께 효율적인 몰입형 비디오의 부호화를 위한 MIV(MPEG Immersive Video) 표준을 개발하고 있다. 몰입감 있는 시각적 경험을 제공하기 위해서는 많은 수의 시점 비디오가 필요하기 때문에 방대한 양의 비디오를 고효율로 압축하는 것이 불가피하다. TMIV 는 여러 개의 입력 시점 비디오를 소수의 아틀라스(atlas) 비디오로 변환하여 부호화되는 화소수를 줄이게 된다. 아틀라스는 선택된 소수의 기본 시점(basic view) 비디오와 기본 시점으로부터 합성할 수 없는 나머지 추가 시점(additional view) 비디오의 영역들을 패치(patch)로 만들어 패킹(packing)한 비디오이다. 본 논문에서는 아틀라스 비디오의 보다 효율적인 부호화를 위해서 패치 내에 생기는 작은 홀(hole)들을 채우는 기법을 제안한다. 제안기법은 기존 TMIV8.0 에 비해 1.2%의 BD-rate 이 향상된 성능을 보인다.

  • PDF

A Study on the Performance Improvement of X-ray Foreign Matter Classification Neural Networks Using Multi-scale CAM (Multi-scale CAM을 이용한 X-ray 이물질 분류 신경망 성능 향상에 대한 연구)

  • Lee, Sung Ju;Cho, Nam Ik
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.307-310
    • /
    • 2021
  • X-ray 영상 검사·검출 문제에 기존 딥러닝 모델을 사용하려는 시도들이 존재해왔고, 합성곱 신경망의 강력한 표현력 덕분에 대체로 준수한 성능이 보장되었다. 그러나 문제의 특성에 따라 기대한 만큼의 분류 및 검출 성능이 나오지 않는 경우가 존재한다. 이는 1) 검출 대상의 스케일이 다양하거나, 2) X-ray 영상은 흑백 영상으로 미세한 특징을 학습하기 어렵거나, 3) 지도학습을 하기에는 학습 데이터의 양이 부족하기 때문인 것이 주요 원인들이다. 본 논문에서는 다양한 스케일의 특징맵을 추출하여 종합적으로 학습하는 신경망을 통해, '생선살 X-ray 영상' 데이터셋에서 '생선 가시' 이물질 class가 모델 내에서 어떻게 학습되는지를 살펴본다. 그리고 X-ray 영상의 경우, 이물질 class를 크기별로 새롭게 labeling하여 성능 개선이 일어날 수 있음을 보인다. 또한 Multi-scale CAM을 통해 class에 따른 활성화 정도를 시각화하여 모델을 직관적으로 분석할 수 있음을 보일 것이다.

  • PDF

Scene Graph Generation with Graph Neural Network and Multimodal Context (그래프 신경망과 멀티 모달 맥락 정보를 이용한 장면 그래프 생성)

  • Jung, Ga-Young;Kim, In-cheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.555-558
    • /
    • 2020
  • 본 논문에서는 입력 영상에 담긴 다양한 물체들과 그들 간의 관계를 효과적으로 탐지하여, 하나의 장면 그래프로 표현해내는 새로운 심층 신경망 모델을 제안한다. 제안 모델에서는 물체와 관계의 효과적인 탐지를 위해, 합성 곱 신경망 기반의 시각 맥락 특징들뿐만 아니라 언어 맥락 특징들을 포함하는 다양한 멀티 모달 맥락 정보들을 활용한다. 또한, 제안 모델에서는 관계를 맺는 두 물체 간의 상호 의존성이 그래프 노드 특징값들에 충분히 반영되도록, 그래프 신경망을 이용해 맥락 정보를 임베딩한다. 본 논문에서는 Visual Genome 벤치마크 데이터 집합을 이용한 비교 실험들을 통해, 제안 모델의 효과와 성능을 입증한다.